Categories: Software

Neue Sprachtechnologie kann Dialekte sprechen

Die Bochumer Firma G-Data hat die Sprachausgabetechnologie LOGOX4 entwickelt. Die Qualität der Sprachausgabe sei bei gleichzeitiger Verkleinerung des Speicherbedarfs stark verbessert worden. Mit der in das Programm Webspeech 4 integrierten Technik könne der Computer nicht nur beliebige Texte vorlesen, sondern erstmalig auch singen und sogar in Dialekten sprechen, so der Hersteller. Die neue Version von Webspeech 4 mit vier Sprecher-Stimmen steht ab sofort kostenlos zum Download zur Verfügung.

„Mit der LOGOX4-Technologie sind wir einen entscheidenden Schritt in der Kommunikation zwischen Maschine und Mensch vorangekommen. Unsere von Grund auf neu entwickelte Technologie ermöglicht den Einzug der Sprache in das tägliche Leben mit elektronischen Geräten. PCs und PDAs sind da erst der Anfang“, konstatierte G-Data-Vorstand Fridolin Rummel.

Die neuartige Sprachtechnologie beruht auf der selbst entwickelten Mikrosegmentsynthese, die es ermöglicht, aus nur 380 Lautbausteinen (Mikrosegmenten) jedes Wort einer Sprache verständlich und menschlich darzustellen. LOGOX4 habe laut den Entwicklern mit der Vorgänger-Version LOGOX3 außer dem grundlegenden Verfahren nichts mehr gemeinsam.

Entscheidend für die Qualitätssteigerung der neuen Sprachtechnologie seien die flexible Systemarchitektur, die verbesserte Textanalyse sowie die neu konzipierte Signalverarbeitung. Für eine verfeinerte Sprachqualität soll die intelligente Transformation von Text in Ton-Signale sorgen. Sie ermöglicht durch Satzanalysen eine „deutlich menschlichere“ Sprechmelodie und einen variableren Sprecherrhythmus.

Zudem könne der Anwender Sprechgeschwindigkeit, Tonhöhe sowie Intonation nach seinen Vorlieben einstellen. Die neue Architektur mit der einhergehenden Flexibilität ermöglichen sogar echte Weltneuheiten: Mit LOGOX4 kann der Computer nun sogar singen oder in Dialekten sprechen.

Die neue LOGOX4-Engine wurde in plattformunabhängigem Code entwickelt. Umsetzungen sind für Windows und Windows CE vorhanden. Das Programm soll nur 1,5 MByte Speicherplatz mit einer Stimme benötigen. LOGOX4 hat damit das Potential, neben dem Einsatz in Organizern mittelfristig als auch Technologie für Sprachchips in Mobiltelefonen, Navigationssystemen, elektronischen Spielzeugen und auch in Haushaltsgeräten zum Einsatz zu kommen, so G-Data.

Als Mindestvoraussetzungen für ein System nennt der Hersteller einen PC mit 200 MHz, 16 MByte RAM, Win 9x/ ME/ 2000/ XP sowie Internet Explorer ab Version 4.0. Empfohlen wird ein Pentium III mit 64 MByte RAM und Internet Explorer Version 5.0.

Kontakt:
G Data, Tel.: 0234/97620 (günstigsten Tarif anzeigen)

ZDNet.de Redaktion

Recent Posts

Gefahren im Foxit PDF-Reader

Check Point warnt vor offener Schwachstelle, die derzeit von Hackern für Phishing ausgenutzt wird.

7 Stunden ago

Bitdefender entdeckt Sicherheitslücken in Überwachungskameras

Video-Babyphones sind ebenfalls betroffen. Cyberkriminelle nehmen vermehrt IoT-Hardware ins Visier.

8 Stunden ago

Top-Malware in Deutschland: CloudEye zurück an der Spitze

Der Downloader hat hierzulande im April einen Anteil von 18,58 Prozent. Im Bereich Ransomware ist…

8 Stunden ago

Podcast: „Die Zero Trust-Architektur ist gekommen, um zu bleiben“

Unternehmen greifen von überall aus auf die Cloud und Applikationen zu. Dementsprechend reicht das Burg-Prinzip…

23 Stunden ago

Google schließt weitere Zero-Day-Lücke in Chrome

Hacker nutzen eine jetzt gepatchte Schwachstelle im Google-Browser bereits aktiv aus. Die neue Chrome-Version stopft…

1 Tag ago

Hacker greifen Zero-Day-Lücke in Windows mit Banking-Trojaner QakBot an

Microsoft bietet seit Anfang der Woche einen Patch für die Lücke. Kaspersky-Forscher gehen davon aus,…

1 Tag ago