Neue Sprachtechnologie kann Dialekte sprechen

Version von Webspeech 4 mit vier Sprecher-Stimmen steht ab sofort kostenlos zum Download zur Verfügung

Die Bochumer Firma G-Data hat die Sprachausgabetechnologie LOGOX4 entwickelt. Die Qualität der Sprachausgabe sei bei gleichzeitiger Verkleinerung des Speicherbedarfs stark verbessert worden. Mit der in das Programm Webspeech 4 integrierten Technik könne der Computer nicht nur beliebige Texte vorlesen, sondern erstmalig auch singen und sogar in Dialekten sprechen, so der Hersteller. Die neue Version von Webspeech 4 mit vier Sprecher-Stimmen steht ab sofort kostenlos zum Download zur Verfügung.

„Mit der LOGOX4-Technologie sind wir einen entscheidenden Schritt in der Kommunikation zwischen Maschine und Mensch vorangekommen. Unsere von Grund auf neu entwickelte Technologie ermöglicht den Einzug der Sprache in das tägliche Leben mit elektronischen Geräten. PCs und PDAs sind da erst der Anfang“, konstatierte G-Data-Vorstand Fridolin Rummel.

Die neuartige Sprachtechnologie beruht auf der selbst entwickelten Mikrosegmentsynthese, die es ermöglicht, aus nur 380 Lautbausteinen (Mikrosegmenten) jedes Wort einer Sprache verständlich und menschlich darzustellen. LOGOX4 habe laut den Entwicklern mit der Vorgänger-Version LOGOX3 außer dem grundlegenden Verfahren nichts mehr gemeinsam.

Entscheidend für die Qualitätssteigerung der neuen Sprachtechnologie seien die flexible Systemarchitektur, die verbesserte Textanalyse sowie die neu konzipierte Signalverarbeitung. Für eine verfeinerte Sprachqualität soll die intelligente Transformation von Text in Ton-Signale sorgen. Sie ermöglicht durch Satzanalysen eine „deutlich menschlichere“ Sprechmelodie und einen variableren Sprecherrhythmus.

Zudem könne der Anwender Sprechgeschwindigkeit, Tonhöhe sowie Intonation nach seinen Vorlieben einstellen. Die neue Architektur mit der einhergehenden Flexibilität ermöglichen sogar echte Weltneuheiten: Mit LOGOX4 kann der Computer nun sogar singen oder in Dialekten sprechen.

Die neue LOGOX4-Engine wurde in plattformunabhängigem Code entwickelt. Umsetzungen sind für Windows und Windows CE vorhanden. Das Programm soll nur 1,5 MByte Speicherplatz mit einer Stimme benötigen. LOGOX4 hat damit das Potential, neben dem Einsatz in Organizern mittelfristig als auch Technologie für Sprachchips in Mobiltelefonen, Navigationssystemen, elektronischen Spielzeugen und auch in Haushaltsgeräten zum Einsatz zu kommen, so G-Data.

Als Mindestvoraussetzungen für ein System nennt der Hersteller einen PC mit 200 MHz, 16 MByte RAM, Win 9x/ ME/ 2000/ XP sowie Internet Explorer ab Version 4.0. Empfohlen wird ein Pentium III mit 64 MByte RAM und Internet Explorer Version 5.0.

Kontakt:
G Data, Tel.: 0234/97620 (günstigsten Tarif anzeigen)

Themenseiten: Software

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

ZDNet für mobile Geräte
ZDNet-App für Android herunterladen Lesen Sie ZDNet-Artikel in Google Currents ZDNet-App für iOS

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu Neue Sprachtechnologie kann Dialekte sprechen

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *