Categories: Innovation

Mozilla veröffentlicht Sprachdatenbank zur freien Verfügung

Mozilla hat die größte frei nutzbare Sprachdatenbank mit Aufnahmen in 18 verschiedenen Sprachen bereitgestellt, die durch sein Projekt Common Voice geschaffen wurde. Sie enthält Aufnahmen mit einer insgesamten Länge von fast 1400 Stunden, die von über 42.000 Sprechern beigetragen wurden. Die Veröffentlichung erfolgt mit der besonders freizügigen Lizenz Creative Commons Zero (CC0), die keine Bedingungen stellt.

Zu den verfügbaren Sprachen gehören Englisch, Französisch, Deutsch, das chinesische Mandarin, Spanisch, Baskisch, Niederländisch, Esperanto und Farsi. Mit dabei sind auch weniger verbreitete Sprachen wie Walisisch und die in Algerien gesprochene Berbersprache Kabylisch. Mozilla stellt auch die große kulturelle Diversität der Aufnahmen heraus. Spracherkennung könnte ihr volles Zukunftspotential nur entfalten, wenn es um die beste Lösung für alle und nicht um Profit geht.

Die Common-Voice-Initiative soll dabei helfen, Maschinen beibringen, wie echte Menschen sprechen. Die Entwickler von Stimmsystemen sind auf großen Mengen von Stimmdaten angewiesen. Die von großen Unternehmen gesammelten Daten sind ihnen regelmäßig nicht zugänglich, was laut Firefox-Hersteller Mozilla die Innovation behindert. Das Projekt soll nicht nur eigenen Entwicklungen zugutekommen, sondern auch Start-ups zu neuen Lösungen befähigen. Common Voice trägt auch zu Mozillas freier Spracherkennung DeepSpeech bei, die in Echtzeit Sprache in Schrift übersetzt.

„Das Problem ist, dass die großen Unternehmen, die unsere Daten über ihre Sprachassistenten sammeln, diese regelrecht einbunkern“, kommentiert Kelly Davis, Manager der Machine Learning Group von Mozilla. „Und für ihre Nutzung eine Gegenleistung verlangen. Das bedeutet, dass kleinere Start-ups mit ihren guten Ideen keine Chance haben, auf den Markt zu kommen. Das Projekt Common Voice will dafür sorgen, dass diese Vielfalt und die Chance für alle Menschen das Beste zu entwickeln, nicht verloren geht.“

De vielen freiwilligen Mitarbeiter wollen die Spielregeln für die Zukunft der Spracherkennung neu und gerecht definieren. „Es gibt unendlich viele Möglichkeiten, in denen diese Technologie nützlich sein kann – von der Smart City bis zum Smart Home“, so Davis. „Mir gefällt zum Beispiel der Gedanke, dass unsere Arbeit helfen kann, dass alte Menschen länger selbstständig zuhause leben können. Oder, dass wir der Medizin helfen können, wenn Menschen ihre Stimme verloren haben.“

Das Stimmen-Spenden macht Common Voice einfach durch die Website voice.mozilla.org. Diese bietet Sätze zum Vorlesen an, die aus unterschiedlichsten Quellen stammen. Gleichermaßen erwünscht ist das Anhören der aufgenommenen Stimmen, um ihre Verständlichkeit zu bewerten.

ZDNet.de Redaktion

NextownCloud entwickelt Funktion zur automatischen Klassifizierung und sicheren Dokumentenverarbeitung »

Previous « eco-Verband setzt sich für Krypto-Mining ein

Published by

ZDNet.de Redaktion

Tags: BrowserOpen SourceSpracherkennung

5 Jahren ago

Neue Backdoor: Bedrohung durch Malvertising-Kampagne mit MadMxShell

Bisher unbekannter Bedrohungsakteur versucht über gefälschte IP Scanner Software-Domänen Zugriff auf IT-Umgebungen zu erlangen.

1 Tag ago

Cybersicherheit

Mozilla veröffentlicht Sprachdatenbank zur freien Verfügung

Recent Posts

Neue Backdoor: Bedrohung durch Malvertising-Kampagne mit MadMxShell

BSI-Studie: Wie KI die Bedrohungslandschaft verändert

KI-Wandel: Welche Berufe sich am stärksten verändern

Wie ein Unternehmen, das Sie noch nicht kennen, eine Revolution in der Cloud-Speicherung anführt

Dirty Stream: Microsoft entdeckt neuartige Angriffe auf Android-Apps

Apple meldet Umsatz- und Gewinnrückgang im zweiten Fiskalquartal

Mozilla veröffentlicht Sprachdatenbank zur freien Verfügung

Related Post

Recent Posts

Neue Backdoor: Bedrohung durch Malvertising-Kampagne mit MadMxShell

BSI-Studie: Wie KI die Bedrohungslandschaft verändert

KI-Wandel: Welche Berufe sich am stärksten verändern

Wie ein Unternehmen, das Sie noch nicht kennen, eine Revolution in der Cloud-Speicherung anführt

Dirty Stream: Microsoft entdeckt neuartige Angriffe auf Android-Apps

Apple meldet Umsatz- und Gewinnrückgang im zweiten Fiskalquartal