Categories: Cloud

KI-gestützte Spracherkennung erreicht neue Stufe

Speechmatics, ein britisches Spracherkennungs-Startup, hat gerade eine Serie-B-Finanzierung in Höhe von 62 Millionen Dollar erhalten. Das Ziel ist es, einen Computer zu entwickeln, der jede Stimme auf der Welt versteht. Die Spracherkennung ist eine große Herausforderung für die Entwickler und ein Rätsel, das in einer Vielzahl von Branchen genau beobachtet wird. Die Technologie hat Auswirkungen auf Mensch-Maschine-Schnittstellen in Bereichen wie Robotik, autonome Fahrzeuge und Personal Computing, die alle von Computern profitieren werden, die natürliche Sprache genau interpretieren können.

Spracherkennung ist also eine Art technologischer Einstiegspunkt, ein Marktbedarf, der die Entwicklung von Technologien vorantreiben kann, die eine breite Resonanz und unabsehbare Auswirkungen darauf haben werden, wie wir mit Maschinen interagieren.

Ein großer Teil der Herausforderung ist das Trainingsmodell. Die meisten Trainingsdaten müssen manuell klassifiziert werden, was bedeutet, dass die Genauigkeit nur bei einer sehr kleinen Gruppe von Sprechern erreicht werden kann. Speechmatics verfolgt in seinem Bemühen um eine repräsentativere Spracherkennung einen anderen Ansatz.

Auf der Grundlage von Datensätzen, die in der Stanford-Studie „Racial Disparities in Speech Recognition“ verwendet wurden, verzeichnete Speechmatics eine Gesamtgenauigkeit von 82,8 % für afroamerikanische Stimmen im Vergleich zu Google (68,6 %) und Amazon (68,6). Dieses Genauigkeitsniveau entspricht einer Reduzierung der Spracherkennungsfehler um 45 % – das entspricht drei Wörtern in einem durchschnittlichen Satz.

Die Engine wird mit Hunderttausenden von individuellen Stimmen konfrontiert, wobei repräsentative Sprachdaten verwendet werden, die kein menschliches Eingreifen erfordern. Das hat dazu beigetragen, die Reichweite über englischsprachige Sprecher hinaus zu erhöhen.

„Unsere Fortschritte in den letzten Jahren haben dazu geführt, dass wir bei den Investoren für unsere Serie-B-Finanzierung auf großes Interesse gestoßen sind“, sagt Katy Wigdahl, CEO. „Das Team von Speechmatics ist sehr ehrgeizig.“

Gegenwärtig versteht die Engine 34 Sprachen, allerdings werden weltweit über 7.000 Sprachen gesprochen. Aber die Plattform hat beeindruckende Fortschritte bei Interpunktion, Zahlen, Währungen und Adressen gemacht, die traditionell Spracherkennungsmaschinen in die Quere kommen.

All dies hat großes Interesse an dem in Großbritannien ansässigen Unternehmen geweckt. Unternehmen wie 3Play Media, Veritone, Deloitte UK und Vonage sowie Regierungsbehörden in aller Welt nutzen die Plattform. Im Einklang mit seinen globalen Zielen hat Speechmatics seinen Hauptsitz in Großbritannien, unterhält aber auch Büros in Boston (USA), Chennai (Indien) und Brünn (Tschechische Republik).

ZDNet.de Redaktion

Recent Posts

Erneut mehr als 90 schädliche Apps im Google Play Store entdeckt

Sie verbreiten einen Banking-Trojanern. Die Hintermänner nehmen mit Anatsa auch Nutzer in Deutschland ins Visier.

1 Tag ago

Markt für KI-Chips wächst 2024 voraussichtlich um 33 Prozent

Das Volumen des Markts steigt auf rund 71 Milliarden Dollar. Der Bereich KI-Beschleuniger für Server…

1 Tag ago

Container und Kubernetes für Cybersicherheitsvorfälle in Deutschland verantwortlich

Das gilt vor allem für Unternehmen mit mehreren Standorten. Viele Vorfälle sind auf Konfigurationsfehler und…

1 Tag ago

17 Prozent der Bundesbürger bereits auf Phishing hereingefallen

Mehr als die Hälfte der Nutzer in Deutschland kann nach eigenen Angaben Phishing und Spam…

1 Tag ago

Neue Technologie in Browsergames – Flash verschwindet und wird durch HTML5 ersetzt

Browsergames haben seit den frühen 2000er Jahren eine enorme Popularität erlangt und Millionen von Spielern…

1 Tag ago

Salesforce schmiedet Datenallianz

Der CRM-Marktführer stellt ein neues Ökosystem vor, das die Integration von Kunden- und Marktdaten erleichtern…

3 Tagen ago