Categories: Cloud

KI-gestützte Spracherkennung erreicht neue Stufe

Speechmatics, ein britisches Spracherkennungs-Startup, hat gerade eine Serie-B-Finanzierung in Höhe von 62 Millionen Dollar erhalten. Das Ziel ist es, einen Computer zu entwickeln, der jede Stimme auf der Welt versteht. Die Spracherkennung ist eine große Herausforderung für die Entwickler und ein Rätsel, das in einer Vielzahl von Branchen genau beobachtet wird. Die Technologie hat Auswirkungen auf Mensch-Maschine-Schnittstellen in Bereichen wie Robotik, autonome Fahrzeuge und Personal Computing, die alle von Computern profitieren werden, die natürliche Sprache genau interpretieren können.

Spracherkennung ist also eine Art technologischer Einstiegspunkt, ein Marktbedarf, der die Entwicklung von Technologien vorantreiben kann, die eine breite Resonanz und unabsehbare Auswirkungen darauf haben werden, wie wir mit Maschinen interagieren.

Ein großer Teil der Herausforderung ist das Trainingsmodell. Die meisten Trainingsdaten müssen manuell klassifiziert werden, was bedeutet, dass die Genauigkeit nur bei einer sehr kleinen Gruppe von Sprechern erreicht werden kann. Speechmatics verfolgt in seinem Bemühen um eine repräsentativere Spracherkennung einen anderen Ansatz.

Auf der Grundlage von Datensätzen, die in der Stanford-Studie „Racial Disparities in Speech Recognition“ verwendet wurden, verzeichnete Speechmatics eine Gesamtgenauigkeit von 82,8 % für afroamerikanische Stimmen im Vergleich zu Google (68,6 %) und Amazon (68,6). Dieses Genauigkeitsniveau entspricht einer Reduzierung der Spracherkennungsfehler um 45 % – das entspricht drei Wörtern in einem durchschnittlichen Satz.

Die Engine wird mit Hunderttausenden von individuellen Stimmen konfrontiert, wobei repräsentative Sprachdaten verwendet werden, die kein menschliches Eingreifen erfordern. Das hat dazu beigetragen, die Reichweite über englischsprachige Sprecher hinaus zu erhöhen.

„Unsere Fortschritte in den letzten Jahren haben dazu geführt, dass wir bei den Investoren für unsere Serie-B-Finanzierung auf großes Interesse gestoßen sind“, sagt Katy Wigdahl, CEO. „Das Team von Speechmatics ist sehr ehrgeizig.“

Gegenwärtig versteht die Engine 34 Sprachen, allerdings werden weltweit über 7.000 Sprachen gesprochen. Aber die Plattform hat beeindruckende Fortschritte bei Interpunktion, Zahlen, Währungen und Adressen gemacht, die traditionell Spracherkennungsmaschinen in die Quere kommen.

All dies hat großes Interesse an dem in Großbritannien ansässigen Unternehmen geweckt. Unternehmen wie 3Play Media, Veritone, Deloitte UK und Vonage sowie Regierungsbehörden in aller Welt nutzen die Plattform. Im Einklang mit seinen globalen Zielen hat Speechmatics seinen Hauptsitz in Großbritannien, unterhält aber auch Büros in Boston (USA), Chennai (Indien) und Brünn (Tschechische Republik).

ZDNet.de Redaktion

Recent Posts

Google schließt kritische Sicherheitslücke in Android 14

Weitere schwerwiegende Fehler stecken in Android 12 und 13. Insgesamt bringt der Mai-Patchday 29 Fixes.

10 Stunden ago

IT Sicherheit: digitale Angriffe sicher abwehren

IT-Sicherheit - Erkennen und Abwehren von digitalen Angriffen

15 Stunden ago

Bestverkaufte Smartphones: Apple und Samsung dominieren

Das iPhone 15 Pro Max ist das meistverkaufte Smartphone im ersten Quartal. Das Galaxy S24…

18 Stunden ago

Google: Passkeys schützen mehr als 400 Millionen Google-Konten

Die Passwort-Alternative Passkeys überholt Einmalpasswörter bei der Zwei-Faktor-Authentifizierung. Auch Microsoft setzt sich aktiv für die…

1 Tag ago

Infostealer: 53 Prozent der Angriffe treffen Unternehmensrechner

Der Anteil steigt seit 2020 um 34 Prozentpunkte. Allein 2023 erfasst Kaspersky rund 10 Millionen…

2 Tagen ago

Salesforce: Mit Einstein GPT zurück auf die Überholspur?

Salesforce forciert den Ausbau seiner Industry Clouds. Mit ihrem Prozesswissen könnten deutsche IT-Dienstleister davon profitieren.

2 Tagen ago