Categories: Cloud

KI-gestützte Spracherkennung erreicht neue Stufe

Speechmatics, ein britisches Spracherkennungs-Startup, hat gerade eine Serie-B-Finanzierung in Höhe von 62 Millionen Dollar erhalten. Das Ziel ist es, einen Computer zu entwickeln, der jede Stimme auf der Welt versteht. Die Spracherkennung ist eine große Herausforderung für die Entwickler und ein Rätsel, das in einer Vielzahl von Branchen genau beobachtet wird. Die Technologie hat Auswirkungen auf Mensch-Maschine-Schnittstellen in Bereichen wie Robotik, autonome Fahrzeuge und Personal Computing, die alle von Computern profitieren werden, die natürliche Sprache genau interpretieren können.

Spracherkennung ist also eine Art technologischer Einstiegspunkt, ein Marktbedarf, der die Entwicklung von Technologien vorantreiben kann, die eine breite Resonanz und unabsehbare Auswirkungen darauf haben werden, wie wir mit Maschinen interagieren.

Ein großer Teil der Herausforderung ist das Trainingsmodell. Die meisten Trainingsdaten müssen manuell klassifiziert werden, was bedeutet, dass die Genauigkeit nur bei einer sehr kleinen Gruppe von Sprechern erreicht werden kann. Speechmatics verfolgt in seinem Bemühen um eine repräsentativere Spracherkennung einen anderen Ansatz.

Auf der Grundlage von Datensätzen, die in der Stanford-Studie „Racial Disparities in Speech Recognition“ verwendet wurden, verzeichnete Speechmatics eine Gesamtgenauigkeit von 82,8 % für afroamerikanische Stimmen im Vergleich zu Google (68,6 %) und Amazon (68,6). Dieses Genauigkeitsniveau entspricht einer Reduzierung der Spracherkennungsfehler um 45 % – das entspricht drei Wörtern in einem durchschnittlichen Satz.

Die Engine wird mit Hunderttausenden von individuellen Stimmen konfrontiert, wobei repräsentative Sprachdaten verwendet werden, die kein menschliches Eingreifen erfordern. Das hat dazu beigetragen, die Reichweite über englischsprachige Sprecher hinaus zu erhöhen.

„Unsere Fortschritte in den letzten Jahren haben dazu geführt, dass wir bei den Investoren für unsere Serie-B-Finanzierung auf großes Interesse gestoßen sind“, sagt Katy Wigdahl, CEO. „Das Team von Speechmatics ist sehr ehrgeizig.“

Gegenwärtig versteht die Engine 34 Sprachen, allerdings werden weltweit über 7.000 Sprachen gesprochen. Aber die Plattform hat beeindruckende Fortschritte bei Interpunktion, Zahlen, Währungen und Adressen gemacht, die traditionell Spracherkennungsmaschinen in die Quere kommen.

All dies hat großes Interesse an dem in Großbritannien ansässigen Unternehmen geweckt. Unternehmen wie 3Play Media, Veritone, Deloitte UK und Vonage sowie Regierungsbehörden in aller Welt nutzen die Plattform. Im Einklang mit seinen globalen Zielen hat Speechmatics seinen Hauptsitz in Großbritannien, unterhält aber auch Büros in Boston (USA), Chennai (Indien) und Brünn (Tschechische Republik).

ZDNet.de Redaktion

Recent Posts

Umfrage: Weniger als die Hälfte der digitalen Initiativen sind erfolgreich

Unternehmen räumen der Entwicklung technischer und digitaler Führungskompetenzen ein zu geringe Priorität ein. Gartner fordert…

9 Minuten ago

Google schließt zwei Zero-Day-Lücken in Android

Betroffen sind Android 12, 13, 14 und 15. Google sind zielgerichtete Angriffe auf die beiden…

18 Stunden ago

Gefährliche Weiterentwicklung der APT36-Malware ElizaRAT

Schadprogramm der pakistanischen Hackergruppe APT36 weitet seine Aktivitäten aus und verbessert seine Techniken.

23 Stunden ago

Google schließt weitere schwerwiegende Sicherheitslücken in Chrome 130

Tenable vergibt für beide Schwachstellen einen CVSS-Basis-Score von 9,8. Zwei Use-after-free-Bugs erlauben möglicherweise das Einschleusen…

1 Tag ago

Microsoft nennt weitere Details zu kostenpflichtigen Patches für Windows 10

Erstmals liegen Preise für Verbraucher vor. Sie zahlen weniger als Geschäftskunden. Dafür beschränkt Microsoft den…

2 Tagen ago

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

3 Tagen ago