Speechmatics, ein britisches Spracherkennungs-Startup, hat gerade eine Serie-B-Finanzierung in Höhe von 62 Millionen Dollar erhalten. Das Ziel ist es, einen Computer zu entwickeln, der jede Stimme auf der Welt versteht. Die Spracherkennung ist eine große Herausforderung für die Entwickler und ein Rätsel, das in einer Vielzahl von Branchen genau beobachtet wird. Die Technologie hat Auswirkungen auf Mensch-Maschine-Schnittstellen in Bereichen wie Robotik, autonome Fahrzeuge und Personal Computing, die alle von Computern profitieren werden, die natürliche Sprache genau interpretieren können.
Spracherkennung ist also eine Art technologischer Einstiegspunkt, ein Marktbedarf, der die Entwicklung von Technologien vorantreiben kann, die eine breite Resonanz und unabsehbare Auswirkungen darauf haben werden, wie wir mit Maschinen interagieren.
Ein großer Teil der Herausforderung ist das Trainingsmodell. Die meisten Trainingsdaten müssen manuell klassifiziert werden, was bedeutet, dass die Genauigkeit nur bei einer sehr kleinen Gruppe von Sprechern erreicht werden kann. Speechmatics verfolgt in seinem Bemühen um eine repräsentativere Spracherkennung einen anderen Ansatz.
Auf der Grundlage von Datensätzen, die in der Stanford-Studie „Racial Disparities in Speech Recognition“ verwendet wurden, verzeichnete Speechmatics eine Gesamtgenauigkeit von 82,8 % für afroamerikanische Stimmen im Vergleich zu Google (68,6 %) und Amazon (68,6). Dieses Genauigkeitsniveau entspricht einer Reduzierung der Spracherkennungsfehler um 45 % – das entspricht drei Wörtern in einem durchschnittlichen Satz.
Die Engine wird mit Hunderttausenden von individuellen Stimmen konfrontiert, wobei repräsentative Sprachdaten verwendet werden, die kein menschliches Eingreifen erfordern. Das hat dazu beigetragen, die Reichweite über englischsprachige Sprecher hinaus zu erhöhen.
„Unsere Fortschritte in den letzten Jahren haben dazu geführt, dass wir bei den Investoren für unsere Serie-B-Finanzierung auf großes Interesse gestoßen sind“, sagt Katy Wigdahl, CEO. „Das Team von Speechmatics ist sehr ehrgeizig.“
Gegenwärtig versteht die Engine 34 Sprachen, allerdings werden weltweit über 7.000 Sprachen gesprochen. Aber die Plattform hat beeindruckende Fortschritte bei Interpunktion, Zahlen, Währungen und Adressen gemacht, die traditionell Spracherkennungsmaschinen in die Quere kommen.
All dies hat großes Interesse an dem in Großbritannien ansässigen Unternehmen geweckt. Unternehmen wie 3Play Media, Veritone, Deloitte UK und Vonage sowie Regierungsbehörden in aller Welt nutzen die Plattform. Im Einklang mit seinen globalen Zielen hat Speechmatics seinen Hauptsitz in Großbritannien, unterhält aber auch Büros in Boston (USA), Chennai (Indien) und Brünn (Tschechische Republik).
Neueste Kommentare
Noch keine Kommentare zu KI-gestützte Spracherkennung erreicht neue Stufe
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.