Categories: Software

IDF: Intel will „Lippen lesen“

Forscher von Intel (Börse Frankfurt: INL) haben auf dem Intel Developer Forum (IDF) in Berlin eine neue Software veröffentlicht, mit der der Bau von Computern, die wie Menschen sehen und „Lippen lesen“ können, möglich sein soll. Aktuelle leistungsfähige Spracherkennungs-Algorithmen arbeiten funktionieren zwar im Ansatz, Hintergrundlärm oder ein durchschnittliches Headset machen den Einsatz aber schnell unmöglich. Die Verwendung etwa auf öffentlichen Plätzen oder im Großraumbüro ist daher bis dato nicht möglich.

In Kombination mit Gesichtserkennungsalgorithmen aus Intels Open CV Computer Vision Bibliothek ermögliche nun aber die neue Audio Visual Speech Recognition (AVSR)-Software, dass die Computer das Gesicht eines Sprechers erkennen und den Mundbewegungen folgen. Die Synchronisation von Videodaten mit Sprachidentifizierung mache eine deutlich genauere Spracherkennung möglich. „Die Ergänzung von Intels Open CV Bibliothek durch Audio/Video-Spracherkennungscode wird die Forschung und Entwicklung in bildgestützter Spracherkennung ganz sicher vorantreiben“, erklärte Justin Rattner, Intel Senior Fellow der Enterprise Platform Group und Director des Intel Microprocessor Research Labs.

Schnellere Mikroprozessoren, sinkende Kamerapreise und eine um den Faktor zehn höhere Bandbreite bei der Videoaufzeichnung durch Technologien wie USB 2.0 versetzten auch konventionelle PCs in die Lage, bilderkennende Algorithmen in Echtzeit ausführen zu können.

ZDNet.de Redaktion

Recent Posts

Big Blue kündigt Zusammenarbeit mit AMD an

IBM Cloud setzt AMD Instinct MI300X Accelerators ein, um generative KI-Workloads und HPC-Anwendungen zu unterstützen.

28 Minuten ago

Jeder zweite vereinbart Arzttermine online

Ein Viertel der Deutschen wählt Arztpraxen sogar ganz gezielt danach aus, ob sie Internettermine anbieten.

19 Stunden ago

Siemens spendiert neuen Rechnern NVIDIA-Chips

Der Technologiekonzern hat Industrie-PCs angekündigt, die mit Grafikprozessoren von NVIDIA ausgestattet sein werden.

20 Stunden ago

Bundesbürger misstrauen KI-generierten Ergebnissen

ChatGPT, Google Gemini, MidJourney oder Anthropic Claude: Gut jeder zweite Bundesbürger hat generative KI bereits…

2 Tagen ago

Typische Fehler beim KI-Einsatz im Marketing

KI gehört schon zu den festen Instrumenten des Marketings. Doch viele Unternehmer setzen die KI…

2 Tagen ago

Starbucks von Cyberattacke betroffen

Ransomware-Angriff auf die KI-gesteuerte Lieferkettenplattform Blue Yonder hat weitreichende Auswirkungen.

3 Tagen ago