Categories: InnovationSoftware

Realistische Mimik statt stures Starren

93 Prozent unserer Kommunikation sind nonverbal, sagt Psychologe Professor Albert Mehrabian. Dabei sind Blickkontakt und Mimik der wichtigste Bestandteil. Bei Videocalls ging dieser Blickkontakt bisher verloren. Die KI-Software des Startups Casablanca erzeugt in Echtzeit Blickkontakt und realistische Mimik in Videocalls. Sie lässt sich mit allen Videocall-Systemen anwenden.

Digitaler Blickkontakt wie im analogen Gespräch

Für die Entwicklung hat das deutsche Startup zwei Jahre geforscht und drei Patente entwickelt. Herausgekommen ist eine Technologie, die mittels KI den natürlichen Blickkontakt wieder herstellt – allerdings nur, wenn man sich auch wirklich anschaut. Die Software arbeitet, als hätte man eine Kamera mitten auf dem Bildschirm angebracht – nur ohne die störende Kamera.

Bisherige Lösungen drehen lediglich die Augen zur Kamera – und zwar ständig, auch wenn der Gesprächspartner eigentlich den Blick abwendet. Das schafft zwar Blickkontakt, dieser ist allerdings sehr unnatürlich. Casablanca ist hingegen in der Lage, das ganze Gesicht zu verarbeiten. Dadurch wird der Kopf im idealen Winkel ausgerichtet und die KI erlaubt es auch, bewusst in eine andere Richtung zu schauen. Augenkontakt entsteht dadurch genau so, wie er auch im analogen Gespräch entstehen würde.

Natürliche Mimik dank Künstlicher Intelligenz

In Casablanca stecken verschiedene Technologien: Einerseits erzeugt die KI ein 3D-Abbild des Kopfes mit einem eigens entwickelten Deep-Learning-Verfahren. Ergänzend wird ein um zusätzliche Diskriminatoren erweitertes GAN (Generative Adversarial Network) eingesetzt, um fehlende Bildteile zu ergänzen. So kann beispielsweise der Hals rekonstruiert werden, wenn die Kamera diesen nicht erfassen kann. Erst diese Kombination ermöglicht die realistische Ausrichtung des Kopfes, natürlichen Blickkontakt und authentische Mimik. Andererseits sorgen neue Interpolationsverfahren dafür, dass Casablanca weniger Daten behandeln muss, um die Bilddrehung zu vollziehen – das sichert eine flüssige Anwendung in Echtzeit.

Die Lösung lässt sich mit allen Videocall-Systemen anwenden, denn es wird tatsächlich als (virtuelle) Kamera installiert, obwohl es reine Software ist. Man wählt dann in Zoom, Teams usw. statt der „Front Camera“ einfach die „Casablanca Camera“ aus. Edie Software benötigt allerdings auf Windows-Notebooks eine Grafikkarte für die KI-Berechnungen. Auf einem Mac mit M1 oder M2 Prozessor läuft die Software problemlos, da diese Prozessoren bereits die erforderliche KI-Rechenleistung mitbringen. Casablanca ist derzeit im Beta-Stadium, man kann sich kostenlos registrieren und die Beta-Version in allen Videocalls nutzen.

Roger Homrich

Recent Posts

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

15 Stunden ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

1 Tag ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

2 Tagen ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

2 Tagen ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

2 Tagen ago

Hacker missbrauchen Google Calendar zum Angriff auf Postfächer

Security-Experten von Check Point sind einer neuen Angriffsart auf die Spur gekommen, die E-Mail-Schutzmaßnahmen umgehen…

3 Tagen ago