Corona is back in town. Nach Monaten der ersten Lockerungen und Unbeschwertheit ist es nun in aller Munde: steigende Inzidenzen, sich füllende Intensivstationen, unsichere Politiker und eine Gesellschaft in Unruhe. Die Lösungen: Teillockdown, Vorteile für Geimpfte und Genesene, Impfflicht. Die Einstellungen dazu bleiben gespalten und sind nicht Thema dieses Beitrags. Doch eins ist ganz klar: Vorsicht ist geboten. Somit stellt sich nicht nur für Beratungsfirmen und Dienstleister die Frage der Remote-Arbeit, sondern auch für viele weitere Unternehmen: Sollte mobiles Arbeiten und Homeoffice wieder verstärkt eingesetzt werden? Bereits erprobte Videokonferenz-Tools würden dann voraussichtlich einen erneuten Anstieg der Nutzung erhalten. Welche Learnings können aus der Vergangenheit mitgenommen werden und so die Zukunft noch digitaler und smarter gestalten?
Eine große, wenn nicht sogar die größte, Herausforderung bei Online-Veranstaltungen mittels Webkonferenzsystemen ist der Verlust der Aufmerksamkeit der Teilnehmenden. Dieser Fokusverlust hat negative Auswirkungen auf die Effizienz der Besprechung und demzufolge auch auf den weiteren Durchführungserfolg von Aufgaben oder Projekten. Daher werden technologische Innovationen benötigt, die mangelnde Aufmerksamkeit erkennen und mittels onlinebasierter Interventionsmöglichkeiten den Fokus des Besprechungsteilnehmers schnellstmöglich wieder auf die Inhalte des Vortrags/ der Besprechung lenken. So kann ein Bewusstsein für das eigene Verhalten geschaffen und die Teilnehmenden in ihrer Selbstregulation unterstützt werden. Dies wiederum führt zu einer höheren intrinsischen Motivation sowie Verantwortungsbereitschaft in Bezug auf die eigene Aufmerksamkeit und das eigene Handeln. Die vorgestellte Projektidee bietet ein Beispiel, wie ein mögliches System mittels maschineller Lernverfahren Signale der Unaufmerksamkeit anhand von Kopfposition sowie Gesichts- und Augenmerkmalen identifizieren kann. Das System soll den Zuhörern sowie den Sprechern ein unmittelbares Feedback geben (z.B. via Pop-up-Nachrichten), um den Prozess der virtuellen Zusammenarbeit effektiver und gegebenenfalls interaktiver zu gestalten.
Nicht nur Daten generieren, sondern auch gewinnbringend nutzen
Die Bestimmung der Aufmerksamkeit durch Eye- oder Head-Tracking ist ein aktives Forschungsfeld der Mensch-Computer-Interaktion. Sowohl Eye- als auch Head-Tracking erfolgt auf Basis von Bilddaten, sodass Videotelefonie hier einen guten Anknüpfungspunkt für weitere Forschung darstellt. Der Fokus visueller Aufmerksamkeit kann dort nämlich durch z.B. die Messung der Kopfhaltung und des Blicks bestimmt werden. Nach einer Gesichts- und Augenerkennung des Teilnehmers könnten Merkmale der Kopfposition, des Augenzustands und der Augenbewegen genutzt werden um bewährte Verfahren des Eye- und Headtrackings sowie das PERcentage of eye CLOsure (PERCLOS) anzuwenden. Bei letzterem handelt es sich um ein Schläfrigkeitsmaß, das auch zur Erfassung der Müdigkeit bei Autofahrern verwendet wird.
Mittels Feature-Extraktion können so relevante Daten ermittelt und zusammengeführt werden, um diese als gemeinsamen Input in ein Trainingsmodell für die Klassifikation der Bilder in „unaufmerksam“ oder „aufmerksam“ zu geben. Die Klassifizierung könnte mittels der Support Vector Machine (SVM), Gradient Boosting, Random Forests oder auch Neuronalen Netzen erfolgen.
Langfristig könnte das System nicht nur auf Basis von Videodaten die Aufmerksamkeit messen, sondern auch diverse weitere Daten von Input-Devices – beispielsweise Tastatur, Maus oder Mikrofon – in das System und dessen Aufmerksamkeitsdetektion einfließen lassen. Im Falle des Mikrofons können Hintergrundgeräusche der Teilnehmenden analysiert werden. Eine laute Umgebung kann zum Beispiel nachweislich zu Konzentrationsschwierigkeiten und verminderter Arbeitsleistung führen. Daher wäre es denkbar, dass ein hoher Geräuschpegel als weitere Einflussvariable genutzt werden kann. Des Weiteren wäre eine Erweiterung des Datenpools durch Fitness-Tracker und Smartwatches denkbar.
Nichts geht ohne Herausforderungen
Um einen möglichst großen Datensatz zu erhalten, müssten zunächst sehr viele Videodaten generiert werden – ein sehr umfangreiches und zeitaufwändiges Unterfangen. Sind die Daten einmal vorhanden, stellt sich die darauffolgende Frage, wie das Labeling beschleunigt werden könnte. Dabei könnten heuristische Funktionen, basierend auf den Inputs des Head- und Eye-Trackings, passende Szenen der Unaufmerksamkeit in den Videos suchen, zum Beispiel: Wann sind die Augen geschlossen? Wann sieht eine Person weg?
Eine weitere, höchst relevante Herausforderung ist der Datenschutz. Da die Daten standort- aber vor allem personenbezogene Informationen enthalten, muss ein großer Fokus auf diesen gelegt werden. Die sensiblen Daten geben zwar Informationen über das Verhalten in der Konferenz, allerdings sollte eine Überwachung und automatisierte Leistungskontrolle der Teilnehmenden verhindert bzw. gänzlich ausgeschlossen werden können. Dies könnte erreicht werden, indem die Video- und Audiodaten verschlüsselt gesichert und nicht mit personenbezogenen Informationen verknüpft werden. Für die nachträgliche Analyse sollten die Daten weiterhin in anonymisierter Form bereitgestellt werden, sodass keine Rückschlüsse auf den eigentlichen Nutzer möglich sind.
Durch die Mustererkennung in Bilddaten rückt ein weiteres Thema in den Vordergrund: die KI-Ethik. Das System lernt auf vorhandenen Trainingsdaten und trifft Entscheidungen, ob beispielsweise der Sprecher vor sinkender Aufmerksamkeit der Zuhörenden gewarnt wird. Das Problem hierbei: verzerrte (biased) Datensätze und darauf aufbauende Algorithmen können Personen bzw. ganze Nutzergruppen ausschließen oder diskriminieren. Doch die Verantwortung für Fairness und Gleichberechtigung liegt nicht bei den Algorithmen selbst, da sie weder menschliche Werte vertreten, noch wie ein Mensch denken können. Sie werden lediglich auf die Erledigung einer Aufgabe, in diesem Fall die Aufmerksamkeitserkennung aus zur Verfügung gestellten Bild-/ Videodaten, trainiert. Somit muss bereits bei den Inputdaten auf Diversität geachtet werden. Außerdem würden eindeutig nachvollziehbare Algorithmen, die Black-Box-Vorgänge vermeiden, die Klassifizierung transparent machen. Somit könnte das System im Falle einer Ungleichberechtigung analysiert und verbessert werden.
Ohne Vertrauen in die sichere Datenverarbeitung geht nichts
Zusammenfassend lässt sich sagen, dass aufgrund der Sensibilität der Daten große Achtsamkeit bei der Entwicklung eines solchen Systems geboten sein sollte. Bereits im Voraus sollten die oben genannten kritischen Punkte aufgegriffen und durch passende Maßnahmen angegangen werden. Nur durch Vertrauen der Nutzer in die Souveränität der eigenen Daten könnte ein solches System Erfolg haben und einen echten Mehrwert bieten. Es könnte nicht nur die Kommunikation im Homeoffice bzw. zwischen räumlich getrennten Standorten verbessern, sondern durch verbessertes Selbstmanagement auch das individuelle Wohlbefinden steigern. Das System würde zu einer verbesserten Balance von Belastung und Pausen führen, da gezielt analysiert würde, wie hoch die Aufmerksamkeitsspanne der Teilnehmenden ist. Langfristig kann dies durch Belastungsreduktion zu einem höheren Grad an psychischem Wohlbefinden am Arbeitsplatz oder auch allgemein führen. Aus Unternehmenssicht wäre ein Einsatz eines solchen Systems somit vor allem unter dem Aspekt des betrieblichen Gesundheitsmanagements (Stichwort: Prävention) zu eruieren. Mit einer erhöhten Konzentration würden in Videokonferenzen mehr Inhalte aufgenommen und verarbeiten werden können, was in einer Effizienzsteigerung von Onlinekonferenzen resultieren würde. Zu guter Letzt sollen Sprechende frühzeitig via Pop-up-Nachrichten hinsichtlich eines niedrigen Levels an Aufmerksamkeit informiert und mittels vorgeschlagener Übungen oder gezielter Fragen zu mehr Interaktion mit den Zuhörenden motiviert werden. Aber auch individuelles Feedback für Teilnehmende könnte zur Lenkung der Aufmerksamkeit auf das Meeting beitragen. Ein abschließender Bericht könnte der Optimierung dienen, da so beide Seiten wertvolles Feedback erhalten würden, welches zu einer Verbesserung der Selbstwahrnehmung und Regulation beitragen würde.
Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…
Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.
2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…
Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…
NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.
Latrodectus, auch bekannt als BlackWidow, ist auch unter dem Namen LUNAR SPIDER bekannt.