Facebook kündigt Automatic Alternative Text an

Facebook hat damit begonnen, automatisch Alternativtexte zu Fotos zu erstellen. Blinde und sehbehinderte Webnutzer erhalten somit eine Beschreibung des Bildinhalts, die von einer Künstlichen Intelligenz kommt.

Die Technik steht zunächst in der iOS-App für Bildschirm-Vorleseprogramme in englischer Sprache zur Verfügung. Andere Sprachen und Plattformen will Facebook bald nachziehen. Es schreibt einschränkend, es handle sich um eine junge Technik, aber um einen wichtigen Schritt, um auch Sehbehinderten Eindrücke von Fotos zu vermitteln.

Als Beispiel für eine aktuelle Ansage zitiert Facebook seine Erkennungsautomatik: „Das Bild enthält wahrscheinlich: drei Personen, lächelnd, im Freien.“ Die Eingangsformulierung ist immer gleich und weist darauf hin, dass die Erkennung noch keineswegs perfekt arbeitet. Bisher hätten Lese-Assistenten aber nur die Anmerkung „Foto“ machen können. Ob dies Sehbehinderten einen ähnlichen „Genuß“ verschaffen kann wie das Ansehen des eigentlichen Bildes, was Facebooks erklärtes Ziel ist, sei dahingestellt – es belegt aber eindrucksvoll Facebooks Fortschritte im Bereich Künstlicher Intelligenz.

Im Hintergrund arbeitet eine Objekterkennungstechnik an der Bildanalyse. Die Beschreibung verpackt Facebook einfach ins alt-Attribut des HTML-Bildercodes, verwendet also einen W3C-Webstandard, um mit Vorlesegeräten zu kommunizieren. Die Entwicklung hat nach seinen Angaben zehn Monate gedauert. Die Erkennung werde in einem neuronalen Netz durchgeführt. Sie verwende „Milliarden Parameter und wird mit Millionen Beispielen trainiert.“

Whitepaper

Studie zu Filesharing im Unternehmen: Kollaboration im sicheren und skalierbaren Umfeld

Im Rahmen der von techconsult im Auftrag von ownCloud und IBM durchgeführten Studie wurde das Filesharing in deutschen Unternehmen ab 500 Mitarbeitern im Kontext organisatorischer, technischer und sicherheitsrelevanter Aspekte untersucht, um gegenwärtige Zustände, Bedürfnisse und Optimierungspotentiale aufzuzeigen. Jetzt herunterladen!

Zunächst beschränkt sich das System dennoch auf nur 100 Konzepte. Dazu zählen das Aussehen oder den Ausdruck schildernde, etwa Baby, Bart oder lächelnd, und das Gesamtbild beschreibende Konzepte wie Natur, Fortbewegung, Sport und Essen. Nach der Eingangsformulierung werden immer zuerst erkannte Personen geschildert, gefolgt von Objekten, und zum Schluss die Szenerie.

Mit typischem Omnipräsenzanspruch schreibt Facebook, es gebe weltweit 39 Millionen Blinde und 246 Millionen stark Sehbehinderte – ihnen wolle man helfen, an Diskussionen um Fotos teilzuhaben. Bei einer Studie der Universität Cornell habe ein blinder Teilnehmer schon kritisch angemerkt, bei Facebook gehe es doch vor allem um Fotos.

[mit Material von Liam Tung, ZDNet.com]

Tipp: Sind Sie ein Facebook-Experte? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

18 Stunden ago

GenKI im Job: Mitarbeitende schaffen Tatsachen

Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.

20 Stunden ago

97 Prozent der Großunternehmen melden Cyber-Vorfälle

2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…

20 Stunden ago

„Pacific Rim“-Report: riesiges, gegnerisches Angriffs-Ökosystem

Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…

23 Stunden ago

DeepL setzt erstmals auf NVIDIA DGX SuperPOD mit DGX GB200-Systemen

NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.

24 Stunden ago

Latrodectus: Gefährlicher Nachfolger von IcedID

Latrodectus, auch bekannt als BlackWidow, ist auch unter dem Namen LUNAR SPIDER bekannt.

24 Stunden ago