Categories: Innovation

Google Lens erkennt über eine Milliarde Objekte

Googles Bilderkennungssoftware Lens erkennt inzwischen über eine Milliarde Objekte. Diesen Fortschritt teilte Aparna Chennapragada, VP Google Lens & AR im Rahmen eines Blogbeitrags mit. Ihr zufolge erkannte Lens zur Vorstellung vor etwa einem Jahr nur gut 250 Millionen Objekte.

Laut Chennapragada sind die enormen Fortschritte durch die Lesefähigkeit von Lens zustande gekommen. Dies hat Google realisiert, indem es eine benutzerdefinierte OCR-Engine (Optical Character Recognition) mit seinen Sprachkenntnissen aus der Suche und seinem Knowledge Graph kombinierte.

Dank der OCR-Engine und des Trainings ist Lens sehr gut im Lesen von Produktetiketten und anderen Texten geworden, was ihm hilft, über eine Milliarde Produkte zu identifizieren. Um beispielsweise zwischen dem Buchstaben „o“ und einer Null zu unterscheiden, stützt er sich auf Rechtschreibkorrekturmodelle der Google-Suche.

„Wenn Computer anfangen zu sehen, wie wir es tun, wird die Kamera zu einer leistungsstarken und intuitiven Schnittstelle für die Welt um uns herum werden; ein KI-Sucher, der die Antworten genau dort findet, wo die Fragen die Richtungen direkt auf den Straßen überlagern, die wir gerade betreten, die Produkte, nach denen wir suchen, in den Verkaufsregalen hervorheben oder sofort jedes Wort vor uns in einer fremden Stadt übersetzen. Wir werden in der Lage sein, unsere Rechnungen zu bezahlen, unsere Parkuhren zu füttern und mehr über fast alles um uns herum zu erfahren, indem wir einfach die Kamera darauf ausrichten“, sagt Chennapragada.

Mit Bixby Vision bietet Samsung eine ähnliche Technik für seine Galaxy-Smartphones. Dort steht die Funktion in der Galerie- und Kamera-App zur Verfügung. Auf den Samsung-Geräten lässt sich aber auch Google Lens nutzen.

Kai Schmerer

Kai ist seit 2000 Mitglied der ZDNet-Redaktion, wo er zunächst den Bereich TechExpert leitete und 2005 zum Stellvertretenden Chefredakteur befördert wurde. Als Chefredakteur von ZDNet.de ist er seit 2008 tätig.

Recent Posts

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

17 Stunden ago

GenKI im Job: Mitarbeitende schaffen Tatsachen

Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.

19 Stunden ago

97 Prozent der Großunternehmen melden Cyber-Vorfälle

2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…

20 Stunden ago

„Pacific Rim“-Report: riesiges, gegnerisches Angriffs-Ökosystem

Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…

23 Stunden ago

DeepL setzt erstmals auf NVIDIA DGX SuperPOD mit DGX GB200-Systemen

NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.

23 Stunden ago

Latrodectus: Gefährlicher Nachfolger von IcedID

Latrodectus, auch bekannt als BlackWidow, ist auch unter dem Namen LUNAR SPIDER bekannt.

24 Stunden ago