Googles Bilderkennungssoftware Lens erkennt inzwischen über eine Milliarde Objekte. Diesen Fortschritt teilte Aparna Chennapragada, VP Google Lens & AR im Rahmen eines Blogbeitrags mit. Ihr zufolge erkannte Lens zur Vorstellung vor etwa einem Jahr nur gut 250 Millionen Objekte.
Laut Chennapragada sind die enormen Fortschritte durch die Lesefähigkeit von Lens zustande gekommen. Dies hat Google realisiert, indem es eine benutzerdefinierte OCR-Engine (Optical Character Recognition) mit seinen Sprachkenntnissen aus der Suche und seinem Knowledge Graph kombinierte.
Dank der OCR-Engine und des Trainings ist Lens sehr gut im Lesen von Produktetiketten und anderen Texten geworden, was ihm hilft, über eine Milliarde Produkte zu identifizieren. Um beispielsweise zwischen dem Buchstaben „o“ und einer Null zu unterscheiden, stützt er sich auf Rechtschreibkorrekturmodelle der Google-Suche.
„Wenn Computer anfangen zu sehen, wie wir es tun, wird die Kamera zu einer leistungsstarken und intuitiven Schnittstelle für die Welt um uns herum werden; ein KI-Sucher, der die Antworten genau dort findet, wo die Fragen die Richtungen direkt auf den Straßen überlagern, die wir gerade betreten, die Produkte, nach denen wir suchen, in den Verkaufsregalen hervorheben oder sofort jedes Wort vor uns in einer fremden Stadt übersetzen. Wir werden in der Lage sein, unsere Rechnungen zu bezahlen, unsere Parkuhren zu füttern und mehr über fast alles um uns herum zu erfahren, indem wir einfach die Kamera darauf ausrichten“, sagt Chennapragada.
Mit Bixby Vision bietet Samsung eine ähnliche Technik für seine Galaxy-Smartphones. Dort steht die Funktion in der Galerie- und Kamera-App zur Verfügung. Auf den Samsung-Geräten lässt sich aber auch Google Lens nutzen.
Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…
Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.
2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…
Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…
NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.
Latrodectus, auch bekannt als BlackWidow, ist auch unter dem Namen LUNAR SPIDER bekannt.