Google hat gestern das US-Patent mit der laufenden Nummer 8.254.699 zugesprochen bekommen, wie Engadget berichtet. Es beschreibt eine Technik, die in einem Video gezeigten Gegenstände zu erkennen – auch ohne dass ein Anwender sie als Tag angibt.
„Automatische und umfassende Objekterkennung in Videos“ lautet die Überschrift des Patentantrags. Die Technik soll mit einer „Objektnamen-Sammlung“ arbeiten, die mindestens 50.000 Begriffe umfasst. Als Beispiele nennt Google „Stuhl“ und auch „Hund“.
„Konventionelle Systeme sind von direkten Eingaben durch einen Menschen angewiesen“, um einen im Video erscheinenden Hund als Hund zu benennen, heißt es im Antrag von 2009. „Solche menschlichen Eingaben sind teuer, zeitaufwändig und nicht für große Datenmengen skalierbar, die hunderttausende Objekte und Millionen Bilder umfassen.“
Um Namen und Objekte miteinander abzugleichen, beschreibt Google gleich mehrere Ansätze. So könnte der Gegenstand durch „Vektoren“ definiert sein, worunter Eigenschaften wie Farbe, Bewegung, Umriss und Textur zu verstehen sind. Ein Algorithmus würde dann bestimmen, ob die Vektoren von Muster und tatsächlicher Repräsentation sich ausreichend decken. Alternativ ließe sich neues Material mit bereits getaggten Inhalten vergleichen – zum Beispiel mit YouTube-Videos oder Bildern aus Google Image Search.
Die Anwendung des Konzepts scheint klar: Es ist dafür gedacht, YouTube-Videos automatisch zu taggen. Der Antrag lässt aber keine Schlüsse zu, wie nahe Google einer tatsächlichen Umsetzung ist. Die Funktion würde nicht nur den Anwendern das Leben erleichtern, sondern vor allem die Suchmöglichkeiten bei YouTube deutlich verbessern.
[mit Material von Don Reisinger, News.com]
Tipp: Wie gut kennen Sie Google? Testen Sie Ihr Wissen – mit dem Quiz auf silicon.de.
Ransomware-Angriff auf die KI-gesteuerte Lieferkettenplattform Blue Yonder hat weitreichende Auswirkungen.
Seit Ende September ist sie also verfügbar: die Apple Watch 10. Auch in Deutschland kann…
ISG sieht engere Vernetzung zwischen Hyperscaler, IT-Partnern und Endkunden. Treiber ist das Zusammenspiel von KI…
Mit dem Tool können Unternehmen KI-Agenten mithilfe synthetisch generierter Daten testen, um präzise Antworten und…
Kostengünstiger Mini-PC mit AMD Ryzen 7 5825U-Prozessor, 16 GB Arbeitsspeicher (RAM) und 512 GB SSD.
Bösartige QR-Codes, die per E-Mail versendet werden, eignen sich sehr gut, um Spam-Filter zu umgehen.