Google hat gestern das US-Patent mit der laufenden Nummer 8.254.699 zugesprochen bekommen, wie Engadget berichtet. Es beschreibt eine Technik, die in einem Video gezeigten Gegenstände zu erkennen – auch ohne dass ein Anwender sie als Tag angibt.
„Automatische und umfassende Objekterkennung in Videos“ lautet die Überschrift des Patentantrags. Die Technik soll mit einer „Objektnamen-Sammlung“ arbeiten, die mindestens 50.000 Begriffe umfasst. Als Beispiele nennt Google „Stuhl“ und auch „Hund“.
„Konventionelle Systeme sind von direkten Eingaben durch einen Menschen angewiesen“, um einen im Video erscheinenden Hund als Hund zu benennen, heißt es im Antrag von 2009. „Solche menschlichen Eingaben sind teuer, zeitaufwändig und nicht für große Datenmengen skalierbar, die hunderttausende Objekte und Millionen Bilder umfassen.“
Um Namen und Objekte miteinander abzugleichen, beschreibt Google gleich mehrere Ansätze. So könnte der Gegenstand durch „Vektoren“ definiert sein, worunter Eigenschaften wie Farbe, Bewegung, Umriss und Textur zu verstehen sind. Ein Algorithmus würde dann bestimmen, ob die Vektoren von Muster und tatsächlicher Repräsentation sich ausreichend decken. Alternativ ließe sich neues Material mit bereits getaggten Inhalten vergleichen – zum Beispiel mit YouTube-Videos oder Bildern aus Google Image Search.
Die Anwendung des Konzepts scheint klar: Es ist dafür gedacht, YouTube-Videos automatisch zu taggen. Der Antrag lässt aber keine Schlüsse zu, wie nahe Google einer tatsächlichen Umsetzung ist. Die Funktion würde nicht nur den Anwendern das Leben erleichtern, sondern vor allem die Suchmöglichkeiten bei YouTube deutlich verbessern.
[mit Material von Don Reisinger, News.com]
Tipp: Wie gut kennen Sie Google? Testen Sie Ihr Wissen – mit dem Quiz auf silicon.de.
Copilot wird stärker in Microsoft 365 integriert. Neue Funktionen stehen unter anderem für Excel, Outlook,…
Schwachstelle weist laut Tenable auf schwerwiegende Sicherheitslücke in Google Cloud Diensten hin, insbesondere App Engine,…
Die neue Version kommt mit einem Supportzeitraum von fünf Jahren. Währenddessen erhält Office LTSC 2024…
Sie führen unter Umständen zur Preisgabe vertraulicher Informationen oder gar zu einem Systemabsturz. Apples KI-Dienste…
Das Projekt liegt wahrscheinlich für rund zwei Jahre auf Eis. Aus der Fertigungssparte Intel Foundry…
Der Sicherheitscheck entzieht unsicheren Websites automatisch alle Berechtigungen. Zudem können Nutzer in Chrome künftig Websites…