Categories: Cloud

Google stellt Entwicklern Bilderkennungs-API bereit

Google hat in einem Blog eine Cloud Vision API vorgestellt. Sie macht Entwicklern eine Bilderkennungsfunktion in der Cloud verfügbar und unterscheidet Google zufolge dabei zwischen Tausenden Kategorien wie „Boot“, Löwe“ oder auch „Eiffelturm“, erkennt die Emotion hinter einem Gesichtsausdruck und auch Wörter in zahlreichen Sprachen.

Google-Produktmanager Ram Ramanathan legt nahe, damit ließen sich Metadaten für einen Bilderkatalog realisieren, Verstöße gegen Nutzungsrichtlinien ermitteln oder durch Analyse von Gefühlsausdrücken neue Marketing-Möglichkeiten schaffen. Eine Anfrage über die API muss derzeit das Bild beinhalten. Künftig will Google aber auch die Möglichkeit abdecken, dass Bilder bereits in seiner Cloud gespeichert sind.

Programmierer können einen oder mehrere Typen Anmerkungen zu ihren Bildern anfordern. Google unterscheidet sechs dieser Typen. Label/Entity Detection ermittelt das zentrale Objekt auf einem Bild – etwa eine Katze oder ein Auto. Optical Character Recognition sucht nach Texten auf dem Bild und versucht, diese zu verstehen.

Der dritte Typ heißt Safe Search Detection und dient der Ermittlung anstößiger Inhalte. Hier wird Google nicht konkret und sagt nur, unangemessener Content werde mit seinem SafeSearch-Algorithmus enttarnt.

Facial Detection, also Gesichtserkennung, ist der vierte Typ. Google weist darauf hin, dass es sich nicht um eine Wiedererkennung oder Identifikation handelt. Vielmehr prüfen seine Algorithmen nur, ob überhaupt ein Gesicht im Bild präsent ist, wo sich wesentliche Merkmale wie Auge, Nase und Mund befinden und auch, ob sich einer von acht Gemütszuständen wie Freude oder Sorge zuordnen lässt. Zudem werden keine Resultate auf Google-Servern gespeichert.

Außerdem steht Landmark Detection zur Verfügung, die bekannte Natur- und Baudenkmäler identifiziert. Der Entwickler bekommt mit dem Ergebnis auch den genauen Standort mit geografischer Länge und Breite geliefert. Sechstens prüft eine Logo-Erkennung, ob sich Logos im Bild befinden und welchen Marken sie gehören.

Die Cloud-Erkennung steht derzeit im Rahmen einer eingeschränkten Vorschau zur Verfügung. Als ersten externen Tester führt Google Aerosense ins Feld, eine Tochter von Sony Mobile. Sie wertet mit den Google-Algorithmen Drohnenbilder in großer Zahl automatisch aus.

Zudem hat Google aus einem Raspberry Pi und Lego-Bausteinen einen Roboter erstellt, den es GoPiGo nennt. Er fährt durch die Gegend und sendet Bilder seiner Kamera mittels Python-Script an die Cloud Vision API, wie ein Youtube-Video zeigt.

Tipp: Wie gut kennen Sie Google? Testen Sie Ihr Wissen – mit dem Quiz auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

NextMicrosoft startet Vorschau auf Azure Container Service »

Previous « Abodienst: Youtube will angeblich Spielfilme und Fernsehserien lizenzieren

Published by

Florian Kalenda

Tags: AnwendungsentwicklungCloud-ComputingKamera

9 Jahren ago

Digitalisierung

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

1 Woche ago

Google stellt Entwicklern Bilderkennungs-API bereit

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Google stellt Entwicklern Bilderkennungs-API bereit

Related Post

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch