Categories: Cloud

Google macht öffentliche Beta seiner Cloud Vision API verfügbar

Google hat eine öffentliche Betaphase für seine im Dezember vorgestellte Cloud Vision API gestartet. Ab sofort kann jedermann die Programmierschnittstelle zur Bilderkennung einsetzen. Zuvor stand sie nur im Rahmen einer eingeschränkten Vorschau zur Verfügung.

Entwickler können die API verwenden, um auf maschinellem Lernen basierende Bilderkennung in ihre Anwendungen zu integrieren. Das System soll sowohl Alltagsgegenstände erkennen als auch Text innerhalb eines Bildes lesen oder Produktlogos identifizieren können.

Mittels der Cloud Vision API werden Bilder in tausende Kategorien klassifiziert, um etwa Emotionen in Gesichtern abzulesen oder geschriebenen Text in verschiedenen Sprachen zu erkennen. Daraus ergeben sich Google zufolge beispielsweise neue Marketing-Möglichkeiten. Die Cloud Vision API soll sich auch einsetzen lassen, um Metadaten für einen Bilderkatalog zu realisieren oder Verstöße gegen Nutzungsrichtlinien zu ermitteln.

In der jetzt verfügbar gemachten Betaversion wurde laut Produktmanager Ram Ramanathan die Farberkennung nochmals verbessert. Zudem muss eine Anfrage über die API nicht mehr das Bild enthalten, sondern dieses kann jetzt auch in der Google-Cloud gespeichert sein.

Googles Cloud Vision kann beispielsweise Gemütszustände aus einem abgebildeten Gesicht ablesen oder Text in verschiedenen Sprachen erkennen (Bild: Google).

Inzwischen stehen auch die Preise für die Nutzung der Cloud Vision API fest, die ab 1. März in Kraft treten. Beispielsweise verlangt Google für die Produktlogoerkennung mindestens 2 Dollar je 1000 Bilder pro Monat, während die Texterkennung bei gleicher Bildermenge mindestens 0,60 Dollar kostet. Bis zu 1000 Anfragen pro Monat sind gratis. Werden für ein Bild mehrere Anfragen gemacht, also etwa Logo- und Gesichtserkennung, addieren sich die Preise der jeweiligen Erkennungstypen.

Programmierer können einen oder mehrere Typen Anmerkungen zu ihren Bildern anfordern. Google unterscheidet sechs dieser Typen. Label Detection ermittelt das zentrale Objekt auf einem Bild – etwa eine Katze oder ein Auto. Optical Character Recognition sucht nach Texten auf dem Bild und versucht, diese zu verstehen. Der dritte Typ ist Facial Detection, also Gesichtserkennung, bei der aber nur geprüft wird, ob ein Gesicht im Bild auftaucht und ob sich daraus einer von acht Gemütszuständen wie Freude oder Sorge ablesen lässt.

Wie KMUs durch den Einsatz von Virtualisierung Kosten sparen und die Effizienz steigern

Das Webinar “Wie KMUs durch den Einsatz von Virtualisierung Kosten sparen und die Effizienz steigern” informiert Sie über die Vorteile von Virtualisierung und skizziert die technischen Grundlagen, die für eine erfolgreiche Implementierung nötig sind. Jetzt registrieren und Aufzeichnung ansehen.

... zur Anmeldung.

Landmark Detection identifiziert bekannte Natur- sowie Baudenkmäler und liefert den genauen Standort mit geografischer Länge und Breite. Die Logoerkennung stellt fest, ob ein Bild ein Firmenlogo enthält und zu welcher Marke dieses gehört. Und Safe Search Detection dient der Ermittlung anstößiger Inhalte.

Im Rahmen der Betaphase steht Nutzern ein Kontingent von bis zu 20 Millionen Bildern pro Monat zur Verfügung. Aufgrund dieser Einschränkung sollte Cloud Vision laut Google nicht für geschäftskritische Echtzeit-Anwendungen eingesetzt werden.

Eine Dokumentation mit Beispielen und Tutorials für den Einsatz der API unter Python und Java findet sich auf der Cloud-Platform-Website. Dort stellt Google auch Beispielcode für Android- und iOS-Anwendungen bereit.

[mit Material von Natalie Gagliordi, ZDNet.com]

Tipp: Sind Sie ein Fachmann in Sachen Cloud Computing? Testen Sie Ihr Wissen – mit dem Quiz auf silicon.de.

ZDNet.de Redaktion

NextHP klagt wegen Patentverletzungen gegen Memjet »

Previous « Qualcomm und Lenovo schließen Patentabkommen

Published by

ZDNet.de Redaktion

Tags: AnwendungsentwicklungCloud-ComputingWebentwicklung

9 Jahren ago

Januar-Patchday: Google stopft kritische Löcher in Android

Ohne Rechteausweitung ist eine Remotecodeausführung möglich. Betroffen sind alle unterstützten Android-Versionen inklusive Android 15.

15 Stunden ago

Firefox 134 schließt schwerwiegende Sicherheitslücken

Sie erlauben unter Umständen das Einschleusen und Ausführen von Schadcode aus der Ferne. Neu ist…

15 Stunden ago

Samsung meldet Umsatz- und Gewinnanstieg im vierten Quartal

Das Ergebnis bleibt hinter den Erwartungen von Analysten zurück. Offenbar belasten fallende Preise für Speicherchips…

24 Stunden ago

Halbleiter

Gartner: Markt für KI-Chips wächst 2025 voraussichtlich um 37 Prozent

Der Umsatz steigt im laufenden Jahr auf 115 Milliarden Dollar. Der größte Teil davon entfällt…

2 Tagen ago

Cybersicherheit

Hackerangriff auf US-Finanzministerium

Die Hintermänner sollen eine Verbindung nach China haben. Als Einfallstor dienen Schwachstellen in einer Remote-Support-Software…

2 Tagen ago

OT-Systeme entwickeln sich zunehmend zum Einfallstor für Cyberangriffe

Sophos-Studie: Mehrheit glaubt, dass OT-Systeme auch in Zukunft beliebte Ziele für Cyberangriffe sein werden, insbesondere…

2 Tagen ago

Google macht öffentliche Beta seiner Cloud Vision API verfügbar

Wie KMUs durch den Einsatz von Virtualisierung Kosten sparen und die Effizienz steigern

Related Post

Recent Posts

Januar-Patchday: Google stopft kritische Löcher in Android

Firefox 134 schließt schwerwiegende Sicherheitslücken

Samsung meldet Umsatz- und Gewinnanstieg im vierten Quartal

Gartner: Markt für KI-Chips wächst 2025 voraussichtlich um 37 Prozent

Hackerangriff auf US-Finanzministerium

OT-Systeme entwickeln sich zunehmend zum Einfallstor für Cyberangriffe