Erfinder und Programmierer Stephen Wolfram hat mit dem Wolfram Language Image Identification Project sein jüngstes Projekt gestartet. Es hat zum Ziel, mittels Computeranalyse Bildinhalte zu identifizieren und anschließend passende Zusatzinformationen bereitzustellen. Technische Basis ist die neue Funktion ImageIdentify der Programmiersprache Wolfram Language, die Antworten auf die Frage liefert „Was zeigt dieses Bild“.
Die Projektwebsite stellt einige Beispielbilder bereit, die Nutzer im Browser mit der Maus an den vorgesehenen Platz ziehen können, um sich zusätzliche Informationen dazu anzeigen zu lassen. Alternativ kann man auch eigene Fotos auswählen und hochladen. Auf diese Weise hat man beispielsweise bei einem Spaziergang die Möglichkeit, mit dem Smartphone eine Pflanze oder Blume zu fotografieren und sie durch das Wolfram Language Image Identification Project bestimmen zu lassen.
Zum Start ist das kostenlose Online-Tool angeblich in der Lage, mehr als 10.000 alltägliche Objekte zu identifizieren. Mit der Zeit soll es dank Nutzer-Feedback immer bessere Resultate liefern. Wie Stephen Wolfram in einem Blogbeitrag aber betont, arbeitet es derzeit noch nicht in allen Bereichen zuverlässig. So könne es keine abstrakte Kunst, bestimmte Personen oder ausgefallene Objekte abseits von Alltagsgegenständen erkennen.
„Es liegt nicht immer richtig, aber meist schlägt es sich meines Erachtens ausgesprochen gut“, schreibt Wolfram. „Und was für mich besonders faszinierend ist: Wenn es etwas falsch macht, erscheinen seine Fehler meist bemerkenswert menschlich.“ Einige lustige Beispiele aus internen Test listet Wolfram in seinem Blogeintrag auf. So identifizierte ImageIdentify etwa eine Mondlandefähre als Betonmischer oder die Star-Wars-Figur Chewbacca als Jagdhund.
Generell sei das Wolfram Language Image Identification Project ein schönes, praktisches Beispiel für künstliche Intelligenz, so Wolfram weiter. „Für mich ist aber noch viel wichtiger, dass wir einen Punkt erreicht haben, an dem wir diese Art von ‚KI-Berechnung‘ direkt in die Wolfram Language integrieren können – um sie als neuen, leistungsfähigen Baustein für wissensbasierte Programmierung zu nutzen.“
Google hat mit Goggles ebenfalls schon eine App für visuelle Suche entwickelt, die Nutzern dabei hilft, Landschaften, Gemälde und andere Dinge auf Bildern zu identifizieren. Das Wolfram-Tool geht aber noch darüber hinaus. Da Entwickler mit der Wolfram Language Anwendungen erstellen können, dürfte es auch bald Apps mit dieser Funktionalität geben, so dass man dafür nicht mehr zwingend die Website nutzen muss.
[mit Material von Matthew Miller, ZDNet.com]
Die Einnahmen klettern auf fast 95 Milliarden Dollar. Allerdings belastet der Steuerstreit mit der EU…
Das stärkste Wachstum verbucht die Cloud-Sparte. Microsoft verpasst bei der Umsatzprognose für das laufende Quartal…
Ein Coil-on-Module-Package integriert Chip und Antenne, was den Kartenkörper fast vollständig recycelbar machen soll.
Mindestens eine Anfälligkeit erlaubt das Einschleusen von Schadcode. Außerdem erweitern die Entwickler den Support für…
Zum 30. Juni 2028 soll das 2G-Netz komplett abgeschaltet werden und den Weg für schnellere…
Gewinn und Umsatz legen deutlich zu. Zum Wachstum tragen auch die Sparten Cloud und Abonnements…