Categories: ForschungInnovation

Microsoft verbessert Bilderkennung mit künstlicher Intelligenz

Microsoft Research hat zusammen mit Wissenschaftlern der Carnegie Mellon University ein System entwickelt, das es Maschinen erlaubt, Bilder zu untersuchen. Anschließend sollen sie in der Lage sein, Fragen zu beantworten, wie Menschen sie stellen würden. Ziel ist es, mithilfe künstlicher Intelligenz Antworten zu Fragen in natürlicher Sprache über vorgegebene Inhalte zu liefern.

Das neue System nutzt einem Blogeintrag von Microsoft Research zufolge Bilderkennung, Deep Learning und Spracherkennung, um Bilder und Fragen zu analysieren. Als Beispiel nennen die Forscher ein Foto, das zwei Hunde zeigt, die in einem Fahrradkorb sitzen. Dazu könne die Frage lauten: „Was sitzt im Fahrradkorb“.

Eine von Microsoft entwicklete Technik soll Fragen wie „Was sitzt im Fahrradkorb“ beantworten können (Bild: Microsoft).

„Zuerst würde man in der ersten Informationsschicht die spezifischen Details erfassen – das Fahrrad, den Korb und was in dem Korb ist“, heißt es in dem Blogeintrag. „Dann würde eine zweite Schicht die fraglichen Schlüsselbereiche genau bestimmen – den Korb – und analysieren, was darin ist. Die Antwort: Hunde.“

Als Mensch konzentriere man sich auf das, was für die Beantwortung einer Frage notwendig sei. Das System wiederum entscheide mithilfe eines neuralen Netzwerks, welche Region für die Frage wichtig sei, und unterdrücke die irrelevanten Informationen, so Microsoft weiter. Das System erfasse Informationen, ähnlich wie menschliche Augen und das Gehirn, schaue sich die Szene ab und stelle Beziehungen zwischen den verschiedenen Objekten her.

Deep Learning wiederum kommt den Forschern zufolge zum Einsatz, um visuelle Informationen zu extrahieren, die Bedeutung der Frage in natürlicher Sprache zu erkennen und in zwei Schritten die Regionen des Bilds einzuengen, um die richtige Antwort zu finden. „Das ist die Technik, die man sich vor wenigen Jahren nicht hätte vorstellen können: menschliches Verhalten zum Vorbild nehmen, um Probleme zu lösen“, ergänzte Li Deng, Forscher am Deep Learning Technology Center von Microsoft Research.

ANZEIGE

Server-Hosting: Sicherheit und Datenschutz Made in Germany

Sicherheit und Datenschutz sind zwei wesentliche Kriterien bei der Auswahl eines virtuellen Servers. Mit zwei nach ISO 27001 zertifizierten Hochleistungsrechenzentren in Deutschland bietet STRATO nicht nur strenge Sicherheitsmaßnahmen, sondern auch Datenschutz nach deutschem Recht. Zudem beinhalten die V-Server zahlreiche Komfortfeatures.

Microsoft geht davon aus, dass sich das System auch in der Praxis einsetzen lässt, beispielsweise für neue Applikationen, die Empfehlungen in Echtzeit abgeben oder gar menschliche Bedürfnisse voraussagen. Konkret nennt das Unternehmen ein Warnsystem für Fahrradfahrer, das dessen Umgebung mit einer Kamera erfasst. „Das System würde sich selbst fragen ‚Was ist links neben oder hinter mir‘ oder ‚Überholen mich andere Fahrräder auf der linken Seite‘ oder ‚Sind irgendwelche Jogger in meiner Nähe, die ich vielleicht nicht sehe‘. „Die Antworten könnten dann automatisch in Richtungsanweisungen übersetzt werden, um Unfälle zu verhindern.

[mit Material von Liam Tung, ZDNet.com]

Tipp: Was wissen sie über Microsoft? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Stefan Beiersmann

Stefan unterstützt seit 2006 als Freier Mitarbeiter die ZDNet-Redaktion. Wenn andere noch schlafen, sichtet er bereits die Nachrichtenlage, sodass die ersten News des Tages meistens von ihm stammen.

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.

4 Tagen ago

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

1 Woche ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

1 Woche ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

1 Woche ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

1 Woche ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

1 Woche ago