Categories: Cloud

Microsoft erweitert Azure Media Services um Künstliche Intelligenz

Microsoft macht seine Azure Media Services genannten Cloudwerkzeuge intelligenter. Auf der NAB Show in Las Vegas, einer Fernsehkonferenz der National Association of Broadcasters, kündigte es die Integration von Videoservices an, die Maschinelles Lernen nutzen. TechCrunch hat die Ankündigung zusammengefasst; für Microsoft hat Principal Program Manager Milan Gada darüber gebloggt.

Beispielsweise wird Media Services damit in der Lage sein, die wichtigsten Ausschnitte eines Videos zu bestimmen und dadurch bessere Zusammenfassungen zu liefern. Auch die von den Cognitive Services (für Fotos) bekannten Optionen Gesichtserkennung und Emotionserkennung sind geplant. Auf diese Weise lassen sich etwa automatisch die Reaktionen des Publikums in Verlauf einer Rede ermitteln.

Als weitere Neuerungen finden Bewegungserkennung, eine Erweiterung der Sprache-zu-Text-Funktion (etwa für Untertitel) um sechs auf acht Sprachen und eine Texterkennung (OCR) für eventuell im Video auftauchende Texte, Inschriften oder Beschriftungen. Die acht Sprachen sind Arabisch, Chinesisch, Deutsch, Englisch, Französisch, Italienisch, Portugiesisch und Spanisch.

Auch die 2014 erstmals vorgestellte Zeitrafferfunktion Hyperlapse will Microsoft in die Media Services integrieren. Sie ermöglicht ruhige, nicht ruckelnde Zeitrafferaufnahmen. Bisher gab es sie als App für Windows, Windows Phone und Android sowie als Clouddienst in Form einer Public Preview mit Beschränkung auf 10.000 Frames. Diese Beschränkung entfällt jetzt.

HIGHLIGHT

Samsung Galaxy TabPro S im Test

Mit einem Gewicht von nur 693 Gramm gehört das Samsung Galaxy TabPro S zu den Leichtgewichten unter den 12-Zoll-Windows-Tablets. Hervorzuheben ist auch das verwendete Super AMOLED-Display: Es liefert einen hervorragenden Schwarzwert und einen sehr hohen Kontrast. Die Farbdarstellung ist exzellent

Als mögliche Einsatzgebiete der KI-Technik nennt Microsoft vier Bereiche: Callcenter, Bildung, Moderieren von Nutzerinhalten und Überwachung. So würden immer mehr IP-basierte Überwachungskameras installiert, deren Material von Hand zu prüfen aufwändig und fehleranfällig sei. Für Callcenter und das Bildungswesen legt Microsoft besonders den Einsatz von Sprach- und Texterkennungstechniken nahe, um eine Suche nach bestimmten Stichwörtern zu erleichtern.

Die Ankündigung erinnert an Facebooks nur einen Tag vorausgegangene Präsentation auf der Entwicklerkonferenz F8. Es zeigte Künstliche Intelligenz, die Personen in Videos erkennen und automatisch taggen soll. Zugleich arbeitet Facebook an automatisch generierten Untertiteln für Videos und Übersetzungen. Laut Candela beherrschen etwa 50 Prozent der Facebook-Nutzer nicht die englische Sprache. Auch seine Objekterkennungstechniken, die bisher für Fotos zum Einsatz kommen, möchte es auf Videos erweitern.

Microsoft aktualisiert die Azure Media Services jedes Jahr zur NAB Show. 2015 kündigte es Live Encoding sowie den Azure Media Player als mögliches Frontend an. Er nutzt Branchenstandards wie HTML5, Media Source Extensions (MSE) und Encrypted Media Extensions (EME) für ein reichhaltiges adaptives Streaming – soll aber bei Bedarf auch nahtlos zurückfallen auf Browser-Plug-ins wie Flash und Silverlight.

Tipp: Was wissen sie über Microsoft? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Taugen Kryptowährungen als Unterstützer der Energiewende?

Bankhaus Metzler und Telekom-Tochter MMS testen, inwieweit Bitcoin-Miner das deutsche Stromnetz stabilisieren könnten.

8 Stunden ago

Supercomputer-Ranking: El Capitan überholt Frontier und Aurora

Mit 1,7 Exaflops ist El Capitan nun der dritte Exascale-Supercomputer weltweit. Deutschland stellt erneut den…

12 Stunden ago

Ionos führt neue AMD-Prozessoren ein

Der deutsche Hyperscaler erweitert sein Server-Portfolio um vier Angebote mit den neuen AMD EPYC 4004…

12 Stunden ago

Lags beim Online-Gaming? DSL-Vergleich und andere Tipps schaffen Abhilfe

Beim Online-Gaming kommt es nicht nur auf das eigene Können an. Auch die technischen Voraussetzungen…

13 Stunden ago

GenKI-Fortbildung immer noch Mangelware

Fast jedes zweite Unternehmen bietet keinerlei Schulungen an. In den übrigen Betrieben profitieren oft nur…

13 Stunden ago

Netzwerk-Portfolio für das KI-Zeitalter

Huawei stellt auf der Connect Europe 2024 in Paris mit Xinghe Intelligent Network eine erweiterte…

15 Stunden ago