Categories: Cloud

Microsoft erweitert Azure Media Services um Künstliche Intelligenz

Microsoft macht seine Azure Media Services genannten Cloudwerkzeuge intelligenter. Auf der NAB Show in Las Vegas, einer Fernsehkonferenz der National Association of Broadcasters, kündigte es die Integration von Videoservices an, die Maschinelles Lernen nutzen. TechCrunch hat die Ankündigung zusammengefasst; für Microsoft hat Principal Program Manager Milan Gada darüber gebloggt.

Beispielsweise wird Media Services damit in der Lage sein, die wichtigsten Ausschnitte eines Videos zu bestimmen und dadurch bessere Zusammenfassungen zu liefern. Auch die von den Cognitive Services (für Fotos) bekannten Optionen Gesichtserkennung und Emotionserkennung sind geplant. Auf diese Weise lassen sich etwa automatisch die Reaktionen des Publikums in Verlauf einer Rede ermitteln.

Als weitere Neuerungen finden Bewegungserkennung, eine Erweiterung der Sprache-zu-Text-Funktion (etwa für Untertitel) um sechs auf acht Sprachen und eine Texterkennung (OCR) für eventuell im Video auftauchende Texte, Inschriften oder Beschriftungen. Die acht Sprachen sind Arabisch, Chinesisch, Deutsch, Englisch, Französisch, Italienisch, Portugiesisch und Spanisch.

Auch die 2014 erstmals vorgestellte Zeitrafferfunktion Hyperlapse will Microsoft in die Media Services integrieren. Sie ermöglicht ruhige, nicht ruckelnde Zeitrafferaufnahmen. Bisher gab es sie als App für Windows, Windows Phone und Android sowie als Clouddienst in Form einer Public Preview mit Beschränkung auf 10.000 Frames. Diese Beschränkung entfällt jetzt.

HIGHLIGHT

Samsung Galaxy TabPro S im Test

Mit einem Gewicht von nur 693 Gramm gehört das Samsung Galaxy TabPro S zu den Leichtgewichten unter den 12-Zoll-Windows-Tablets. Hervorzuheben ist auch das verwendete Super AMOLED-Display: Es liefert einen hervorragenden Schwarzwert und einen sehr hohen Kontrast. Die Farbdarstellung ist exzellent

Als mögliche Einsatzgebiete der KI-Technik nennt Microsoft vier Bereiche: Callcenter, Bildung, Moderieren von Nutzerinhalten und Überwachung. So würden immer mehr IP-basierte Überwachungskameras installiert, deren Material von Hand zu prüfen aufwändig und fehleranfällig sei. Für Callcenter und das Bildungswesen legt Microsoft besonders den Einsatz von Sprach- und Texterkennungstechniken nahe, um eine Suche nach bestimmten Stichwörtern zu erleichtern.

Die Ankündigung erinnert an Facebooks nur einen Tag vorausgegangene Präsentation auf der Entwicklerkonferenz F8. Es zeigte Künstliche Intelligenz, die Personen in Videos erkennen und automatisch taggen soll. Zugleich arbeitet Facebook an automatisch generierten Untertiteln für Videos und Übersetzungen. Laut Candela beherrschen etwa 50 Prozent der Facebook-Nutzer nicht die englische Sprache. Auch seine Objekterkennungstechniken, die bisher für Fotos zum Einsatz kommen, möchte es auf Videos erweitern.

Microsoft aktualisiert die Azure Media Services jedes Jahr zur NAB Show. 2015 kündigte es Live Encoding sowie den Azure Media Player als mögliches Frontend an. Er nutzt Branchenstandards wie HTML5, Media Source Extensions (MSE) und Encrypted Media Extensions (EME) für ein reichhaltiges adaptives Streaming – soll aber bei Bedarf auch nahtlos zurückfallen auf Browser-Plug-ins wie Flash und Silverlight.

Tipp: Was wissen sie über Microsoft? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Microsoft nennt weitere Details zu kostenpflichtigen Patches für Windows 10

Erstmals liegen Preise für Verbraucher vor. Sie zahlen weniger als Geschäftskunden. Dafür beschränkt Microsoft den…

6 Stunden ago

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

1 Tag ago

GenKI im Job: Mitarbeitende schaffen Tatsachen

Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.

1 Tag ago

97 Prozent der Großunternehmen melden Cyber-Vorfälle

2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…

1 Tag ago

„Pacific Rim“-Report: riesiges, gegnerisches Angriffs-Ökosystem

Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…

1 Tag ago

DeepL setzt erstmals auf NVIDIA DGX SuperPOD mit DGX GB200-Systemen

NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.

1 Tag ago