Microsoft weitet Unterstützung von Apache Spark aus

Microsoft stellt anlässlich des Spark Summit in San Francisco alte und neue Initiativen rund um das Big-Data-Framework vor, das unter dem Dach der Apache Foundation entwickelt wird. Spark-Support ist demnach für die Microsoft-Produkte HDInsight, Cortana Intelligence Suite, Power BI und Microsoft R Server in Vorbereitung oder abgeschlossen.

Bereits verfügbar kann Microsoft sein Spark for Azure HDInsight melden. Vor einem Jahr war es in eine Public Preview gestartet. HDInsight ist dabei natürlich die Microsoft-Cloud-Version von Hadoop.

R Server for HDinsight soll im Lauf des Sommers folgen. Eine Public Preview liegt auch hiervon vor. Die Spark-Integration ist sowohl für die Cloudvariante wie auch für die Software zur Installation in eigenen Rechenzentren des Kunden vorgesehen. Die für Big-Data-Auswertung, Vorhersagemodelle und Maschinelles Lernen konzipierte Programmiersprache R hatte sich Microsoft im April 2015 mit der Übernahme von Revolution Analytics zu einem nicht genannten Preis ins Haus geholt.

Dass es die kommerzielle Distribution von R in SQL Server 2016 integriert und dies SQL Server R Services nennt, hatte Microsoft schon früher wissen lassen. Seit einer knappen Woche ist SQL Server 2016 samt R Services allgemein verfügbar.

ANZEIGE

Das Samsung Galaxy S7 und Galaxy S7 Edge im Business-Einsatz

Die Samsung-Smartphones Galaxy S7 und S7 Edge zählen unter Privatanwendern zu den beliebtesten Android-Smartphones. Dank Samsung KNOX und dem kürzlich aufgelegten Enterprise Device Program sind sie auch für den Unternehmenseinsatz gut geeignet.

R Server for Hadoop ist eine Software für die Installation im Rechenzentrum, die sowohl Microsoft R als auch native Spark-Frameworks für die Ausführung unterstützen wird. Microsoft will sie noch im laufenden Monat freigeben. In der aktuellen Blog-Ankündigung heißt es: „Die Kombination von R Server mit Spark gibt Nutzern die Flexibilität, R-Funktionen über tausende Spark-Knoten laufen zu lassen, wobei Modelle mit 1000-mal größeren Datensätzen und 100-mal schneller als mit der Open-Source-Version von R trainiert werden können – und auch fast doppelt so schnell wie mit Sparks eigenem MLLib.“

Power BI unterstützt ab sofort Spark Streaming. Neu ist dabei nur die Ausweitung auf Streaming-Szenarien; Power BI war schon länger zu Spark kompatibel.

Anders als manche Spark-Unterstützer positioniert Microsoft das quelloffene Framework nicht als Konkurrenten von Hadoop, sondern in vielen Fällen als Ergänzung. Mit Prajna/OneNet gibt es zudem ein Microsoft-Projekt für eine verteilte Plattform für funktionale Programmierung. Damit lassen sich Clouddienste mit Big-Data-Analysefunktionen erstellen, die in bestimmter Hinsicht den Möglichkeiten von Spark ähnlich sind.

[mit Material von Mary Jo Foley, ZDNet.com]

Tipp: Was wissen sie über Microsoft? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Microsoft nennt weitere Details zu kostenpflichtigen Patches für Windows 10

Erstmals liegen Preise für Verbraucher vor. Sie zahlen weniger als Geschäftskunden. Dafür beschränkt Microsoft den…

4 Stunden ago

Microsoft verschiebt erneut Copilot Recall

Die Entwickler arbeiten noch an weiteren „Verfeinerungen“. Windows Insider erhalten nun wohl eine erste Vorschau…

22 Stunden ago

GenKI im Job: Mitarbeitende schaffen Tatsachen

Laut Bitkom-Umfrage werden in jedem dritten Unternehmen in Deutschland private KI-Zugänge genutzt. Tendenz steigend.

1 Tag ago

97 Prozent der Großunternehmen melden Cyber-Vorfälle

2023 erlitten neun von zehn Unternehmen in der DACH-Region Umsatzverluste und Kurseinbrüche in Folge von…

1 Tag ago

„Pacific Rim“-Report: riesiges, gegnerisches Angriffs-Ökosystem

Der Report „Pacific Rim“ von Sophos beschreibt Katz-und-Maus-Spiel aus Angriffs- und Verteidigungsoperationen mit staatlich unterstützten…

1 Tag ago

DeepL setzt erstmals auf NVIDIA DGX SuperPOD mit DGX GB200-Systemen

NVIDIA DGX SuperPOD soll voraussichtlich Mitte 2025 in Betrieb genommen und für Forschungsberechnungen genutzt werden.

1 Tag ago