Categories: Cloud

IBM macht Apache Spark als Cloud-Service verfügbar

IBM hat ein Angebot von Apache Spark-as-a-Service eingeführt. Der Dienst ist Teil der Bluemix-Cloud und lässt sich mit anderen Daten- und Analysediensten kombinieren, darunter Cloudant noSQL und der Data-Warehouse-Dienst dashDB.

Die Ankündigung erfolgte jetzt bei seiner Konferenz IBM Insight in Las Vegas. IBM hatte aber schon im Juni auf dem Spark Summit angekündigt, Spark zu unterstützen und 300 Millionen Dollar zu investieren. Es wollte auch ein Spark Technology Center in San Francisco gründen und 3500 Forscher für Spark abstellen.

IBM Analytics on Apache Spark wird auch Python-basierte Code-Notizbücher unterstützen – eine Funktion, die sich in Databricks Cloud-Spark-Plattform ebenfalls findet.

Parallel stellt IBM die so genannten Insight Cloud Services vor, die „externe Daten über Menschen, Veranstaltungen, Orte und Firmen aus Quellen wie Twitter und The Weather Company“ bereitstellen, wie es in der Presseerklärung heißt – also Daten, die beim Einsatz von Analytics die internen Daten des Kunden um Kontext anreichern können, um sie anschließend mit Spark auszuwerten.

ANZEIGE

MobileIron: Sichere Verwaltung von Android-Geräten

In vielen Unternehmen nutzen Mitarbeiter ihre privaten mobilen Geräte. Unternehmen, die dieser Szenario erlauben, sollten sich Gedanken über eine leistungsfähige Enterprise Mobility Management Suite machen. Nur damit lassen sich Unternehmensdaten gegen nicht autorisierten Zugriff absichern.

Der frühere Cloudant-CEO Derek Schoettle – und seit dessen Übernahme durch IBM General Manager of Cloud Data Services (CDS) – kommentierte gegenüber ZDNet.com, Spark sei nicht nur eine parallele Big-Data-Verarbeitungsplattform, sondern auch eine, die Maschinelles Lernen, Graph-Engine-Analysen und Streaming-Data-Verarbeitung einschließe. IBM sehe Spark daher als umfassende Umgebung, um mit Daten zu arbeiten.

Aus diesem Grund habe IBM rund 15 seiner eigenen Handels- und Analytics-Produkte auf Spark umgestellt. DataWorks beispielsweise habe auf diese Weise von 40 Millionen auf 5 Millionen Zeilen Quellcode reduziert werden können.

Mit DB2, Watson, Netezza, Cognos, TM1, SPSS, DataStage, Informix, Cloudant und der Hadoop-Distribution BigInsights dürfte IBM ohnehin schon das größte Angebot der Branche rund um Daten und Analytics haben – ein Portfolio, das über Jahrzehnte gewachsen ist. Diese Dienste rund um Apache Spark zu föderieren und per Cloud auszuliefern scheint nun sein Ziel.

[mit Material von Andrew Brust, ZDNet.com]

Tipp: Was haben Sie über Datenbanken gespeichert? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

2 Tagen ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

3 Tagen ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

3 Tagen ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

3 Tagen ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

4 Tagen ago

Hacker missbrauchen Google Calendar zum Angriff auf Postfächer

Security-Experten von Check Point sind einer neuen Angriffsart auf die Spur gekommen, die E-Mail-Schutzmaßnahmen umgehen…

5 Tagen ago