IBM hat ein Angebot von Apache Spark-as-a-Service eingeführt. Der Dienst ist Teil der Bluemix-Cloud und lässt sich mit anderen Daten- und Analysediensten kombinieren, darunter Cloudant noSQL und der Data-Warehouse-Dienst dashDB.
Die Ankündigung erfolgte jetzt bei seiner Konferenz IBM Insight in Las Vegas. IBM hatte aber schon im Juni auf dem Spark Summit angekündigt, Spark zu unterstützen und 300 Millionen Dollar zu investieren. Es wollte auch ein Spark Technology Center in San Francisco gründen und 3500 Forscher für Spark abstellen.
IBM Analytics on Apache Spark wird auch Python-basierte Code-Notizbücher unterstützen – eine Funktion, die sich in Databricks Cloud-Spark-Plattform ebenfalls findet.
Parallel stellt IBM die so genannten Insight Cloud Services vor, die „externe Daten über Menschen, Veranstaltungen, Orte und Firmen aus Quellen wie Twitter und The Weather Company“ bereitstellen, wie es in der Presseerklärung heißt – also Daten, die beim Einsatz von Analytics die internen Daten des Kunden um Kontext anreichern können, um sie anschließend mit Spark auszuwerten.
In vielen Unternehmen nutzen Mitarbeiter ihre privaten mobilen Geräte. Unternehmen, die dieser Szenario erlauben, sollten sich Gedanken über eine leistungsfähige Enterprise Mobility Management Suite machen. Nur damit lassen sich Unternehmensdaten gegen nicht autorisierten Zugriff absichern.
Der frühere Cloudant-CEO Derek Schoettle – und seit dessen Übernahme durch IBM General Manager of Cloud Data Services (CDS) – kommentierte gegenüber ZDNet.com, Spark sei nicht nur eine parallele Big-Data-Verarbeitungsplattform, sondern auch eine, die Maschinelles Lernen, Graph-Engine-Analysen und Streaming-Data-Verarbeitung einschließe. IBM sehe Spark daher als umfassende Umgebung, um mit Daten zu arbeiten.
Aus diesem Grund habe IBM rund 15 seiner eigenen Handels- und Analytics-Produkte auf Spark umgestellt. DataWorks beispielsweise habe auf diese Weise von 40 Millionen auf 5 Millionen Zeilen Quellcode reduziert werden können.
Mit DB2, Watson, Netezza, Cognos, TM1, SPSS, DataStage, Informix, Cloudant und der Hadoop-Distribution BigInsights dürfte IBM ohnehin schon das größte Angebot der Branche rund um Daten und Analytics haben – ein Portfolio, das über Jahrzehnte gewachsen ist. Diese Dienste rund um Apache Spark zu föderieren und per Cloud auszuliefern scheint nun sein Ziel.
[mit Material von Andrew Brust, ZDNet.com]
Tipp: Was haben Sie über Datenbanken gespeichert? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.
Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…
Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…
Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.
Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…
Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…
Security-Experten von Check Point sind einer neuen Angriffsart auf die Spur gekommen, die E-Mail-Schutzmaßnahmen umgehen…