Apache finalisiert Hadoop 2.0

Apache hat die finale Version von Hadoop 2.0 allgemein verfügbar gemacht. Die wichtigste neue Komponente ist YARN, das bisweilen auch als MapReduce 2.0 oder MRv2 bezeichnet wird. Gegenüber MapReduce 1.0 hat es den Vorteil, dass der Verwaltungsteil der Engine aus dem eigentlichen Algorithmus ausgeklammert wurde. Das bedeutet auch, dass Anwender den MapReduce-Algorithmus wie ein Plug-in austauschen und stattdessen etwa ein interaktives Verfahren verwenden können.

Dies gilt als Meilenstein bei der Entwicklung von Hadoop von einem einfachen Werkzeug hin zu einem kompletten Betriebssystem für Big Data. YARN steht für „Yet Another Resource Negotiator“, ist also ein selbstreferenzielles Akronym. Zwar gibt es bereits auf Apache Hadoop aufsetzende Distributionen mit YARN, etwa Cloudera CDH, sie basieren aber auf einer Hadoop-Version, die Apache noch als Preview eingestuft hat.

Der zuständige Release Manager Arun C. Murphy kommentiert: „Hadoop 2 markiert eine bedeutende Weiterentwicklung des Open-Source-Projekts, die leidenschaftliche Entwickler der Apache-Gemeinschaft gemeinsam erstellt haben. Ihr Ziel war es vor allem, die Datenplattform einfacher nutzbar und stabiler zu machen.“

Neu in Hadoop 2.0 sind Hochverfügbarkeit für die Apache-Version von HDFS, also das Hadoop Distributed File System, Unterstützung von Microsoft Windows, Data-Snapshots in sowie NFS-v3-Zugang zu HDFS. Föderation von HDFS ermöglicht deutlich bessere Skalierbarkeit als mit Apache Hadoop 1.x. Gleichzeitig besteht Binärkompatibilität zu MapReduce-Anwendungen, die für Apache Hadoop 1.x geschrieben wurden.

Parallel hat das Projekt Apache Hive eine neue Version (0.12.0) vorgelegt, die zu Hadoop 2.0 kompatibel ist. Hive ermöglicht SQL-Abfragen von Hadoop-Daten. Es basiert derzeit auf den MapReduce-Algorithmus. Mit Apache Tez und Hortonworks Stinger gibt es aber schon Entwicklungen, um Hives SQL-Anfragen über YARN abzuwickeln und MapReduce zu umgehen, sodass auch Hive mit alternativen Algorithmen zurechtkommt.

[mit Material von Andrew Brust, ZDNet.com]

Tipp: Wie gut kennen Sie sich mit Open-Source aus? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Gaming-bezogene Phishing-Attacken um 30 Prozent gestiegen

Über drei Millionen Angriffsversuche unter Deckmantel von Minecraft / YouTube-Star Mr. Beast als prominenter Köder

2 Tagen ago

KI erleichtert Truckern die Parkplatzsuche

Die Prognose für die Anfahrt bezieht das Verkehrsaufkommen, die Stellplatzverfügbarkeit sowie die Lenk- und Ruhezeiten…

2 Tagen ago

EU AI-Act Risk Assessment Feature

Unternehmen können mit Casebase Portfolio an Daten- und KI-Anwendungsfällen organisieren.

2 Tagen ago

Smarthome-Geräte sind Einfallstor für Hacker

Smart-TV oder Saugroboter: Nutzer schützen ihre smarten Heimgeräte zu wenig, zeigt eine repräsentative BSI-Umfrage.

2 Tagen ago

Core Ultra 200V: Intel stellt neue Notebook-Prozessoren vor

Im Benchmark erreicht der neue Core Ultra 200V eine Laufzeit von 14 Stunden. Intel tritt…

2 Tagen ago

Irrglaube Inkognito-Modus

Jeder dritte hält sich damit für unsichtbar. Wie widersprüchlich unser Datenschutzverhalten oft ist, zeigt eine…

3 Tagen ago