Apache erklärt Hadoop zur Final

Version 1.0 gilt vor allem als Signal an die Außenwelt. Die Datenplattform wird längst von Firmen wie Amazon, Microsoft oder Yahoo eingesetzt. Das Update korrigiert aber auch zahlreiche Fehler und ermöglicht Schreibzugriff über HTTP.

Die Apache Software Foundation hat die erste für den produktiven Einsatz gedachte Version von Hadoop veröffentlicht. Das skalierbare, verteilt nutzbare Software-Framework dient dazu, mit Tausenden Servern große Mengen unstrukturierter Daten auszuwerten – beispielsweise aus Sozialen Netzwerken oder von Websites, aber auch aus internen Archiven oder wissenschaftlichen Versuchen. Version 1.0 wurde Ende Dezember freigegeben, aber erst jetzt offiziell angekündigt.

Logo von Hadoop

Die Apache Foundation arbeitet seit sechs Jahren an Hadoop. „Dieser Release ist ein Höhepunkt nach einer Menge harter Arbeit und und Kooperation der lebendigen Apache-Community aus engagierten Software-Entwicklern, die dem Hadoop-Projekt mit ihren praktischen Kenntnissen zu einer neuen Stufe an Stabilität verholfen haben“, schreibt Vizepäsident Arun Murthy. Die Versionsbezeichnung 1.0 sei daher ehrlich verdient.

Apache Hadoop wird von zahlreichen großen IT-Firmen längst eingesetzt. Amazon, EMC, Facebook, Google, IBM und Yahoo haben alle auch Code beigetragen und bei Tests der Software geholfen. Einige – darunter Microsoft – haben auch eine eigene Distribution der Software zusammengestellt.

Das quelloffene Hadoop steht unter der Apache License 2.0. Laut Murthy ist es „auf dem besten Weg zum De-facto-Standard für Datenplattformen, mit denen Unternehmen große Datenströme speichern, verarbeiten und durchsuchen können.“ Was Leistung, Stabilität und Sicherheit angehe, sei Version 1.0 ein großer Schritt nach vorne.

Dass jetzt eine Final vorliegt, gilt angesichts der ohnehin schon beträchtlichen Verbreitung vor allem als Signal nach außen. Allerdings enthält Hadoop 1.0 auch eine große Zahl Fehlerkorrekturen. Zu den neuen Funktionen gehört zudem Schreibzugriff auf das Hadoop Distributed File System (HDFS) über HTTP.

Yahoo als wichtiger Entwicklungspartner des Projekts und Nutzer von Hadoop hat sein Entwicklungsteam vergangenes Jahr in ein unabhängiges Unternehmen namens Hortonworks ausgelagert. Yahoos Cloud-Chef Jay Rossiter bedachte die Final von Hadoop daher ebenfalls mit einem Kommentar: „Dass der Release-Status 1.0 erreicht wurde, ist ein gewaltiger Erfolg für die Community sowie das Ergebnis von harter Arbeit und gemeinsamen Lernens. Apache Hadoop bleibt für Yahoo ein wichtiger Investitionsbereich. Heute steht Hadoop hinter jedem Klick bei Yahoo.“

Themenseiten: Amazon, Apache Foundation, Big Data, EMC, Hadoop, Microsoft, Open Source, Software, Yahoo

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu Apache erklärt Hadoop zur Final

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *