Open-Source-Software „R“ bekommt Hadoop-Integration

Revolution Analytics‘ Statistik-Software Revolution R Enterprise verfügt ab sofort über ein Add-on-Package zur Analyse sehr großer Datenmengen. Mit Hilfe von RevoScale R auf Basis der Statistik-Sprache „R“ ist das Programm nun erstmals in der Lage, Datensätze in Terabyte-Größe zu verarbeiten, zu visualisieren und zu modifizieren, teilte das Unternehmen mit.

Herzstück der „Big-Data“-Architektur ist die Integration von Apaches Hadoop-Framework für skalierbares Distributed Computing. Zudem arbeitet Revolution R Enterprises mit diversen NoSQL-Datenbanken.

Das RevoScaleR-Paket enthält unter anderem das XDF-Datenformat, ein binäres „Big-Data“-Format mit einem R-Interface, das einen sekundenschnellen Zugriff auf frei wählbare Datenreihen und -blöcke ermöglichen soll. Ein Set von Statistik-Algorithmen aus der Deskriptiven Statistik sowie Algorithmen zur Linearen Regressionsanalyse, der Binomialen Logistischen Regression und Kreuztabellen stehen ebenfalls zur Verfügung.

Revolution Analytics möchte mit dem Add-on-Package die Anwendung seiner Statistik-Software vom akademischen Bereich auf den Business-Bereich ausweiten. In der Vergangenheit habe die Verarbeitung von 13 GByte Daten bis zu 12 Stunden gedauert; mit RevoScaleR werde dieselbe Datenmenge innerhalb einer Sekunde verarbeitet, sagte ein Sprecher von Revolution Analytics.

R steht unter der GNU-Lizenz und ist eine freie Implementierung der Programmiersprache „S“. Die Mehrzahl der für S geschriebenen Programme ist auch unter R lauffähig.

ZDNet.de Redaktion

Recent Posts

Taugen Kryptowährungen als Unterstützer der Energiewende?

Bankhaus Metzler und Telekom-Tochter MMS testen, inwieweit Bitcoin-Miner das deutsche Stromnetz stabilisieren könnten.

7 Stunden ago

Supercomputer-Ranking: El Capitan überholt Frontier und Aurora

Mit 1,7 Exaflops ist El Capitan nun der dritte Exascale-Supercomputer weltweit. Deutschland stellt erneut den…

11 Stunden ago

Ionos führt neue AMD-Prozessoren ein

Der deutsche Hyperscaler erweitert sein Server-Portfolio um vier Angebote mit den neuen AMD EPYC 4004…

11 Stunden ago

Lags beim Online-Gaming? DSL-Vergleich und andere Tipps schaffen Abhilfe

Beim Online-Gaming kommt es nicht nur auf das eigene Können an. Auch die technischen Voraussetzungen…

12 Stunden ago

GenKI-Fortbildung immer noch Mangelware

Fast jedes zweite Unternehmen bietet keinerlei Schulungen an. In den übrigen Betrieben profitieren oft nur…

12 Stunden ago

Netzwerk-Portfolio für das KI-Zeitalter

Huawei stellt auf der Connect Europe 2024 in Paris mit Xinghe Intelligent Network eine erweiterte…

14 Stunden ago