Da es so datenintensiv ist, erfordert Echtzeit-Data-Mining beträchtliche Hardware-Investitionen, um Analytics neben der Verarbeitung der alltäglichen Transaktionen ausführen zu können, die für den Betrieb eines Unternehmens erforderlich sind. Alle Betriebssysteme und Datenbankkombinationen haben von der kontinuierlichen Beschleunigung der Server-Prozessorgeschwindigkeiten profitiert, aufgrund der Echtzeit-Data-Mining erst möglich wurde.
Oracle ist dieses Problem mit der Förderung seiner Oracle-on-Linux-Plattform für Data-Mining angegangen, vor allem aufgrund der anerkannten Skalierbarkeit und Robustheit der Linux-Plattform und Oracles eigener Clustering-Technologie RAC (Real Application Clusters).
„Sie kann […] auf Clustern von Linux-Servern eingesetzt werden, was Enterprise-Datenmanagement ermöglicht – jedoch mit hoher Zuverlässigkeit“, so Roland Slee, Direktor für Business- und Technologielösungen bei Oracle Australia. „Wir haben Kunden, die Datenbanken auf Intel-basierten Servern mit sehr hohen Taktgeschwindigkeiten einsetzen. Dank der Unterstützung für transparentes Clustering erhält man Skalierbarkeit und Erschwinglichkeit und kann von den Data-Mining-Funktionen profitieren. Nach Oracles Erfahrung sind diese [Computing-]Zyklen bei Verwendung von Linux-Clustern preiswerter und leistungsfähiger als in jeder anderen Umgebung.“
Dies ist jedoch nur eine Perspektive. In dem Maße, in dem sowohl RISC- als auch Intel-Prozessoren immer weiter die Exponentialkurve von Moores Law nach oben klettern, werden die Server, die für das Funktionieren von Echtzeit-Data-Mining nötig sind, schnell im Preis fallen. Das bedeutet, dass Data-Mining heute preiswerter ist und einer breiteren Menge von Unternehmen als je zuvor zur Verfügung steht.
- Data-Mining: Verborgene Schätze in Unternehmensdaten
- Unbekannte Beziehungen identifizieren
- Betriebsabläufe und Erfolgschancen
- Vorbeugen ist besser als heilen
- Echtzeit-Data-Mining
- Beträchtliche Hardware-Investitionen
- Grundlagen des Angewandten Data-Mining
- Geheimnisvoll und esoterisch
- Data-Mining für die Anwender
- Aufräumen im Warehouse
- Probleme mit der Datenkonsistenz
- Datenintelligenz stärkt OneSteel
- Datenschwemme
- Nach Gold graben und das Geröll wegwerfen
Neueste Kommentare
3 Kommentare zu Data-Mining: Verborgene Schätze in Unternehmensdaten
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.
Open Source Data Mining mit RapidMiner und RapidAnalytics
Als kostenlose erhältliche Open-Source-Lösungen für den Unternehmenseinsatz empfehle ich:
* RapidMiner für Desktop oder Notebook: http://www.RapidMiner.com/
* RapidAnalytics als Server-Lösung: http://www.rapid-i.com/
Wahlweise kann man in RapidMiner und RapidAnalytics über Erweiterung (Extensions) die Open-Source-Systeme Weka und R einbinden. Es geht aber auch ohne, denn RapidMiner und RapidAnalytics bieten bereits von hause aus sehr viele maschinelle Lernverfahren und statistische Modellierungsverfahren.
Data-Mining mit R
Die freie Statistikprogrammiersprache R dazu verwenden.
Ausführlich – aber bitte weiteren Aspekt bedenken!
Vielen Dank für den langen Artikel. Es hat sich gelohnt!
Ich möchte aber ergänzen, dass Data Mining Modelle (Algorytmen) ein Training für die Datenbasis benötigen, um Vorhersagen treffen zu können. Daraus folgt, das sie mit der Zeit immer besser werden können, wenn man die Voraussagen mit den Ergebnissen konfrontiert.
Das Training (mit verifizierten Daten) ist wesentlich für die Qualität der Aussagen der Mining Modelle.