Die wachsende Profilierung der Funktionen von Data-Mining-Lösungen hat einen weiteren vorteilhaften Effekt: Sie hat dazu geführt, dass sich Entwicklungs-Kits leichter in eigenständig funktionsfähigen Einheiten bündeln lassen. Nachdem die Hersteller die Verfügbarkeit von Data-Mining-Lösungen verbessert haben, ermöglichen die neuesten Toolkit-Revisionen (viele davon auf der Grundlage von Java) es Enterprise-Entwicklern, die Data-Mining-Funktionen der verschiedenen Plattformen leicht in unternehmenseigene Anwendungen zu integrieren. Diese Flexibilität stellt im Vergleich mit den esoterischen und komplexen Oberflächen früherer Systeme eine bedeutende Verbesserung dar. Dieser Wandel sollte die Entwicklung von Analytics-Portalen erleichtern, welche die Bedürfnisse spezifischer Anwender-Communities innerhalb des Unternehmens bedienen. Anstatt als komplexe Anwendungen zu existieren, die nur von einigen wenigen technischen Analysten verwendet werden, kann die Integration von Analytics in ein Allzweck-Portal dazu beitragen, dass leistungsfähige Analyse-Tools für mehr Mitarbeiter als je zuvor zur Verfügung stehen.
Eins bleibt zu bedenken: Auch wenn die Mitarbeiter zweifelsohne von den besseren Informationen profitieren werden, können sie auch daran ersticken, wenn sie zuviel davon bekommen. „Die Oberfläche ist ganz einfach, wir müssen aber das richtige Maß an Informationen festlegen, dem die Anwender ausgesetzt sein sollen“, so Colin Shearer, Vizepräsident für Analytics bei SPSS. „Sie wollen keine detaillierten Statistiken über die Akkuratheit des Vorhersagemodells sehen, sondern Dinge, die sie sofort und innerhalb ihrer eigenen Wissensbereiche interpretieren können.“
Damit dies möglich wird, ist natürlich eine enge Zusammenarbeit zwischen Technikern und den Geschäftseinheiten vonnöten, so dass die entwickelten Anwendungen die Eigenheiten des Geschäfts eines jeden Unternehmens widerspiegeln können. Auch die Entwicklung konsistenter Geschäftsrichtlinien ist wichtig, damit nicht alles dem Zufall überlassen wird: Richtlinien, die mit Systemen wie Business Rules Engine von CA CleverPath durchgesetzt werden, gewährleisten konsistente Resultate und ermöglichen Überprüfungen, falls Fragen über die Mechanismen auftauchen sollten, mit deren Hilfe die Zahlen zusammengestellt werden.
„Die Art und Weise, wie Data-Mining-Technologie verkörpert wird, verändert sich momentan ziemlich drastisch“, so Slee von Oracle. „Es handelt sich nicht mehr um eine Aktivität für Spezialisten, die nur von einer kleinen Zahl von Anwendern anhand einer Untermenge von Daten durchgeführt wird. Data-Mining kann nun eine Mainstram-Anwendung werden, die zusammen mit anderen Mainstream-Anwendungen von sämtlichen Anwendern benutzbar ist.“
- Data-Mining: Verborgene Schätze in Unternehmensdaten
- Unbekannte Beziehungen identifizieren
- Betriebsabläufe und Erfolgschancen
- Vorbeugen ist besser als heilen
- Echtzeit-Data-Mining
- Beträchtliche Hardware-Investitionen
- Grundlagen des Angewandten Data-Mining
- Geheimnisvoll und esoterisch
- Data-Mining für die Anwender
- Aufräumen im Warehouse
- Probleme mit der Datenkonsistenz
- Datenintelligenz stärkt OneSteel
- Datenschwemme
- Nach Gold graben und das Geröll wegwerfen
Neueste Kommentare
3 Kommentare zu Data-Mining: Verborgene Schätze in Unternehmensdaten
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.
Open Source Data Mining mit RapidMiner und RapidAnalytics
Als kostenlose erhältliche Open-Source-Lösungen für den Unternehmenseinsatz empfehle ich:
* RapidMiner für Desktop oder Notebook: http://www.RapidMiner.com/
* RapidAnalytics als Server-Lösung: http://www.rapid-i.com/
Wahlweise kann man in RapidMiner und RapidAnalytics über Erweiterung (Extensions) die Open-Source-Systeme Weka und R einbinden. Es geht aber auch ohne, denn RapidMiner und RapidAnalytics bieten bereits von hause aus sehr viele maschinelle Lernverfahren und statistische Modellierungsverfahren.
Data-Mining mit R
Die freie Statistikprogrammiersprache R dazu verwenden.
Ausführlich – aber bitte weiteren Aspekt bedenken!
Vielen Dank für den langen Artikel. Es hat sich gelohnt!
Ich möchte aber ergänzen, dass Data Mining Modelle (Algorytmen) ein Training für die Datenbasis benötigen, um Vorhersagen treffen zu können. Daraus folgt, das sie mit der Zeit immer besser werden können, wenn man die Voraussagen mit den Ergebnissen konfrontiert.
Das Training (mit verifizierten Daten) ist wesentlich für die Qualität der Aussagen der Mining Modelle.