Nachdem sie erkannt haben, dass die Verbesserung dieser Situation eine bedeutende Möglichkeit zur Produktdifferenzierung darstellt, sind viele Hersteller von Datenbanken und Enterprise-Anwendungen in letzter Zeit dazu übergegangen, den Nutzen des Data-Mining zu vergrößern, indem sie es als Echtzeit-Funktion positionieren, die in Business-Informationssysteme integriert ist.
„Wir haben DB2 mit Data-Mining-Algorithmen ausgestattet, um Dinge wie Echtzeit-Segmentierung beim Eintreffen von Transaktionen möglich zu machen“, so Janet Perna, weltweite General-Managerin für Data-Management bei IBM. „Das große Problem mit der Data-Mining-Technologie war, dass bisher allgemein angenommen wurde, man brauche einen Doktortitel, um die Technologie verwenden zu können. Diese Technologien entwickeln sich jedoch zu einem Bestandteil der Dateninfrastruktur, und in dem Maße, in dem mehr und mehr Fähigkeiten in die Data-Engine integriert werden, werden sie sich immer mehr zu Mainstream-Anwendungen entwickeln.“
Zu diesem Zweck hat IBM seinen DB2 OLAP Server kürzlich um eine Menge an Data-Mining-Funktionen ergänzt und bietet zusätzliche Funktionen über seinen DB2 Intelligent Miner an, der in Echtzeit Ergebnisse aus DB2-Daten und PMML-Daten (Predictive Model Markup Language) zusammenträgt. PMML ist eine XML-basierte Markup-Sprache, die bereits in der Version 2.1 vorliegt und in einer Vielzahl von Data-Mining- und Enterprise-Anwendungen unterstützt wird. Diese Sprache beschreibt Eingaben in Data-Mining-Modelle, die Transformationen, die zur Vorbereitung von Daten für das Data-Mining verwendet werden, und die Parameter, welche die Data-Mining-Modelle definieren.
Microsoft für seinen Teil plant Yukon, das nächste größere Release von SQL Server, um sieben zusätzliche Data-Mining-Algorithmen zu ergänzen. SQL Server verfügt bereits seit seiner 2000er Version über OLAP-Fähigkeiten und Unterstützung für Clustering und „Entscheidungsbaum“-Data-Mining-Algorithmen.
Terry Clancy, Microsofts Marketing-Manager für Data-Access-Produkte, räumt ein, dass die Konzentration des Unternehmens auf OLAP seine Markenstärke im Data-Mining-Bereich geschwächt hat. Mit dem Erscheinen von Yukon plant Microsoft allerdings, diese Situation mit neuen Partnern und neuer Marketing-Strategie zu verbessern und den Data-Mining-Markt insgesamt anzusprechen. Damit steht das Unternehmen jedoch nicht allein: SAP, Peoplesoft, i2 und weitere Hersteller von Enterprise-Anwendungen ergänzen ihre Kernanwendungen momentan um Analytics-Funktionen zum Ausbau von deren Fähigkeit, Daten bereits während der Entstehung zu verarbeiten.
- Data-Mining: Verborgene Schätze in Unternehmensdaten
- Unbekannte Beziehungen identifizieren
- Betriebsabläufe und Erfolgschancen
- Vorbeugen ist besser als heilen
- Echtzeit-Data-Mining
- Beträchtliche Hardware-Investitionen
- Grundlagen des Angewandten Data-Mining
- Geheimnisvoll und esoterisch
- Data-Mining für die Anwender
- Aufräumen im Warehouse
- Probleme mit der Datenkonsistenz
- Datenintelligenz stärkt OneSteel
- Datenschwemme
- Nach Gold graben und das Geröll wegwerfen
Neueste Kommentare
3 Kommentare zu Data-Mining: Verborgene Schätze in Unternehmensdaten
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.
Open Source Data Mining mit RapidMiner und RapidAnalytics
Als kostenlose erhältliche Open-Source-Lösungen für den Unternehmenseinsatz empfehle ich:
* RapidMiner für Desktop oder Notebook: http://www.RapidMiner.com/
* RapidAnalytics als Server-Lösung: http://www.rapid-i.com/
Wahlweise kann man in RapidMiner und RapidAnalytics über Erweiterung (Extensions) die Open-Source-Systeme Weka und R einbinden. Es geht aber auch ohne, denn RapidMiner und RapidAnalytics bieten bereits von hause aus sehr viele maschinelle Lernverfahren und statistische Modellierungsverfahren.
Data-Mining mit R
Die freie Statistikprogrammiersprache R dazu verwenden.
Ausführlich – aber bitte weiteren Aspekt bedenken!
Vielen Dank für den langen Artikel. Es hat sich gelohnt!
Ich möchte aber ergänzen, dass Data Mining Modelle (Algorytmen) ein Training für die Datenbasis benötigen, um Vorhersagen treffen zu können. Daraus folgt, das sie mit der Zeit immer besser werden können, wenn man die Voraussagen mit den Ergebnissen konfrontiert.
Das Training (mit verifizierten Daten) ist wesentlich für die Qualität der Aussagen der Mining Modelle.