Data-Mining: Verborgene Schätze in Unternehmensdaten

In der Vergangenheit wurde der Data-Mining-Markt von proprietären Produkten bestimmt, die auf Enterprise-Data-Warehouses aufgesetzt wurden oder die Erweiterungen dieser Warehouses selbst waren. Data-Mining wurde als eigenständige Aktivität angesehen, in der ein fähiger Analyst komplexe Suchparameter definierte und die Tools dann in das Data-Warehouse einspeiste und auf Ergebnisse wartete.

Trafen die Ergebnisse dann ein, waren sie für gewöhnlich nutzbringend: Sie zeigten, dass sich zwei oder mehr Produkte gut zusammen verkaufen ließen oder dass ein bestimmter Kundentyp im vergangen Monat mehr Ansprüche auf Fundsachen anmeldete. Egal um was für Daten es sich handelte, der größte Mangel des Data-Mining bestand darin, dass es eine gewisse Zeit dauern konnte, bis sich die Geschäftspraktiken auf die erkannten Beziehungen eingestellt hatten.

Dieses Problem war häufig das Ergebnis der architektonischen und technischen Schwierigkeiten, die das Data-Mining mit sich brachte. Deshalb wurde OLAP geboren (OnLine Analytical Processing), eine Werkzeugkategorie, die es Analysten ermöglicht, mehrere Dimensionen aus einem größeren Datensatz zu ziehen und anschließend die Beziehungen zwischen diesen Sätzen zu untersuchen. In den Jahren seit seiner Einführung hat OLAP als Weg zur Auffindung von Mustern in großen Datenmengen eine ständig wachsende Anhängerschaft gewonnen. Dennoch wird auch OLAP nur vom Menschen gesteuert und erkennt nur die Muster, die es auch erkennen soll. Außerdem ist OLAP von Natur aus sehr beschränkt, denn seine Funktionsweise basiert auf dem Ignorieren vieler anderer Datensätze.

Beim Data-Mining im eigentlichen Sinne geht es darum, eine Methodologie zur Datenanalyse einzuführen, die als Obermenge für die beschränkten Möglichkeiten von OLAP dienen kann. Jedoch hat sich dies in der Vergangenheit als schwierig erwiesen, allein schon aufgrund der riesigen Datenmengen und der damit verbundenen Zeit, die zur Verarbeitung dieser Daten benötigt wird.

Themenseiten: IT-Business, Strategien, Technologien

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

3 Kommentare zu Data-Mining: Verborgene Schätze in Unternehmensdaten

Kommentar hinzufügen
  • Am 11. Februar 2011 um 19:11 von Frank Xavier

    Open Source Data Mining mit RapidMiner und RapidAnalytics
    Als kostenlose erhältliche Open-Source-Lösungen für den Unternehmenseinsatz empfehle ich:

    * RapidMiner für Desktop oder Notebook: http://www.RapidMiner.com/

    * RapidAnalytics als Server-Lösung: http://www.rapid-i.com/

    Wahlweise kann man in RapidMiner und RapidAnalytics über Erweiterung (Extensions) die Open-Source-Systeme Weka und R einbinden. Es geht aber auch ohne, denn RapidMiner und RapidAnalytics bieten bereits von hause aus sehr viele maschinelle Lernverfahren und statistische Modellierungsverfahren.

  • Am 8. September 2003 um 9:59 von Dieter Gennburg

    Data-Mining mit R
    Die freie Statistikprogrammiersprache R dazu verwenden.

  • Am 25. August 2003 um 20:19 von Ralf Dietrich

    Ausführlich – aber bitte weiteren Aspekt bedenken!
    Vielen Dank für den langen Artikel. Es hat sich gelohnt!
    Ich möchte aber ergänzen, dass Data Mining Modelle (Algorytmen) ein Training für die Datenbasis benötigen, um Vorhersagen treffen zu können. Daraus folgt, das sie mit der Zeit immer besser werden können, wenn man die Voraussagen mit den Ergebnissen konfrontiert.
    Das Training (mit verifizierten Daten) ist wesentlich für die Qualität der Aussagen der Mining Modelle.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *