Vor dem Start: Semantische Suche im Unternehmensnetz

Geht man rein rechnerisch davon aus, dass Google eine 2,5-Milliarden-Dollar-Firma ist, so ergibt sich daraus, dass ein Herausforderer mindestens fünf Milliarden, im Maximalfall sogar bis zu 42,5 Milliarden Dollar ausgeben müsste, um den Marktführer von der Spitze zu verdrängen. „Man braucht kein Experte sein, um zu erkennen, dass sich das zum gegenwärtigen Zeitpunkt niemand leisten kann“, sagt Reischl.

Andererseits könnten Web-2.0-Technologien das Google-Imperium auch von innen heraus aushöhlen. Die größten Herausforderungen für den Suchprimus lauern nicht in Europa, sondern in China und Indien, denn deren IT-Firmen expandieren auch nach Europa. Andererseits eröffnen sich nach Auffassung von Acatech auch hierzulande neue Perspektiven. Als viel versprechendes Projekt gilt etwa ConWeaver.

„Interessant sind semantische Suchen insbesondere dort, wo verschiedene, unter Umständen heterogene Datenquellen, wie Projektdatenbanken, Expertendatenbanken, ERP-Systeme und Fileserver, vorliegen“, sagt Thomas Kamps vom Fraunhofer-Institut für Graphische Datenverarbeitung IGD. Die Verknüpfung der gespeicherten Daten liefere häufig genau jene Zusammenhänge, die Unternehmen für semantische Suchanfragen benötigten.

Das Hauptproblem liegt jedoch darin, diese Verknüpfungen herzustellen. Gewöhnliche Ansätze semantischer Technologien gehen davon aus, dass diese Zusammenhänge manuell hergestellt werden müssen. „Das ist jedoch bei den großen Datenvolumina in den Unternehmen illusorisch, weshalb diese Ansätze wohl bisher noch keine Durchschlagskraft erreicht haben“, sagt Kamps.

Benötigt werde deshalb ein automatischer Aufbau der Zusammenhänge aus den Unternehmensdaten. „Genau dies vermag ConWeaver derzeit wie kein anderes System zu bewerkstelligen“, so der Experte. Da die Datenquellen beziehungsweise die darin gespeicherten Inhalte von Anwendung zu Anwendung verschieden seien, werde ein flexibles System zur Datenanalyse benötigt. Es müsse zudem so konfigurierbar sei, dass die semantischen Zusammenhänge aus den gegebenen Datenquellen optimal und automatisch herausgefiltert werden könnten.

Dazu stellt ConWeaver eine Bibliothek von mehr als 200 unterschiedlichen Analysemodulen bereit. Diese dienen etwa der Konzept-, Entitäten- und Relationenextraktion oder der Berechnung von Ähnlichkeiten und Klassifikationen, der automatischen Erzeugung mehrsprachiger Lexika und der Analyse von Benutzerverhalten bis hin zu intelligenten Importregeln.

„Diese Analysemodule können mit Hilfe von Analyseworkflows ohne Programmieraufwand miteinander kombiniert werden, und zwar so, wie es für die gegebenen Daten optimal Ergebnisse produziert“, fasst Thomas Kamps zusammen. Denn nicht immer lassen sich für jeden gegebenen Datenbestand mehrsprachige Wissensnetze automatisch generieren und aktualisieren. „Wichtig ist dabei, dass von Seiten der Unternehmen wenig Personalaufwand erforderlich ist.“

Page: 1 2 3

ZDNet.de Redaktion

Recent Posts

Sicherheitslücken bei Verivox und Check24 geben Kundendaten preis

Das Datenleck betrifft den Kreditvergleich. Unbefugte haben zwischenzeitlich Zugriff auf die Kreditvergleiche anderer Kunden.

3 Tagen ago

Copilot Wave 2: Microsoft kündigt neue KI-Funktionen an

Copilot wird stärker in Microsoft 365 integriert. Neue Funktionen stehen unter anderem für Excel, Outlook,…

3 Tagen ago

Kritische RCE-Schwachstelle in Google Cloud Platform

Schwachstelle weist laut Tenable auf schwerwiegende Sicherheitslücke in Google Cloud Diensten hin, insbesondere App Engine,…

4 Tagen ago

Microsoft macht Office LTSC 2024 allgemein verfügbar

Die neue Version kommt mit einem Supportzeitraum von fünf Jahren. Währenddessen erhält Office LTSC 2024…

4 Tagen ago

iOS 18 schließt 33 Sicherheitslücken

Sie führen unter Umständen zur Preisgabe vertraulicher Informationen oder gar zu einem Systemabsturz. Apples KI-Dienste…

4 Tagen ago

Intel verschiebt Bau der Chipfabrik in Magdeburg

Das Projekt liegt wahrscheinlich für rund zwei Jahre auf Eis. Aus der Fertigungssparte Intel Foundry…

4 Tagen ago