VIKEF geht diese Herausforderung zur Entschlüsselung und expliziten Kodierung der Semantik von Webinhalten auf der Basis eines technologischen Rahmenwerkes an, um Wissen automatisch aus textuellen und multimedialen Inhalten zu schöpfen. Universitäten, Forschungseinrichtungen und Unternehmen aus neun Ländern arbeiten bereits seit 2004 an diesem Projekt, bei dem Dokumente und Bildmedien mit Verfahren der Linguistik und der Bildanalyse hinsichtlich der Bedeutung ihrer Inhalte untersucht werden.
Das gewonnene Wissen wird in einer einheitlichen wissenstechnischen Infrastruktur – einer Virtuellen Informations- und Wissensumgebung – zur Weiterverarbeitung bereitgestellt. So kann es genutzt werden, um computerlesbare Wissensrepräsentationen für die analysierten Inhalte zu erzeugen. In einem weiteren Schritt werden die Informationen zusammen mit dem computerlesbar repräsentierten Wissen nicht mehr nur automatisch interpretiert, sondern zielgerichtet für spezifische Anwendungen – etwa im Bereich wissenschaftlicher Kongresse und Handelsmessen – aufbereitet und danach proaktiv den Benutzern zur Verfügung gestellt.
Damit derartiges explizit kodiertes Wissen überhaupt gezielt und effektiv von Maschinen zur Unterstützung von menschlichen Benutzern in deren Informationsbedürfnissen und Arbeitsaufgaben genutzt werden kann, müssen sie die auf eine Zeichenfolge im Kontext des Gesamttextes zutreffende Wortbedeutungen verstehen und diese auf versteckte Art und Weise der Zeichenkette in maschinenlesbarer Form hinzufügen. Diese so genannte semantische Annotation funktioniert über Markups in den XML-basierten Wissensrepräsentationssprachen RDF und OWL, die danach unsichtbar mit der „Buchstabenfolge“ verknüpft sind.
Diese Markups müssen Wortbedeutungen darstellen, die in allen Sprachen inhaltlich identisch sind: „Zurzeit sind sie aber noch ziemlich beliebig“, bedauert Hemmje, „wir müssen deshalb für die Bezeichnung dieser Wortbedeutungen geeignete Vokabulare finden und festlegen, die weltweit in gleicher Weise verwendet wird und gleichzeitig maschinenlesbar sind.“ Mit Hilfe dieser Zusatzinformationen können Maschinen die zutreffende Bedeutung des Inhalts dann zukünftig ohne eine erneute Inhaltsanalyse ableiten und z. B. ein Banküberweisungsformular im Web automatisch erkennen oder eine Flugbuchungsseite nicht mit einer Anmeldungsseite im Web für eine Konferenzveranstaltung oder eine Handelsmesse verwechseln.
Selbst Bilder können so maschinell in Anfängen „verstanden“ werden: Eine Straße, die über ein Wasser führt, könnte als „Brücke“ interpretiert, Menschen um einen Tisch herum sitzend als Essens- oder Gesprächsrunde, je nachdem, ob auch Speisen oder Dokumente auf dem Tisch erkennbar sind. In Messekatalogen könnten darüber hinaus abgebildete Produkte mit deren textuellen Beschreibungen automatisch verknüpft werden.
Neueste Kommentare
Noch keine Kommentare zu VIKEF: Auf dem Weg zum semantischen Web
Kommentar hinzufügenVielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.