VIKEF geht diese Herausforderung zur Entschlüsselung und expliziten Kodierung der Semantik von Webinhalten auf der Basis eines technologischen Rahmenwerkes an, um Wissen automatisch aus textuellen und multimedialen Inhalten zu schöpfen. Universitäten, Forschungseinrichtungen und Unternehmen aus neun Ländern arbeiten bereits seit 2004 an diesem Projekt, bei dem Dokumente und Bildmedien mit Verfahren der Linguistik und der Bildanalyse hinsichtlich der Bedeutung ihrer Inhalte untersucht werden.
Das gewonnene Wissen wird in einer einheitlichen wissenstechnischen Infrastruktur – einer Virtuellen Informations- und Wissensumgebung – zur Weiterverarbeitung bereitgestellt. So kann es genutzt werden, um computerlesbare Wissensrepräsentationen für die analysierten Inhalte zu erzeugen. In einem weiteren Schritt werden die Informationen zusammen mit dem computerlesbar repräsentierten Wissen nicht mehr nur automatisch interpretiert, sondern zielgerichtet für spezifische Anwendungen – etwa im Bereich wissenschaftlicher Kongresse und Handelsmessen – aufbereitet und danach proaktiv den Benutzern zur Verfügung gestellt.
Damit derartiges explizit kodiertes Wissen überhaupt gezielt und effektiv von Maschinen zur Unterstützung von menschlichen Benutzern in deren Informationsbedürfnissen und Arbeitsaufgaben genutzt werden kann, müssen sie die auf eine Zeichenfolge im Kontext des Gesamttextes zutreffende Wortbedeutungen verstehen und diese auf versteckte Art und Weise der Zeichenkette in maschinenlesbarer Form hinzufügen. Diese so genannte semantische Annotation funktioniert über Markups in den XML-basierten Wissensrepräsentationssprachen RDF und OWL, die danach unsichtbar mit der „Buchstabenfolge“ verknüpft sind.
Diese Markups müssen Wortbedeutungen darstellen, die in allen Sprachen inhaltlich identisch sind: „Zurzeit sind sie aber noch ziemlich beliebig“, bedauert Hemmje, „wir müssen deshalb für die Bezeichnung dieser Wortbedeutungen geeignete Vokabulare finden und festlegen, die weltweit in gleicher Weise verwendet wird und gleichzeitig maschinenlesbar sind.“ Mit Hilfe dieser Zusatzinformationen können Maschinen die zutreffende Bedeutung des Inhalts dann zukünftig ohne eine erneute Inhaltsanalyse ableiten und z. B. ein Banküberweisungsformular im Web automatisch erkennen oder eine Flugbuchungsseite nicht mit einer Anmeldungsseite im Web für eine Konferenzveranstaltung oder eine Handelsmesse verwechseln.
Selbst Bilder können so maschinell in Anfängen „verstanden“ werden: Eine Straße, die über ein Wasser führt, könnte als „Brücke“ interpretiert, Menschen um einen Tisch herum sitzend als Essens- oder Gesprächsrunde, je nachdem, ob auch Speisen oder Dokumente auf dem Tisch erkennbar sind. In Messekatalogen könnten darüber hinaus abgebildete Produkte mit deren textuellen Beschreibungen automatisch verknüpft werden.
Eine schwerwiegende Anfälligkeit hebelt die Sicherheitsfunktion Seitenisolierung auf. Betroffen sind Chrome für Windows, macOS und…
DeepL Voice ermöglicht Live‑Übersetzung von Meetings und Gesprächen in 13 Sprachen.
Betroffen sind Windows und Windows Server. Microsoft patcht aber auch Schwachstellen in Excel, Word und…
Es lässt sich um bis zu 50 Prozent dehnen. Allerdings besitzt es eine deutliche geringere…
Allerdings nimmt auch die Resilienz gegenüber Cyberattacken zu. Das BSI hat außerdem die Cybersicherheit anstehender…
Es ist das größte Wachstum in einem Jahr seit 2021. Unter anderem lässt das Interesse…