Software erschließt Computern Wikipedia und Wiktionary

Informatiker der TU Darmstadt haben eine Software entwickelt, die es Computern ermöglicht, auf das eigentlich für menschliche Leser bestimmte Wissen in Online-Werken wie Wikipedia und Wiktionary zuzugreifen. Sowohl die Analysesoftware für Wikipedia als auch jene für Wiktionary ist für nichtkommerzielle Forschungszwecke frei verfügbar.

„Während für Wikipedia mittlerweile eine Reihe von Zugriffsmöglichkeiten existiert, ist die Software für Wiktionary eine Neuheit. Sie verwandelt das Online-Werk in ein von Computern verarbeitbares multilinguales Netz, das Wörter verschiedener Sprachen miteinander verknüpft und zusätzlich eine große Menge an lexikografischer Information auf Knopfdruck bereitstellt“, sagt der am Projekt beteiligte Informatiker Christof Müller.

Die Darmstädter Wikipedia-Software ist für alle Sprachen verfügbar, in denen es Wikipedia-Editionen gibt. Für Wiktionary haben die Wissenschaftler zunächst eine englische und eine deutsche Sprachversion fertiggestellt. Durch die Verknüpfung zwischen Wikipedia-Artikeln und Wiktionary-Einträgen sowie zwischen sprachenspezifischen Editionen ließen sich auch automatisch Übersetzungen erstellen. Ein Programm zur Informationssuche in einer Sprache, für die der Umfang der Online-Werke noch relativ klein ist, könne so vom Wissen der wesentlich größeren englischsprachigen Wikipedia-Gemeinschaft profitieren.

„Wir sind überzeugt, dass die von uns entwickelte Software der Wissensgewinnung zu qualitativen Sprüngen im Bereich des automatischen Sprachverstehens führen wird. Teilweise haben wir das automatisch gewonnene Wissen in eigenen Experimenten bei der Informationsrecherche, der Erkennung von Meinungen in freien Texten und der Beantwortung von natürlichsprachlichen Fragen bereits eingesetzt und überzeugende Verbesserungen festgestellt“, erklärt Iryna Gurevych, Fachgebietsleiterin an der TU Darmstadt.

ZDNet.de Redaktion

Recent Posts

KI-gestütztes Programmieren bringt IT-Herausforderungen mit sich

OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.

2 Tagen ago

Studie: Ein Drittel aller E-Mails an Unternehmen sind unerwünscht

Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…

6 Tagen ago

HubPhish: Phishing-Kampagne zielt auf europäische Unternehmen

Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…

6 Tagen ago

1. Januar 2025: Umstieg auf E-Rechnung im B2B-Geschäftsverkehr

Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.

6 Tagen ago

Google schließt schwerwiegende Sicherheitslücken in Chrome 131

Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…

6 Tagen ago

Erreichbarkeit im Weihnachtsurlaub weiterhin hoch

Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…

1 Woche ago