EU-Sprachdatenbestand wird frei zugänglich

Textsammlung soll computergestützte Übersetzung verbessern

von Björn Greif am 21. Januar 2008 , 18:14 Uhr

Die EU-Kommission will ihren Sprachdatenbestand frei zugänglich machen, um computergestützte Übersetzungen zu verbessern. Die Sammlung umfasst über eine Million Sätze und deren Übersetzung in 22 der 23 EU-Amtssprachen.

Mithilfe der Daten können maschinelle Übersetzungssysteme lernen, wie Wörter und Sätze im Zusammenhang richtig zu übertragen sind. Auch bei der Entwicklung anderer Sprachsoftware sind solche Daten hilfreich, beispielsweise für Programme zur Grammatik- und Rechtschreibprüfung, Online-Wörterbücher und mehrsprachige Textklassifizierungssysteme.

„Mit dieser Initiative möchte die Europäische Kommission die Sprachtechnologien voranbringen, die Mehrsprachigkeit fördern und die computergestützte Übersetzung einfacher, billiger und leichter zugänglich machen“, sagte Leonard Orban, EU-Kommissar für Mehrsprachigkeit. Die Bürger, die kleineren Sprachgemeinschaften angehörten, erhielten so einen leichteren Zugang zu Dokumenten und Webseiten, die es oft nur in den häufig verwendeten Sprachen gebe.

Die EU-Organe verfügen über mehr multilinguale Texte als jede andere Organisation, weil die EU-Vorschriften in allen 23 Amtsprachen vorliegen müssen. Ihre Übersetzungsdienste produzieren jährlich etwa 1,5 Millionen Seiten.

EU-Sprachdatenbestand wird frei zugänglich

Neueste Kommentare

Noch keine Kommentare zu EU-Sprachdatenbestand wird frei zugänglich

Vielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.

Schreibe einen Kommentar Antworten abbrechen

Neueste Kommentare

Noch keine Kommentare zu EU-Sprachdatenbestand wird frei zugänglich

Vielen Dank für Ihren Kommentar.Ihr Kommentar wurde gespeichert und wartet auf Moderation.

Schreibe einen Kommentar Antworten abbrechen

Vielen Dank für Ihren Kommentar.
Ihr Kommentar wurde gespeichert und wartet auf Moderation.