Categories: NetzwerkeTelekommunikation

EU-Sprachdatenbestand wird frei zugänglich

Die EU-Kommission will ihren Sprachdatenbestand frei zugänglich machen, um computergestützte Übersetzungen zu verbessern. Die Sammlung umfasst über eine Million Sätze und deren Übersetzung in 22 der 23 EU-Amtssprachen.

Mithilfe der Daten können maschinelle Übersetzungssysteme lernen, wie Wörter und Sätze im Zusammenhang richtig zu übertragen sind. Auch bei der Entwicklung anderer Sprachsoftware sind solche Daten hilfreich, beispielsweise für Programme zur Grammatik- und Rechtschreibprüfung, Online-Wörterbücher und mehrsprachige Textklassifizierungssysteme.

„Mit dieser Initiative möchte die Europäische Kommission die Sprachtechnologien voranbringen, die Mehrsprachigkeit fördern und die computergestützte Übersetzung einfacher, billiger und leichter zugänglich machen“, sagte Leonard Orban, EU-Kommissar für Mehrsprachigkeit. Die Bürger, die kleineren Sprachgemeinschaften angehörten, erhielten so einen leichteren Zugang zu Dokumenten und Webseiten, die es oft nur in den häufig verwendeten Sprachen gebe.

Die EU-Organe verfügen über mehr multilinguale Texte als jede andere Organisation, weil die EU-Vorschriften in allen 23 Amtsprachen vorliegen müssen. Ihre Übersetzungsdienste produzieren jährlich etwa 1,5 Millionen Seiten.