EU-Sprachdatenbestand wird frei zugänglich

Textsammlung soll computergestützte Übersetzung verbessern

Die EU-Kommission will ihren Sprachdatenbestand frei zugänglich machen, um computergestützte Übersetzungen zu verbessern. Die Sammlung umfasst über eine Million Sätze und deren Übersetzung in 22 der 23 EU-Amtssprachen.

Mithilfe der Daten können maschinelle Übersetzungssysteme lernen, wie Wörter und Sätze im Zusammenhang richtig zu übertragen sind. Auch bei der Entwicklung anderer Sprachsoftware sind solche Daten hilfreich, beispielsweise für Programme zur Grammatik- und Rechtschreibprüfung, Online-Wörterbücher und mehrsprachige Textklassifizierungssysteme.

„Mit dieser Initiative möchte die Europäische Kommission die Sprachtechnologien voranbringen, die Mehrsprachigkeit fördern und die computergestützte Übersetzung einfacher, billiger und leichter zugänglich machen“, sagte Leonard Orban, EU-Kommissar für Mehrsprachigkeit. Die Bürger, die kleineren Sprachgemeinschaften angehörten, erhielten so einen leichteren Zugang zu Dokumenten und Webseiten, die es oft nur in den häufig verwendeten Sprachen gebe.

Die EU-Organe verfügen über mehr multilinguale Texte als jede andere Organisation, weil die EU-Vorschriften in allen 23 Amtsprachen vorliegen müssen. Ihre Übersetzungsdienste produzieren jährlich etwa 1,5 Millionen Seiten.

Themenseiten: Telekommunikation

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

ZDNet für mobile Geräte
ZDNet-App für Android herunterladen Lesen Sie ZDNet-Artikel in Google Currents ZDNet-App für iOS

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu EU-Sprachdatenbestand wird frei zugänglich

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *