Ausgangslage

Das Bundesamt für Kultur sieht laut einem im Auftrag erstellten Evaluationsbericht (2019) mittelfristig die Gefahr einer existentiellen Bedrohung der rätoromanischen Sprache. Es geht hervor, dass unter anderem die mediale Präsenz fehlt um der Sprache die benötigte Sichtbarkeit zu geben. Das Projekt versucht durch die Teilautomatisierung des Übersetzungsprozesses Potential zur Steigerung von Qualität, Geschwindigkeit und Effizienz von Übersetzungsaufgaben zu schaffen.

Projektziel

Ziel dieses Projekts ist es, ein Werkzeug zu schaffen, sowie Empfehlungen auszuarbeiten, um Unternehmen mit Übersetzungstätigkeit dabei zu unterstützen, ihre bestehenden Prozesse besser zu digitalisieren und teilweise zu automatisieren. Durch diese Ziele wird entsprechende Fachkompetenzen an der FHGR aufgebaut, und ein Unterstützungsnetzwerk gebildet, welches es erlaubt das geschaffene Werkzeug in Zukunft zu optimieren und damit zu einem Gegenstand des täglichen Gebrauchs weiterentwickeln zu können.

Umsetzung

Computergestützte Übersetzungen sind ein Anwendungsfeld der Computerlinguistik, und erzielten mit dem Aufkommen von Deep Learning basierten Algorithmen in den letzten Jahren bei grossflächig gesprochenen Sprachen fast menschenähnliche Qualitätsniveaus. Bei diesem neuartigen Ansatz werden immense Datenmengen genutzt, um ein Computersystem durch iterative Trainings zu schaffen. Im Fall der Rätoromanischen Sprache existiert eine nur bedingt ausreichende Menge an Daten, die konkrete Disziplin wird deshalb «Low Resource Machine Translation» bezeichnet. Aktuelle Ergebnisse liegen hierbei weit hinter vergleichbaren stark vertretenen Sprachen zurück.

Die Umsetzung des Projekts ist in mehrere Arbeitspakete gegliedert: Zusammen mit der Lia Rumantscha und weiteren Kooperationspartnern werden über den Projektrahmen hinaus Übersetzungsdaten gesammelt, geeignet aufbereitet und in Form von anwendungsbezogenen Korpora gespeichert. Parallel werden anhand dieser Daten iterativ Computermodelle berechnet, welche eine Übersetzung von Deutsch ins Rätoromanische zulassen. Durch regelmässige manuelle und automatische Evaluationen wird die Qualität jedes Modells bewertet und analysiert. Das Feedback und die ständig wachsende verfügbare Datenmenge erlauben die schrittweise Optimierung der Übersetzungsqualität.