Research

21.06.2022

Lucas Seiler

Automatisierte Übersetzung für Rätoromanisch

Übersetzung mittels künstlicher Intelligenz findet in der Schweiz breite Anwendung in den Landessprachen Deutsch, Italienisch und Französisch – erstmalig sind nun auch Übersetzungen aus dem Rätoromanischen und ins Rätoromanische verfügbar. Möglich macht es eine Kollaboration der Schweizer Unternehmen Radiotelevisiun Svizra Rumantscha (RTR) und Textshuttle.

Die Verwendung von maschineller Übersetzung ist für die meisten Menschen in der Schweiz, die Deutsch, Italienisch oder Französisch sprechen, ein gängiges Hilfsmittel im Alltag. Erstmalig ist es nun auch möglich, solche maschinellen Übersetzungssysteme für rätoromanische Texte einzusetzen. Im Auftrag und in Zusammenarbeit mit dem rätoromanischen Medienhaus RTR hat Textshuttle ein System für automatisierte Textübersetzung für die Sprache Rätoromanisch hergestellt.


Das Zürcher Unternehmen und RTR nutzen modernste Technologien und vorhandene Sprachressourcen für die Entwicklung der Übersetzungslösung und tragen somit aktiv zum Erhalt der Landessprache bei. Die beiden Unternehmen befassten sich im Frühjahr 2021 während einer ersten Projektphase intensiv mit der Übersetzung von Rätoromanisch nach Deutsch. Hierbei gelang es, dass grundsätzlich alle Idiome des Rätoromanischen als Ausgangssprache verwendet werden können. Nach dieser ersten erfolgreichen Zusammenarbeit arbeiteten Textshuttle und RTR von Sommer 2021 bis Frühling 2022 an der Gegenrichtung von Deutsch nach Rätoromanisch. Bei Rätoromanisch als Zielsprache wird in Rumantsch Grischun (Amtssprache) übersetzt. Es ist aber durchaus denkbar, dass in Zukunft auch einzelne Idiome berücksichtigt werden können.


Die Übersetzung wird mittels neuronalen Netzen (künstliche Intelligenz) erstellt. Das Sprachmodell erlernt während eines mehrwöchigen Trainings auf Basis von vorhandenen Daten die Übersetzungsmechanismen, indem dem Modell immer und immer wieder bestehende Übersetzungen gezeigt werden. Die Entwicklung wird in iterativen Prozessen vorangetrieben, die laufend durch aktuelle Technologien angepasst und ausgebessert werden. Muttersprachler:innen unterstützen diesen Prozess, indem sie die Ergebnisse evaluieren und Rückmeldungen zur Verbesserung geben.


Die Herausforderung besteht darin, dass Rätoromanisch, im Vergleich zu weiter verbreiteten Sprachen, über sehr wenig bestehende Sprachressourcen verfügt. In der Entwicklung werden vorhandene Daten aufbereitet, parallelisiert und gesäubert, bevor sie für das Training berücksichtigt werden können. Insgesamt wurden bis jetzt 200’000 parallele Segmente verwendet, die aus bestehenden, frei verfügbaren Daten wie beispielsweise Gesetzestexten, der Bundesverfassung und Pressetexten des Kantons stammen. Des Weiteren werden bestehende Daten von RTR in die Trainings eingebracht und priorisiert - dadurch ist das System auf die Texte von RTR spezialisiert und eignet sich besonders gut für deren Textsorten.


Die ersten Ergebnisse sind vielversprechend und wurden von Sprachexpert:innen als Unterstützung im Praxisalltag wahrgenommen. Die automatisierte Übersetzung kann bequem für einzelne Wörter, ganze Texte oder Word-Dokumente in der Weboberfläche, dem sogenannten Translation Interface, genutzt werden und funktioniert ähnlich wie frei verfügbare Übersetzungsdienste im Web. RTR wird die maschinelle Übersetzung künftig einsetzen, um die redaktionelle Arbeit zu erleichtern. Durch die maschinelle Vorübersetzung müssen Texte lediglich noch leicht nachbearbeitet oder korrigiert werden.


Es ist denkbar, dass der Rätoromanisch-Übersetzer in Zukunft als Online-Dienst angeboten wird, um so der gesamten Bevölkerung den Zugang zur Rätoromanischen Sprache zu ermöglichen.


Alle, die die rätoromanische Sprache jetzt nach diesen grossartigen Neuigkeiten näher kennenlernen möchten, können Textshuttle kostenlos nutzen.


Kontaktieren Sie uns hier.


Über Textshuttle

Textshuttle ist eine unabhängige Anbieterin von maschinellen Übersetzungslösungen mit den Schwerpunkten Datensicherheit und Corporate Wording. Gegründet als Spin-off der Universität Zürich, unterhält das Unternehmen enge Beziehungen zu führenden Forschungseinrichtungen und beschäftigt derzeit 17 Expert:innen für maschinelles Lernen und Übersetzungstechnologie. Die KI-basierte Übersetzungssoftware von Textshuttle wird von Tausenden von Mitarbeiter:innen und Dutzenden professionellen Übersetzungsteams in Schweizer und multinationalen Konzernen wie SwissLife, Migros Bank und der OBI Group eingesetzt.


‍Über RTR

Radiotelevisiun Svizra Rumantscha (RTR) ist ein Tochterunternehmen des Schweizer Medienunternehmens SRG SSR. RTR, mit Hauptsitz in Chur, erbringt als einziges Unternehmen den audiovisuellen Service public für die „Svizra rumantscha“, die rätoromanische Schweiz.


Über das eigentliche rätoromanische Sprachgebiet hinaus sieht sich das Unternehmen in einer «Brückenfunktion im sprachlich uneinheitlichen Graubünden, für die rätoromanische Diaspora in der ganzen Schweiz und jenseits der Landesgrenze.» Mehr Informationen finden Sie hier.


RTR hat vergangenes Jahr bereits mit der Firma Recapp ein Projekt zur die schriftliche Wiedergabe von gesprochenem Rätoromanisch lanciert, in dessen Rahmen mittels Spracherkennung unterdessen alle Idiome erkannt werden können.