Research

30.08.2023

Simona Todesco

Forschung für genderfaire Übersetzung bei Textshuttle

Geschlechtervorurteile in KI-Modellen sind eine weit verbreitete Problemstellung. Sie sind meist auf voreingenommenen Datensätzen trainiert und neigen daher dazu, unbeabsichtigte Geschlechterstereotypen und somit gesellschaftliche Vorurteile zu reproduzieren. So wird bei einer automatischen Textübersetzung beispielsweise “teacher” zu “Lehrer” und “nurse” zu “Krankenpflegerin”, obwohl die Übersetzung dieser Begriffe sowohl in die weibliche wie auch in die männliche Form korrekt sein kann.

Blogpost_genderfair_gross.png

Forschung

Textshuttle positioniert sich mit der aktiven Beteiligung in der Wissenschaft als Pionierin in diesem Feld. Chantal Amrhein, Florian Schottmann und Samuel Läubli haben zusammen mit Rico Sennrich von der Universität Zürich einen neuen Ansatz entwickelt und auf seine Akzeptanz in der Praxis geprüft. Die Publikation wurde an der ACL 2023 veröffentlicht.


Genderfaire Sprache bietet einen neuartigen Ansatz, um voreingenommene Sätze umzuformulieren, während ihre Bedeutung und Kohärenz möglichst erhalten bleiben sollen. KI-Modelle, die Texte genderfairer gestalten, werden folgendermassen trainiert: Zunächst werden Sätze mit geschlechtsspezifischen Wörtern in einem gegebenen Korpus identifiziert. Im nächsten Schritt werden diese automatisch umformuliert, um eine unvoreingenommene Alternative der entsprechenden Sätze zu generieren. Anhand dieser Daten wird nun ein KI-Modell trainiert, das mithilfe der gelernten mathematischen Repräsentation von Text jegliche Sätze umformulieren kann.


Aktuell wird eine Übersetzung in genderfaire Sprache mit Textshuttle folgendermassen produziert: Zunächst wird von einem unserer Übersetzungmodelle eine Übersetzung erstellt. Danach wird diese von einem zweiten Modell in genderfaire Sprache umgeschrieben. Genau wie unsere Übersetzungsmodelle lernt das Umformulierungsmodell aus grossen Datenmengen. Während des Trainingsprozesses erkennt das Modell Muster in der Sprache, die es ermöglichen, die relevanten Wörter im Ausgangstext in eine genderfaire Form zu überführen.


Überprüfung auf Akzeptanz

Der veröffentlichte Ansatz zu genderfairer Sprache wurde anschliessend auf seine Akzeptanz mit Laien geprüft. Es wurde eine Evaluation mit 294 freiwilligen Teilnehmer:innen (141 weiblich, 82 nicht-binär, 55 männlich, 16 andere) durchgeführt. Für die Bewertung wurden sechs Absätze aus deutschen Texten ausgewählt, die geschlechterbezogene Wörter enthielten. Diese Absätze wurden in drei Versionen präsentiert: als Original, mit dem genderfairen Ansatz und als manuell erstellte Referenz.


Die Teilnehmer:innen wurden gebeten, die Geschlechtergerechtigkeit der Absätze auf einer Skala von 1 (stimme überhaupt nicht zu) bis 5 (stimme vollkommen zu) zu bewerten. Die Ergebnisse zeigten, dass diejenigen Texte mit dem genderfairen Ansatz im Durchschnitt besser bewertet wurden als die Originaltexte, jedoch noch immer schlechter als die Texte, die von Menschen (Referenz) erstellt wurden. Besonders interessant: Auch wenn die Texte mit dem genderfairen Ansatz nicht immer perfekt sind, werden sie dennoch von einem Grossteil der Befragten bevorzugt.


Genderfaire Sprache hat sich in der Gesellschaft noch nicht durchgesetzt und wird in der Praxis auf unterschiedlichste Art und Weise umgesetzt. Diese Faktoren erschweren die Entwicklung von neuen Ansätzen. Darüber hinaus muss sichergestellt werden, dass das KI-System selbst keine neuen Vorurteile einführt oder unbeabsichtigt die ursprüngliche Bedeutung des Textes verändert. Die Ergebnisse aus der Umfrage verdeutlichen, dass der neue Ansatz trotz Mängel dazu beitragen kann, geschlechtergerechte Sprache zu fördern.


Aus der Forschung in die Praxis

Mit dieser Forschungsinitiative soll schlussendlich das Anliegen für genderfaire Sprache in die Praxis umgesetzt und ein Beitrag zu inklusiver Sprache geleistet werden. Unter textshuttle.com stellen wir in einer Beta-Version einen ersten Ansatz für die Adaption in die Praxis vor, wobei eine kontinuierliche Verbesserung angestrebt wird. Anwender:innen können bei der Sprachform in den Zielsprachen Deutsch und Englisch genderfaire Übersetzung auswählen. Jeder:jedem Anwender:in ist selbst überlassen, ob ein Text genderfair formuliert sein soll oder nicht. Die Formulierungen sind vorerst in der Variante mit Doppelpunkt verfügbar; Ziel ist es, dass die Verwendung weiterer Formen, wie etwa des Gendersterns, in Zukunft möglich sein wird.


Fazit

Als Anbieterin von KI-Systemen tragen wir die Verantwortung, Fairness zu fördern und Vorurteile zu bekämpfen. Erste Rückmeldungen bilden ein positives Fazit. Und auch in Zukunft wird die genderfaire Sprache in der Forschung und Entwicklung unserer Produkte Raum einnehmen. Feedback unserer Anwender:innen treibt die kontinuierliche Verbesserung voran. Die Beta-Version unter textshuttle.com steht ab sofort für alle zur freien Verfügung. Wir begrüssen Verbesserungsvorschläge und Rückmeldungen sehr.


Weitere Informationen

Sie möchten mehr über Textshuttle erfahren oder sind auf der Suche nach Expert:innen zum Thema künstliche Intelligenz? Besuchen Sie unseren Media Corner. Hier finden Sie die Medienmitteilung zum Launch von Textshuttle. Die Business-Lösung von Textshuttle wird von Tausenden von Mitarbeiter:innen und dutzenden professionellen Übersetzungsteams in Schweizer und multinationalen Konzernen wie Swiss Life, Migros Bank oder OBI Group eingesetzt.