Genderinklusive Sprache
zugänglicher machen

all.txt ist ein Online-Texteditor, der inklusives und genderneutrales Schreiben in deutscher Sprache ermöglichen soll – ein „Rechtschreibcheck“ für Inklusion in Bezug auf alle Gender. Das CDL unterstützt bei der Erstellung von offenen Daten für genderinklusive Sprache, der Entwicklung eines ersten Datenprodukts und dessen Cloud-Integration. Mit dem gelabelten Datensatz gibt es erstmals im deutschsprachigen Raum eine Basis, um große Sprachmodelle genderinklusiv zu nutzen – auch für andere Projekte.


  • Abgeschlossen
  • Datenanwendung
  • Open Data

Inklusives und genderneutrales Schreiben in deutscher Sprache für alle – das wird möglich durch eine Software, die Texteditor und Rechtschreibprüfung zugleich ist. Sie kann als Plugin heruntergeladen und direkt im Browser eingesetzt werden, um geschlechtsneutrale Texte zu schreiben. Das Ziel von all.txt ist, überholte und nicht-inklusive Sprachpraktiken der Menschen auf zeitgemäße Weise durch Anleitung, Übung und Erklärung zu ändern. Die Software soll als Brücke zwischen Unsicherheit bei der Verwendung von geschlechtergerechter Sprache und dem Verständnis für Gender dienen. Das Programm bietet somit eine einfache Möglichkeit, Unternehmen und Menschen, die im Netz aktiv sind, bei der Verwendung von genderneutraler Sprache im täglichen Gebrauch zu unterstützen.

Das Civic Data Lab unterstützte das all.txt Team von Januar 2024 bis März 2025 bei den nächsten Schritten in ihrer Entwicklung durch:

  • Die Erstellung eines offenen Datensatzes mit Wörtern und Beispielsätzen in genderinklusiver deutscher Sprache (Civic Data Lab Team & all.txt Team)
  • Die Umsetzung einer prototypischen Webanwendung für den Browser, mithilfe derer Nutzer*innen all.txt testen können und die als Basis für die weitere Entwicklung von all.txt dient (Dienstleister &effect GmbH und all.txt Team)
  • Das Aufsetzen von technischer Infrastruktur und technisch-organisatorischen Prozessen (DevOps) (Dienstleister &effect GmbH und all.txt Team)
Übergangswelle

Technologien

  • Programmiersprache: Python
    • Frameworks: FastAPI
  • Datenbank: PostgreSQL
  • Programmiersprache: Typescript
    • Frameworks: vue.js
  • Cloud: Scaleway
  • Infrastructure-as-Code (IaC): terraform
  • Versionierung: GitLab
  • CI/CD & Deployment: GitLab CI/CD, Docker
  • Slack
  • GitLab Issues
  • Notion (aber: Zugriff und Berechtigungen für alle sicherstellen!)
  • Google Docs
  • Zoom für Online-Meetings: anfangs wöchentlich/zweiwöchentlich, im späteren Projektverlauf nur noch alle paar Monate
Übergangswelle

Erkenntnisse

  • Sowohl die Entwicklung einer datenbasierten Webanwendung mit Frontend und Backend als auch die Implementation von DevOps-Praktiken wie CI/CD und Infrastructure-as-Code sind gut gelöste Probleme, die von kompetenten Dienstleistern zügig umgesetzt werden können. Die Integration von DevOps in der weiteren Entwicklung erfordert jedoch ein Grundverständnis und praktische Kompetenzen (z.B. Triggern von Pipelines). Hier ist ein guter Wissenstransfer und umfassende Dokumentation essenziell.
  • Die zentrale technische Herausforderung des Vorhabens war die Konzeption und Implementierung eines Algorithmus, der beliebige Input-Texte in verschiedene Versionen von genderinklusive Sprache (z.B. verschiedene Neopronomen, Entgendern mit Gender-Sternchen/Doppelpunkt/Binnen-I, geschlechtsneutrale Formulierungen) “übersetzen” konnte. Zur Lösung dieser Herausforderung gibt es bisher keine Standardalgorithmen und –modelle. Es war und ist daher sehr unsicher, wie dieses Problem am besten gelöst werden kann. Eine Option besteht darin, computerlinguistische Methoden z.B. zu Co-Reference Resolution zu implementieren. Auf der anderen Seite werden die Funktionsumfänge von Small und Large Language Models immer schneller größer und können ggf. auch dieses Problem lösen. Hier muss noch mehr geforscht werden. Der Open Data Datensatz, der im Rahmen des Datenvorhabens entstand, kann hier als Benchmark und als Trainingsdatensatz dienen.

Erkenntnisse zur Zusammenarbeit und zur Organisation des Datenvorhabens

  • Strukturelle Hürden wie finanzielle Unsicherheit, zusätzlicher Überzeugungsaufwand für queere Projekte und klassistische Benachteiligung nicht-privilegierter Personen im IT-Umfeld haben Auswirkungen auf persönliche Kapazitäten und Ressourcen. Offene, verständnisvolle und empathische Kommunikation ist die zentrale Voraussetzung dafür, trotz dieser Herausforderungen erfolgreich zusammenarbeiten zu können.
  • Es ist wichtig, zentrale Unsicherheitsfaktoren zu identifizieren und sie zügig zu reduzieren. Bei der Planung des Datenvorhabens wäre es sinnvoll gewesen, stärker und früher auf den Algorithmus zu fokussieren und verschiedene Ansätze zu testen.
  • „Mut zum Pivotieren“ – Flexibilität bei der Neuausrichtung von Vorhaben ist notwendig, gerade bei Vorhaben mit vielen unklaren Parametern und viel Unsicherheit hinsichtlich technischer Machbarkeit.
  • In einem von Unsicherheit und hoher Arbeitsbelastung geprägten Umfeld sind kleine, klar definierte Arbeitspakete noch wichtiger als sonst, um Erfolgserlebnisse zu schaffen und die Motivation im Team zu erhalten.
  • Strukturierte Arbeitsprozesse und gutes Projektmanagement sind essenziell.

Mehr zu Erkenntnissen aus dem Datenvorhaben mit all.txt in unserem Blog Post.

Beteiligte

all.txt Team

Mpho und Kolleg*innen waren die zivilgesellschaftliche*n Partner*innen. Sie haben existierenden Code bereitgestellt, inhaltliche & technische Expertise eingebracht und den Datensatz miterstellt.

Erfahre mehr

&effect data solutions GmbH

Jan und Rahkakavee von &effect haben als technischer Dienstleister mit viel Expertise die Textbox umgesetzt und technische Infrastruktur sowie Deployment erarbeitet.

Erfahre mehr
Civic Data Lab

Civic Data Lab Team

Vom CDL Team waren Leo, Helen und Nevena betetiligt.


Aus dem Projektverlauf:

Übergangswelle

Kontakt zum Umsetzungs-Team

Mpho Mathelemuse (dey/dem)

all.txt Team und nun auch Teil des CDL Teams Kontakt in HumHub

Leo Preu (er/ihm)

CDL Team Kontakt in HumHub

Nevena Nikolajević (sie/ihr)

CDL Team Kontakt in HumHub