zurück

Sprachengerechtigkeit

Technologie sollte alle Sprachen sprechen 

Um unterrepräsentierte Sprachen im digitalen Raum zu stärken, hat Wikimedia Deutschland zwei Partnerschaften mit lokalen Communitys in Indonesien und Nigeria gestartet. Die Projekte zielen auf die Entwicklung von Software, die nicht nur für Sprachen wie Englisch, Deutsch oder Chinesisch funktioniert.

Maria Heuschkel

13. Juli 2023

Das Internet steht – zumindest seinem Grundgedanken nach – für unbegrenzte Vielfalt. Hinsichtlich der Sprachen, die dort gebräuchlich sind, ist allerdings eher das Gegenteil zu beobachten. Eine deutliche Mehrheit von 75 Prozent der Menschen, die auf die eine oder andere Weise online gehen, verwenden lediglich zehn Sprachen. Allen voran Englisch, Spanisch, Französisch, Deutsch, Arabisch, Russisch oder Chinesisch (Quelle: State of the Internet’s Language). Die Folge: kleinere Sprachen oder Sprach-Communitys werden noch weiter marginalisiert – und sind in letzter Konsequenz vom Verschwinden bedroht.

Wo die Sprachlücken klaffen

Genau dieser Entwicklung versuchen wir bei Wikimedia Deutschland entgegenzuwirken. Wir setzen uns dafür ein, dass unterrepräsentierte Sprachen und Sprachgruppen im Internet nachhaltig gestärkt werden. Die größte Hürde und Herausforderung ist dabei allerdings der Status quo der Sprachtechnologie. Solange beispielsweise Sprachassistenten (wie „Alexa“ oder „Siri“) oder automatische Übersetzungstools (wie „Deepl“ oder „Google Translate“) größtenteils von westlichen Tech-Unternehmen geplant, entwickelt und optimiert werden – so wie es gegenwärtig der Fall ist – können wir unser Ziel kaum erreichen.

Produkte aus dem Bereich Sprachtechnologie werden heute meist so konzipiert, dass sie optimal für Menschen funktionieren, die Englisch, Deutsch oder Chinesisch sprechen, beziehungsweise verstehen. Wer hingegen versucht, mit Smartphone-Anwendungen in Yoruba zu kommunizieren – eine Sprache, die in afrikanischen Ländern wie Nigeria, Benin oder Sierra Leone von immerhin 30 Millionen gesprochen wird – dürfte schnell an Grenzen und auf gewaltige Lücken stoßen. Automatische Übersetzungstools oder Programme zur Rechtschreibprüfung sind für kleinere oder unterrepräsentierte Sprachen in der Regel entweder nicht verfügbar oder, falls doch, nur mit begrenzten Inhalten und Funktionalitäten.

Wikidata als Motor der Entwicklung

Genau hier muss das Bemühen um mehr sprachliche Diversität im Netz ansetzen. Aus diesem Grund hat Wikimedia Deutschland schon 2021 zusammen mit der britischen NGO Arcadia Fund eine Initiative gestartet. Gemeinsam wollen wir dafür sorgen, dass künftig die unterrepräsentierten Sprach-Communitys die Entwicklung von Software übernehmen, die dem Erhalt ihrer Sprachen am meisten dient. Konkret arbeitet Wikimedia Deutschland gemeinsam mit zwei Partnerorganisationen daran, die Kapazitäten für Softwareentwicklung in lokalen Communitys auszuweiten: mit Wikimedia Indonesia und der Igbo Wikimedians User Group in Nigeria.

Die Teams fokussieren sich dabei auf die technische Umgebung von Wikidata – die freie Wissensdatenbank, die Wikimedia Deutschland bereits seit 2012 aufbaut und die stetig weiter wächst. Wikidata umfasst neben allgemeingültigen Daten und Fakten auch miteinander verbundene und aufeinander verweisende Informationen über Sprachen – sogenannte Lexeme.

Die digitale Sammlung dieser Lexeme bildet wiederum die Grundlage dafür, dass Sprachtechnologien und -anwendungen zukünftig nicht nur in Französisch, Deutsch oder Englisch funktionieren, sondern auch für andere Sprachgruppen nutzbar werden.

Indonesische Lexeme

Seit Mitte 2022 arbeitet ein neu gegründetes Team bei Wikimedia Indonesia daran, Wikidata und insbesondere die Lexeme in Wikidata für ihre Communitys zugänglicher zu machen. Die Sammlung der Lexeme in Indonesisch und auch in anderen regionalen Sprachen Indonesiens soll perspektivisch deutlich ausgebaut werden. Dafür gilt es Zugänge zu schaffen und technische Hürden so weit wie möglich zu senken. Nach einem umfangreichen Rechercheprozess und Befragungen innerhalb der eigenen Communitys hat das Team bei Wikimedia Indonesia daher entschieden, in den verbleibenden anderthalb Jahren der Partnerschaft eine neue Anwendung zu entwickeln, die es erleichtern soll, zur Sammlung der Lexeme beizutragen. Neben Wikimedia Deutschland wird zukünftig in Südostasien also eine weitere Organisation für technische Veränderungen sorgen, die den Wikimedia-Communitys weltweit dabei helfen, Wikidata voranzubringen.

Wiki Mentor Africa

Einen anderen Ansatz verfolgt das Team der Igbo Wikimedians User Group, mit dem Wikimedia Deutschland die zweite Partnerschaft aufgebaut hat: Das Mentoring-Programm „Wiki Mentor Africa“ bringt jeden Monat zahlreichen Interessierten aus den lokalen Communitys die Entwicklung und Wartung von Wikidata-Tools näher. Ein Programm, das in den vergangenen zwölf Monaten erfolgreich etabliert wurde – und das nun in den kommenden anderthalb Jahren überarbeitet und neu ausgerichtet wird. „Wiki Mentor Africa 2.0“ soll Mitglieder der afrikanischen Wiki-Communitys an die technischen Erfordernisse rund um Wikidata heranführen.

Das Team von Wikimedia Deutschland teilt dabei das Wissen und die Erfahrungen, die in vielen Jahren der Software-Entwicklung für Wikidata gewonnen werden konnten, mit den Teams bei Wikimedia Indonesia und der Igbo Wikimedians User Group. Ganz im Geiste des globalen Ansatzes der Wikimedia-Bewegung geht es schließlich darum, die Kapazitäten für Softwareentwicklung zu stärken, um Wissensgerechtigkeit und Diversität für alle Menschen auf der Welt zu fördern. Daran werden alle drei Organisationen in den kommenden Monaten weiter mit voller Kraft arbeiten.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert