zur Artikelübersicht

Wikidata

Sprachlücken überbrücken: Wie Wikidata Sprachen im Internet fördert

Etwas googeln und valide Informationen finden, ist nicht für alle Menschen auf der Welt möglich. Deshalb setzt sich Wikimedia Deutschland für die Förderung unterrepräsentierter Sprachen im Internet ein. Mit internationalen Partnerschaften soll auf Basis von Wikidata die Vielfalt im Internet gefördert und die Nachhaltigkeit des globalen Wikimedia Movements gesichert werden. Anlässlich des Wikidata-Geburtstages am 29. Oktober wollen wir die Projekte im Detail vorstellen.

Kim Brune

31. Oktober 2024

Das Internet ermöglicht es uns, unendlich viele Informationen über uns und die Welt, in der wir leben, auszutauschen. Dafür brauchen wir Sprache. Allerdings sind die Sprachen der Welt im Netz nicht gleich stark vertreten. Ein Beispiel: Tools für Übersetzungen oder Rechtschreibprüfung sind in der Regel auf gängige Sprachen wie Englisch, Französisch, Spanisch oder Chinesisch zugeschnitten. Bei virtuellen Assistenten wie Siri oder Alexa ist es ähnlich. Für viele andere Sprachen fehlt die grundlegende Basis, auf die neue Sprachtechnologien aufbauen können. Dies führt dazu, dass viele Menschen gezwungen sind, online auf eine andere Sprache auszuweichen. Das bedeutet vor allem für viele Minderheitensprachen oder vom Aussterben bedrohte Sprachen einen kritischen Verlust an Sprachgebrauch.

Vor diesem Hintergrund arbeitet Wikimedia Deutschland seit 2022 an dem Projekt Software Collaboration for Wikidata, ermöglicht durch den Arcadia Philanthropic Trust. Gemeinsam mit internationalen Partnern aus dem Wikimedia Movement werden inzwischen in vier Projekten Sprach-Communitys unterstützt, die online kaum vertreten sind. Das Ziel: Diese Communitys sollen künftig selbst die Entwicklung von Software übernehmen können, die dem Erhalt und der Förderung ihrer Sprachen am besten dient.

Software Collaboration for Wikidata – unsere Methode

Da Sprache und ihre Verwendung ein stark lokalisiertes Konzept ist, spielt die Einbeziehung der Communitys vor Ort eine zentrale Rolle bei der Entwicklung neuer Softwareprodukte. Nur so kann sichergestellt werden, dass die Software am Ende dem Erhalt unterrepräsentierter Sprachen dient. Doch zunächst muss dafür gesorgt werden, dass auch die Kapazitäten für eine nachhaltige Softwareentwicklung vorhanden sind. Deshalb werden in den Projekten gezielt Repräsentant*innen aus den Communitys mit Kompetenzen und Führungsqualitäten ausgestattet, sodass sie auch nach Projektende in ihrer Region als Anlaufstelle für Wikidata-Nutzer*innen bereitstehen können.

Wenn lokale Communitys in jeder Phase der Projektentwicklung einbezogen werden, können unterschiedliche Perspektiven eingebracht werden. Diese Dezentralisierung der Softwareentwicklung ermöglicht Ideen und Lösungen, die den Bedürfnissen der Weltbevölkerung entsprechen.
Raisha Abdillah, Projektleiterin Software Team Indonesia

Mehr über Raisha und das Projekt erfahren Sie auch im Wikimove- Podcast: Folge #21 – Building Capacity for Tech Development.

Wikidatas Schlüsselfunktion als Quelle für Sprachanwendungen

Für die Inklusion aller Sprachen im Internet ist die Sammlung diverser Sprachdaten von entscheidender Bedeutung. Sprachtechnologien erfordern große Mengen an strukturierten Daten von guter Qualität, die viele Sprachen oft noch nicht zur Verfügung stellen können. Hier kommt Wikidata ins Spiel: Als umfangreiche und freie Sammlung von strukturierten Daten bietet Wikidata den Zugang zu weiterem Wissen für unterrepräsentierte Sprachen. Die freie Wissensdatenbank umfasst nicht nur allgemeine Daten und Fakten über die Welt, sondern auch verknüpfte Informationen, die Sprachen näher beschreiben können – sogenannte lexikografische Daten. Die Sammlung dieser lexikografischen Daten ist einer der Schwerpunkte unseres Partnerteams in Indonesien.

Unsere Partner und ihre Projekte

Wikimedia Deutschland hat in den letzten zwei Jahren eine enge Zusammenarbeit mit Partnern aus Nigeria, Indonesien, Brasilien und Ghana aufgebaut. Diese Teams arbeiten an verschiedenen Projekten zum Aufbau technologischer Kapazitäten. Dabei fließt regelmäßig auch das Feedback der Communitys ein, mit denen die Partner im Austausch sind.

1. Wikidata Software Collaboration Team Indonesia

Treffen in Berlin mit WMDE und SWT ID 12 August 2024

Das Wikidata Software Collaboration Team Indonesia arbeitet in einem der linguistisch vielfältigsten Länder der Welt mit über 700 Sprachen. Da Sprachtechnologien große Mengen an strukturierten Daten von hoher Qualität erfordern, die viele Sprachen oft nicht zur Verfügung stellen können, haben sie im Rahmen von Software Collaboration for Wikidata das Tool „Lexica“ entwickelt, das mehr Beiträge zu lexikografischen Daten und neue Wikidata-Nutzer*innen fördern soll.

„Lexica“ ist eine einfache und benutzerfreundliche Möglichkeit, lexikografische Daten hinzuzufügen, indem Lexeme mit bereits vorhandenen Wikidata-Einträgen verknüpft werden. Mögliche zukünftige Funktionalitäten sind z. B. die Erweiterung um weitere Sprachen sowie das Hinzufügen von Audio und Bildern. Dieses Tool geht auch auf die Bedürfnisse von Handynutzer*innen ein, die keinen Zugang zu einem Desktop haben.

Hier ein Beispiel: Mit welchem Item kann das englische Lexem „Blossom” verknüpft werden?

2. Igbo Wikimedians User Group

Unser zweiter Partner mit Bezug zur Igbo Sprache und Kultur hat seinen Sitz in Nigeria, ist aber in der ganzen West- und Zentralafrikanischen Region tätig. Sie haben das Programm „Wiki Mentor Africa” zum Aufbau technischer Kapazitäten in der afrikanischen Wikimedia Community ins Leben gerufen. Es setzt sich dafür ein, mehr Afrikaner*innen in den technischen Bereich von Wikimedia zu bringen und die Nachhaltigkeit der Wikimedia Tools zu verbessern.

Ein interdisziplinäres Team von Mentor*innen organisiert regelmäßig Veranstaltungen. Hier werden neue Mitglieder durch modulare Lerninhalte in die Softwareentwicklung und das Technical Writing rund um Wikidata herangeführt.

Zudem arbeiten sie an der Unterstützung und Verbesserung verschiedener Tools in Sprachen aus der gesamten Region, einschließlich Nigeria, der Demokratischen Republik Kongo und Kamerun, und bringen Sprachen wie Igbo, Twi, Dagbani oder Igala  ein.

Die Igbo User Group beim 10-jährigen Geburtstag von Wikidata
Die Igbo User Group beim 10-jährigen Geburtstag von Wikidata

3. Weitere Projekte

2024 sind zwei weitere Projekte als Teil von Software Collaboration for Wikidata gestartet. Im Rahmen einer öffentlichen Ausschreibung für innovative Softwareanwendungen erhielt Wikimedia Deutschland zahlreiche Projektideen aus der internationalen Wikidata-Community für die Förderung unterrepräsentierter Sprachen.

Folgende Projekte wurden zur Förderung ausgewählt:

  • Das Projekt „QuickStatements 3.0” von Wiki Movimento Brasil baut auf dem weit verbreiteten und beliebten Tool „QuickStatements” auf und erweitert durch aktives Feedback der Community die Funktionalität in mehreren Bereichen.
  • Das Wikidata „One Click Info” Team arbeitet mit Unterstützung der Dagbani Wikimedians User Group an einer Browser-Erweiterung: der sogenannten „One Click Info”. Diese bietet eine schnelle Zusammenfassung des markierten Wikidata Eintrags.

Software Collaboration for Wikidata möchte mit solchen Projekten langfristig zu mehr Wissensgerechtigkeit beitragen, einem der Hauptpfeiler, um bessere Lebensverhältnisse und ein größeres Gleichgewicht in der Welt zu schaffen.

Happy Birthday Wikidata!

Am 29. Oktober feierte Wikidata den 12. Geburtstag. Im Rahmen der Feierlichkeiten organisiert die internationale Community noch bis in den November hinein verschiedene Events. Auch Lexica, QuickStatements 3.0 und One Click Info werden in diesem Rahmen der Community vorgestellt und veröffentlicht! Für alle, die mitfeiern möchten: Hier finden Sie  alle Geburtstags-Events sowie die Aufzeichnung des Geburtstagsstreams mit einer Demonstration der Tools und weiterer Geburtstagsgeschenke für Wikidata!