Zum Inhalt überspringen
Zum Inhalt überspringen

Wikidata ist eine beeindruckend große Sammlung freier Wissensdaten. 2013 gestartet, besteht sie heute aus über 120 Millionen strukturierten Datensätzen, die sowohl für Menschen verständlich, als auch für Maschinen lesbar sind. Nicht nur die Wikipedia greift auf diese Daten zu, um beispielsweise Informationen wie Einwohnerzahlen oder Geburtsdaten automatisch zu aktualisieren. Wikidata bildet auch das Rückgrat zahlreicher digitaler Anwendungen innerhalb und außerhalb der Wikimedia-Welt – von großen Sprach-Assistenten über Plattformen wie Govdirectory bis hin zu Reise-Apps oder Spielen wie Wikitrivia.

Wissen im Dienste der Menschheit

Wikidata ist eine der tragenden Säulen eines offenen und transparenten Internets. Diese Bedeutung wurde im Oktober 2025 mit einer besonderen Auszeichnung gewürdigt. Die Digital Public Goods Alliance – eine von den Vereinten Nationen unterstützte Initiative – hat Wikidata als digitales Gemeinwohl anerkannt. Wenige Monate zuvor war auch die Wikipedia als Digital Public Good anerkannt worden.

Wikidata zeigt, dass Technologie den Menschen dienen kann – und nicht umgekehrt. Es ist ein Gegenentwurf zu Datenmonopolen und geschlossenen Systemen und ein Ort, an dem eine weltweite Community gemeinsam Wissen offen, frei und verlässlich verfügbar macht.
Lydia Pintscher, Portfolio Lead Wikidata bei Wikimedia Deutschland

Über 24.000 Ehrenamtliche arbeiten weltweit daran, die Datenbasis in Wikidata zu prüfen, aktuell zu halten und zu erweitern. Zusammen mit den Entwicklerteams bei Wikimedia haben diese Menschen 2025 erheblich dazu beigetragen, ein Internet zu gestalten, das gerechter, transparenter und menschlicher ist.

Wikidata Embedding Projekt fördert faire und offene KI-Lösungen

Das gilt besonders für technologische Neuerungen. Während die offenen Wikidata-Daten seit Jahren von Tech-Unternehmen für das Training von KI-Systemen genutzt werden, setzen wir uns bei Wikimedia Deutschland gezielt für die Förderung offener und fairer KI-Lösungen ein.

Ein zentraler Baustein ist das 2024 gestartete Wikidata Embedding Projekt. Ziel ist es, insbesondere Open-Source-Entwickler*innen den Zugang zu den Wikidata-Daten zu erleichtern und so die Entwicklung innovativer, gemeinnütziger KI-Anwendungen zu fördern.

Im Herbst 2025 wurde im Rahmen des Projekts eine Vektordatenbank veröffentlicht. Sie bereitet die hochwertigen Wikidata-Daten so auf, dass sie unmittelbar für die Entwicklung generativer KI-Anwendungen nutzbar sind. Davon profitieren vor allem kleinere Entwicklungsteams und Open-Source-Initiativen, für die eine solche Aufbereitung bislang kaum zu leisten war.

Der Start des Embedding Projekts zeigt, dass leistungsstarke KI nicht von einer Handvoll Unternehmen kontrolliert werden muss – sie kann offen und kollaborativ entstehen.
Philippe Saadé, AI/ML-Projektmanager bei Wikimedia Deutschland

In der ersten Phase des Embedding Projektes wurden rund 23 Millionen Items aus Wikidata über die neue Datenbank bereitgestellt. Weitere Daten sollen folgen. Das Interesse an dem Angebot ist bereits hoch: Seit dem Launch wurde auf die Vektordatenbank zwischen 100.000 und 150.000 Mal pro Monat zugegriffen.

Community-Aufbau über Kontinente

Als Wikimedia Deutschland haben wir uns zum Ziel gesetzt, dass noch mehr Menschen Projekte wie Wikipedia und Wikidata nutzen und zu ihnen beitragen können. Dafür wollen wir leichtere, gerechtere und barriereärmere Zugangsmöglichkeiten und Vernetzungen schaffen.

Ein Beispiel für neue Wege bei der internationalen Zusammenarbeit ist das Projekt Software Collaboration for Wikidata, das bis Juni 2025 vom Arcadia Fund gefördert wurde. Im Rahmen dieser Kooperation arbeiteten Entwickler*innen-Teams aus Deutschland, Indonesien, Nigeria, Ghana und Brasilien daran, praktische Werkzeuge für die Arbeit in der freien Wissensdatenbank zu entwickeln – gerade auch in kleineren Sprachversionen, für die es oft keine Technologie oder keinen Zugang zu Informationen im Internet gibt. Unter anderem entstand das neue Tool Broomstick, das Editierenden dabei hilft, Probleme in Wikidata zu erkennen und zu beheben.

Aus der Software Collaboration for Wikidata ist auch das Projekt Wiki Mentor Africa hervorgegangen. Die Trainingsserie wurde von einem Team aus Nigeria ins Leben gerufen, das Workshops und Hackathons in verschiedenen afrikanischen Ländern anbot. Durch das Programm wurden viele Menschen befähigt, mit Wikidata zu arbeiten und ihr Wissen in ihrer Sprache ins Internet zu bringen.

Wie Wikidata Projekte möglich macht: Einblicke von der WikidataCon

Wie vielseitig die Daten aus Wikidata eingesetzt werden können, wird jedes Jahr auf verschiedenen Veranstaltungen deutlich. Dazu gehören die Wikidata Data Reuse Days oder auch das Event Wikidata and Sister Projects. Ein weiterer zentraler Treffpunkt der internationalen Wikidata-Community ist die WikidataCon, auf der sich jährlich Ehrenamtliche, Entwickler*innen, Forschende und Organisationen austauschen, die mit Wikidata arbeiten.

Bei der Konferenz 2025, die Ende Oktober digital stattfand, war auch der Ehrenamtliche „Cookroach“ dabei. Er stellte das von ihm mit initiierte Projekt „Digitale Stolpersteine“ vor. Europaweit gibt es bis heute über 116.000 Gedenksteine für die Opfer des Nationalsozialismus. In dem Projekt werden Fotos der Gedenksteine mit den Biografien der Ermordeten und weiteren historischen Hintergründen zusammengetragen und in Wikidata verknüpft. So entsteht ein einzigartiges digitales und frei zugängliches Netzwerk der Erinnerung.

Ein weiteres Projekt, das auf der WikidataCon vorgestellt wurde, ist eine App für Hörtraining, die auf Wikidata-Lexemen basiert und Menschen mit Hörschwierigkeiten unterstützt.

Arbeit am Wikibase-Ökosystem

Ein weiterer Schwerpunkt für Wikimedia Deutschland lag 2025 auf dem Ausbau des Wikibase‑Ökosystems. Wikibase ist die Software, auf der auch Wikidata basiert. Während Wikidata lange alleiniger Sammelpunkt für offene strukturierte Daten war, entsteht nun ein vielfältiges, dezentral organisiertes Netzwerk von Daten-Instanzen. So sollen Techcommunitys, Forschungsgruppen und Institutionen wie beispielsweise Bibliotheken eigene Wissensdatenbanken ganz im Stil von Wikidata, sogenannte Wikibase-Instanzen, betreiben können, um spezialisierte Daten unabhängig zu pflegen.

Eines von vielen Beispielen ist das Projekt einer Gruppe aus Peru, die Wikibase nutzt, um die indigene Quechua-Sprachfamilie zu dokumentieren und ein frei zugängliches Wörterbuch aufzubauen. Auch die National Library of Nigeria nutzt Wikibase, um Daten über nigerianische Autor*innen besser zugänglich zu machen und so die Vernetzung innerhalb der nigerianischen Wissenslandschaft zu stärken.

Die Zukunft ist frei und offen

All diese Entwicklungen zeigen, wie wichtig freie und offene Wissensprojekte wie Wikidata und Wikibase sind. Nicht nur die Zahl der zugänglichen Daten wächst kontinuierlich – auch immer mehr Menschen und Initiativen arbeiten an und mit den Projekten. Diese Entwicklung wird von Wikimedia Deutschland auch in Zukunft gefördert.

Durch Open-Source-Projekte wie Wikidata können wir Wissensmonopole verhindern und sicherstellen, dass Wissen als gemeinsames Gut allen Menschen gleichermaßen zugutekommt.
Franziska Heine, Geschäftsführende Vorständin von Wikimedia Deutschland

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert