Wikidata wird acht Jahre alt – ein Interview mit Produktmanagerin Lydia Pintscher
WMDE allgemein
28. Oktober 2020
Warum liegt dir der Geburtstag persönlich am Herzen?
Das was Wikidata ausmacht, ist die Community, die sich Tag für Tag darum bemüht, der Welt hochqualitative, vollständige und maschinenlesbare Daten zur Verfügung zu stellen. In all dieser Arbeit an den unterschiedlichen Projekten verliert man schnell den Blick fürs große Ganze und das, was wir schon erreicht haben. Es ist immer gut einmal innezuhalten, darüber zu reflektieren und Erfolge zu feiern.
Außerdem nehmen wir den Geburtstag als Gelegenheit, als Community zusammenzukommen, etwa zur WikidataCon in Berlin in 2017 und 2019 oder online in 2018 und 2020.
Wie wird der Geburtstag gefeiert?
Dieses Jahr feiern wir online. Es gibt viele Veranstaltungen, die von Community-Mitgliedern aus aller Welt organisiert wurden. Mit dabei ist ein 24h-Livestream, bei dem es im Stundentakt viele tolle Sachen zu sehen gibt, sowie die WikiCite Konferenz. Und natürlich wäre es kein Geburtstag ohne Geschenke, das sind bei Wikidata dann Programme, Dokumentationen oder Spiele, aber auch Songs und Kuchen. Die werden auch aufgemacht! Alle Details über den Geburtstag stehen hier.
Bitte erzähl uns von den Anfängen! Wie ist es damals zur Idee von Wikidata gekommen?
Die Idee hinter Wikidata entstand etwa 2005. Denny Vrandečić und Markus Krötzsch wollten die Wikipedia verbessern und maschinenlesbar machen. Wikipedias Texte sind fantastisch, aber leider nur schwer maschinenlesbar. Das macht es schwer, sie weiterzuverwenden, um neue Applikationen oder Visualisierungen darauf zu bauen.
Im April 2012 haben wir bei Wikimedia Deutschland mit der Entwicklung von Wikidata angefangen. Am 29. Oktober 2012 wurde das Wiki dann unter wikidata.org erstmals freigeschaltet. Am Anfang stand die Verwaltung der Links zwischen verschiedenen Sprachversionen der Wikimedia Projekte. Diese wurden vorher aufwendig von Hand in jedem Artikel in jeder Sprachversion gepflegt und werden jetzt nur einmal zentral in Wikidata verwaltet.
Wenig später folgte dann die Möglichkeit, die eigentlichen Daten in Aussagen zu speichern und sie auch in den Wikimedia Projekten einzubinden. Und während der ganzen Zeit hatten wir viele Freiwillige an unserer Seite, die Wikidata mit Leben und Daten füllen – mittlerweile über 12.500.
Was waren die größten Meilensteine?
In den letzten acht Jahren ist so viel passiert, da ist es schwer Highlights herauszustellen. Aber ich versuche es mal: Ein großer Meilenstein aus Sicht des Entwickler*innenteams war sicher die Eröffnung des Wikis nach vielen Monaten Grundlagenarbeit. Die erste Befüllung von Wikidata mit Konzepten aus Wikipedia durch die Editoren und Bots und die Nutzung dieser Daten in den anderen Wikimedia-Projekten waren wichtige Schritte.
Danach folgte die Erweiterung zu anderen Arten von Daten mit der Unterstützung von Mediadaten auf Wikimedia Commons und lexikographischen Daten auf Wikidata. Mit diesen Daten konnten wir ein maschinenlesbares Wörterbuch in vielen Sprachen aufbauen.
In den letzten Jahre haben wir dann außerdem einen Fokus auf das Wikibase Ecosystem gelegt, bei dem das Ziel ist, mehr Organisationen in die Lage zu versetzen, eine Wissensdatenbank wie Wikidata aufzusetzen und eng mit Wikidata zu verknüpfen.
Auf dem Weg dahin hat Wikidata mehrere Preise erhalten – der für uns wichtigste ist dabei sicher der Open Data Award, der von Sir Tim Berners-Lee und Sir Nigel Shadbolt übergeben wurde.
Was sind die Herausforderungen?
Wikidata wächst und mit diesem Wachstum kommen Herausforderungen, sowohl technisch als auch sozial. Technisch muss unsere Infrastruktur mit mehr Daten und mehr Zugriffen auf diese Daten umgehen, da die Daten in Wikidata immer häufiger in immer mehr Applikationen innerhalb und außerhalb von Wikimedia genutzt werden. Das ist aber ein gutes Problem, dem wir uns gerne stellen.
Sozial ist es wichtig, dass wir die menschliche Komponente des Projekts nicht verlieren – bei einer so großen Community wie bei Wikidata passiert das schnell. Deshalb sind Events wie der Geburtstag und die WikidataCon alle 2 Jahre so wichtig für uns.
Zuletzt will ich noch die Datenqualität nennen. Umso mehr Daten Wikidata der Welt zur Verfügung stellt, umso mehr Wartung und Aktualisierung dieser Daten bedarf es, gerade weil Wikidatas Daten an immer mehr Stellen genutzt werden, die von großer Bedeutung sind.
Was ist für das nächste Jahr geplant?
Im nächsten Jahr werden wir uns damit beschäftigen, wie wir die Sprach- und Kulturabdeckung in Wikidata erhöhen, die Infrastruktur weiter verbessern und skalieren und die Editoren noch besser bei der Qualitätssicherung unterstützen können. Und ich freue mich auf ein weiteres Jahr mit einer tollen Community und einem tollen Projekt.