zurück

Wikidata Geburtstag

Wikidata überschreitet 100 Millionen Einträge – (k)ein Grund zu feiern?

Die freie Wissensdatenbank Wikidata, die unter anderem als Quelle für die mehr als 300 Sprachversionen von Wikipedia dient, hat die Marke von 100 Millionen Items (sprich: Datenobjekte) erreicht. Zudem steht in dieser Woche der 10. Geburtstag der Wissensdatenbank bevor. Anlass für ein Gespräch mit Lydia Pintscher, Produktmanagerin für Wikidata bei Wikimedia Deutschland.

Patrick Wildermann (freier Redakteuer)

25. Oktober 2022

Ist die Rekordzahl von 100 Millionen hochgeladener Items ein Grund zu feiern?

LYDIA PINTSCHER: Ja und nein. Natürlich freut es mich, andererseits möchte ich solchen „höher, schneller, weiter“-Meilensteinen auch nicht zu viel Bedeutung beimessen, schon weil die Aussagekraft dieser Zahl begrenzt ist. Man kann die Daten nicht mit Wikipedia-Artikeln vergleichen, in die Ehrenamtliche wirklich viel Zeit, Mühe und Recherche investiert haben. Wikidata funktioniert anders, ein Item ist generell relativ schnell zu erstellen, teilweise auch automatisiert. Nehmen wir als Beispiel das Wikidata-Projekt „Sum of all paintings“, das sich auf Gemälde und andere Kunst fokussiert – dafür werden unter anderem von Museen Datenbanken zur Verfügung gestellt, die in der Regel schon gut vorbereitet sind. Auch das bedeutet Arbeit, aber auf einem anderen Level als in Wikipedia. Die wirkliche Arbeit liegt dann im Ausbauen des Items. Insgesamt sind mir deswegen das Wachstum unserer Community, oder die immer vielfältigeren Einsatzmöglichkeiten unserer Daten wichtiger.

Gab oder gibt es eine Zielsetzung, welchen Umfang Wikidata erreichen will?

Nein, nicht in Zahlen quantifiziert. Aber wir haben uns eine strategische Richtung gegeben. Mein Wunsch ist, dass Wikidata als zentraler Knotenpunkt in einem Open-Data-Netzwerk operiert. Dieser Knoten soll einen Grundstock an Daten über alles nur Erdenkliche liefern – und wer mehr wissen will, bekommt Hinweise, wo sich das Wissen vertiefen lässt. So wie es auch bei Wikipedia-Artikeln ist, die in der Regel nicht alles zu einem Thema erzählen, sondern Links für die weitere und nähere Beschäftigung anbieten. 

Lydia Pintscher arbeitet seit mehr als zehn Jahren bei Wikimedia Deutschland. Sie bezeichnet sich selbst als eine Enthusiastin für freie Software und freie Kultur. 2012 war Lydia Teil des Teams, das Wikidata entwickelt hat und arbeitet seitdem kontinuierlich in einem engagierten Team und zusammen mit der Community an der Weiterentwicklung der freien Wissensdatenbank.

Ein konkretes Beispiel?

In Wikidata gibt es zum Beispiel eine Reihe von Daten zu Musikern und auch Songs, aber nicht zwangsläufig die komplette Diskografie eines Künstlers. Wir haben einen Eintrag zu Elvis, aber nicht zu jedem Lied, das er je aufgenommen hat. Was wir aber bieten, ist ein Link zum Elivs-Eintrag in MusicBrainz – einer offenen Datenbank, die sehr viele Informationen aus der Welt der Musik liefert, eben auch zu jedem einzelnen Elvis-Song. Dadurch ermöglichen wir einen nächsten Schritt in diesem offenen Daten-Netzwerk. Generell verweisen wir in Wikidata auf Einträge in über zehntausend anderen Datenbanken, Webseiten, Katalogen oder Archiven.

Wie groß ist die Wikidata-Community derzeit – und wie könnte sie noch weiter wachsen?

Sie umfasst aktuell rund 12.000 aktive Editierende, also Menschen, die mindestens fünf Edits in den vergangenen 30 Tagen vorgenommen haben. Unser Ziel ist es, noch viel mehr Menschen zu vermitteln, welche Vorteile es hat, zu Wikidata beizutragen – etwa, indem wir mehr Bewusstsein dafür schaffen, in welchen alltäglich genutzten Technologien unsere Daten stecken und wie diese Technologien sich verbessern lassen, wenn Wikidata noch besser wird. Unsere Daten werden in etlichen Webseiten, Apps und Services benutzt, was aber die Menschen, die damit in Verbindung kommen und Wissen daraus ziehen, in der Regel nicht bemerken. Schließlich gehen sie nicht auf Wikidata.org, sondern bekommen die Daten zum Beispiel von dem persönlichen digitalen Assistenten auf ihrem Smartphone geliefert, wenn sie eine Frage stellen. 

Wie genau lässt sich mehr Bewusstsein für den Wert von Wikidata schaffen?

Wenn ein cooles Spiel herauskommt, das unsere Daten nutzt, oder eine neue nützliche App, versuchen wir mit regelmäßigen Showcases darauf hinzuweisen. Das Verständnis dafür, dass Wikidata eben keine trockene Wissenbasis ist, in der nur ein paar Daten gepflegt werden, ist grundlegend für die Motivation, selbst beizutragen und mehr solcher Anwendungen zu ermöglichen oder zu verbessern. Das müssen wir weiter forcieren. Außerdem bin ich ein großer Fan von „Depth of Wikipedia“ – das ist eine Sammlung von Social-Media-Accounts von Annie Rauwerda, die regelmäßig Kuriositäten und Bemerkenswertes aus Wikipedia postet. Damit vermittelt sie, wie viel Witz und Herzblut auch in diesem Projekt steckt und dass Wikipedia eben keine langweilige Enzyklopädie ist. So etwas würde ich mir auch für Wikidata wünschen.

2014 wurde Wikidata mit dem Open Data Innovation Award ausgezeichnet. Auf dem Bild neben Lydia Pintscher (von links nach rechts): Sir Nigel Shadbolt, Vorsitzender des Open Data Institute. Magnus Manske, der 2002 die erste Version der MediaWiki-Software schrieb, die Wikipedia betreibt. Und Sir Tim Berners-Lee, der Erfinder des World Wide Web.

Welche innovativen Projekte sind auf der Grundlage von Wikidata entstanden?

In den vergangenen zehn Jahren jede Menge! Ein Beispiel ist die Webseite „Open Library“, über die man Bücher ausleihen kann. Sie verwendet Daten aus Wikidata über Autorinnen und Autoren, um Nutzenden ihr Leseverhalten aufzuzeigen – etwa, dass eine Leserin oder ein Leser vor allem Bücher von männlichen Autoren aus Nordeuropa liest. Je nachdem kann sie oder er dann den eigenen Fokus erweitern und das Leseverhalten diverser gestalten. Ein anderes Beispiel ist ein Maschinen-Learning-Programm, das erkennen soll, was auf historischen Theaterfotografien zu sehen ist. Die Entwicklerin hat Wikidata benutzt, um das Programm zu verbessern. Wenn es zum Beispiel auf einem Bild von 1905 einen Laptop erkannt zu haben glaubte, konnte sie dem Programm mit den Informationen aus Wikidata beibringen, dass es damals noch gar keine Laptops gab…

Ein anderer Forscher hat sich damit beschäftigt, wie die politische Elite in verschiedenen Ländern vernetzt ist und welche Verflechtungen sich daraus ergeben: der Premierminister des Landes X stellt als Justizministerin seine Schwester ein, der Schah des Landes Y gibt das größte staatliche Unternehmen in die Hände seines Bruders – solche Fälle. Mit den Daten aus Wikidata lassen sich diese Verbindungen aufzeigen. Die bestehenden Familienbeziehungen, welche Firmen diese Leute besitzen, welche Ämter sie innehaben. Eine solche Kombination von Daten aus Industrie, Recht und Regierung, noch dazu weltweit, liefert keine andere Datenbank. 

Gehört zu euren Zielen auch, die Wikidata-Community diverser aufzustellen?

Auf jeden Fall. Wenn wir Daten sammeln, pflegen und für Technologie nutzbar machen wollen, mit der Menschen jeden Tag in Berührung kommen, brauchen wir auch möglichst diverse Gruppen, die zu Wikidata beitragen. Daran arbeiten wir. Ein Vorhaben ist, uns nicht so sehr darauf zu fokussieren, dass jede und jeder auf Wikidata gehen soll, um dort zu editieren. Sondern uns stattdessen die Entscheidungsprozesse auf Wikidata sehr genau anzuschauen. Welche sind besonders wichtig, weil sie darüber entscheiden, wie unsere Daten aussehen und wer sie wie benutzen kann? Daraus wollen wir lernen, wo wir ansetzen müssen, um mehr Stimmen hörbar zu machen, die bislang nicht gehört werden.

Um welche Entscheidungsprozesse geht es dabei?

Ein Beispiel sind Modellierungen von Namen. Auf den ersten Blick scheint das eine simple Angelegenheit zu sein, tatsächlich sind Namen eines der komplexesten Felder überhaupt – unter anderem, weil sich der Umgang mit ihnen  von Kulturkreis zu Kulturkreis stark unterscheidet. Daran hängt etwa die Frage der Transliteration: ist der kyrillisch geschriebene Name Mohammed derselbe wie jener in arabischer Schrift? Sind Muhamed und Mohammed gleichzusetzen? In solche Entscheidungsprozesse müssen wir so viele verschiedene Perspektiven wie möglich einbringen, eben weil so viele verschiedene Ideen davon existieren, was ein Name ist. Und weil von der Modellierung abhängt, ob bestimmte Personen sich im Zweifelsfall in unseren Daten nicht wiederfinden.

Löst sich bei Wikidata das Versprechen ein, dass alle beitragen können – oder exististieren Hürden, zum Beispiel technischer Natur?

Theoretisch kann jede und jeder beitragen, genau wie bei Wikipedia. Faktisch – auch das ist mit Wikipedia vergleichbar – sieht die Sache etwas komplizierter aus. Einen Knowledge Graph zu bauen, Daten zu modellieren und zu pflegen, das ist eben nicht jedermanns Sache, genau wie es nicht allen liegt, Wikipedia-Artikel zu recherchieren oder zu bearbeiten. Es braucht ein bestimmtes Mindset, eine bestimmte Affinität, die Welt beschreiben zu wollen. In jedem Fall haben wir eine sehr aufgeschlossene Community, eine, die auch für Dinge offen bleibt, die sie noch nicht weiß. Das ist wichtig, wenn man die Welt in Daten fassen will. Und wir freuen uns über jede neue Beitragende und jeden neuen Beitragenden, die helfen, Wikidata besser zu machen und damit Wikipedia und weit mehr verbessern und bereichern.

Mehr Wissenswertes über Wikidata!

Am 29. Oktober feiert Wikidata den 10. Geburtstag! Aus diesem Anlass haben wir eine Reihe von Blogartikeln mit vielen interessanten Fakten über die Geschichte der weltweit größten freien Wissensdatenbank und ihrer einzigartigen Community veröffentlicht:

Vor zehn Jahren hat eine kleine Gruppe in Berlin den Grundstein für die heute größte freie Wisssensdatenbank der Welt gelegt: Am 29. Oktober 2012 ging Wikidata an den Start. Lydia Pintscher über die Anfänge.

Teil 1 über die Menschen, die Wikidata zu dem kollaborativen Projekt gemacht haben, das es heute ist.

Teil 1 über die Menschen, die Wikidata zu dem kollaborativen Projekt gemacht haben, das es heute ist.

Teil 1 über den Einfluss von Wikidata und den Mitwirkenden bei der Förderung der Wikimedia-Mission.

Teil 2 über den Einfluss von Wikidata und den Mitwirkenden bei der Förderung der Wikimedia-Mission.

Mehr über den Einfallsreichtum der Wikidata-Community und ihre Tools und Hacks.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert