Interview zur WikidataCon 2023
“Wir brauchen mehr Austausch mit externen Communitys”
Zarah Ziadi
25. Oktober 2023
Die internationale Konferenz WikidataCon findet jedes Jahr an einem anderen Ort auf der Welt statt – wo, das hängt auch von Wikimedia Deutschlands Kooperationspartnern ab. Dieses Mal wird sie zusammen mit der taiwanesischen Wikimedia und Community vom 28.-29. Oktober als hybride Veranstaltung realisiert. Der Fokus liegt auf der virtuellen Teilnahme, um es allen Interessierten zu ermöglichen den Programmpunkten beizuwohnen. Das ist auch der Grund, warum manche Sessions mehrere Male zu unterschiedlichen Uhrzeiten stattfinden – so wird keine Zeitzone von der Veranstaltung ausgeschlossen. Allen Wang, dem leitenden Koordinator des taiwanesischen Kern-Organisationsteams, lag es sehr am Herzen, dass die Konferenz in diesem Jahr wirklich jedem offen steht.
Hi Allen, kannst du uns kurz erzählen, was das Besondere an der WikidataCon ist?
Allen: Bei der WikidataCon kommt die globale Wikidata-Community zusammen, um alle Angelegenheiten zu diskutieren, die mit Wikidata und dem damit verbundenen Ökosystem zusammenhängen, einschließlich der Wikidata-Plattform, der dahinter liegenden Software Wikibase und dem gesamten Linked-Open-Data-Ökosystem. Linked Open Data beschreibt frei verfügbare Daten, die leicht abgerufen werden können und auf weitere Daten verweisen. Die miteinander verknüpften Daten ergeben ein weltweites Netz, das unter anderem auch als Wissensgraph bezeichnet wird.
Es gibt weltweit zwar einige globale Wikimedia-Foren und Community-Konferenzen, wie z. B. die Wikimania, doch die WikidataCon hebt sich durch ihren speziellen Fokus ab. Die auf dieser Konferenz repräsentierten Bereiche konzentrieren sich zudem stark auf organisationsübergreifende Zusammenarbeit mit externen Institutionen und Communitys und erstrecken sich z. B. auf Gebiete wie Daten-, Bibliotheks- und Informationswissenschaften.
Welche Themen werden während der WikidataCon präsentiert und diskutiert?
Allen: Dieses Jahr legen wir einen besonderen Schwerpunkt auf das Thema Multikulturalität. Taiwan ist ein Schmelztiegel verschiedener Kulturen und Sprachen: Neben Mandarin-Chinesisch, das als Amtssprache dient, sind etwa 40-50 Sprachen im Umlauf, darunter Taiwanesisch, Hakka, Min Dong und austronesische Sprachen, die von einheimischen taiwanesischen Gemeinschaften gesprochen werden. Im Kontext der Wikimedia-Aktivitäten in Taiwan war es schon immer ein entscheidendes Anliegen, sicherzustellen, dass andere Sprachen neben Mandarin effektiv genutzt werden können, um kulturelles Wissen in Wikimedia-Projekten abzubilden. Wir wollen die globale Community darauf aufmerksam machen, wie wichtig Wikidata und Linked Open Data für die Bewahrung und Verbreitung von Wissen in unterrepräsentierten Sprachen sind.
Der Titel der diesjährigen WikidataCon ist “Collaboration across Boundaries” (Zusammenarbeit über Grenzen hinweg) und du legst großen Wert darauf, externe Entwickler und Communitys zu der Veranstaltung einzuladen – warum ist das so wichtig?
Allen: Dies basiert auf meinen Erfahrungen in Taiwan. Bevor ich mich in den Wikidata- und Wikimedia-Communitys engagierte, nahm ich häufig an Veranstaltungen von Open-Source- und Open-Data-Communitys, wie Mozilla oder Ubuntu, teil und führte Diskussionen über offene Daten. In den letzten Jahren habe ich festgestellt, dass sich die Themen von Wikidata und weiteren Wikimedia-Projekten oft mit den Themen anderer Communitys überschneiden. In einigen Fällen könnten Wikimedia-Projekte Ressourcen bereitstellen, die für bestimmte Open-Data-Themen benötigt werden. Allerdings ist Wikimedia bei den Diskussionen anderer Communitys oft nicht dabei.
Woran liegt das aus deiner Sicht?
Allen: Es liegt auf jeden Fall nicht daran, dass die Angebote von Wikimedia nicht mit den Bedürfnissen anderer Communitys übereinstimmen. Vielmehr liegt es daran, dass es zu wenige Menschen gibt, die Wikimedia-Projekte kennen, wodurch die Integration dieser Werkzeuge nicht in die Diskussionen eingebracht werden kann. Wikidata verfügt als offene Datenplattform über viele hervorragende Linked-Open-Data-Funktionen, darunter eindeutige Identifikatoren, Cross-Identifier-Mappings und mehrsprachige Normdateien. Diese Funktionen können für die Erweiterung externer offener Datenbestände von Nutzen sein. Indem man mehr Nicht-Wiki-Communitys dazu ermutigt an der WikidataCon teilzunehmen, können sie Einblicke in die aktuellen Möglichkeiten von Wikidata und seinem Ökosystem gewinnen. Dies wiederum kann den Austausch von Wissen und Ressourcen innerhalb der breiteren Open-Data-Community fördern. Es hilft auch der Wikimedia-Community, die praktischen Bedürfnisse der externen Communitys besser zu verstehen.
Wie können die externen Communitys von Wikidata profitieren?
Allen: Wikidata bietet eine niedrigschwellige und kostengünstige Lösung für die Abfrage und das Hosting offener Daten. Dazu gehören Dienste wie das Hinzufügen von den bereits erwähnten eindeutigen Identifikatoren, API-Funktionen sowie Sprach- und Identifikator-übergreifende Zuordnungen zu bestehenden Datensätzen, die alle durch Wikidata bereitgestellt werden können. Auf der WikidataCon gibt es zahlreiche entsprechende Fallstudien und Diskussionen, die für Teilnehmer besonders aus den Bereichen Daten-, Bibliotheks- und Informationswissenschaft von großer Bedeutung sind. Es ist eine ausgezeichnete Gelegenheit, sich über die Lösungen zu informieren, die Wikidata und Wikibase bereithalten.
Was hebt Wikidata von anderen Datenbanken und -sets ab?
Allen: Wikidata hat mehrere faszinierende Eigenschaften. In erster Linie handelt es sich um eine Linked-Open-Data-Datenbank – diese Form offener Daten ist ein Maßstab für das Erreichen der höchsten Stufe offener Daten, wie sie im „Five Star“-Rahmen nach Tim Berners-Lee definiert ist. Es gibt nicht viele Online-Datenbanken, die über diese Funktionalität verfügen. Darüber hinaus ist Wikidata eine der wenigen globalen Linked-Open-Data-Datenbanken, die in einer offenen, von einer Community getragenen Weise arbeiten.
Auf welche Weise profitiert die gesamte Welt der Datenverarbeitung von Wikidata?
Allen: Wikidata enthält derzeit über eine Million Einträge, die die gesamte Wikipedia, verschiedene Wikimedia-Projekte und diverse Daten, die von der Wikidata-Community aktiv beigesteuert werden, umfassen. Wenn es um die Entwicklung einer Big-Data- oder KI-Anwendung geht, dient es als wertvolle Referenz-Datenquelle. Das bedeutet nicht, dass man eine KI-Anwendung ausschließlich mit Wikidata entwickeln kann; vielmehr kann Wikidata eine wertvolle Referenz sein, um bestehende Datensätze mit zusätzlichen Perspektiven zu ergänzen.
Ich glaube, Wikidata wird seit langem von vielen großen Unternehmen in deren Informationsprodukten verwendet. Allerdings haben wir oft keinen detaillierten Einblick in die Art und Weise, wie es integriert wird, da es sich oft um proprietäre Produkte handelt. Einige Berichte haben jedoch Aufschluss darüber gegeben, wie Google Wikidata nutzt, um seinen Wissensgraphen zu verbessern und Informationen aus dem Wissenspanel in den Suchergebnissen bereitzustellen. Kürzlich wurde auch berichtet, dass Sprachassistenten, wie etwa Alexa, Wikidata nutzen. Dies sind Beispiele für kommerzielle Anwendungen, die wir beobachten können.
Herzlichen Dank für das Gespräch!
Wer nun neugierig auf die WikidataCon geworden ist, kann sich bis zum 29. Oktober, dem letzten Tag der Konferenz, auf der WikidataCon-Seite kostenlos registrieren und das Programm virtuell verfolgen.
Wer Lust bekommen hat, Daten zu Wikidata hinzuzufügen, kann sich hier anschauen, wie das funktioniert. Und die Entwickler, die jetzt gleich mit Wikidata arbeiten möchten, können sich mit dem Query-Service vertraut machen.