zurück

Neues Testfeld für Wikibase: Eine Bundesbehörde geht auf Expedition im Wikiversum.

Die Deutsche Nationalbibliothek und Wikimedia Deutschland gehen zusammen neue Wege. Jahrelang haben Freiwillige der Wikipedia geholfen, Einträge der deutschen Nationalbibliographie mit Wikipedia-Einträgen zu verknüpfen und dabei auch Fehler korrigiert. Jetzt haben die beiden Einrichtungen vereinbart, gemeinsam die Potenziale von Wikibase, der Software mit der die freie Datenbank Wikidata betrieben wird, für den Einsatz in der größten Normdatenbank für Kulturdaten im deutschsprachigen Raum, der Gemeinsamen Normdatei (GND), intensiv zu testen.
CC0

WMDE allgemein

9. Mai 2019

Die Bedeutung des Evaluationsvorhabens für die Welt der offenen Daten, den GLAM-Bereich und Bibliotheken insbesondere wollen wir hier beschreiben.

Laut Statistik verbringt der Mensch in Deutschland 196 Minuten täglich im Netz. Tendenz steigend. Die meisten von uns sind dort auf der Suche. Wir suchen Konsumangebote, Medien, Informationen oder schlichtweg Daten. Immer mehr Daten sind im Netz. Im Alltag verlassen wir uns auf die Algorithmen von Suchmaschinen. Doch für tiefergehende Recherchen in der Wissenschaft oder für solche von den Kundenwünschen der Suchmaschinenbetreiber unabhängigere braucht es alternative Angebote. Hier kommen kodifizierte Daten in den Fokus. Der Bedarf an der sicheren Identifikation von Objekten, Personen, Ereignissen und Orten im Netz steigt mit der Anzahl der Suchanfragen und der Menge der im Netz befindlichen Daten. Wikidata ist eine Antwort auf diesen Bedarf. Eine andere Antwort liegt in dem über die Fachgrenzen der deutschsprachigen Bibliotheken hinausgehende Interesse an den Normdaten der Deutschen Nationalbibliothek, der GND. Normdaten, wie die von Wikidata und der GND, unterstützen den Prozess von Linked Data und den Aufbau eines semantischen Webs, das Dinge nach ihrer Bedeutung sinnvoll miteinander verknüpft.

Finden, wonach man sucht.

Was sind Normdaten und wozu braucht man sie?

Normdaten belegen eine Benennung, einen Namen für ein Objekt zweifelsfrei mit einer Codenummer und bieten mittels einem dauerhaften Internetlink einen verlässlichen Knotenpunkt im Netz an. In der Regel wird zur Herstellung der Unverwechselbarkeit noch mindestens eine Eigenschaft des Objektes verknüpft. Im Fall einer Person treten zu ihrem Namen meist die Lebensdaten hinzu. Bei Orten die Geo-Koordinaten. Bei Ereignissen deren zeitliche Dauer. Ob noch weitere Eigenschaften und Beziehungen dieser zu anderen Normdatensätzen erfasst werden, hängt letztlich von dem zugrundeliegenden Datenmodell ab. Im Fall von Wikidata, des Freiwilligenprojekts zur strukturierten und maschinenlesbaren Beschreibung der Welt, ist die Liste der Eigenschaften und Relationen eines Datenobjektes im Prinzip unendlich. Die Gemeinschaft der Beitragenden der GND pflegt ein deutlich engeres Regelwerk und Verständnis von Normdaten.

Normdatensysteme unterliegen wie alle Artefakte, die über einen längeren Zeitraum von einer Gruppe von Menschen erstellt werden, den Gesetzmäßigkeiten von sozialen Systemen. Zur Sicherung der Qualität, zur Vereinfachung von Entscheidungs- und Arbeitsprozessen und zur Abgrenzung gegenüber anderen Systemen bilden sie oft mit der Zeit komplexer werdende Konventionen und Regelwerke aus. Dies passiert in Wikidata genauso wie in der GND trotz der grundverschiedenen Rahmenbedingungen. Zusätzlich zu den Regeln treten Bedingungen, die durch die jeweilige technischen Voraussetzungen gesetzt werden. Datenbanken werden in ihrer Funktionsweise durch die ihnen zugrunde liegenden Software definiert. Die Kommunikation zwischen zwei verschiedenen Datenbanken, die zudem unterschiedliche Software verwenden, ist schwierig. Der Datenaustausch, ob im Kleinen oder im Großen kann nicht automatisch erfolgen. Die Verknüpfung und Föderation von Daten, die gemeinschaftliche Pflege von Daten über die Systemgrenzen hinaus ist zwar nicht gänzlich unmöglich, aber doch schwerfällig und mühselig.

Die Deutsche Nationalbibliothek und Wikimedia Deutschland e. V. möchten beide auch unabhängig voneinander das Semantic Web mittels Linked-Data-Angeboten fördern. Daher versuchen sie bereits seit geraumer Zeit ihre jeweiligen Rahmenbedingungen dergestalt zu verändern, dass die Öffnung des jeweiligen Systems für weitere Beitragende attraktiver wird. Und unabhängig voneinander haben sie die Erfahrung gemacht, dass es nicht reicht, eine Tür zu öffnen. Jetzt schlagen sie eine Brücke, um gemeinsam ihre Ziele zu erreichen.

Was wir wollen und wie wir vorgehen

Zusammen bauen wir eine Testlandschaft von mehreren Normdatenbanken als Wikibase-Instanzen auf. Das heißt das Team der Deutschen Nationalbibliothek legt in der Software Wikibase Strukturen an, um möglichst vollumfänglich die GND aus unterschiedlichen Perspektiven dort abbilden zu können. Die erste Datenbank bildet die GND ab, wie sie heute von Bibliotheken eingesetzt und bearbeitet wird. Ein zweite Datenbank modelliert die GND erweitert um die zusätzlichen Bedarfe aus den kulturbewahrenden Institutionen, wie Museen und Archiven. Und schließlich die dritte Datenbank, Factgrid, legt auf der Grundlage von GND-Datensätzen eine Forschungsdatenbank für historische Personen und Körperschaften an, die keine eigentliche Normdatenbank mehr sein wird. Sie alle benutzen die Software Wikibase und die GND-Entitäten. In dieser Testlandschaft werden wir die Leistungsfähigkeit und Nutzerfreundlichkeit von Wikibase testen und evaluieren.

Wir wollen wissen, wie leicht sich Daten zwischen den Instanzen synchronisieren lassen. Welche Möglichkeiten der Föderation aus Wikidata lassen sich auf die GND-Wikibase Instanzen übertragen? Vereinfacht Wikibase technisch die Zusammenarbeit über institutionelle Grenzen hinweg? Kann Wikibase über die Rollenmodelle von Wikidata, die Verlässlichkeit von bibliothekarischen Normdaten durch ein komplexes Rechtehandling gewährleisten? Wie steht es mit dem Nachnutzungspotenzial vieler praktischer Anwendertools, die für Wikidata entwickelt wurden, für andere Wikibase Instanzen? Wikidata wird zum Beispiel benutzt, um mit Histropedia Zeitleisten zu visualisieren — von ABBA-Alben bis zu Zulu-Königen. Oder Wikidata liefert die Technik hinter Crotos, einem Visualiserungs- und Entdeckungswerkzeug für Kunstwerke. Wenn Wikidata diese Möglichkeiten zum Bau von Anwendertools bietet, weil es die enzyklopädischen Daten zum menschlichen Wissen sammelt, was ist dann erst an spannenden Anwendungen denkbar, die auf spezialisierten Daten eigener Wikibase-Instanzen basieren?

Beispiel einer Histropedia-Timeline, powered by Wikidata. Bild: Sandra Fauconnier, Histropedia – timeline of female photographers, CC BY-SA 4.0

Im ersten Schritt haben wir jetzt gemeinsam drei Wikibase – Instanzen, also Datenbanken angelegt und modellieren hier die Eigenschaften und Beziehungen, die in den jeweiligen Instanzen gelten sollen. Gerade hatten wir ein gemeinsames Projekttreffen in Frankfurt, zu dem die Kolleginnen und Kollegen von Wikimedia Deutschland e. V. und der Deutschen Nationalbibliothek gemeinsam Arbeitsprozesse für den Datenimport aus der bestehenden GND in die neuen Strukturen abstimmten. In den kommenden Wochen werden wir sukzessive aus der bestehenden GND ausgewählte Entitätstypen, wie zum Beispiel alle Daten zu Personen und Geografika, in die neuen Instanzen importieren. Dies sollte bis zum Sommer einen Stand erreicht haben, der es uns erlaubt, dann mit weiteren Tests zur Benutzerfreundlichkeit (Usability) und der Synchronisierung zu beginnen.

Da die GND als Normdatenbank unbedingt verlässlich sein muss, muss sichergestellt sein, dass die Anwender- oder Editorinnen und Editoren die Verantwortung für die Korrektheit der von ihnen eingegebenen Daten dauerhaft übernehmen. Zwar ist es in Wikibase um einiges leichter als in der starren Softwarestruktur des bestehenden Systems, in der die jetzige GND geführt wird,  jeder Aussage einen Beleg zuzuordnen, auch die Provenienz der Daten lässt sich in Wikibase leichter dokumentieren, dennoch muss in der GND dauerhaft sichergestellt sein, dass die Pflege, die Aktualisierung, die Rechtssicherheit der Daten und möglicherweise erforderliche Korrekturen zügig erfolgen. Daher wird die GND auch in Zukunft stets nur für einen geschlossenen unter Vertrag stehenden Anwenderkreis für die Mitwirkung offen sein, auch wenn dieser durch neue Gruppen von Mitwirkenden erweitert wird. Dies ist einer der wesentlichen Unterschiede zu Wikidata, wo alle eingeladen sind mitzumachen und man einerseits erfolgreich auf die Eigenverantwortung der Beitragenden setzt und andererseits die Autorengemeinschaft die Kontrolle über die Qualität der Daten gemeinschaftlich übernimmt.

Auch Wikidata kennt unterschiedliche Rollen innerhalb der Community. Jede dieser Rollen ist mit unterschiedlichen Rechten und Verantwortlichkeiten ausgestattet. Von den Benutzerinnen und Benutzern, die Daten eingeben, über die Admins mit erweiterteten Befugnissen bis hin zu speziellen Rechtegruppen wie denjenigen, die neue Eigenschaften anlegen können, entspricht das oft auch den Spezialisierungen und Hierarchien in Bibliotheken — und ist doch an einigen Stellen ganz anders und eher dem Wiki-Prinzip als der Bibliothekswissenschaft verbunden. Eine unserer kommenden Aufgaben wird es sein, zu prüfen, ob die bestehenden Möglichkeiten zur Rollendefinition in Wikibase ausreichen, um den Ansprüchen des Rechtemanagements der GND gerecht zu werden, oder ob und wenn ja, welche Anpassungen der Software erforderlich wären.

Bis zur WikidataCon Ende Oktober planen wir, einen ersten Evaluationsbericht vorlegen zu können, der für alle die Chancen, Probleme und erste Ideen für Lösungen im Einsatz von Wikibase für die GND aufzeigen wird. Schließlich möchten wir alle die GND leichter für einen größeren Anwenderkreis zugänglich machen und die Nachnutzung der Normdaten für Wikidata sowie die Einbindung der GND in neue Anwendungen so attraktiv wie möglich machen. Wir sind gespannt, in welchem Umfang Wikibase diesen Erwartungen gerecht wird.

Wir freuen uns über Kommentare, Fragen und Anregungen!

Hinterlasse einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert