Lassen sich Normdaten wikifizieren? Wikibase wurde für die Gemeinsame Normdatei (GND) evaluiert

Wikimedia Deutschland e. V. und die Deutsche Nationalbibliothek (DNB) haben gemeinsam in den vergangenen Monaten die Eignung von Wikibase als Software für die Gemeinsame Normdatei (GND) evaluiert. Der proof of concept untersucht, ob Wikibase – die Software hinter Wikidata – die Zusammenarbeit mit Bibliotheken sowie diversen Communities vereinfachen würde. Barbara Fischer, Liaison Counsel an der Arbeitsstelle für Standardisierung (AfS) der Deutschen Nationalbibliothek und Jens Ohlig von Wikimedia Deutschland e. V. stellen im Gespräch die Ergebnisse vor.

  • Barbara Fischer
  • Jens Ohlig
  • 4. März 2020

Zur englischen Version.

Jens Ohlig: Mit der digitalen Transformation wächst der Bedarf in wissenschaftlichen Forschungseinrichtungen, Museen und Archiven nach einer verbesserten Auffindbarkeit digitaler Kulturdaten im Netz. Lange nutzten nur Bibliotheken die Gemeinsame Normdatei (GND). In Bibliothekskatalogen werden primär Normdaten verwendet um z. B. Autoren, Publikationsorte oder Sachthemen eindeutig zu kennzeichnen. Das erleichtert die Erfassung neuer Medien, hilft aber auch unterschiedliche Medien miteinander über Normdaten als gemeinsame Knotenpunkte zu verknüpfen. 

Barbara Fischer: Im Zuge des digitalen Wandels steigt der Bedarf nach verlässlichen und interoperablen Normdaten. Die ursprünglich für Bibliotheken konzipierte GND weckt das Interesse der anderen Kulturgut bewahrenden Institutionen. Man möchte nicht nur die GND-Identifikatoren nutzen, sondern bei Bedarf neue GND-Datensätze anlegen und pflegen können, die Bezug nehmen auf museale Objekte, Archivalien und Forschungsdaten. Das DFG-geförderte Projekt GND für Kulturdaten (GND4C) verdeutlicht diesen Bedarf. Zugängliche Software und eine technisch überzeugende Plattform hilft, Regeln und Ausnahmen zur Modellierung festzulegen sowie,  relevante Eigenschaften und Relationen zu reflektieren, diskutieren und dokumentieren. Im Kontext von Linked Open Data wird Verlässlichkeit der Daten immer stärker an die Transparenz und Nachvollziehbarkeit ihrer Referenzierung geknüpft. Und das für jede einzelne Aussage. Zudem macht das Internet vor Sprachgrenzen nicht halt. Deshalb ist die Multilingualität der Benennungen erwünscht. Wikidata erfüllt alle diese Kriterien und ist doch keine Normdatei. Jedoch basiert Wikidata auf der von Wikimedia Deutschland entwickelten Software Wikibase. In einem gemeinsamen Kooperationsprojekt mit Wikimedia Deutschland hat die Deutsche Nationalbibliothek daher die Leistungsfähigkeit von Wikibase für die GND untersucht und nach folgenden Kriterien getestet:

Die Ergebnisse sind ermutigend. Wikibase ist eine  Brücke in die Welt der offenen, kooperativ und interdisziplinär erstellten Normdaten. Der proof of concept zeigt, dass diese Brücke tragfähig ist.

Was hat uns überzeugt?

Jens Ohlig: Wikimedia und die Deutsche Nationalbibliothek sind zwei Institutionen, die auf unterschiedliche Weise menschliches Wissen zur Verfügung stellen. Bibliotheken sind nicht nur starke Verbündete in Sachen Freies Wissen, sondern in gewisser Weise die älteren, institutionellen Wahlverwandten von Wikimedia. Die GND-IDs sind mit den Q-Nummern von Wikidata durchaus zu vergleichen. Viel Überzeugungsarbeit war da für das Projekt nicht mehr nötig. Hinzuzu kommt, dass die Deutsche Nationalbibliothek und die GND als Leuchtturm quasi über das gesamte Feld der Bibliotheksmetadaten strahlt – daher weckte die  Evaluation auch international Interesse an Wikibase. Auf einem Treffen von Nationalbibliotheken in Stockholm im Sommer 2019 war das Interesse an Wikibase deutlich zu sehen: denn ohne eine Strategie zu Linked Open Data und Wikibase geht es heutzutage nicht mehr.

Barbara Fischer: Aus der Perspektive der Deutschen Nationalbibliothek hat  die Leichtigkeit überzeugt, mit der wir Instanzen anlegen und modellieren konnten. Wir brauchten in unserem gemischten Team aus Softwareentwickler*innen und Bibliothekar*innen keine langwierigen Schulungen, um mit der Software arbeiten zu können. Die Instanzen liefen einmal eingerichtet stabil und waren auch leicht zu klonen. Für uns als Betreiber einer Normdatei ist es wichtig, die Verlässlichkeit der Daten unter anderem über die Transparenz ihrer Herkunft herzustellen. Daher gefällt uns, dass es sich jederzeit und für jede Aussage zu einer Entität  nachverfolgen lässt, wer etwas verändert hat, und was verändert wurde. Ganz wie man es auch von Wikipedia kennt. 

Was hat uns überrascht?

Jens Ohlig: Wikibase ist als Software für Wikidata entstanden, um Datenbestände zu ordnen und zu verknüpfen. Die damit abbildbaren Datenmodelle sind nicht explizit auf Bibliotheken und ihre speziellen Bedürfnisse ausgerichtet: Wikibase ist keine Bibliothekssoftware. Trotzdem passt das flexible Datenmodell sehr gut zur GND, alle Beziehungen und Eigenschaften lassen sich hier abbilden und ausdrücken. Sowohl die Genauigkeit der Evaluation – zum Beispiel wurde genau gemessen, wie lange der Import von Daten dauerte –  als auch das Ergebnis, nach dem Wikibase den Anforderungen entspricht, waren für Wikimedia eine positive Überraschung. Dass Wikibase als Software-Paket für Linked Open Data “out of the box” für eine Institution wie die Deutsche Nationalbibliothek und das Projekt GND so passgenau ist, war überraschend. 

Barbara Fischer: Wir von der Deutschen Nationalbibliothek hatten uns vieles leichter vorgestellt. Gerade weil Wikidata selbst ja eine sehr mächtige Datenbank ist, hätten wir gedacht, dass der Import von größeren Datenmengen bereits zu den Standardumsetzungen gehört. Vielleicht war es unsere Perspektive als Kulturinstitution und unsere mangelnde Erfahrung mit einer  offenen Anwendung wie Wikibase mit ihrer engen Verflechtung mit der Mediawiki-Software zunächst ungewöhnlich erschien. Eine so enge, auch im Code eingeschriebene Verbindung ist für die Wikipedia und viele anderen Wikis normal, doch unerwartet wenn man mit einer Datenbanksoftware rechnet. Die Entwicklung ist sehr unmittelbar von einer freiwilligen Community getrieben, was  auch erklärt, warum nach wie vor viele der attraktiven Ergänzungen Wikidata-affin sind und für eine generische Nachnutzung durch alle Wikibase-Anwenderinnen und Anwender erst adaptiert werden müssten. Aber im Großen und Ganzen bietet Wikibase ein für uns nutzbares Arbeitsambiente. 

Wirklich positiv überrascht hat uns das Potenzial einer offenen GND, einer GND 2.0. in Bezug auf die Möglichkeit, das ganze Beziehungsgeflecht der Eigenschaften und Beziehungen, sowie wie diese definiert sind, abbilden zu können. Die Regelwerke, die notwendig sind, um tatsächlich verbindliche und verlässliche Normdaten kreieren zu können, lassen sich in eine Wikibase Instanz übertragen. Nach unseren bisherigen Tests glauben wir, dass wir damit die in Wikibase modellierten Regelwerke nutzen könnten, um intelligente und sich dynamisch anpassende Eingabemasken steuern zu können. Das verspricht, die Zusammenarbeit mit Nicht-Bibliothekar*innen erheblich zu vereinfachen. Die Zukunft wird zeigen, ob sich dieses Versprechen einlösen lässt.

Und was bringt die Zukunft?

Barbara Fischer: Da die GND eingebunden ist in ein ganzes System von Diensten für den nationalen Bibliothekssektor, werden wir die Normdatenbank auch in dem bisherigen System fortführen. Aber wir möchten mit einer vollständigen GND-Wikibase-Instanz den Normdaten ein zweites Zuhause geben und Außenposten für Erweiterungen einrichten, die in der bisherigen Umgebung nur schwer umzusetzen sind. Wir wollen mit Wikibase einen erweiterten Zugang zur GND schaffen für Interessengruppen, für die die bibliothekarischen Redaktionsoberflächen nicht geeignet sind. 

Die nächsten Schritte sind daher der vollständige Import der circa acht Millionen GND-Einträge, die Modellierung der Eigenschaften gemäß des GND-Datenmodells, die Dokumentation der Regeln, nach denen die Entitäten erfasst werden und schließlich eine belastbare Synchronisierung der Wikibase-Instanz mit dem “Master” im traditionellen CBS-System.

Jens Ohlig: Da liegt noch ein ganzes Stück Arbeit vor uns. Wikibase ist ein Speicher für strukturierte Daten. Vieles, was Bibliothekar*innen bei der täglichen Arbeit benötigen, fehlt noch: von der Konvertierung von Standardformaten wie die bibliographischen Datenformate MARC21 oder PICA+ hin zu spezialisierten Interfaces zur Dateneingabe in intelligenten Formularen.  All dies muss jetzt entwickelt und an die Software angepasst werden. 

Im Verlauf des Jahres 2020 liegt jetzt die konkrete Planung für den Einsatz von Wikibase bei der GND vor uns. Die Partnerschaft von Wikimedia und der Deutschen Nationalbibliothek hat sich bewährt. Zusammen wollen wir eine Wikibase-basierte GND weiterentwickeln und zum Einsatz bringen. Mit der GND auf der Grundlage von Wikibase wächst im Ökosystem der freien verlinkten Daten eine starke Grundlage heran, die das Interesse von vielen anderen Institutionen weckt: z. B. die französische Nationalbibliothek Bibliothèque Nationale de France (BNF) und der Hochschulbibliotheksverbund ABES in Frankreich arbeiten bereits an ihrem eigenen Prototypen mit Wikibase. Grund genug für die Deutsche Nationalbibliothek und Wikimedia mit der BNF und ABES in den kommenden Wochen den Austausch bei einem gemeinsamen Treffen in Paris zu suchen. Wir sind zuversichtlich, dass Wikibase nicht nur eine Heimstatt für Normdaten werden kann, sondern dass diese sich mit der Zeit im Sinne eines Linked-Open-Data-Ökosystems wikifizieren.

Einen ersten Blogpost zu Wikibase und GND gibt es hier.