zurück

Zitationen offen verfügbar machen: Wikimedia Deutschland unterstützt die „Initiative for Open Citations“

Dr. Dominik Scholl

13. April 2017

Zitationen sind als Literaturangaben und Verweise die Verknüpfungen, die wissenschaftliches und kulturelles Wissen miteinander in Beziehung setzen. Sie vernetzen das Wissen der Menschheit über Zeit und Raum hinweg. Eine offene Datenbank zur Erschließung von Zitationen wissenschaftlicher Arbeiten bietet nicht nur für die Wissenschaft, sondern auch für Projekte Freien Wissens wie die Wikipedia oder Wikidata viele Möglichkeiten, Wissensbestände zu verknüpfen und  darüber neue Einsichten zu gewinnen.

Als Belege ermöglichen es Zitationen, Informationen nachzuprüfen, Argumentationen nachzuvollziehen und weiterzuentwickeln sowie mit vorliegenden Daten und Studien weiter zu arbeiten. Sie machen nicht nur sichtbar, auf welchem bestehenden Wissen aufgebaut wird. Sondern sie zeigen auch, welchen Einfluss einzelne Forschungsbeiträge haben und spielen daher eine große Rolle, wenn es darum geht, Wissenschaft zu evaluieren.

Aber Zitationen sind nicht nur für die Wissenschaft relevant. Ganz grundlegend geben sie Auskunft darüber, woher wir wissen und warum wir wissen, was wir wissen. Auch für ein Projekt enzyklopädischen Wissens wie die Wikipedia ist das Prinzip der Belegpflicht daher grundlegend. Aus Sicht des Freien Wissens problematisch ist der Umstand, dass Literaturangaben und Verweise in der Wissenschaft bislang kaum frei verfügbar sind, sondern nur in kommerziellen und kostenpflichtigen Datenbanken wie Web of Science und Scopus aggregiert werden.

Ausschnitt aus dem Zitationsnetzwerk eines Fachartikels. Wikimedia Commons. CC0.

 

Eine Initiative für freie Zitations-Metadaten

Dies möchte nun die „Initiative for Open Citations (I4OC)“ ändern, die am 6. April 2017 von der Wikimedia Foundation gemeinsam mit Wissenschaftsverlagen, Wissenschaftlerinnen und Wissenschaftlern sowie vielen anderen ins Leben gerufen wurde, um die unbeschränkte Verfügbarkeit wissenschaftlicher Zitationsdaten voranzubringen. [1] Beteiligt daran sind zum einen 29 renommierte Verlagshäuser wie MIT Press, SAGE Publishing, Springer Nature, Taylor & Francis und Wiley, die ihre Zitations-Metadaten frei zugänglich machen. Zum anderen wird die Initiative unterstützt von zahlreichen Projekten und Organisationen wie dem Internet Archive, der Open Knowledge Foundation, Mozilla, Wikimedia Deutschland und anderen mehr.

Der Initiative kommt dabei zugute, dass viele Verlage ihre veröffentlichten wissenschaftlichen Artikel bei Crossref registrieren, einer Agentur der International DOI Foundation. Mit den Artikeln werden auch deren Metadaten erfasst: bibliografische Informationen wie der Titel, die Autorin oder der Autor, aber auch andere maschinenlesbare Daten darüber, wie sich Artikel gegenseitig zitieren. Crossref vergibt so genannte Digital Object Identifier, um wissenschaftliche Zeitschriftenartikel im Internet als Objekte selbst identifizierbar zu machen, anstatt sie über die Adresse, unter der sie momentan abgelegt sind, anzusprechen.

Diese eindeutigen und dauerhaften digitalen Objektbezeichner spielen auch für die Wikipedia eine wichtige Rolle, wie Geoffrey Bilder, Leiter für strategische Allianzen bei Crossref, hervorhebt:

„Wikipedia ist als Ganzes betrachtet vermutlich an fünfter Stelle aller Websites, die auf wissenschaftliche Literatur verweisen. Das bedeutet, dass mehr Wikipedia-Nutzerinnen und -Nutzer auf Zitationen klicken und von den Wikipedia-Domains in die wissenschaftliche Literatur gelangen, als von jedem einzelnen Wissenschaftsverlag dieser Welt.“ [2]

 

1 Prozent und 1 gute Idee

Vor dem Start der I4OC-Initiative waren nur 1 Prozent der Zitations-Metadaten von in Crossref registrierten Publikationen frei verfügbar. Dies liegt zum einen an rigiden Lizenzbedingungen der Verlage, zum anderen daran, dass bei Crossref selbst diese Metadaten standardmäßig als nicht-offen markiert werden, solange bis der Verlag sich explizit dafür entscheidet, die Daten öffentlich nutzbar zu machen. Dies gilt selbst für Open-Access-Publikationen, die im Internet als Volltext frei verfügbar sind. Die I4OC-Initiative setzt genau an diesem Punkt an und macht deutlich, wie einfach sich mit einer guten Idee und viel Überzeugungsarbeit auf der einen und gutem Willen auf der anderen Seite eine Veränderung erreichen lässt. Seit März ist durch die Unterstützung der beteiligten Verlage der Anteil von bei Crossref erfassten Publikationen mit offenen Zitations-Metadaten von 1 Prozent auf mehr als 40 Prozent gestiegen, das entspricht annähernd 15 Millionen Artikeln.

Abbildung von Dario Taraborelli, Wikimedia Commons, CC0

 

Ein weltweites Netz des Wissens

Eine offene Datenbank zur Erschließung von Zitationen wissenschaftlicher Arbeiten bietet Vorteile und Potenziale in mehrerlei Hinsicht: Ein weltweites Netz verlinkter wissenschaftlicher Zitations-Metadaten würde die Auffindbarkeit von – sowohl open access als auch closed access – veröffentlichten Forschungsergebnissen deutlich verbessern. Davon profitieren dann insbesondere all diejenigen, die nicht Mitarbeitende einer Wissenschaftsinstitution sind, die ihren Mitarbeitenden oft über Abonnements Zugang zu den bestehenden kostenpflichtigen Datenbanken wie Web of Science oder Scopus eröffnen. Offene Zitations-Metadaten ermöglichen es, Verknüpfungen zwischen verschiedenen Forschungsfeldern und Wissensbereichen herzustellen und darüber neue Einsichten zu gewinnen. Außerdem bieten offene Daten für Projekte Freien Wissens die Möglichkeit, Wissensbestände miteinander zu verknüpfen und darauf aufbauend neue Anwendungen zu entwickeln.

 

Wikimedia + Zitationen = WikiCite

Dies führen auch die Wikimedia-Projekte vor. Hier gab es in der Vergangenheit bereits verschiedene Initiativen, die darauf zielten, wissenschaftliche Zitationen systematisch mit den Inhalten der Wikipedia oder in Wikidata zu verknüpfen. Schon der Name des Projekts WikiCite macht deutlich, dass es hier darum geht, Wikimedia-Projekte und Zitationen (Englisch: citations) zusammenzubringen. In diesem Projekt wird daran gearbeitet, eine bibliografische Datenbank in Wikidata zu entwickeln, die allen Wikimedia-Projekten zur Verfügung steht. Am Beispiel der Forschung zum Zika-Virus und Zika-Fieber wurde mit einem überschaubaren Textkorpus von etwas mehr als 1.000 wissenschaftlichen Artikeln vorgeführt, welcher Mehrwert darin steckt, Zitations-Metadaten in Wikidata zu erfassen. So lassen sich Informationen zu Krankheiten oder Genen mit einer Vielzahl wissenschaftlicher Zitationen anreichern, und es wird nachvollziehbar, wie das Wissen dazu entsteht.

Visualisierung von Themen, die in wissenschaftlichen Publikationen zusammen mit dem Thema Zika-Virus auftreten. Wikimedia Commons. CC0.

Was mit diesen Metadaten noch möglich ist, wird aktuell zum Beispiel im Projekt Scholia getestet. Hier geht es einerseits darum, Autorinnen und Autoren beim Erstellen neuer Fachpublikationen ein Wikidata-basiertes Hilfsmittel zum Einfügen von Referenzen zur Verfügung zu stellen. Andererseits ermöglicht es Scholia, über Anfragen an den Wikidata Query Service wissenschaftliche Profilseiten zu Themen wie dem Zika-Virus, zu einzelnen Publikationen oder Publikationslisten von Institutionen, Fachzeitschriften, Wissenschaftsverlagen oder einzelnen Wissenschaftlerinnen und Wissenschaftlern zu erzeugen. Diese Seiten können verschiedene Visualisierungen enthalten: zur Zahl veröffentlichter Artikel oder Artikelseiten im Jahr; zu Zeitschriften, in denen publiziert wurde; zur Verbindung zwischen Autorinnen und Autoren, die gemeinsam Artikel veröffentlicht haben.

Visualisierung der Zeitschriften, in denen der Chemiker Egon Willighagen veröffentlicht hat. Wikimedia Commons. CC0. Query on Wikidata.

Auf diese Weise wird ein weltweites Netz des Wissens, von Personen und Forschungsthemen, von zeitlichen und räumlichen Bezügen sichtbar. All dies wird nur durch offene Zitations-Metadaten möglich. Daher ist es Wikimedia Deutschland wichtig, die I4OC-Initiative zu unterstützen, um die fehlenden 60 Prozent frei verfügbarer Metadaten in Angriff zu nehmen.

 

[1] Maßgeblich vorangetrieben wurde das Vorhaben von Jonathan Dugan, Martin Fenner, Jan Gerlach, Catriona MacCallum, Daniel Mietchen, Cameron Neylon, Mark Patterson, Michelle Paulson, Silvio Peroni, David Shotton und Dario Taraborelli.

[2] Zitiert nach: https://meta.wikimedia.org/wiki/Wikipedia_as_the_front_matter_to_all_research

Kommentare

  1. […] Um diesem Missstand abzuhelfen, haben sich mehrere Organisationen, darunter DataCite, PLOS und Wikimedia, zur Initiative for Open Citations (I4OC) zusammengeschlossen. Ein weiteres Problem neben der […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert