zur Artikelübersicht

Enriched publications und Wikidata: Ein Werkstattbericht

Christopher Schwarzkopf

12. Januar 2017

Logo Fellow-Programm, leomaria designbüro, CC BY-SA 4.0

Das Fellow-Programm Freies Wissen wurde 2016 von Wikimedia Deutschland und dem Stifterverband initiiert, um junge Wissenschaftlerinnen und Wissenschaftler dabei zu unterstützen, ihre eigene Forschung und Lehre im Sinne von Open Science zu öffnen und damit für alle zugänglich und nachnutzbar zu machen. In diesem Gastbeitrag berichtet die Stipendiatin Adelheid Heftberger über ihr Projekt im Rahmen des Fellow-Programms und ihre Erfahrungen mit Open Science.

Der Einstieg

Nun saß ich also da, inmitten von schlauen Menschen, die alle sehr viel Ahnung von Open Science hatten. “Da” war das Kick-Off-Meeting des neuen Fellow-Programms “Freies Wissen”, das von Wikimedia Deutschland und dem Stifterverband ins Leben gerufen worden war. Viel war die Rede von Wissenskommunikation wie Blogs, Twitter etc., von Forschungsdaten, von selbst geschriebenen Programmen. Man tauschte sich über Plattformen aus, von denen ich nur vage eine Ahnung hatte oder auf denen ich nur sehr vorsichtig bisher erste Schritte getan hatte. Kurz: Mir rauchte der Kopf. Am Ende verabschiedete ich mich hochmotiviert in der Gewissheit, dass es Zeit war, die Ärmel hochzukrempeln und die Idee von Open Science in meine Community zu tragen bzw. erst einmal zu recherchieren, was der Wissensstand war.

Ein Schritt zurück. Warum nahm ich an einem Kick-Off-Meeting im Wikimedia Deutschland Gebäude in Berlin teil? Meine Bewerbung für das Fellow-Programm entstammte meiner Arbeit am Open Access Journal Apparatus, das von Natascha Drubek 2015 gegründet worden war. Dabei konnte ich aus nächster Nähe erleben, wie komplex ein solcher Gründungsprozess ist und wie viele Partner es dazu braucht. Apparatus widmet sich der Film- und Medienwissenschaft, daher scheint es nicht weit hergeholt, bewegtes Bild in die Artikel einzubauen. Nicht besonders innovativ möchte man meinen, ist das Internet doch voll mit Videos auf den Webseiten. Ein Blick auf die Journal-Landschaft in diesem Bereich zeigt aber rasch, dass geisteswissenschaftliche Artikel immer noch sehr traditionell publiziert werden [1]. Ein typischer Artikel besteht aus Textteilen, zwischen die hin und wieder Bilder zur Illustration eingefügt sind. Umfangreiche Bibliographien und Filmographien sind typischerweise am Ende des Artikels angefügt und Links zu anderen Webseiten sind meist spärlich vorhanden. Sehr oft liegt der Artikel überhaupt nur als pdf zum Download bereit. Sexy ist das nicht gerade. Und auch nicht einfach zu erklären.

Die fehlende Kreativität oder technische Umsetzung derselben liegt nicht nur am fehlenden Willen der Herausgeber und Herausgeberinnen, sondern zu einem großen Teil an mangelhaften Infrastrukturen und nicht zuletzt an den fehlenden oder unklaren Rechten. Viele Open Access Journals verwenden das weit verbreitete Open Journals System (OJS) [2], in dem Videos im Grunde embedded werden können [3]. Dazu kommen Fragen der Archivierung der Inhalte: Wer würde sich um die Langzeitarchivierung kümmern, wenn kein einfaches PDF/A [4] an Bibliotheken abgeliefert werden konnte? Und: ging es in meinem Projekt denn nicht eigentlich um viel mehr als nur ein Video in meinen Test-Artikel einzubauen?

Statt Video im Artikel nun enhanced publications

Allein war ich mit meiner Idee nicht. Wie der langjährige Open Access Aktivist Jeroen Sondervan in seinem Blog schreibt: “It’s hot again!” [5] Jedoch bin ich immer noch auf der Suche nach guten Beispielen, wie eine enhanced publication denn aussehen könnte. Meine Mentorin Claudia Müller-Birn [6] versorgt mich zwar mit spannender Lektüre und macht mich mit interessanten Menschen bekannt, aber mir scheint, dass sich Texte zum Thema oft auf die technische Infrastruktur konzentrieren, aber wenig darüber sagen, wie so ein Artikel denn praktisch aussehen könnte. Dabei können digitale Publikationen auf eine 20-jährige Geschichte verweisen, wie Niels-Oliver Walkowski ausführt [7]. Aber erst seit 2001 ermöglichen die technischen Entwicklungen, vor allem das Semantic Web, wesentliche und notwendige Fortschritte in diesem Bereich. Ab 2007 kommt es dann zu einer regelrechten innovativen Explosion, in deren Zuge Konzepte wie das Open Laboratory Book, Semantic Publishing, Research Objects, Enhanced Publications, Nano-Publications und Multimodal Publications präsentiert werden [8]. Ich entschied mich schließlich einfachheitshalber für den Begriff enhanced publication und für folgende Arbeitsdefinition:

Enhanced publications are commonly intended as digital publications that consist of a mandatory narrative part (the description of the research conducted) plus related “parts”, such as datasets, other publications, images, tables, workflows, devices [9].

Anschließend machte mich daran, zu bestimmen, welche der erwähnten related “parts” mein Testartikel beinhalten könnte. Multimedial sollte der Artikel sein, klar. Außerdem sollten Forschungsdaten eingebunden werden und damit die Ergebnisse nachvollziehbar werden. Dazu wäre eine Datenvisualisierung schön, Tag Clouds verstehen sich von selbst und grafisch sollte das komplexe Geflecht auch noch darstellbar sein. Soweit, so gut. Stichpunktartige Umfragen unter meinen peers legten aber eher die Annahme nahe, dass die traditionelle Art der wissenschaftlichen Publikation in diesem Bereich durchaus auf ebenso traditionelle Arbeits- und Rezeptionsweisen gründet. Anstatt dass man mich euphorisch auffordert, doch rasch einen Prototypen zu entwickeln, der für Film- und Medienwissenschaften endlich den Mehrwert bringt, den man schmerzlich vermisst, blicke ich in fragende Gesichter. Was ich denn da noch einbauen wolle, außer vielleicht einem Link zum Film (auf YouTube) oder zum Wikipedia-Eintrag des Regisseurs? Und ob das dann nicht eher vom Lesen ablenken würde? Ich merke mir, dass ich später unbedingt einen button einbauen werde, der alle zusätzlichen Funktionen der enhanced publication optional wählbar macht. Solche Bedenken zeigen zweierlei: Dass es erstens wichtig ist, von den Ansprüchen der peers auszugehen und nichts auszuarbeiten, was dann nicht angenommen wird. Denn nicht alles, was möglich ist, ist für meine Zielgruppe auch sinnvoll. Wichtiger ist es, die Funktionen auf die Bedarfe abzustimmen und vor allem im Hinblick auf die im Artikel verfügbaren Quellen sorgfältig zu wählen. Und zweitens, dass man bei den Möglichkeiten der elektronischen Publikationen nicht nur Pionierarbeit im technischen Bereich sondern auch Überzeugungsarbeit leisten muss. Bei einer systematischen Auflistung möglicher Werkzeuge unterscheide ich dann zunächst zwischen solchen, die vor allem für die Herausgeber des Journals nützlich sein könnten (z.B. für bessere Durchsuchbarkeit, Metadaten-Ablieferung, Verwaltung der Bibliographien etc.). Den Mehrwert für die Leserschaft in Funktionen umzusetzen ist schon schwieriger. Ein wichtiger Nebenaspekt, zumindest für mein Projekt: Nachdem ich mich durch den State-of-the-Art Report zum Thema durchgearbeitet hatte [10], verstand ich außerdem, dass die Anreicherung nur ein Teil der Arbeit ist. Die komplexe und multimodale Struktur einer solchen Publikation erfordert ebenso komplexe Workflows für die Archivierung. Probleme wie diese schiebe ich vorerst einmal beiseite und konzentriere mich auf das, was in sechs Monaten (die Laufzeit des Fellow-Programms) machbar ist.

Aus dem Artikel in WikiData

Bekanntlich erhöht Open Access die Zugänglichkeit und dadurch auch die Sichtbarkeit einer wissenschaftlichen Publikation. Kommt das mühsam zusammengetragene Wissen eines Artikels, das oft auch Faktenwissen ist, nun aber tatsächlich einer breiteren Öffentlichkeit zugute? Ein Blick in Wikipedia zeigt, dass gerade in Nischenbereichen wie es die osteuropäische Film- und Medienwissenschaft zweifellos ist, mehr Information und aktuelle Forschungsergebnisse wünschenswert sind. Zudem publiziert Apparatus ausdrücklich in allen mittel- und osteuropäischen Sprachen, was zusätzlich einen Mehrwert bedeutet. Denn in “kleinen Sprachen” gibt es oft noch wenig wissenschaftliche Begriffsbildung. Statt über mögliche Formen der multimedialen Anreicherung meines Testartikels mit Informationen aus dem Web nachzudenken (Pull-Prinzip), sollte ich nicht besser zuerst versuchen, die Informationen aus dem Artikel in einen größeren Wissenspool, z.B. Wikidata einzuspeisen, damit mehr Menschen davon profitieren können (Push-Prinzip)? Wikidata ist die zentrale Datenbank, die hinter den Projekten der Wikimedia Foundation steht und die unter anderem sicherstellt, dass Fakten in allen Sprachversionen gleich sind, z.B. die Einwohnerzahl von Potsdam [11]. Sie ist frei, kollaborativ, vielsprachig und sammelt strukturierte Daten in einer sogenannten secondary database, d.h. dass Wikidata nicht nur Aussagen speichert, sondern auch die Quellen dazu und damit die Diversität des verfügbaren Wissens reflektiert. Interessiere ich mich beispielsweise für den russischen Regisseur Dziga Vertov, so suche ich den Namen zuerst in Wikidata und finde ihn unter diesem Label. Dem Label sind dann verschiedene Statements zugeordnet, die ich ausfüllen oder sogar neu anlegen kann, z.b. date of birth, date of death, sibling etc., aber auch Zuordnungen zu Wikicommons finde ich hier. Prinzipiell gilt: will ich einen neuen Eintrag in Wikidata anlegen [12] oder editieren, so kann ich das ohne vorherige Registrierung machen [13]. Für diese Verknüpfung mit Wikidata von Personennamen ist ein manueller, ein semi-automatischer oder sogar ein vollautomatischer Prozess möglich. Was möglich und sinnvoll ist, das wird sich in den kommenden Wochen noch zeigen, aber der Vorteil liegt auf der Hand. Die Verknüpfung von wissenschaftlichen Publikationen mit Wikidata trägt so unmittelbar dazu bei, dass Forschung dort ankommt, wo sie hinsoll: bei so vielen Menschen wie möglich.


Zur Autorin

Adelheid Heftberger ist wissenschaftliche Referentin am ZeM (Brandenburgisches Zentrum für Medienwissenschaften) in Potsdam. Wissenschaftliche Artikel bestehen bisher immer noch zum überwiegenden Teil aus reinem Text, in den manchmal Bilder eingesetzt werden; nur ganz selten sind Videos in der Präsentation von Texten im Web eingebettet. Ihr Ziel im Projekt ist es daher anhand des Open Access Journals Apparatus, eine Vision für zukünftige elektronische Publikationen zu entwerfen. Solche enhanced publications sollen einerseits mit frei verfügbaren Daten und Medien angereichert, und andererseits daraus Forschungsergebnisse in offene Wissenssammlungen übertragen werden.


 

[1]  In DOAJ gibt es ca. 30 Journals zu Film- und Medienwissenschaften, die ich stichpunktartig gesichtet habe. Darauf und auf weitere mir bekannte Open Access Journals stütze ich meine Aussagen.

[2]  “Open Journal Systems (OJS) is a journal management and publishing system that has been developed by the Public Knowledge Project through its federally funded efforts to expand and improve access to research”, wie es auf der Webseite heißt. Siehe: https://pkp.sfu.ca/ojs/.

[3]  Ganz leicht ist dies aber auch nicht, zumindest erfordert die Verwendung von OJS jemanden im Team, der über informatische Grundkenntnisse verfügt und sich durch plugins und Kommandozeilen kämpft.

[4]  PDF-A ist das genormte Format für die Abgabe von digitalen Textdokumenten für die Langzeitarchivierung: https://de.wikipedia.org/wiki/PDF/A

[5]   Eintrag vom 13. September 2016 mit dem Titel “Enriched publications advancing scholarly communication?” Siehe: https://oamediastudies.com/blog/

[6] Hier mehr zu Prof. Claudia Müller-Birn: http://www.mi.fu-berlin.de/inf/groups/ag-nbi/members/mueller-birn.html

[7]  Siehe: Walkowski, N.-O. (2016). Digital Publications Beyond Digital Communication. DARIAH-DE Working Papers, (17). Retrieved from Urn:nbn:de:gbv:7-dariah-2016-3-4. Empfehlenswert ist folgender stark theoretisierender Text, der eine Darstellung der Entwicklungen im digitalen Publizieren zum Anlaß nimmt, generelle Thesen zum digitalen Medienshift zu entwickeln: Walkowski, N.-O. (2013). Text, Denken und E-Science. Eine intermediale Annäherung an eine Konstellation. In Digital Humanities (pp. 37–54). Zürich; Berlin: Diaphanes.

[8] Walkowski (2016, S. 8), hier werden die unterschiedlichen Begriffe auch näher beschrieben. Zu semantic publication siehe auch hier: Siehe: Shotton D, Portwin K, Klyne G, Miles A (2009) Adventures in Semantic Publishing: Exemplar Semantic Enhancements of a Research Article. PLoS Comput Biol 5(4): e1000361. doi:10.1371/journal.pcbi.1000361.

[9]  Siehe: Bardi, A. & Manghi, P., (2014). “Enhanced Publications: Data Models and Information Systems”. LIBER Quarterly. 23(4), pp. 240–273. DOI: http://doi.org/10.18352/lq.8445

[10]  Der State-of-the-Art Report zu enhanced publications ist übrigens: Woutersen-Windhouwer S., Brandsma, R. (2009). “Enhanced Publications: State of the Art”. In: Vernooy-Gerritsen, M. (ed), Enhanced Publications. Linkin Publications and Research Data in Digital Repositories. SURF, Amsterdam University Press, 2009.

[11]  Hier mehr zu Wikidata: https://de.wikipedia.org/wiki/Wikidata.

[12]  Auf dieser Seite ist das möglich: https://www.wikidata.org/wiki/Special:NewItem.

[13]  Siehe: https://www.wikidata.org/wiki/Wikidata:Introduction.