Offene Kulturdaten
Wie das Naturkundemuseum mit Linked Open Data unbekannte Forschende sichtbar macht
Patrick Wildermann
22. April 2024
Das Museum für Naturkunde in Berlin verfügt über eine gigantische Sammlung. Schätzungsweise umfasst sie rund 30 Millionen Objekte, genau gezählt wurde das nie. Was auch bedeutet: Es liegen noch Berge an Informationen in den Beständen der Kulturinstitution, die darauf warten, erschlossen zu werden. Genau daran arbeitet das Museum im Rahmen eines ambitionierten Zukunftsplans.
Eine Säule dieses von Bund und Land geförderten Vorhabens ist die Sammlungserschließung und -entwicklung. „Dabei geht es eben nicht nur darum, Bilder von Objekten digital verfügbar zu machen“, erklärt Sabine von Mering, biologische Datenwissenschaftlerin im Forschungsbereich „Zukunft der Sammlung des MfN. Vielmehr sei das Ziel „eine offene Forschungsinfrastruktur zu schaffen, die allen Interessierten zugänglich ist“. Um dies zu erreichen, nutzt von Mering zusammen mit Kolleg*innen die Potenziale von Linked Open Data. „Wir müssen die institutionellen Datensilos aufbrechen, die Daten frei verfügbar machen und international zusammenarbeiten“, ist die studierte Botanikerin überzeugt: „Dann sind viele spannende Analysen zu Netzwerken möglich“.
Ein Sammler*innen-Projekt als Ausgangspunkt
Am Museum für Naturkunde Berlin hat von Mering dazu ein Sammler*innen-Projekt ins Leben gerufen. Grundlage dieses Forschungsunternehmens – das aus dem hauseigenen Innovationsfonds gefördert wurde – ist ein internes Wiki des MfN, das Informationen zu rund 600 historischen Sammler*innen mit Bezug zur enthält: Wissenschaftler*innen, Präparator*innen, Illustrator*innen. „Personen“, erklärt von Mering, „sind die zentrale Einheit im Wissensnetz und als Anknüpfungspunkt hoch relevant.“ An sie ließen sich andere Entitäten andocken: Objekte in Sammlungen, Publikationen, Archivalien, Fotos – und natürlich andere Personen. „Diese Vernetzung war unser ursprüngliches Interesse“, so die Wissenschaftlerin.
Als Pilotdatensatz wurde das interne Sammlerwiki im Rahmen eines Edit-a-thons im September 2022 noch per Hand in Wikidata übertragen. „Wikidata ist mehrsprachig, maschinen- und menschenlesbar und kollaborativ – und deswegen ein sehr nützliches Tool für unsere Arbeit“, betont von Mering. Dadurch, dass den Personen nach dem Prinzip der Linked Open Data ein eindeutiger Identifikator zugeordnet wird, lassen sich die Verknüpfungen herstellen, die für die Forschung spannend sind.
Zunächst einmal gilt das für die Sammlung des Museums selbst, die auch Archiv und Bibliothek mit einbezieht: War Person X vielleicht nicht nur Ornitholog*in, sondern hat daneben auch Insekten gesammelt und Bücher geschrieben? Aber möglich wird durch LOD vor allem auch „der Blick über den Tellerrand“, wie Sabine von Mering beschreibt – eine Domänen-übergreifende Verknüpfung: „Beispielsweise hat Person X auf Reisen auch ethnologische Objekte gesammelt, die sich im Ethnologischen Museum Berlin befinden. Oder die Person hat neben Insekten auch die Wirtspflanzen der Tiere gesammelt, die im Herbarium des Botanischen Gartens liegen – um nur die möglichen Berlin-Bezüge zu veranschaulichen.“ Denn natürlich lassen sich mit Linked Open Data solche Verknüpfungen weltweit herstellen.
Mehr Sichtbarkeit für Hidden Champions
Für die Forschung bedeutet das einen enormen Gewinn. „Wenn wir Sammlungsdaten inklusive Daten zu Personen mit Sammlungsbezug zugänglich und nachnutzbar machen“ – den FAIR Data-Prinizipien folgend –, „helfen sie uns als globale Wissensressource und offene Forschungsinfrastruktur für alle dabei, viele offene Fragen zu beantworten“, von Mering. Fragen etwa aus dem Themenspektrum Biodiversitätsverlust, oder zu unterrepräsentierten Gruppen, sogenannten „hidden champions“ – was etwa lokale Guides, Sammler*innen oder Informant*innen sein können, aber auch Frauen, die einen wichtigen Beitrag zur Forschung geleistet haben, deren Verdienste jedoch Männern zugeschlagen wurden. Kurzum: Es geht zentral auch darum, die Sichtbarkeit und Auffindbarkeit dieser „versteckten“, sprich: marginalisierten Menschen zu erhöhen.
Gefunden im Sammlerwiki: Eine dieser Hidden Champions ist die Zoologin Bat-Sheva Aharoni, Q108309256, (im Bild mit ihrem Vater Israel Aharoni) promovierte 1932 über die Muridae (kleine Nagetiere) Palästinas an der Friedrich-Wilhelms-Universität Berlin (heute Humboldt-Universität). Das Foto zeigt sie in den Gängen der zoologischen Sammlung der Hebräischen Universität Jerusalem. Aufgenommen wurde das Foto vor 1947. Den Wikidata-Eintrag zu der Zoologin hat Sabine von Mering angelegt.
Von den rund 600 Personen im internen Sammler-Wiki des Museums für Naturkunde Berlin waren zum Beispiel nur 11 Frauen. Sabine von Mering und ihr Team wissen, dass hier ein Bias vorliegt und es tatsächlich viel mehr gewesen sein müssen, die einen Beitrag geleistet haben. Entsprechend suchen die Wissenschaftler*innen in der Folge des Sammler*innen-Projektes nun weitere Frauen mit Bezug zum MfN. Das Problem: Über sie ist oft so wenig bekannt, dass jede Recherche ein kleines Forschungsprojekt für sich bedeutet.
Zusammen mit der neuseeländischen Wissenschaftlerin und Wikimedian Siobhan Leachman – die auf der Wikimania 2023 als „Wikimedia Laureate“ ausgezeichnet wurde – hat von Mering zudem ein Data-Paper zu Pflanzengattungen erstellt, die nach Frauen benannt wurden. Innerhalb der Gattungen, die überhaupt den Namen von Personen tragen, machen sie wiederum nur einen Bruchteil aus, ca. 700 haben die beiden zusammengetragen, bei Männern ist es ein Zehnfaches. Ihr Datensatz, der auch über Wikidata verfügbar ist, hilft wiederum, Verknüpfungen herzustellen – zwischen der Pflanzengattung und der Namensgeberin, die vielleicht Botanikerin war, Schriftstellerin oder eine Mäzenin, die wissenschaftliche Arbeit unterstützt hat. Auch hier ist das Anliegen, die Sichtbarkeit zu erhöhen.
Arbeit an kolonialen Kontexten
Linked Open Data spielen am Museum für Naturkunde Berlin zudem dort eine wichtige Rolle, wo es um die historische Kontextualisierung und die Reflektion von Wissen im Zusammenhang mit Kolonialgeschichte geht. Am Haus existiert ein „Center for the Humanities of Nature“. Eine Gruppe von Historiker*innen, Sozial-Anthropolog*innen oder auch Kulturwissenschaftler*innen durchleuchtet die eigenen Bestände und liefert Daten, die zur Aufarbeitung von Unrechtskontexten und Sammelpraktiken beitragen, die oft mit dem Begriff „Raub“ präziser beschrieben sind. Provenienzforschung, wie sie das MfN betreibt, bedeutet immer auch das Ausloten von Grauzonen. „Viele Wissenschaftlerinnen und Wissenschaftler haben vielleicht nicht selbst geraubt, aber auch koloniale Strukturen genutzt – das ist ein Erkenntnis- und ein Lernprozess“, so Sabine von Mering.
Wie sich solche Verflechtungen auch in Wikidata abbilden lassen, ist eine Frage, an der sie gegenwärtig unter anderem mit Lucy Patterson – Projektmanagerin digitales Kulturgut bei Wikimedia Deutschland e.V. – sowie dem Wissenschaftler Yann LeGall forscht, der an der Technischen Universität Berlin in das Projekt „The Restitution of Knowledge“ involiviert ist. Die Überlegung ist: „Wie kontextualisiere ich, dass der Kolonialbeamte aus Deutschland auch ein Plünderer war?“. Oder: Wie lässt sich in strukturierten Daten der Unterschied zwischen einer „klassischen“ Forschungsexpedition und einer Strafexpedition („punitive expedition“) sichtbar machen – Gewaltunternehmungen von Kolonialtruppen, in deren Zuge nicht selten auch „gesammelt“ wurde?
Hans Dominik (rechts), Q879441, war ein Kolonialoffizier der Schutztruppe, der als dienstältester Offizier in der Kolonie Kamerun ein brutales und mörderisches Erbe hinterließ. Im Sammlerwiki wird auch angegeben, dass er (wahrscheinlich geplünderte) Gegenstände in die Sammlungen des Linden-Museums und des Ethnologischen Museums Berlin eingebracht hat. Zu sehen ist er auf dem Foto in Kamerun, im Hintergrund ist der Bismarck Brunnen in Buea zu sehen.
Mit kolonialen Fragen hat sich auch ein zweiter – diesmal öffentlicher – Edit-a-thon am MfN beschäftigt, bei dem Menschen aus neun Ländern gemeinsam Wikidata-Einträge zu Personen editiert haben, die in der früheren deutschen Kolonie Kamerun tätig waren. Mit dabei waren auch Teilnehmer*innen von verschiedene Wikimedia-Usergroups, etwa aus Nigeria und Kamerun. „Wichtig ist“, betont Sabine von Mering, „bei solchen Projekten nicht die koloniale Perspektive zu replizieren und sich nur auf die bekannten weißen Akteure zu fokussieren“. Das Ziel sei vielmehr, Daten verfügbar zu machen, die gerade auch für die Menschen aus Herkunfts-Communities einen Wert hätten, „um beispielsweise Informationen über ihre Vorfahren zu gewinnen oder über die Vorgänge in ihrem Land zur Kolonialzeit.“
Während des Edit-a-thons wurden in Wikidata aber auch Items zu heute in Kamerun tätigen Botaniker*innen, Biolog*innen oder Zoolog*innen erstellt – wobei sich allerdings ein Bias gezeigt hat, der vielen Datenbanken gemein ist: „Sowohl für Frauennamen weltweit als auch für Namen aus dem Globalen Süden existieren oft keine Datenobjekte“, sagt von Mering. „Englische oder französische Namen sind als Items selbstverständliche vorhanden, aber ein weiblicher Vorname aus Nepal nicht.“ Umso wichtiger sei es, gerechte Wege zu finden, um mehr Communities auch aus nicht-westlichen Ländern in die gemeinsame Arbeit an Wikidata einzubinden.
Schnittstellen zwischen Wikimedianer*innen und Institutionen
In der Forschungs-Community sei die freie Datenbank derweil immer akzeptierter als „zentraler Ort für die Verknüpfung von Informationen“, beobachtet die Datenwissenschaftlerin. Sie selbst hat im Zuge des Sammler*innen-Projektes erfolgreich eine neue Wikidata-Property beantragt, die Person und Institution verknüpft: “collection items at”. Damit lässt sich nun die Information weitergeben, dass von Person X Objekte nicht nur im MfN, sondern beispielsweise auch im Ethnologischen Museum Berlin vorhanden sind.
Generell sieht Sabine von Mering noch viel Potenzial für die Nutzung von Linked Open Data in Kulturerbe-Institutionen. Wobei daran natürlich stets die Frage von Ressourcen hinge. Auf technischer Ebene sei viel Arbeit bei der Erschließung von Daten nötig, „bei den vielen Schritten, die Informationen in Datenbanken einzupflegen und zu prüfen.“ Eine vertrauensvolle Ressource zu sein, sei gerade in Zeiten von Fake News das Wichtigste für eine Forschungseinrichtung. Genauso aber gelte es, im Kontext von Linked Open Data Fragen nach Wissensgerechtigkeit in den Blick zu nehmen, sich global auszutauschen, Schnittstellen zwischen Wikimedians, Forschenden und Institutionen weltweit zu schaffen. „Letztlich können wir unsere 30 Millionen Objekte nicht allein erschließen“, bilanziert Sabine von Mering. „Es ist sinnvoll, die globale Community mit einzubinden.“