WMDE allgemein
6. Februar 2019
Daten sind ein Geschenk des Zufalls
Für HistorikerInnen sind Daten nicht nur ein Produkt der Forschung, sie sind häufig ein Geschenk des Zufalls. ChemikerInnen entwerfen unter Laborbedingungen Versuchsreihen so, dass sie Annahmen testen können, SoziologInnen entwickeln Fragebögen, die die Forschungsinteressen genau abbilden. HistorikerInnen (und auch ArchäologInnen) hingegen sind immer auf der Suche nach Puzzlesteinen, die eines Tages das Bild ergeben könnten, das man zu Beginn der Forschungsvorhabens vor Auge hatte, oder aber auch ein komplett anderes Bild.
Eine Akte im Archiv kann Aufzeichnungen enthalten, die bislang noch niemand entziffert hat und ab und an taucht ein “smoking gun”-Dokument auf, das ein völlig neues Bild auf die Ausgangsfrage wirft. Doch allzu oft erntet man nur ein Kopfschütteln der Archivare, “alles verloren, Bomben, Zweiter Weltkrieg, die Wirren, Sie wissen schon.” Je weiter man in der Geschichte zurück geht, desto wertvoller wird jedes einzelne Blatt, aus jeder Urkunde könnte noch ein Körnchen Erkenntnis gewonnen werden.
Es ist also auch immer eine Frage des Glücks und der Geduld, ob ein historisches Forschungsvorhaben gelingt. Die Frage nach den Quellen setzt den Maßstab von Gelingen und Scheitern eines Projektes. SinologInnen und HistorikerInnen, die sich mit der Geschichte Chinas befassen [eine umfassende Diskussion zur Unterscheidung beider Begriffe würde den Rahmen dieses Blogeintrags sprengen], sind in der glücklichen Position, dass die Quellenbestände in vielen Gebieten noch wachsen. Immer wieder tauchen verschollene Manuskripte auf, historische Zeitschriften werden digitalisiert und Quelleneditionen erleichtern die Zugänglichkeit.
Gleichzeitig befinden sich HistorikerInnen außerhalb der Volksrepublik in einer merkwürdigen Position der Abhängigkeit, die sich aus der räumlichen aber auch systemischen Distanz zwischen Forschenden und Forschungsobjekten ergeben kann.
Archive und Bibliotheken gehören zu den wichtigsten Anlaufstellen
Obwohl sich viele europäische und amerikanische Einrichtungen (beispielsweise die Hoover Institute Archives in den USA oder auch die SASS-Sammlung der FAU in Deutschland) bemüht haben, chinesischsprachige Dokumente und Publikationen zu erwerben, so gehören die Archive und Bibliotheken der Volksrepublik China und der Republik China (Taiwan) noch immer zu den wichtigsten Anlaufstellen für HistorikerInnen. In der Volksrepublik unterliegt die Zugänglichkeit der Archive strengen Auflagen. Ob eine Akte einsehbar, oder überhaupt im Katalogsystem auffindbar ist, kann von der Willkür des Personals, häufiger aber von der politischen Dimension des Forschungsgegenstands bestimmt werden.
So können lang geplante Archivreisen sehr abrupt an der Empfangstheke eines Lokalarchivs enden. Daher greifen viele HistorikerInnen inzwischen auf digitalisierte Quellen zurück, doch wie Glenn Tiffert kürzlich demonstrieren konnte, können auch staatlich digitalisierte Quellen genau wie Archivquellen einer Zensur unterliegen. Auf diese Entwicklungen haben HistorikerInnen jedoch bislang nur ungenügende Antworten gefunden. Wie erhöhen wir die Diversität von Quellen und verbinden bestehenden Bestände und Forschungsdaten so miteinander, dass sie für eine breite Zahl von HistorikerInnen nutzbar gemacht werden?
Diversität und Nutzung von Daten fördern
Eine mögliche Antwort ist die Digitalisierung und freie Veröffentlichung historischer Quellen durch die ForscherInnen selbst, wie dies z. B. in der “Maoist Legacy Database” geschehen ist. Dort wurden tausende von chinesischen Text- und Bilddokumenten, die sich mit dem schwierigen Prozess der Aufarbeitung der Mao-Zeit beschäftigen, gescannt und online verfügbar gemacht.
Auch in meinem eigenen Projekt zu den Mitgliederstrukturen und -programmen einer kleinen politischen Partei (vergleichbar mit den Blockparteien der DDR) in den 1940er und 50er Jahren in der Volksrepublik China, möchte ich möglichst viel von dem von mir gesammelten Material für weitere Forschungsprojekte zur Verfügung stellen. Allerdings kann ich dabei keine Quellen veröffentlichen, da ich keine Scans oder Kopien von Archivdokumenten erhalte, aber ich kann beispielsweise die von mir zusammengestellten Biographien online verfügbar machen.
Der schmale Grad der Forschung
Dabei bewegt man sich als HistorikerIn jedoch auf einem schmalen Grad: Das Interesse an Erkenntnisgewinn darf nicht über die Interessen der in den Quellen behandelten Personen gestellt werden. Konkret bedeutet dies, dass einige Personen, mit deren politischen Ideen und deren Lebensläufen ich mich beschäftige, noch Leben könnten, denn bei tausenden Akteuren kann ich nicht immer ein Sterbedatum identifizieren. Ich darf also nicht leichtfertig Informationen öffentlich machen, die ich aus Archivquellen über diese Personen gesammelt habe, denn oft kann ich gar nicht überblicken, welche persönlichen Konsequenzen dies für die Betroffenen hätte. Zwar sind diese Informationen nicht im eigentlichen Sinne geheim (sonst hätte ich sie nicht zusammentragen können), aber gerade das aufwendige verknüpfen verschiedenster Quellentypen, die Rekonstruktion von Freundschafts- und Arbeitsnetzwerken und die Anreicherung biografischer Daten, die sich daraus ergibt, erschwert ein sorgloses Veröffentlichen kompletter Datensätze.
Wie könnte ich diese Datensätze jedoch so anonymisieren, dass ich sie teilen kann? Wie viele Informationen müssen dazu gelöscht werden? Name, Geschlecht, Arbeitsplatz, Geburtsort, -datum und Angaben zur Parteimitgliedschaft. Doch was bleibt dann noch an Informationen übrig? Ich habe mich also entschieden Datensätze zu einzelnen Personen nur nach einem mehrstufigen Verfahren frei zu geben: Ist die Person bereits verstorben? Gibt es schon bestehende Biografien zu der Person und wird dort auch die Mitgliedschaft in der Partei erwähnt? Wenn diese drei Punkte zutreffen, dann kann ich meine Informationen teilen. Sollte ich jedoch auch nur einen der drei Punkte nicht klar mit “ja” beantworten können, so kann ich die Daten (noch) nicht teilen und muss auch bei deren Sicherung besondere Vorsicht walten lassen.
Was ich zu Beginn der Laufzeit des Projektes noch nicht antizipiert habe, war jedoch, wie auch die von mir im Laufe des Projektes entwickelten Ontologien und Verfahrensweisen für andere Projekte von Relevanz sein könnten, beispielsweise Listen von Ortsnamen mit den dazugehörigen Geo-Daten, Datensätze zu sich im Laufe des 20. Jahrhunderts verändernden Namen von Schulen und Universitäten usw. All diese “Metadaten”, die so oder so ähnlich fast in jedem historischen Forschungsprojekt generiert werden, sollen anderen HistorikerInnen zur Verfügung gestellt werden. Insgesamt können HistorikerInnen, die zur zweiten Hälfte des 20. Jahrhunderts forschen, also nicht immer die Antwort zu der Frage “Wer war das?” offenlegen, aber wir sollten dennoch das Teilen von Forschungsdaten oder anonymisierten Quellen generell nicht ablehnen, auch wenn dies einen Mehraufwand verursacht.
Zur Autorin: Henrike Rudolph forscht als Postdoc am Lehrstuhl für Sinologie an der FAU Erlangen-Nürnberg zur Geschichte des modernen China. In ihrem aktuellen Projekt beschäftigt sie sich mit der Entwicklung chinesischer Minderheitsparteien und rekonstruiert die Netzwerke, die die akademischen Eliten in den 1940er und 50er Jahren untereinander und mit den neuen kommunistischen Machthabern verbanden. Im Rahmen des Fellowships soll eine Online-Datenbank aufgebaut werden, um die in ihrem Forschungsprojekt gesammelten Daten sowie die Netzwerkvisualisierungen öffentlich zugänglich zu machen und Best-Practice-Ansätze für eine offene Wissenschaft in der China-Forschung zu entwickeln.