Find the English version of this blog post in the Wikimedia Foundation’s news section.

MediaWiki, die freie und quelloffene Software hinter Wikipedia und seinen Schwesterprojekten, ist weit über das Wikimedia-Ökosystem hinaus bekannt und wird von Tausenden von Wikis auf der ganzen Welt genutzt. Weniger Menschen wissen, dass Wikibase — die Software hinter Wikidata, der Wissensdatenbank von Wikimedia — ebenfalls als freie und offene Software verfügbar ist, die für externe Datenbanken und verknüpfte offene Datenprojekte verwendet werden kann. Um zu zeigen, wie Organisationen Wikibase nutzen, veröffentlichen die Wikimedia Foundation und Wikimedia Deutschland eine Reihe von Blog-Einträgen mit dem Titel „Many Faces of Wikibase“.

Dr. Olaf Simons arbeitet an der Universität Erfurt am Forschungsbereich Gotha als Historiker. Er ist der Initiator von FactGrid, einer Datenbank für Historikerinnen und Historiker. Als langjähriger Wikipedianer hat er sehr früh das Potenzial von Wikibase für die historische Forschung erkannt. Zu den Datenschätzen, die in Gotha mit Hilfe von Wikibase gehoben werden sollen, gehört unter anderem eine umfangreiche Sammlung von Daten zum historischen Orden der Illuminati im 18. Jahrhundert. Wir haben ihn zum gegenwärtigen Stand seines Projekts und den Zukunftsaussichten interviewt.

Erstmal herzlichen Glückwunsch, ihr habt einen Zwischenstand erreicht, denn ihr habt jetzt erstmals eine umfangreiche Datensatzsammlung komplett hochgeladen. Vielleicht erzählst du erst einmal, was das so für eine Sammlung ist.

Das sind im ersten Schub einmal die Datensätze zu allen uns bekannten etwa 9000 Illuminaten-Akten. Ich habe verschiedene Datensätze sozusagen geerbt, von verschiedenen Leuten, die bereits mit Excel-Listen, mit einer alten Access-Datenbank, Material gesammelt hatten. Und dann hatten wir in unserem alten Illuminaten-Wiki, das auch nach wie vor läuft, mehrere Tabellen generiert, in denen ebenfalls Daten drin waren. Das waren allerdings alles nicht zusammenlaufende Datenbestände, und jetzt fügte ich diese im letzten halben Jahr alle in fünf Excel-Listen zusammen. Von dort aus füllte ich sie dann in die Datenbank. Das macht insgesamt etwas mehr als 16.000 einzelne Datensätze, davon sind so etwa 9.000 zu Dokumenten, dann gibt es eine ganze Reihe, etwa 2.000, zu Publikationen, und noch weitere Datensätze zu Personen, Orten und Ereignissen – so die Gruppen.

Wenn man im Internet nach dem Begriff “Illuminaten” sucht, landet man schnell bei Verschwörungstheorien und Popkultur wie den Romanen von Dan Brown, aber eure Beschäftigung mit dem Thema ist wissenschaftlich. Es geht bei euch also immer um den historischen Illuminatenorden…

Genau, es geht um den Illuminatenorden, der zwischen 1778 und 1788 aktiv war und tatsächlich ein Geheimorden war, der die Freimaurer von oben infiltrierte und dabei als Geheimorden eine extreme Aktenproduktion zuwege brachte. Diese ist heute zum guten Teil verloren, aber wir haben immer noch etwa 10.000 Dokumente.

Hier arbeitete ein eigenes Team von Historikern am Forschungszentrum Gotha der Uni Erfurt in einem DFG-Projekt; zudem es gab bereits Vorgängerprojekte, das wichtigste dabei das von Reinhard Markner und Hermann Schüttler am IZEA Halle geführte zur Illuminatenkorrespondenz, an dem beide arbeiteten, seit der Aktenbestand in den 1990er Jahren mit der Auflösung der DDR zugänglich wurde.

Seiten aus der „Schwedenkiste“

Die Geschichte dieser Quelle ist schon fast ein Thriller. Das sieht man sehr schön bei den Seiten, die aus der „Schwedenkiste“ stammen – da habe ich die komplette Geschichte dokumentiert und wenn man man sich da durchklickt, kommt man wiederum in Einzelereignisse herein, die man theoretisch jetzt wieder mit Dokumenten hinterlegen kann.

Die Dokumente zeigen im Prinzip, wie dieser gesamte Aktenbestand freimaurerisch wurde, dann von der Gestapo konfisziert wurde, von der Sowjetunion bei Kriegsende erbeutet wurde, der DDR restituiert wurde, und von der DDR schließlich den Freimaurern zurückgegeben wurde. Heute liegen 19 der 20 Bände im Geheimen Staatsarchiv Preußischer Kulturbesitz in Berlin; Band 10 mit den Mitgliederlisten blieb in Moskau. Das ist alles letztlich auch ein Krimi auf der europäischen Landkarte, auf der sich nun zeigen lässt, wie dieser Aktenbestand gewandert ist und erst in den 1990er Jahren so richtig aufgetaucht ist.

Du bist länger schon Wikipedianer, das kann man so sagen, oder?

Seit 2004. Also wirklich fast die erste Generation… Da lag es dann für mich auch auf der Hand, in dem Bereich, in dem ich professionell arbeitete, als Historiker, die Werkzeuge zu benutzen, die ich auch aus dem Wikimedia-Umfeld kenne.

Um in unseren kleineren Forschungsbereich überhaupt ein bisschen das Material zu ordnen, setzte ich ein ganz konventionelles Wiki auf. Das war für meine Kollegen am Anfang ein Schock, weil ich eben plötzlich vollkommen transparent arbeitete. Das Wiki war von Tag eins offen sichtbar. Jeder konnte sehen, was ich jeden Tag tat, und jeder hätte mir das auch stehlen können – so die Sorgen der unmittelbaren Kollegen. Aber letztlich ist das Gegenteil passiert: Alle, die in dem Bereich forschen, wollten dann auch an diesem Wiki Accounts haben, weil das praktisch die einzige Stelle ist, wo wir auf diese Weise mit dem Material selber zusammenarbeiten können. Insofern hat dieses Wiki die Forscher eigentlich eher zusammengebracht.

Eines der gravierendsten Probleme des Illuminaten-Wikis ist, dass es nur auf deutsch läuft. Das große Interesse am Illuminatenorden liegt aber natürlich im anglophonen Bereich; und das ist mit einer der Gründe, weshalb wir dachten, eine Datenbank aufzusetzen, die die Wikibase-Software benutzt, gerade weil man die in jeder Sprache bedienen kann.

Du hast sehr früh Interesse an Wikidata gehabt und geschaut, wie es wissenschaftlich zu nutzen ist..

Von den Entwicklungen wusste ich seit 2012. 2016 riet mir Daniel Kinzler, als ich ihm vom Gedanken erzählte, auf ein Semantic Mediawiki umzusteigen, doch die Wikibase Software bei uns aufzusetzen. Im April 2017 sind wir nach Berlin gefahren und konferierten darüber unter anderem mit Lydia Pintscher und Daniel.

Es gab dann eine Zusammenarbeit mit Wikimedia Deutschland unter einem gemeinsamen Memorandum of Understanding. Im Dezember 2017 haben wir, auch mit Unterstützung von Wikimedia Deutschland, erste Freelancer für Werkverträge gesucht.

Die eigentliche Installation der Software hat ein guter Freund übernommen und das verlief eigentlich problemlos. Aber wie es so ist: Die letzten 20% machen immer 80% der Arbeit — und vor denen muss man sich hüten. Als wir dann zu den Tools zur Befüllung und Abfrage kamen, speziell Quick Statements und der Query Service, da lief nichts, und wir wussten auch nicht genau, warum nichts lief. Dann wurde uns klarer, dass die Tools alle mit Wikidata verdrahtet sind, und mit unserer Instanz nicht kommunizierten.

Nachdem ihr diesen harten Weg der Pioniere gegangen seid, ist erst einmal ein Zwischenstand erreicht, also ihr habt die Daten, die ihr haben wolltet. Und jetzt steht etwas ganz Großes an, nämlich die Verknüpfung mit anderen Formen strukturierter Daten, namentlich mit der Gemeinsamen Normdatei, der GND.

Mal sehen, ob das klappt. Von uns aus ist das Interesse sehr groß, diese Daten einzuladen. Ein Wikidata-Double zu machen ist eigentlich nicht besonders interessant, aber die GND-Daten wären eine interessante Alternative, die auch sehr gut zu unserem Datenbestand passen würde. Die Software eignet sich dafür, dass viele Projekte nebeneinander diese Datenbank benutzen, sodass man mehr mit der Verknüpfung als mit dem Kreieren von Datenitems beschäftigt ist. Deshalb unsere Idee, die GND zu importieren als Grundstock an Daten.

Unser Ziel, ist es, uns nicht auf die Illuminaten zu beschränken – darum auch die Entscheidung keine “Illuminatendatenbank”, sondern neutraler das Projekt FactGrid aufzubauen, in dem die Iluminatenforschung dann Platz finden kann. Die Illuminatenakten sind da ein Vorzeigeprojekt.

Ich bin im Moment in einem Projekt, das relativ nah benachbart ist, zu Gotha um 1800 als Wissenschaftsstandort. Das ist deswegen benachbart, weil der Illuminatenorden in Gotha sein letztes Zentrum hatte und Personen in beiden Sphären aktiv waren. Ich will für das neue Projekt ungern ein zweites Wiki aufsetzen, und die Datenbank würde es eigentlich sehr gut erlauben, verschiedene Forschungsprojekte auf derselben Plattform arbeiten zu lassen. Bisher macht ja jedes wissenschaftliche Projekt eine neue Plattform auf, und auch eine eigene Datenbank — auf der die Daten dann mitsamt der Software veralten. Das ist die Lage aus der wir heraus wollen. Spannend wird es, sobald Forschung sich berührt und andere Projekte mit den eigenen Daten weiterarbeiten — warum nicht in derselben Ressource?

Unser Projekt wird erst einmal einen Schwerpunkt in der frühen Neuzeit haben, so 1500 bis 1850. In Gotha wird in einer zweiten Abteilung zu Globalisierung im 19. Jahrhundert mit Beständen des Perthes-Verlags gearbeitet, aber eigentlich ist geplant, wenn wir das mit der GND schaffen sollten, die Ressource für historische Projekte auf breiter Fläche zu öffnen.

Die Wikibase-Software ist wie keine andere dazu geeignet, solche Zusammenarbeit zu erlauben — zu ihr geht der Trend, also nutzen wir die Software und sehen, welche Dynamik das hat!

Und was für Feedback habt ihr da so bekommen aus der wissenschaftlichen Community?

Wir sind erst seit kurzem soweit, dass wir die Datensatzsammlung drin haben. Noch ist nichts da, was ich vorzeigen kann. Spannend wird es, wenn ich Anwendungsfälle zeigen kann, und sagen kann: das funktioniert. Dann kann man auf der Datenbank mit seinem eigenen wissenschaftlichen Projekt seine eigene Plattform eröffnen und Tools der anderen Projekte nutzen. Visualisierungen und spezifische Materialrecherchen sind hier von besonderem Interesse. Wir arbeiten mithin im Moment am Showcase, von dem die weiteren Einladungen ausgehen werden. Am Forschungszentrum beobachten die Kollegen das Projekt mit Neugier. Wenn das Projekt gelingt, werden sie mit eigener Arbeit einsteigen, wenn nicht, müssen sie schauen, dass sie konventionellere Lösungen finden, mit eigenen Datenbanken.

Was ist für euch jetzt am wichtigsten, damit es weiter gehen gehen kann mit euerem spannenden Projekt?

Was für uns großartig wäre: wenn wir an der Community partizipieren könnten. Wenn speziell Leute, die sich mit Wikidata viel besser auskennen als ich, sagen, jetzt habt ihr da so einen Datenbestand drin, und wir wissen eigentlich, wir wissen wie man ihn durchleuchtet, in ihm recherchiert.. Darüber wiederum wäre mit uns interessant zu kommunizieren, weil wir schon wissen, was wir da an Daten eingespeist haben, aber eigentlich noch nicht wissen, wie man Vermutungen, die wir hegen, in der Datenbank greifbar machen kann. Von vielem hat man ein Bauchgefühl, das einem bei Recherchen leitet, grobe Vorstellungen davon, was da an Information zu suchen ist und sich wohl auch sichtbar machen ließe. Die Befragung von Datenbanken ist dann aber bereits eine eigene Wissenschaft — jedenfalls für uns.

Wir wissen zum Beispiel, wie im Illuminatenorden kommuniziert wurde (intransparent für die unteren Mitglieder, transparent für die oberen). Die Datenbank weiß das jetzt tatsächlich viel besser als wir. Das Problem ist, dass wir dieses bessere und präzisere Wissen noch nicht aus der Datenbank wieder herauskriegen. Wir können eigentlich nur die Abfragen laufen lassen, die wir so in Form der Eingaben gemacht, aber da gäbe es sicherlich spannende Abfragen, die sehr viel mehr über den Illuminatenorden verraten. Das ist etwas, wo man kreativ sein muss, wo es spannend wäre, mit Leuten zusammen zu sitzen, die schon mit der Software gearbeitet haben und auch schon Sachen visualisiert haben.

Es steckt jetzt viel drin in unserer Datenbank. Jetzt brauchen wir Datenenthusiastinnen und -enthusiasten, die wissen, wie man mit SPARQL die richtigen Fragen stellt und welche Tools es gibt, um das Wissen in den Dokumenten wiederum sichtbar zu machen.

Du bist Datenenthusiast oder SPARQL-Expertin oder -Experte und möchtest dich an FactGrid beteiligen? Kontaktiere Olaf unter olaf.simons@pierre-marteau.com.