zur Artikelübersicht

Offene Kulturdaten

Mit Wikidata Wissen über die Kunst der Moderne vernetzen

In der Database of Modern Exhibitions (DoME) sind die Daten von knapp 1400 Ausstellungskatalogen der europäischen Moderne gesammelt. Der am Projekt beteiligte Digitalisierungs-Spezialist Daniel Burckhardt erklärt, welche Rolle Linked Open Data in diesem Prozess gespielt haben. Und welchen wertvollen Beitrag die Wikidata-Community leisten konnte.

Patrick Wildermann

15. Mai 2024

Innerhalb weniger Jahre, in der Zeit vor dem Ersten Weltkrieg, hat sich das Gesicht der europäischen Malerei radikal gewandelt. Es entstanden Avantgarde-Bewegungen wie Expressionismus, Kubismus oder Futurismus, Stile, „die ihre Verbreitung vor allem über Ausstellungen rund um die Welt fanden“, wie Daniel Burckhardt beschreibt.

Der wissenschaftliche Mitarbeiter am MMZ – dem Moses Mendelssohn Zentrum für Europäisch-Jüdische Studien an der Universität Potsdam – hat einen Forschungsschwerpunkt auf Digitalisierungsstrategien und war von 2017 bis 2021 an einem besonderen Projekt in Wien beteiligt: „Exhibitions of Modern European Painting 1905 -1915“. Das Forschungsvorhaben hatte zum Ziel, Ausstellungskataloge aus dem entsprechenden Zeitraum zu analysieren: Welche Gemälde haben Künstschaffende wann und wo ausgestellt? Verfolgten sie dabei bestimmte Strategien, um sich bekannt zu machen? Und wie interagierten die Ausstellungen mit Publikum und Kunstkritik?

Database of Modern Exhibitions

Erstellt wurde dafür die Database of Modern Exhibitions (DoME).  „Wir haben die Kataloge von knapp 1400 Ausstellungen mit über 200.000 Einträgen und rund 13.000 Künstlern erfasst“, so Burckhardt. Der Forscher, der ursprünglich Mathematik sowie Wissenschafts- und Technikgeschichte studiert hat, betont aber auch: „Namen sind erst einmal nur Schall und Rauch“. Weswegen Linked Open Data (LOD) eine entscheidende Rolle bei diesem Projekt spielen. „Knapp 10.000 unserer 13.000 Künstler“, sagt Burckhardt, „haben mittlerweile einen stabilen Identifier in Wikidata“ – was die eindeutige Zuordnung der Personen ermöglicht. Enorm hilfreich angesichts der Tatsache, dass etwa in vielen der Ausstellungskataloge aus dem frühen 20. Jahrhundert Frauen oft unter dem Namen ihres Mannes geführt sind. Wie beispielsweise „Mrs. Geoffrey Buckingham Pocock“. „Bis man herausbekommt, dass sich dahinter vermutlich die britische Künstlerin Anna Airy verbirgt, ist viel Recherche nötig“, erklärt Burckhardt. „Auch hier kann Wikidata weiterhelfen, wo im Zweifelsfall der Geburtsname der betreffenden Person vermerkt ist.“

Wikidata als Brücke

Der Digitalisierungsexperte hat schon zuvor an Projekten gearbeitet, bei denen Linked Open Data ein wesentlicher Faktor waren. Im Rahmen des Kultur-Hackathons „Coding da Vinci” wirkte er zum Beispiel schon 2014 an „Verbannte und Verbrannte“ mit – einer Webseite, auf der die im Nationalsozialismus verbotenen Publikationen, Autor*innen und Verlage gelistet sind.

Als Datengrundlage diente hier die vom Land Berlin als offene Daten veröffentlichte „Liste der verbrannten Bücher“, in einem nächsten Schritt erfolgte ein automatisierter Abgleich der Listeneinträge mit den Katalogdaten der Deutschen Nationalbibliothek, was eine eindeutige Identifikation der Autor*innen und Herausgeber über die sogenannte GND-Nummer ermöglichte. Darüber wiederum konnte aus anderen Web-Services – wie Wikidata – Lebensdaten der Personen (Geburts- und Sterbedatum sowie Geburts- und Sterbeort) eingelesen und die Einträge mit dem entsprechenden Wikipedia-Artikel verknüpft werden.

Den Vorteil von Wikidata gegenüber Datenbanken wie GND oder ULAN („Union List of Artists Names“) sieht Burckhardt darin, „dass sich bei Wikidata Identifier leichter anlegen lassen, wo sie noch nicht existieren.“ Zudem sei die freie Datenbank eine Brücke zu anderen Schemata wie eben GND, ULAN oder VIAF (Virtual International Authority File). Einstein zum Beispiel, sagt Burckhardt, habe etliche verschiedene Normdaten-Identifier. Wenn er gefragt werde, welchen man denn verwenden solle, entgegne er: „Wichtig ist nur, überhaupt einen zu nehmen – die übrigen bekommt man über Wikidata heraus.“

Internationale Fragen: Hund oder chien?

Ergänzungsbedarf sieht Burckhardt in Bereich LOD generell noch bei Werkdaten für Kunstwerke. Ein Bildtitel wie „Frau mit Hund“ etwa sei im Untersuchungszeitraum des Projekts „Exhibitions of Modern European Painting 1905 -1915“ geradezu inflationär oft verwendet worden – wenn Ausstellungen in verschiedenen Ländern gezeigt wurden, komme dazu noch die lokalsprachliche Hürde: Handelt es sich bei „Frau mit Hund“ und „Femme avec chien“ um dasselbe Werk?

Mit Blick auf die Internationalität wiederum habe sich Wikidata im Kontext der Forschungsarbeit sehr bewährt: „Die GND etwa hat einen Fokus auf Deutschland, Österreich und die Schweiz, deckt aber Frankreich oder Italien kaum ab“, erläutert Burckhardt. „Bei einem transnationalen Projekt wie DoME, das rund 20 Länder umfasst, hat Wikidata aufgrund der globalen Vernetzung sehr geholfen, solche Lücken zu füllen.“ Zudem gäbe es in der Database of Modern Exhibitions viele russische Einträge, auch im Kyrillischen, das noch dazu in Deutschland anders transkribiert werde als in den USA. Sprich: „Wenn eine russische Künstlerin in den USA ausstellt, erscheint ihr Name anders im Katalog als bei ihrer Ausstellung in Deutschland“. Auch in solchen Fällen sei die multilinguale Wikidata, die eine Brücke zu verschiedenen Alphabeten biete, „eine gute Quelle.“

Highlight Mix’n’Match

Besonders aber schwärmt der Wissenschaftler von der Zusammenarbeit mit der Wikidata-Community. Nicht nur verlief die Beantragung einer Wikidata-Property für sein Projekt, die Personen in der Datenbank mit ihren Wikidata-Datenobjekten verknüpft, höchst unproblematisch: die „DoME artist ID“ wurde binnen kurzer Zeit etabliert. Sondern es erwies sich auch ein Tool als „Highlight“, so Burckhard, das von User Magnus Manske – eine Legende des Wikiversums – entwickelt wurde: Mix’n’Match. Mit dessen Hilfe lassen sich die eigenen Daten mit Wikidata abgleichen, um festzustellen, welche bereits in Wikidata existieren und welche noch keine Datenobjekte haben.

Beim Abgleich der DoME-Daten habe „die Community extrem unterstützt“, so Burckhardt. „Das alles selbst zu machen, wäre enorm aufwändig gewesen.“ Bei der großen Mehrheit der Personen aus DoME gäbe es gute Matches, Namen und Geburtsdaten stimmten überein, „es muss sich also um dieselbe Person handeln.“ In rund 1300 Fällen bestehe eine hohe Wahrscheinlichkeit der Übereinstimmung, für 3000 Personen existiere möglicherweise noch kein Wikidata-Eintrag. „Durch den Abgleich haben wir bei uns auch viele Doppelungen und fehlende Einträge gefunden“, erzählt Burckhardt. „Die Datenqualität konnte deutlich verbessert werden.“

Linked Open Data für Ausstellungen

Das Projekt DoME – gefördert aus dem österreichischen Wissenschaftsfonds FWF – ist zwar unterdessen abgeschlossen. Aber ungefähr einmal im Quartal lässt Burckhardt ein Skript laufen um zu schauen: „Gibt es einen neuen Wikidata-Identifier zu einem DoME-Eintrag, der noch keinen besitzt?“. Eine laufende Datenpflege. Im Rahmen des Projekts fand auch ein Workshop statt, in dem es um die Perspektive von LOD speziell für Ausstellungen ging. „Der Tenor war, dass Wikidata das passende Projekt dafür wäre“, so Burckhardt. Für einzelne Fälle – etwa die „Armory Show“ von 1913, mit der die europäische Moderne in die USA getragen wurde – gäbe es zwar Einträge. Aber das seien eher eine Handvoll als Zehntausende. Hier läge also noch viel Potenzial.

Generell habe er nur gute Erfahrungen mit Wikidata gemacht, bilanziert Burckhardt – gerade dort, wo es um die Abgleiche von Einträgen ging. Im Wissenschaftsbereich sei ja das Thema „Named Entity Recognition“ auf dem Vormarsch, also das automatisierte Herauslesen von Namen aus einem Text durch eine KI. Sie hätten das auch für die Database of Modern Exhibitions versucht, für Kataloge französischer Salons mit tausenden beteiligten Künstler*innen, so Burckhardt. „Aber das hat am Ende nicht wirklich Zeit gespart.“ Überprüft werden müssten die Übereinstimmungen – handelt es sich den Namen wirklich um die fraglichen Künstler*innen? – schließlich trotzdem: „Und da sind die Wikidata-Informationen sehr verlässlich.“

Daniel Burckhardt ist davon überzeugt, dass die Arbeit mit der freien Datenbank für viele Kulturinstitutionen einen Mehrwert bieten könnte. Entsprechend regt er an: „Warum nicht mal ein Wikidata-Hackathon für GLAM-Einrichtungen?“

Kommentare

  1. Webdesign Krefeld
    10. Juni 2024 um 10:54 Uhr

    Ich schätze deine Beiträge wirklich, denn sie sind durchweg informativ und bieten stets wertvolles Wissen.
    Danke dafür!

    MfG
    Moritz

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert