zurück

Datenfitness für Coding-da-Vinci-Datengeber

WMDE allgemein

14. Juli 2017

Wie kommen Kulturdaten in die Coding-da-Vinci-Apps?

Im Herbst startet Coding da Vinci, der Kultur-Hackathon. Wir erwarten viele neue spannende digitalisierte Kulturgüter aus den Museen, Archiven, Bibliotheken und Kunstsammlungen des Landes und sind ganz neugierig auf die Software-Projekte, die aus ihnen gebaut werden. Das kann man sich vorher gar nicht so vielfältig und fantastisch ausdenken, wie es nachher kommt. Das muss man erleben! Veranstaltet wird der diesjährige Programmierwettbewerb von der Deutschen Digitalen Bibliothek, der Servicestelle Digitalisierung des Landes Berlin und Wikimedia Deutschland. Unsere Partner sind DNK Sharing Heritage, die HTW, das JMB und die OKF. Kulturinteressierte Coder*innen, Entwickler*innen und Designer*innen treffen sich mit Museolog*innen, Archivar*innen und Bibliothekar*innen. Sie entwickeln gemeinsam neue Anwendungen auf der Grundlage der vorliegenden digitalisierten Kulturgüter. Das macht viel Freude und zeitigt erstaunliche Ergebnisse. Aber auch viel Arbeit.

Erst die Arbeit – dann das Vergnügen

Daten putzen ist harte Arbeit. Aber sie macht Spaß, mit Anna-Lena Nowicki von @digisBerlin. Lizenzhinweis: Jonas Sydow (WMDE) (Own work) [CC BY-SA 4.0 (http://creativecommons.org/licenses/by-sa/4.0)], via Wikimedia Commons

Daten für Coding da Vinci bereitzustellen, ist nicht so einfach. Sie sollen ja nachnutzbar sein. Das heißt nicht Bilder zum Anschauen, sondern Rohmaterial, mit dem man arbeiten kann. Nutzen kann man Sachen, wenn man es darf. Das Urheberrecht regelt den Zugang zu den Werken. Meist verhindert es aber gerade die Nutzung. Daher haben wir uns am ersten Tag des Workshops Prepare Your Data for Coding da Vinci  Ready for Download ganz auf die rechtlichen Aspekte konzentriert. Das Recht gilt es zu interpretieren, und schließlich hat eine Institution erstaunlich große Spielräume, um die digitalisierten Kulturgüter unter eine Freie Lizenz zu stellen und so nachnutzbar zu machen. Eben diese zeigten wir im Workshop ©© Change Your Mind auf. Erst die Kennzeichnung der Daten mit Freien Lizenzen macht es möglich, dass Menschen, Maschinen und Softwareprogramme die Daten einfach und ohne aufwändige Kontaktaufnahme zum Datengeber verwenden können. Die Quelle der Daten anzugeben versteht sich dabei eigentlich von selbst. Sie birgt für Qualität und verspricht mehr Information. Unterstützt von Cosina Berta, Mitarbeiterin der Deutschen Digitalen Bibliothek, Christoph Jackel, langjähriger Wikipedianer, und John Weitzmann, Syndikus von Wikimedia Deutschland, erarbeiteten sich Mitarbeiter*innen aus 14 Institutionen aus Berlin, Brandenburg und Mecklenburg-Vorpommern die notwendige Medienkompetenz, um im eigenen Haus möglichst umfassend frei lizenzieren zu können.

Daten putzen

Am zweiten Tag ging es um die technische Aufbereitung der beschreibenden Daten zu den Dateien, die für Coding da Vinci zur Verfügung gestellt werden sollen. Wer kennt nicht das Phänomen? Die Datenbank ist über die Jahre gewachsen, unterschiedliche Kollegen haben sie mit Informationen befüllt und nun sollen Dritte sich in den Daten zurechtfinden? Schwierig, denn das hausinterne Datenbankformat erweist sich oft als relativ singulär. Coder*innen arbeiten mit anderen standardisierten Formaten als Museen oder Archive. Bevor sie mit den Daten neue Anwendungen kreieren können, müssen die Dateneinträge daher oft umformatiert  und vereinheitlicht werden. Nur eine konforme Darstellung von Jahreszahlen z. B. stellt sicher, dass die App, die auf diesen Daten aufbaut, nur Bilder von 1900 bis 1999 anzeigt, wenn dies gewünscht ist, nicht die davor oder danach. Zum Glück muss man solche Datenbereinigungen nicht händisch vornehmen. Man kann sich, wie uns Anna-Lena Nowicki von der Servicestelle Digitalisierung des Landes Berlin zeigte, mit dem Software-Programm Open Refine viele lästige Details abnehmen lassen. Wenn alle Daten “befreit”, “geputzt” und neu “geordnet” sind, dann sind sie “Ready for Download”.

Datentransfer nach Wikimedia Commons

Mitte September folgt der zweite Workshop von Prepare Your Data for Coding da Vinci. Da geht es um “Ready for Upload”. Mediendateien und möglichst viel der beschreibenden Metadaten werden von den Kolleg*innen aus den Kulturinstitutionen, unterstützt von Coder*innen und Wikimedianer*innen, in das Medienarchiv Wikimedia Commons hochgeladen. Wir freuen uns auf u. a. historische Fahrkarten aus dem Deutschen Technikmuseum Berlin. Dort können sie dann nicht nur von den Teilnehmern von Coding da Vinci nachgenutzt werden, sondern auch von Wikipedia-Autor*innen, von Blogger*innen, von Verleger*innen und Lehrenden. Mit dem Lizenzhinweisgenerator ist sogar das wiederum erforderliche urheberrechtliche Kennzeichnen ein Kinderspiel.

Mit dem Zug nach Patagonien – historische Fahrkarten aus dem Berliner Technikmuseum – vielleicht ein Datensatz für Coding da Vinci. Lizenzhinweis:  by SDTMB [CC BY-SA 4.0 (http://creativecommons.org/licenses/by-sa/4.0)]

Wir danken der Medienanstalt Berlin-Brandenburg für die finanzielle Unterstützung des Medienkompetenzworkshops und Infoport für die Dokumentation.

 

Informationen:

Prepare Your Data Ready for Upload (Anmeldung)

Coding da Vinci Berlin Kick-Off 21. & 22. Oktober in der HTW Berlin-Schönweide

Der Lizenzworkshop CC-Change Your mind

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert