Folgender Blogbeitrag basiert auf dem Bericht von Matti Blume, den er im Wikipedia:Kurier veröffentlichte und einem Erfahrungsbericht von Andrea Knabe-Schönemann.
Vom 23. bis 26. Juni fand in Ulm der zweite von Wikimedia Deutschland veranstaltete Wikidata-Workshop statt. Diesmal drehte sich alles um das Thema Wahldaten. Eine bunte Mischung aus Wikipedianern, Open-Data-Aktivisten (u. a. von FragDenStaat.de, Freiwilligen hinter dem offenen Standard OParl und Offene Wahlen Österreich) und Entwicklern (Wikidata und Code for Germany) war dazu im Verschwörhaus in der historischen Altstadt von Ulm zusammengekommen. Im Mittelpunkt des Workshops stand folgende Frage: Wie kann Wikidata helfen, Daten aus Politik und Verwaltung besser zugänglich zu machen?
Nach einleitenden Vorträgen wurden zunächst kurze Einführungen in Wikidata, SPARQL und Live Coding mit Wikidata angeboten. Parallel dazu wurden bereits erste Ideen entwickelt und ausgetauscht. Während sich einige Teilnehmer auf die Auswertung vorhandener Daten konzentrierten, kümmerten sich mehrere andere Gruppen um das Einpflegen neuer Daten in Wikidata. Dabei stellte sich schnell heraus, dass manche der zunächst formulierten Ziele deutlich zu groß für ein Wochenende waren. Zunächst mussten erstmal die vorhandenen Strukturen und Eigenschaften erforscht und ggf. neue Strukturen erdacht werden. Als zweite Herausforderung stellte sich das Zusammensuchen und Aufbereiten der Daten heraus. Wahlergebnisse und Abgeordnetenlisten werden zwar inzwischen automatisch und selbstverständlich von offizieller Seite im Internet veröffentlicht, jedoch bei vielen verschiedenen Stellen (Bundeswahlleiter, Landeswahlleiter, etc.) in jeweils eigenen Formaten und beinahe nie in maschinenlesbaren Formaten. Das Zusammenstellen und Vorbereiten einer Liste von „nur“ 598 Wahlkandidaten kann so schon mal einen halben Tag in Anspruch nehmen.
Dank großer Beharrlichkeit wurden schließlich doch erste zählbare Ergebnisse erzielt: so wurden z.B. die Daten aller Mitglieder des Thüringischen Landtags seit 1990, vieler österreichischen Nationalratsabgeordneten sowie die Wahlergebnisse aller erfolgreichen Direktkandidaten bei der Bundestagswahl 2013 (und inzwischen auch der meisten Zweitplatzierten) in Wikidata eingetragen.
Eine Teilnehmerin aus der Gruppe, die sich um die Daten des Thüringischen Landtags gekümmert hat, ergänzt:
„Meine Motivation für den Workshop war das Thema Offene Daten, Wahldaten, Workshops (SPARQL), Hoffnung auf bessere Vernetzung und die Möglichkeit sich netto 2 Tage mit Wikidata zu beschäftigen (die Zeit habe ich zusammenhängend sonst nie dafür). Erwartet habe ich die Möglichkeit beim Projekt einer Gruppe unterstützend mitzuwirken (Daten reinigen o.ä.) und zu ernen (Auswertung, automatisiertes Einlesen von Daten etc.)
Vor Ort habe ich ein unscheinbares Projekt aus einem Workshop mitgenommen — ich habe in einem Screenshot während eines Workshops gesehen, dass die Angaben zu den konkreten Wahlperioden in Parlamenten unvollständig sind bzw. fehlen; die Daten sind m. E. eine Grundlage, wenn mit Wahldaten gearbeitet werden soll. Ein weiterer Schritt wäre dann die Verknüpfung der Daten zu den Wahlperioden mit anderen Daten zu den Parlamenten. Thüringen bot sich als Beispiel an: wenige Wahlperioden, eigene Kenntnisse, da von Anfang an in diesem Bundesland dabei gewesen. Es folgten Recherche (Auswertung der Parlamentsprotokolle der konstituierenden Landtagssitzungen), Daten sichten und bekommen, maschinenlesbar machen (in Thüringen gibt es offene Daten nur als PDF-Dokumente), Daten angleichen, Daten zusammenführen, Qualitätskontrolle.
Das Ergebnis nach zwei Tagen kann sich sehen lassen. Wikidata umfasst jetzt alle aktuellen und ehemaligen Mitgliedern des Thüringer Landtages, die im Parlamentsprotokoll der konstituierenden Sitzung aufgeführt sind. Zugeordnet sind die Wahlperioden, in denen sie Mitglied des Landtags waren. Das waren nicht „ein paar Edits, die man schnell manuell erledigt“, sondern von mir exakt 1.091 (habe gerade nachgesehen), insgesamt wesentlich mehr, die die bereits in der Wikipedia vorhanden Einträge zu den Abgeordneten anreichern.
Die in der Wikipedia vorhandenen Informationen zu Abgeordneten sind jetzt strukturiert auswertbar; meine Testabfrage der Datenbank ergab z.B., dass die Parlamentarier 1990 ein geringeres Durchschnittsalter aufwiesen als zu Beginn der aktuellen Legislaturperiode — gefühlt ist das genau andersherum. Der Thüringische Landtag hat sich seit 1990 also nicht verjüngt, sondern ist im Durchschnitt älter geworden.
Im Projekt bleibt noch einiges zu tun: weitere Qualitätssicherung, recherchieren und einarbeiten der Bewegungsdaten in den einzelnen Legislaturperioden, Prozess zur weiteren Datenpflege überleben, eventuell auf andere Parlamente übertragen.
Einen mehrtägigen Workshop zu dem Thema fand ich sehr hilfreich. Wir konnten Ideen entwickeln, mit Hilfe anderer Werkzeuge einsetzen, an denen ich mir bislang die Zähne ausbiss, einfach nach nebenan gehen und jemanden finden, der ein Stück Code schreibt, um eine Aufgabe zu automatisieren, einfach nach nebenan gehen und jemanden finden, der einem zu den Strukturen von Wikidata Auskunft geben kann, überhaupt nur jemanden finden, der sich aus Interesse an den Arbeitsabläufen und der Zusammenarbeit für so ein wenig strahlendes Projekt begeistert, sich überhaupt erst mal trauen, mitzumachen (ich bin von fast null auf ziemlich hoch). Nicht zu vergessen: einfach nach nebenan gehen und essen und trinken können, und dann einfach weiterzumachen, also keine Zeit mit den trivialen Alltagsdingen verschwenden müssen.”
Darum, dass auch der Spaß nicht zu kurz kommt, wurde sich natürlich auch gekümmert: Auf http://guessr.morr.cc/?Q7138926 kann man nun sein Geografiewissen testen und versuchen zu erraten, wo auf der Welt welches Parlamentsgebäude steht; natürlich powered by Wikidata.
Ein besonderer Dank gebührt dem Verschwörhaus als perfekten Gastgeber für dieses Wochenende. Wir kommen gerne wieder.
Zum Schluss möchte sich der Autor noch eine persönliche Betrachtung erlauben: Interessanterweise sind die Wahlergebnisse der letzten drei Bundestagswahlen in bewundernswerter Vollständigkeit und Präzision in den Wikipedia-Artikeln der jeweiligen Wahlkreise eingetragen, während eine Wikidata-Abfrage zu den Kandidaten der letzten Bundestagswahl bis vor wenigen Tagen genau ein Ergebnis lieferte (Q567). Wenn man nun überlegt, um wieviel größer der positive Effekt ist, wenn die Ergebnisse der anstehenden Wahl direkt in Wikidata eingetragen werden, wäre es fast schade, wenn diese Kleinarbeit erneut nur einer einzigen Sprachversion der Wikipedia zugute kommt.