Frank Böker
1. November 2022
Die Datenstrategie der Bundesregierung aus dem Januar 2021 umfasst einige vielversprechende Punkte, etwa eine Bildungsoffensive für mehr Datenkompetenz oder die Stärkung nachhaltiger Dateninfrastrukturen. Ein konsequentes Bekenntnis zu Freiem Wissen und maschinenlesbaren Informationen war jedoch schon 2021 nicht zu erkennen – und daran hat sich bis heute nicht viel geändert. Auch bei der Bereitstellung von Daten muss gerade die öffentliche Hand deutlich zulegen.
Wikimedia Deutschland begrüßt deshalb das Vorhaben der Bundesregierung, die bestehende Datenstrategie zu überarbeiten. Am 24. Oktober fand beim Bundesministerium für Digitales und Verkehr ein Stakeholder-Dialog statt, bei dem sich auch das Bundesministerium des Innern und für Heimat sowie das Bundesministerium für Wirtschaft und Klimaschutz beteiligten, die beiden anderen co-federführenden Ressorts. Neben zahlreichen weiteren Organisationen und Verbänden war auch Wikimedia Deutschland eingeladen, Input für eine neue, überarbeitete Datenstrategie zu liefern. Wir haben drei unserer zentralen Forderungen zusammengefasst:
Daten maschinenlesbar bereitstellen
In vielen Bereichen stellt die öffentliche Hand bereits Daten ins Netz. Allerdings geschieht das noch viel zu häufig händisch, etwa in Form von PDF-, Excel- oder CSV-Dokumenten. Das führt nicht nur zu immensem Aufwand bei den verantwortlichen Abteilungen, sondern macht die Daten auch schwer nutzbar. Denn der Sinngehalt und die Beziehungen einzelner Informationen untereinander müssen dann immer erst von Menschen hergestellt werden. Es braucht maschinenlesbare Formate in auffindbarer Struktur („5-Sterne-Linked-Data“), damit sich Daten sinnvoll nutzen und wiederverwenden lassen. Dazu müssen Einrichtungen der öffentlichen Hand gesetzlich verpflichtet werden.
Bestehende Standards nutzen
Die Bereitstellung von Daten muss standardisiert werden. Schon bei ihrer Speicherung sollten etablierte Linked-Data-Schemas zum Einsatz kommen. Was es für die überwiegende Mehrheit der Daten dabei nicht braucht, sind neu entwickelte Standards oder Formate. Vielmehr kann hier auf etablierte und in der Praxis bewährte Schemas und Vokabulare zurückgegriffen werden. Diese Datenorganisation schafft auch innerhalb der Behörden die Grundlage für eine bessere Wiederverwendung von Informationen. Automatisch bereitgestellte und maschinenlesbaren Daten sind ein Indikator für eine moderne Verwaltungs-IT.
Offener Zugang statt Datensilos
In der bisherigen Datenstrategie der Bundesregierung wird ein starker Fokus auf sogenannte Datenräume gelegt. Darunter versteht man eine Infrastruktur, in der Daten bereitgestellt, gemeinsam ausgewertet und genutzt werden können. Auch wenn die Autor*innen der bestehenden Datenstrategie Potenziale für das Gemeinwohl sehen: In der Praxis hat sich erwiesen, dass sich solche Datenräume schnell zu geschlossenen Clubs mit starken Kontrollrechten entwickeln. Das führt dazu, eine veraltete und auch laut Koalitionsvertrag unerwünschte Vorstellung von Daten als technisch-faktisches Eigentum gewissermaßen unbeabsichtigt durch die Hintertür der technischen Kontrolle zu zementieren. Das gilt nicht nur für z. B. Mobilitätsdaten, die von vielen Beteiligten erzeugt werden, sondern auch für reine Faktendaten. Stattdessen sollte es einen möglichst offenen Datenzugang geben, bei dem das Teilen von Daten nur dann nicht erfolgt, wenn es starke Gründe dagegen gibt, wie etwa Datenschutz.