Offene Daten für mehr Durchblick in der Pandemie

Der Umgang mit Daten zur Pandemie in Deutschland muss sich dringend verbessern. Denn selbst zwei Jahre nach Beginn der Pandemie sind wichtige Kennzahlen nicht oder viel zu spät verfügbar. Welchen Beitrag können offene und maschinenlesbare Daten leisten?

  • Christian Humborg
  • 27. Januar 2022

Deutschland hat keine systematische Pandemiedatenpolitik. Das hat jetzt auch der „ExpertInnenrat der Bundesregierung zu COVID-19“ scharf kritisiert. In einer Stellungnahme vom vergangenen Wochenende heißt es:

„[A]uch zwei Jahre nach Beginn der Pandemie in Deutschland [besteht] weiterhin kein Zugang zu einigen wichtigen, aktuellen Versorgungsdaten“.

Stellungnahme des ExpertInnenrates der Bundesregierung zu COVID-19, 22.01.2022.

Die datenpolitischen Defizite gehen allerdings noch weit über die Versorgungsdaten hinaus. Die Datenpolitik in der Pandemie insgesamt ist ein Stückwerk, für das Bundes- und Landesregierungen verantwortlich sind. Weder hat die alte Bundesregierung das Problem in den Griff gekriegt, noch ist von der neuen Bundesregierung ein konzertiertes Vorgehen erkennbar.

Das Problem: Die Daten werden nicht aktuell genug veröffentlicht. Wird einem Gesundheitsamt in Deutschland derzeit ein neuer Covid-19-Fall bekannt, hat dieser in der Regel noch einen weiten Weg vor sich, bis er in den Statistiken des RKI auftaucht. Denn die Gesundheitsämter melden ihre Fallzahlen nicht dem RKI direkt, sondern an die zuständige Landesbehörde. Diese reicht die Daten weiter an das RKI. Diese Verzögerungen sind ein Grund dafür, dass etwa ZEIT Online dazu übergegangen ist, Zahlen telefonisch von Gesundheitsämtern einzuholen und selbst aufzuarbeiten.

Bislang werden Daten im Dashboard des Robert-Koch-Instituts unter der sogenannten „Deutschland-Lizenz“ bereitgestellt. Diese ist zwar auch eine offene Lizenz, aber kein internationaler Standard, sodass die Weiterverarbeitung erschwert wird. International üblich sind offene Creative-Commons-Lizenzen.

Maschinenlesbar und schnell verfügbar

Der ExpertInnenrat hat absolut Recht: Es müssen mehr Daten auch maschinenlesbar vorliegen. Daten sind offensichtlich besser nutzbar, wenn sie direkt ausgelesen werden können, anstatt sie per Hand aus PDF-Dateien zu kopieren. Gerade für ehrenamtlich betriebene Projekte wie Wikipedia und Wikidata ist das essentiell.

Auch in der Schulverwaltung sind die Defizite offensichtlich. So werden beispielsweise in Nordrhein-Westfalen die Informationen zu Corona- und Quarantänefällen an den Schulen zentral im Schulministerium in Düsseldorf gesammelt. Das Ministerium schickt den Bezirksregierungen montags eine Übersicht der Daten für die Kreise und kreisfreien Städte. Diese Daten wurden jeweils am Mittwoch der Vorwoche gesammelt und anschließend ausgewertet. Eine tagesaktuelle Übersicht fehlt.

Vorbild Frankreich?

Diese Prozesse ließen sich beschleunigen, wenn neue Covid-19-Fälle bereits auf lokaler Ebene in ein offenes System eingepflegt würden – also etwa in den Gesundheitsämtern oder Teststellen. In Frankreich wird bereits mit einem solchen Modell gearbeitet. Dort melden die Teststellen bestätigte Covid-19-Fälle direkt an ein zentrales Portal.

Ein Modell, das auch in Deutschland denkbar wäre. So könnten Daten anonymisiert, offen und unter freier Lizenz, maschinenlesbar und in hoher Qualität vorliegen. Mit der Konsequenz, dass die Entwicklungen rund um die pandemische Lage in Echtzeit zur Verfügung stehen könnten – zum Vorteil besonders auch der Medien, die nicht erst auf die Veröffentlichung durch das RKI warten müssten, sondern direkt und ohne Zeitverlust Daten für alle verständlich aufbereiten könnten. 

Eine solide Datenbasis für mehr Vertrauen

Die Erhebung von Informationen und Daten und ihre Zugänglichkeit sind eine wichtige Maßnahme der Vertrauensbildung, gerade in einer Pandemie. Digitalisierung und Vernetzung der Behörden verbessern die Datenlage und das schafft Vertrauen. Fehlende Daten hingegen zwingen Regierungen in einen Blindflug und lassen zweifeln, auf welcher Datenbasis Maßnahmen verabschiedet werden.

Der Artikel ist zuerst am 25. Januar 2022 im Tagesspiegel Background Digitalisierung & KI erschienen.