Data Reuse Days 2025: Mit offenen Daten weltweit nützliche Anwendungen fördern

Namibia, Portugal, Kanada – insgesamt 267 Teilnehmer*innen aus der ganzen Welt nahmen an dem zweiwöchigen Online-Event teil. Sie wollten wissen, wie sie den vielfältigen Datenschatz von Wikidata für eigene Projekte nutzen können. Die Bandbreite der Themen war groß. Bei den 28 Sessions wurde keine wichtige Frage zur Nutzung von Wikidata-Daten ausgelassen.Vor allem war die Veranstaltung ein Fest der offenen Daten und der praktischen Anwendungen, die durch ihre Wiederverwendung entstehen. Drei nützliche Beispiele stellen wir vor.

Was ist Wikidata?

Wikidata ist eine offene, frei bearbeitbare Datenbank, die strukturierte Daten über die Welt sammelt – von Orten und Persönlichkeiten bis hin zu wissenschaftlichen Konzepten. Anders als herkömmliche Datenbanken hat Wikidata jedoch die Struktur eines Wissensgraphen, in dem Informationen nicht in starren Tabellen, sondern als miteinander verknüpfte Knoten gespeichert sind. Dies ermöglicht komplexe Abfragen wie „zeige alle Nobelpreisträger, die in Berlin geboren wurden“. Dank offener Daten kann Wikidata flexibel in vielen Projekten eingesetzt werden.

Andrew McAllister: Schreiben ohne Sprachbarriere

Andrew ist Datenanalyst für Wikidata bei Wikimedia Deutschland und Open-Source-Enthusiast. Wenn er nicht mit Daten jongliert,  engagiert er sich unter anderem bei activist.org, einer Plattform für progressiven politischen Wandel. Auf den Data Reuse Days 2025 stellte er Scribe vor, eine Tastatur-Anwendung, die das Schreiben in einer Fremdsprache erleichtert.

Wer eine Fremdsprache lernt, kennt das Problem: Man muss ständig nach Wortbedeutungen oder Verbformen suchen. Daher entwickle ich zusammen mit einer Gruppe die Scribe-Keyboard-App. Sie bringt Informationen – zum Beispiel zur Konjugation – direkt in die Tastatur eines Smartphones
Sceenshot: Scribe Keyboard Installation – Light

Damit das funktioniert, braucht die App eine zuverlässige Quelle für Sprachwissen – und das bietet Wikidata. Dort sind nicht nur Wörter gespeichert, sondern auch Informationen darüber, wie sie sich verändern. Zum Beispiel steht dort nicht nur „laufen“, sondern auch, dass es in der ersten Vergangenheit „lief“ heißt oder dass „Sonne“ im Deutschen ein weibliches Wort ist. Wikidata kennt so viele Sprachen, weil Ehrenamtliche aus der ganzen Welt daran mitarbeiten. Wenn ein neues Wort und Informationen zu dessen Wortformen hinzukommen,wächst die Sammlung und hilft so auch den Nutzenden der Scribe-App.

Die Daten zu den Wörtern werden in der App gespeichert, so dass sie auch ohne WLAN-Empfang verfügbar sind.

Die Wikidata-Community hat das Projekt von Anfang an unterstützt, und es ist großartig, nun die Fortschritte zu präsentieren. Mein wichtigster Rat an Entwickler*innen: Baut auf Wikidata! Es bietet einen offenen Datenschatz, der sonst nur großen Unternehmen vorbehalten wäre. Und vergesst nicht, der Community etwas zurückzugeben – gemeinsam können wir noch so viel mehr erreichen.

Volker Krause: Reisen mit Überblick

Volker ist seit über 20 Jahren in der KDE-Community aktiv und ein echter Open-Source-Tüftler. KDE ist eine Gemeinschaft von Programmierern, Künstlern und vielen anderen, die freie Software entwickeln. Volker arbeitet gerne an intelligenten Lösungen rund ums Reisen – vom Routing im öffentlichen Nahverkehr bis hin zu Wetter- und Katastrophenwarnungen. Auf den Data Reuse Days stellte er die KDE Itinerary App vor.

Ich entwickle seit über 20 Jahren Freie Software. Die Itinerary App ist ein Reiseassistent. Die App verwaltet Buchungen von Zügen, Flügen, Hotels und Veranstaltungen – alles auf Basis offener Daten und ohne Tracking.

Als Volker mit anderen von KDE 2017 mit der Arbeit an der App begannen, stießen sie schnell auf ein Problem: Auf den QR-Codes von Tickets standen Identifikationsnummern, die Flughäfen oder Bahnhöfen zugeordnet sind. Diese Nummern waren oft schwer zuzuordnen. Wikidata war die perfekte Lösung, weil dort viele dieser Nummern und dazugehörige Informationen schon gespeichert waren.

Wenn wir eine Nummer in Wikidata nicht finden konnten, haben wir sie einfach selbst hinzugefügt oder Fehler korrigiert – was bei geschlossenen Datensätzen viel schwieriger ist. Seitdem nutzen wir Wikidata regelmäßig für die Itinerary App und für andere Datenbereiche.

In dem auf den Data Reuse Days vorgestellten Anwendungsfall ging es um die Anzeige der offiziellen Logos und Farben der ÖPNV-Linien in der App. Ein visuelles Detail, das enorm wichtig für die Orientierung der Nutzenden ist. In der App sind diese Logos zum Beispiel bei der Routenplanung oder in der Fahrplananzeige sichtbar, so dass man auf einen Blick weiß, welche Linie man nehmen muss.

Die Abbildung der korrekten Logos war nicht ganz einfach, da ÖPNV-Linien oft ähnliche oder sogar gleiche Namen haben können. Zum Beispiel können Buslinien in mehrere Städten  „Linie 42“ heißen. Hinzu kommt, dass die Linien in vielen verschiedenen Systemen unterschiedlich identifiziert werden – zum Beispiel durch Nummern, Farben oder spezielle Codes. Wenn man also nur den Namen einer Linie kennt, ist es schwierig zu sagen, welche Farbe oder welches Logo dazu gehört.

Screenshot: KDE Itinerary

Um dieses Problem zu lösen, hat das KDE-Team Wikidata und OpenStreetMap kombiniert. Wikidata enthält viele Informationen über die verschiedenen Linien und ihre Identifikatoren, und OpenStreetMap hilft dabei, die geografische Lage der Linien zu bestimmen. So konnte sichergestellt werden, dass die richtige Farbe und das richtige Logo für eine Linie angezeigt werden, auch wenn es ähnliche Linien in anderen Städten oder Regionen gibt. Ein gutes Beispiel dafür, wie durch die Verknüpfung offener Datenquellen eine zuverlässige Lösung geschaffen werden kann.

Besonders spannend an den Data Reuse Days ist die thematische Vielfalt. Man entdeckt odt ähnliche Herausforderungen in der Datenmodellierung. Mein wichtigster Rat für Entwickler*innen: Nutzt offene, editierbare Datensätze! Wikidata und OpenStreetMap sind für mich immer die erste Anlaufstelle. Ich kann ihre Daten nicht nur zu nutzen, sondern auch verbessern.

Magnus Manske: Freie Filme für alle

Magnus Manske ist eine Wikidata- und Wikipedia-Legende! Bereits 2001 programmierte er die erste Version der Software, die später als MediaWiki bekannt wurde und Wikipedia zugrunde liegt. Auch heute noch ist er ehrenamtlich unterwegs und baut spannende Non-Profit-Tools – zum Beispiel WikiFlix, eine freie Filmdatenbank für gemeinfreie Filme.

Die Data Reuse Days zeigen eindrucksvoll, welchen Mehrwert vorhandene Daten haben, wenn sie richtig kombiniert werden. Viele Nutzungsmöglichkeiten hätten sich die ursprünglichen Urheber der Daten nie träumen lassen, aber jede neue Anwendung erhöht den Wert freier Daten für alle.

Ein gutes Beispiel dafür ist WikiFlix, das Magnus auf den Data Reuse Days 2025 vorgestellt hat. Der freie Streamingdienst präsentiert tausende Filme und dazugehörige Informationen in einer vertrauten Oberfläche. Wie bei Netflix nur mit gemeinfreien Filmen! Wikidata enthält derzeit rund 31.000 Einträge zu Filmen. Wenn ein Film unter Public Domain steht – also frei genutzt werden darf – ist diese Information oft direkt im Dateneintrag zum Film vermerkt. Die Filmdateien sind auf Plattformen wie Wikimedia Commons, YouTube oder Internet Archive verstreut. WikiFlix bringt sie an einem Ort zusammen  – mit Hilfe so genannter Identifier. Ein Identifier ist eine eindeutige Bezeichnung, oft eine Kombination aus Zahlen und Buchstaben, die einen Film (oder eine Person, ein Kunstwerk usw.) in einer Datenbank eindeutig identifiziert. Die Datenbank von WikiFlix synchronisiert sich stündlich mit Wikidata. Sobald jemand einen Identifier aus einem Filmarchiv zu einem Filmeintrag in Wikidata hinzufügt, erscheint dieser kurze Zeit später auch in WikiFlix.

Mein wichtigster Rat an Entwickler*innen: Lasst eure Daten frei! Selbst kleine Datensätze können großen Mehrwert bringen. Und wenn ihr ein Problem löst, fragt euch: Kann das noch allgemeiner gedacht werden? Könnten andere diese Lösung ebenfalls nutzen? Wikidata ist einzigartig – eine offene, vernetzte Wissensbasis über alles, regelmäßig gepflegt von einer Community. Durch die Verknüpfung mit externen Identifikatoren lassen sich Daten aus verschiedenen Quellen kombinieren und völlig neue Zusammenhänge erschließen. Das macht Wikidata so mächtig.
Screenshot: Wikiflix

Natürlich gab es noch viel mehr spannende Anwendungen, die auf den Data Reuse Days vorgestellt wurden. Sie alle hatten eins gemeinsam: Durch kreative Kombinationen von Daten wurden Mehrwerte für Menschen auf der ganzen Welt geschaffen.

Für alle, die die Data Reuse Days verpasst haben und erfahren wollen, welche Apps noch vorgestellt wurden: Die gesamte Veranstaltung wurde aufgezeichnet und kann hier jederzeit noch einmal angeschaut werden:

https://www.youtube.com/playlist?list=PLduaHBu_3ejMPb2P_3XWnLH4K14f7wGRd

Wikidata für Entwickler*innen

Wer Lust bekommen hat, weitere spannende Beispiele zu entdecken oder gleich mit Wikidata arbeiten möchte, findet mehr Informationen auf unserem Wikidata Entwickler*innen Portal.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert