Letzte Woche feierte Wikidata seinen zweiten Geburtstag. Mit Wikidata sammeln Menschen Daten über die Welt (z. B. Einwohnerzahlen oder Geburtsdaten) in strukturierter Form und in mehreren hundert Sprachen. Diese Daten werden genutzt, um Wikipedia und deren Schwesterprojekte zu verbessern. Sie stehen aber darüber hinaus Allen zur freien Nachnutzung zur Verfügung. Mehr als 16.000 Nutzer der Wikidata-Community haben seit dem Start über 12,8 Millionen Einträge angelegt und mit Daten gefüllt – ehrenamtlich und kollaborativ wie im Schwesterprojekt Wikipedia. Die Arbeiten für die Software hinter Wikidata wurden von Wikimedia Deutschland begonnen und als offene Software kontinuierlich weiterentwickelt. Wikidata hat sich in den letzten zwei Jahren zu einem der erfolgreichsten Wikimedia-Projekte entwickelt und liegt bei der Anzahl der aktiven Benutzerinnen und Benutzer vor vielen Sprachversionen der Wikipedia.
Geschenke zum zweiten Geburtstag von Wikidata
Zu Feier des Geburtstags gab es eine spezielle Seite auf Wikidata selbst und wie bei jeder ordentlichen Party gab es Geschenke — aus der Community und für die Community. Zu den Geschenken sind ein paar Worte angebracht:
- Ein Gemälde wurde dem Projekt anonym gespendet (hier ist eine Fotoserie, wie es gemalt wird)
Das Gemälde wird in der Geschäftsstelle von Wikimedia Deutschland als Dauerleihgabe zu sehen sein, denn eigentlich geht das Geschenk ja an die Community. Hinter dem Bild steckt eine Geschichte. Pinocchio, der die Welt und seine Konzepte verstehen will, merkt, dass seine Gedanken zu Blasen werden. Erst im Baum des Freien Wissens sitzend, mit Wikidata als Feder in seiner Hand, werden die Gedankenblasen berührbar und können benutzt werden, um neue Bücher zu füllen. In dem Gemälde ist die Geschichte hinter der Erkenntnis des Wikidatianers Pinocchio in Venedig künstlerisch verarbeitet worden.
- Das Entwicklungs-Team stellte zum Geburtstag mehrere Performance-Verbesserungen an der Software fertig
Wikidata ist längst ein Projekt, das weltweit von Freiwilligen entwickelt wird, aber das Wikidata-Team der Software-Entwicklung von Wikimedia Deutschland steuert in einigen Kernbereichen gerne Arbeit und Expertise zur Verbesserung bei. 2014 stand unter anderem im Zeichen der Performance-Verbesserungen. Datensätze bei Wikidata werden jetzt auch dann rasch geladen, wenn sie sehr umfangreich sind.
Wikidata liebt Daten und Daten lieben Visualisierungen. Von den Machern des zauberhaft hypnotischen Kunstwerks “Listen to Wikipedia” stammt die wunderschöne Animation von dem, was in Echtzeit auf Wikidata passiert.
Von Denny Vrandečić, ehemaliger Director des Wikidata-Projekts und jetzt bei Google beschäftigt, wurde uns ein besonderer Datenschatz überreicht. Mit Heuristiken und Algorithmen haben Fans von Wikidata bei Google einige Wikipedia-Artikel gefunden, die offensichtlich den gleichen Wissensgegenstand in unterschiedlichen Sprachen beschreiben, aber noch nicht auf Wikidata verknüpft sind. Vermutlich liegen die Algorithmen bei ihrer Analyse von natürlicher Sprache zu etwa 92% richtig und berücksichtigen 60 Sprachversionen von Wikipedia. Die Daten sind unter CC-0 verfügbar.
Wikidata beinhaltet strukturierte Daten. Das Semantische Web ist ein Konzept von einem weiterentwickelten Internet, in dem Informationen im Web von Maschinen interpretiert und automatisch weiterverarbeitet werden können. Die beiden Welten von Wikidata und Semantischem Web haben viele Berührungspunkte, auch wenn sie nicht ganz deckungsgleich sind. Von Wikidata gibt es einen Auszug der Datenbank in RDF, einer der Notationen, die im Semantischen Web benutzt werden. Bisher gab es aber keine einfache Schnittstelle, mit der diese Daten zum Beispiel mit SPARQL, einer graph-basierten Abfragesprache für RDF, abgefragt werden können. WikidataLDF, eins unserer Geburtstagsgeschenke, bietet genau das. Mit Abfragen auf WikidataLDF lassen sich so Mengen und Teilmengen abfragen, etwa Artikel, die in zwei Sprachversionen von Wikidata vorhanden sind.
Wikidata bei den Open Data Awards ausgezeichnet
Aber mit den Geschenken zum Geburtstag war es nicht nicht vorbei. Mit großem Stolz hat uns die Nominierung von Wikidata in zwei Kategorien der Open Data Awards des Open Data Institutes erfüllt: “Open Data Innovation Award – celebrating open data used as a tool for innovation, in any sector” und “Open Data Publisher Award – celebrating high publishing standards and use of challenging data“. In der Kategorie Open Data Publisher gewann Wikidata den Preis und wurde ausgezeichnet.
Dienstag Nacht waren Magnus Manske aus der Wikidata-Community und Lydia Pintscher, Product Manager von Wikidata und beschäftigt bei Wikimedia Deutschland, bei der Preisverleihung der Open Data Awards im Museum of London. Es freut uns außerordentlich, dass Sir Nigel Shadbolt und Sir Tim Berners-Lee, die die Preise überreicht haben, gewürdigt haben, dass das Projekt von Anfang an “in the open” entwickelt wurde und dass Wikidata ein breites Spektrum an Themen abdeckt. Ein paar Fotos von der Preisverleihung gibt es im Twitter-Stream von Wikidata zu sehen.