zurück

Ein paar Daten zu Wikidata

WMDE allgemein

19. März 2013

Am Wochenende wurde das 7-millionste Objekt in Wikidata angelegt. Wir hatten schon ein paar Daten basierend auf den Wikidata Datenbankexporten gesammelt, haben aber jetzt die Skripte so erweitert, dass sie uns täglich mit Updates versorgen können. Wir wollen diese Möglichkeit nutzen, um ein paar Statistiken zu veröffentlichen.

Vor einem Monat wurden Aussagen in Wikidata verfügbar gemacht. Inzwischen sind zu mehr als 660.000 Objekten auch Aussagen hinzugefügt worden, was im Endergebnis mehr als 1,4 Millionen Aussagen bedeutet. Das Objekt mit den meisten Aussagen ist das Objekt “Vereinte Nationen (Q1065)“, welches alle Mitgliedsstaaten auflistet. Das Wachstum der Aussagenmenge ist großartig und übertrifft unsere Erwartungen.

Bisher haben wir mehr als 22 Millionen Links zu Wikipedia Artikeln. Es gibt etwas 24 bis 25 Millionen Wikipedia-Artikel, was also bedeutet, dass wir bereits mehr als 90% aller Links in Wikidata haben. Angenommen die Bots arbeiten weiterhin so effizient wie bisher, sollten alle Links in einem oder zwei Monaten übertragen sein. Danach ist es zu erwarten, dass das Wachstum in der Anzahl der Objekte erheblich zurückgeht.

Zur gleichen Zeit gibt es mehr und mehr Bearbeitungen auf Wikidata. Mit bisher mehr als 12,5 Millionen Edits ist Wikidata eines der dynamischsten Wikimedia-Projekte. Man könnte jetzt sagen, dass das alles nur durch Botaktivität zustande kommt – aber das wäre falsch. Etwa 2 Millionen Bearbeitungen wurden von menschlichen Editoren vorgenommen und der Prozentsatz der Bearbeitungen durch Menschen steigt. Mehr als 4.500 menschliche Editoren waren in den letzten 30 Tagen auf Wikidata aktiv.

Zu Labels und Beschreibungen: Wikidata hat bisher mehr als 23 Millionen Labels und mehr als 5 Millionen Beschreibungen gesammelt, in 333 Sprachen. Wir sehen eine große Möglichkeit für externe Werkzeuge und Webseiten, uns beim Zusammentragen von Labels und Beschreibungen zu helfen, da diese die Übersetzung des Inhalts von Wikidata bereitstellen und seinen Inhalt in vielen Sprachen gleichzeitig zur Verfügung stellen.

Es ist noch zu früh, um wirklich zu verstehen, was diese Zahlen bedeuten, aber wir können ganz klar sagen, dass die Arbeit der Community die Hoffnungen des Entwicklungsteams bei Weitem übersteigen. Auch wenn noch viele Features fehlen, ist die warmherzige Begrüßung des Wikidata-Projekts durch die Wikimedia-Communitys einfach großartig und ich kann nur “Danke!” an die tausenden Editoren sagen für ihren Beitrag zum Freien Wissen.

Kommentare

  1. […] Metrics and Activities Meeting der Wikimedia Foundation gegeben. In einem Blogbeitrag gibt es eine detailliertere Analyse. Zusätzlich wurde die erste Phase (Sprachlinks) von Wikidata auf den verbleibenden 282 Wikipedien […]

  2. Denny Vrandecic
    21. März 2013 um 10:10 Uhr

    Jan – ich überlasse Kritik gerne den Kritikern, und nehme dann auch an der entsprechenden Konversation teil. Der Wunsch nach einer Kritik aus den Federn der Macher halte ich für verfrüht, noch fehlt uns der notwendige Abstand um selbst zu erkennen, was wir nicht richtig gemacht haben.

    Dieser Eintrag ist kein Ergebnis unserer PR Abteilung – die hätte das viel besser gemacht. Dieser Beitrag entstand, weil ich in meiner Freizeit ein Skript geschrieben habe, um ein paar Metriken zu generieren, um irgendwie die Entwicklung auf Wikidata beobachten zu können. Ich dachte, es wäre interessant, die Ergebnisse zu veröffentlichen – aber es ist, in der gegebenen Form nicht viel mehr als eine kindliche Lust am Spielen mit Zahlen. Ein Ziel hingegen ist, das sich jemand Externes, ohne dem internen Bias, diese Zahlen sieht, für spannend erachtet, und mit der notwendigen Schärfe und Kritik analysiert.

    Quellenangaben sind indes seit ein paar Wochen möglich, und seit gestern in einer erweiterten Form. Ich bin schon sehr gespannt darauf, ob und wie das verwendet wird.
    Das Projekt ist noch in der Entwicklung, und es fehlen noch zahlreiche Features, aber daran arbeiten wir ja.

    Das der Wachstum nur den Bots zu verdanken ist will ich strikt widersprechen. Mehr als nunmehr 5500 menschliche Beitragende haben an Wikidata allein im letzten Monat mitgearbeitet, und sie haben bislang mehr als anderthalb Millionen Veränderungen eingetragen.

    Das letzte Argument erscheint mir hingegen wenig konsistent: wenn die Qualität von Wikidata so schlecht wäre, wie könnte sie dann für irgendjemanden als nützlich erachtet werden, oder gar als das, “was sie brauchen”? Außerdem sind wir vom Umfang von Google’s KnowledgeGraph drei bis vier Zehnerpotenzen entfernt, die brauchen diese Wissensbasis wohl am wenigsten – das Ziel von Wikidata ist es, eine der Allgemeinheit frei zugängliche Wissensbasis aufzubauen.

    Wir sind noch nicht soweit. Wikidata ist – auch als technische Plattform – noch nicht fertig (und inhaltlich sowieso wirklich nur am Anfang). Das ist uns allen klar. Aber dennoch finde ich die bisherigen Zahlen sehr ermutigend.

  3. Jan Kowaljuk
    21. März 2013 um 02:07 Uhr

    Diese PR-Einträge sind wirklich entlarvend. Ein kritischer Blick auf Wikidata? Fehlanzeige. Stattdessen die naive Freude über eine große, dank Bots rasant anwachsende Datenhalde. Quellenangaben sind bis heute nicht möglich. Der Berg gleicht daher eher einer Müllhalde als einem Lexikon. Die Chancen, die Wikidata geboten hätte, wurden vertan. Freuen kann sich eigentlich nur Google, denn die haben für ihr Geld bekommen, was sie brauchen: Daten! Inhalt und Qualität? Egal.

  4. Infobib » Wikidata wächst und gedeiht
    20. März 2013 um 09:42 Uhr

    […] nicht nur eine Kopfgeburt ist, sondern von den aktiven Nutzern sehr gut angenommen wird. Im Wikimediablog sind nun erste Zahlen zur Nutzung zu […]

  5. […] (Die deutsche Version dieses Artikels ist hier.) […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert