Zum Inhalt überspringen
Zum Inhalt überspringen

Kommentare

  1. [...] Ontologie, also die möglichen Beziehungen zwischen den verschiedenen Wikidata-Objekten, ist nach Willen der Entwickler offen. So kann die Community flexibel entscheiden, welche Angaben zu einem Objekt in der Datenbank [...]

  2. Goldzahn
    24. Februar 2013 um 06:44 Uhr

    @Steffen Ich habe mir Freebase angesehen (http://www.freebase.com/docs/data). Da steht: "Freebase contains at this time of writing more than 10 million topics, more than 3000 types, and more than 30,000 properties." Ich habe mir auch durchgelesen wie man Infos auslesen kann - schon beeindruckend. Lustig ist allerdings, dass sie trotzdem ähnliche Probleme wie wir haben. Ich habe versucht die Seite zu Berlin zu finden. Es gab massig Seiten mit diesem Namen, genau wie bei uns. Genommen habe ich dann etwas anderes, weil ich es nicht gefunden habe, und von dort ging es dann (http://www.freebase.com/view/en/berlin) Ich denke man kann hier gut den Unterschied zu Wikidata sehen. Freebase ist Wikidata plus die Verlinkungen in der Wikipedia. Und die Daten dort sind mehr oder weniger bedeutungslos. Hier ist Wikidata besser, weil es auf die Anwendung Wikipedia ausgerichtet ist. Vielleicht ändert sich das bei Freebase, nachdem Google es gekauft hat. Oder vielleicht beerdigen sie Freebase auch demnächst, ähnlich wie Google Knol. Ich glaube, dass wir die von dir angesprochenen Mängel nachträglich noch beheben werden, aber sonst das einfachere und damit bessere System haben. Übrigens, da hat aktuell jemand ein Javascript-Programm geschrieben, mit dem man die Eingabe für z.B. P107 beschränken kann. (User:Tpt/validator.js) Vielleicht wird so etwas mal zur Standardeinstellung?

  3. Steffen
    23. Februar 2013 um 15:56 Uhr

    Es geht nicht darum, jedem Property zwangsweise feste Eingaben mitzuteilen, sondern um die Möglichkeit eine sinnvolle Auswahl zu treffen. Genauso unbefriedigend ist ein weiteres "Feature", auf das ich in auf den Diskussionsseiten gestoßen bin. Wer sich die Arbeit macht, Shakespeare seine wichtigsten Dramen zuzuordnen, kann später trotzdem unter "Hamlet" die Autorenangabe "Goethe" finden. Auch Ehepartner können einseitig verheiratet sind. A mit B, B aber lieber mit C. Andere Datenbanken (z.B. Freebase) beherrschen solche Grundfunktionen, wie die gegenseitige Verlinkung von Aussagen. Ich habe das Gefühl, das Wikidata an den Interessen der Autoren vorbeientwickelt wird.

  4. Goldzahn
    23. Februar 2013 um 08:55 Uhr

    Für P107 kann man bots einsetzen, die Fehlerlisten produzieren. Im Grunde kann man das auch bei anderen properties machen. Denkbar wäre ein lernender bot, der die Plausibilität ermittelt und Listen anlegt, wo Benutzer nachschauen könnten. Ansonsten soll ja eine Verknüpfung von Wikidata mit der Beobachtungsliste auf Wikipedia kommen. Das heißt, Falscheingaben dürften etwa so häufig werden, wie damals bevor das Sichten eingeführt wurde. Ein weiterer Punkt ist, dass wir möglicherweise etwas mit dem Missbrauchsfilter machen werden müssen. Der Alptraum wäre ein Vandal-bot. Ansonsten stimme ich dem Artikel voll zu. Jedem Property mögliche Eingaben mitzuteilen wäre eine nicht zu bewältigende Daueraufgabe, die auch zu komplex wäre. Zu Phase 3: Ausgehend von Wikidata:Phase_III bin ich auf den Artikel Technical_proposal in meta gestoßen. Dort steht, dass eine einfache "query language" entstehen soll. Nun, ich hatte als Sprache an Prolog, Lisp oder Erlang gedacht. Damit könnte man ein beliebig komplexes System bauen, dass mit den Daten von Wikidata arbeitet. Man könnte so etwas als Prototyp offline mal machen. Die Ausgabe einfacher Listen ist da eine einfache Aufgabe. Interessanter wird es schon, wenn man damit einen lernenden bot baut oder einen, der Umgangssprache versteht. Vorbild wäre hier das IBM-Programm Watson, dass bei der Quizsendung Jeopardy mitspielte und gewann. Laut WP bestand der Computer aus 90 Servern. Das heißt, das wird es nur mit etwas ähnlichem wie bei SETI@home geben können.

  5. Raymond
    22. Februar 2013 um 20:37 Uhr

    zu Steffens Kommentar: Es wäre zumindest sinnvoll, wenn Admins lokal ein Dropdown Menü mit den meistbenötigten/sinnvollsten Werten erstellen können. Ein davon abweichender Wert dürfte trotzdem gespeichert werden. Funktioniert in den (mit bekannten) OSM-Editoren auch recht gut.

  6. Steffen
    22. Februar 2013 um 20:32 Uhr

    Um das Beispiel mit den "main type of items" (P107) aufzugreifen. Hier sind nur sechs Werte sinnvoll, aber es ist nicht möglich, eine entsprechende Einstellung vorzunehmen. Fröhliches Suchen in 5 Mill. items ist die Folge und ein ständiges Hinterherräumen. Einen grundlegenden Mangel der Datenbank lasse ich mir nicht als Freiheit verkaufen.

  7. Raymond
    22. Februar 2013 um 19:05 Uhr

    Vielleicht ist Wikidata in dem Sinne vergleichbar mit OpenStreetMap? Es gibt in OSM keine festen Zuweisungen, was an Werten erlaubt ist. Jeder kann alles taggen, es gibt Fehler und Inkonsistenzen, in der Summe entsteht jedoch eine freie Weltkarten, die ohne Probleme nutzbar ist. Findige Programmierer entwickeln Spezialkarten, um Fehler und Inkonsistenzen zu finden, die dann von den Mappern korrigiert werden.

  8. Torsten
    22. Februar 2013 um 16:44 Uhr

    Wenn es um Listen geht, muss sich aber dann doch eine Ontologie etabliert haben, richtig? Damit die 100 größten Städte aufgelistet werden, muss jede davon als "Stadt" markiert sein. Ich bin auf die Entwicklung, das Skalieren und die Konfliktlösungsmechanismen gespannt.

  9. Lydia Pintscher
    22. Februar 2013 um 15:50 Uhr

    Weil Wikidata strukturierte Daten verwendet und es viel einfacher ist Änderungen auch in großem Maße zu automatisieren.

  10. Torsten
    22. Februar 2013 um 15:36 Uhr

    Wikitext ist frei gewachsen und unreparabel inkonsistent. Wieso wird das Wikidata nicht passieren?

  11. [...] (Die deutsche Version dieses Artikels ist hier.) [...]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert