[...] Ontologie, also die möglichen Beziehungen zwischen den verschiedenen Wikidata-Objekten, ist nach Willen der Entwickler offen. So kann die Community flexibel entscheiden, welche Angaben zu einem Objekt in der Datenbank [...]
@Steffen Ich habe mir Freebase angesehen (http://www.freebase.com/docs/data). Da steht: "Freebase contains at this time of writing more than 10 million topics, more than 3000 types, and more than 30,000 properties." Ich habe mir auch durchgelesen wie man Infos auslesen kann - schon beeindruckend. Lustig ist allerdings, dass sie trotzdem ähnliche Probleme wie wir haben. Ich habe versucht die Seite zu Berlin zu finden. Es gab massig Seiten mit diesem Namen, genau wie bei uns. Genommen habe ich dann etwas anderes, weil ich es nicht gefunden habe, und von dort ging es dann (http://www.freebase.com/view/en/berlin) Ich denke man kann hier gut den Unterschied zu Wikidata sehen. Freebase ist Wikidata plus die Verlinkungen in der Wikipedia. Und die Daten dort sind mehr oder weniger bedeutungslos. Hier ist Wikidata besser, weil es auf die Anwendung Wikipedia ausgerichtet ist. Vielleicht ändert sich das bei Freebase, nachdem Google es gekauft hat. Oder vielleicht beerdigen sie Freebase auch demnächst, ähnlich wie Google Knol.
Ich glaube, dass wir die von dir angesprochenen Mängel nachträglich noch beheben werden, aber sonst das einfachere und damit bessere System haben. Übrigens, da hat aktuell jemand ein Javascript-Programm geschrieben, mit dem man die Eingabe für z.B. P107 beschränken kann. (User:Tpt/validator.js) Vielleicht wird so etwas mal zur Standardeinstellung?
Es geht nicht darum, jedem Property zwangsweise feste Eingaben mitzuteilen, sondern um die Möglichkeit eine sinnvolle Auswahl zu treffen. Genauso unbefriedigend ist ein weiteres "Feature", auf das ich in auf den Diskussionsseiten gestoßen bin. Wer sich die Arbeit macht, Shakespeare seine wichtigsten Dramen zuzuordnen, kann später trotzdem unter "Hamlet" die Autorenangabe "Goethe" finden. Auch Ehepartner können einseitig verheiratet sind. A mit B, B aber lieber mit C. Andere Datenbanken (z.B. Freebase) beherrschen solche Grundfunktionen, wie die gegenseitige Verlinkung von Aussagen. Ich habe das Gefühl, das Wikidata an den Interessen der Autoren vorbeientwickelt wird.
Für P107 kann man bots einsetzen, die Fehlerlisten produzieren. Im Grunde kann man das auch bei anderen properties machen. Denkbar wäre ein lernender bot, der die Plausibilität ermittelt und Listen anlegt, wo Benutzer nachschauen könnten. Ansonsten soll ja eine Verknüpfung von Wikidata mit der Beobachtungsliste auf Wikipedia kommen. Das heißt, Falscheingaben dürften etwa so häufig werden, wie damals bevor das Sichten eingeführt wurde. Ein weiterer Punkt ist, dass wir möglicherweise etwas mit dem Missbrauchsfilter machen werden müssen. Der Alptraum wäre ein Vandal-bot.
Ansonsten stimme ich dem Artikel voll zu. Jedem Property mögliche Eingaben mitzuteilen wäre eine nicht zu bewältigende Daueraufgabe, die auch zu komplex wäre.
Zu Phase 3: Ausgehend von Wikidata:Phase_III bin ich auf den Artikel Technical_proposal in meta gestoßen. Dort steht, dass eine einfache "query language" entstehen soll. Nun, ich hatte als Sprache an Prolog, Lisp oder Erlang gedacht. Damit könnte man ein beliebig komplexes System bauen, dass mit den Daten von Wikidata arbeitet. Man könnte so etwas als Prototyp offline mal machen. Die Ausgabe einfacher Listen ist da eine einfache Aufgabe. Interessanter wird es schon, wenn man damit einen lernenden bot baut oder einen, der Umgangssprache versteht. Vorbild wäre hier das IBM-Programm Watson, dass bei der Quizsendung Jeopardy mitspielte und gewann. Laut WP bestand der Computer aus 90 Servern. Das heißt, das wird es nur mit etwas ähnlichem wie bei SETI@home geben können.
zu Steffens Kommentar: Es wäre zumindest sinnvoll, wenn Admins lokal ein Dropdown Menü mit den meistbenötigten/sinnvollsten Werten erstellen können. Ein davon abweichender Wert dürfte trotzdem gespeichert werden. Funktioniert in den (mit bekannten) OSM-Editoren auch recht gut.
Um das Beispiel mit den "main type of items" (P107) aufzugreifen. Hier sind nur sechs Werte sinnvoll, aber es ist nicht möglich, eine entsprechende Einstellung vorzunehmen. Fröhliches Suchen in 5 Mill. items ist die Folge und ein ständiges Hinterherräumen. Einen grundlegenden Mangel der Datenbank lasse ich mir nicht als Freiheit verkaufen.
Vielleicht ist Wikidata in dem Sinne vergleichbar mit OpenStreetMap? Es gibt in OSM keine festen Zuweisungen, was an Werten erlaubt ist. Jeder kann alles taggen, es gibt Fehler und Inkonsistenzen, in der Summe entsteht jedoch eine freie Weltkarten, die ohne Probleme nutzbar ist.
Findige Programmierer entwickeln Spezialkarten, um Fehler und Inkonsistenzen zu finden, die dann von den Mappern korrigiert werden.
Wenn es um Listen geht, muss sich aber dann doch eine Ontologie etabliert haben, richtig? Damit die 100 größten Städte aufgelistet werden, muss jede davon als "Stadt" markiert sein.
Ich bin auf die Entwicklung, das Skalieren und die Konfliktlösungsmechanismen gespannt.
Wir verwenden Cookies auf unserer Website, um Ihnen die beste Erfahrung zu bieten, indem wir Ihre Präferenzen speichern auch bei wiederholten Besuchen. Durch Klicken auf "Akzeptieren" stimmen Sie der Verwendung aller Cookies zu. Sie können jedoch die Cookie-Einstellungen aufrufen, um eine kontrollierte Einwilligung zu erteilen. Mehr Informationen finden Sie auch in unserer Datenschutzerklärung
Diese Website verwendet Cookies, um Ihre Erfahrung zu verbessern, während Sie durch die Website navigieren. Von diesen Cookies werden die Cookies, die nach Bedarf kategorisiert werden, in Ihrem Browser gespeichert, da sie für das Funktionieren der grundlegenden Funktionen der Website wesentlich sind. Wir verwenden auch Cookies von Drittanbietern, mit denen wir analysieren und verstehen können, wie Sie diese Website nutzen. Diese Cookies werden nur mit Ihrer Zustimmung in Ihrem Browser gespeichert. Sie haben auch die Möglichkeit, diese Cookies zu deaktivieren. Das Deaktivieren einiger dieser Cookies kann sich jedoch auf Ihre Browser-Erfahrung auswirken.
Diese Website benutzt den Open Source Webanalysedienst Matomo zur statistischen Analyse der Website-Nutzung.
Wir verwenden zudem die Matomo-Funktion „Heatmaps“, welche Bewegungen des Mauszeigers und Interaktionen mit Elementen analysiert und so besonders nützliche Informationen zur Nutzung der Seite liefert.
[...] Ontologie, also die möglichen Beziehungen zwischen den verschiedenen Wikidata-Objekten, ist nach Willen der Entwickler offen. So kann die Community flexibel entscheiden, welche Angaben zu einem Objekt in der Datenbank [...]
@Steffen Ich habe mir Freebase angesehen (http://www.freebase.com/docs/data). Da steht: "Freebase contains at this time of writing more than 10 million topics, more than 3000 types, and more than 30,000 properties." Ich habe mir auch durchgelesen wie man Infos auslesen kann - schon beeindruckend. Lustig ist allerdings, dass sie trotzdem ähnliche Probleme wie wir haben. Ich habe versucht die Seite zu Berlin zu finden. Es gab massig Seiten mit diesem Namen, genau wie bei uns. Genommen habe ich dann etwas anderes, weil ich es nicht gefunden habe, und von dort ging es dann (http://www.freebase.com/view/en/berlin) Ich denke man kann hier gut den Unterschied zu Wikidata sehen. Freebase ist Wikidata plus die Verlinkungen in der Wikipedia. Und die Daten dort sind mehr oder weniger bedeutungslos. Hier ist Wikidata besser, weil es auf die Anwendung Wikipedia ausgerichtet ist. Vielleicht ändert sich das bei Freebase, nachdem Google es gekauft hat. Oder vielleicht beerdigen sie Freebase auch demnächst, ähnlich wie Google Knol. Ich glaube, dass wir die von dir angesprochenen Mängel nachträglich noch beheben werden, aber sonst das einfachere und damit bessere System haben. Übrigens, da hat aktuell jemand ein Javascript-Programm geschrieben, mit dem man die Eingabe für z.B. P107 beschränken kann. (User:Tpt/validator.js) Vielleicht wird so etwas mal zur Standardeinstellung?
Es geht nicht darum, jedem Property zwangsweise feste Eingaben mitzuteilen, sondern um die Möglichkeit eine sinnvolle Auswahl zu treffen. Genauso unbefriedigend ist ein weiteres "Feature", auf das ich in auf den Diskussionsseiten gestoßen bin. Wer sich die Arbeit macht, Shakespeare seine wichtigsten Dramen zuzuordnen, kann später trotzdem unter "Hamlet" die Autorenangabe "Goethe" finden. Auch Ehepartner können einseitig verheiratet sind. A mit B, B aber lieber mit C. Andere Datenbanken (z.B. Freebase) beherrschen solche Grundfunktionen, wie die gegenseitige Verlinkung von Aussagen. Ich habe das Gefühl, das Wikidata an den Interessen der Autoren vorbeientwickelt wird.
Für P107 kann man bots einsetzen, die Fehlerlisten produzieren. Im Grunde kann man das auch bei anderen properties machen. Denkbar wäre ein lernender bot, der die Plausibilität ermittelt und Listen anlegt, wo Benutzer nachschauen könnten. Ansonsten soll ja eine Verknüpfung von Wikidata mit der Beobachtungsliste auf Wikipedia kommen. Das heißt, Falscheingaben dürften etwa so häufig werden, wie damals bevor das Sichten eingeführt wurde. Ein weiterer Punkt ist, dass wir möglicherweise etwas mit dem Missbrauchsfilter machen werden müssen. Der Alptraum wäre ein Vandal-bot. Ansonsten stimme ich dem Artikel voll zu. Jedem Property mögliche Eingaben mitzuteilen wäre eine nicht zu bewältigende Daueraufgabe, die auch zu komplex wäre. Zu Phase 3: Ausgehend von Wikidata:Phase_III bin ich auf den Artikel Technical_proposal in meta gestoßen. Dort steht, dass eine einfache "query language" entstehen soll. Nun, ich hatte als Sprache an Prolog, Lisp oder Erlang gedacht. Damit könnte man ein beliebig komplexes System bauen, dass mit den Daten von Wikidata arbeitet. Man könnte so etwas als Prototyp offline mal machen. Die Ausgabe einfacher Listen ist da eine einfache Aufgabe. Interessanter wird es schon, wenn man damit einen lernenden bot baut oder einen, der Umgangssprache versteht. Vorbild wäre hier das IBM-Programm Watson, dass bei der Quizsendung Jeopardy mitspielte und gewann. Laut WP bestand der Computer aus 90 Servern. Das heißt, das wird es nur mit etwas ähnlichem wie bei SETI@home geben können.
zu Steffens Kommentar: Es wäre zumindest sinnvoll, wenn Admins lokal ein Dropdown Menü mit den meistbenötigten/sinnvollsten Werten erstellen können. Ein davon abweichender Wert dürfte trotzdem gespeichert werden. Funktioniert in den (mit bekannten) OSM-Editoren auch recht gut.
Um das Beispiel mit den "main type of items" (P107) aufzugreifen. Hier sind nur sechs Werte sinnvoll, aber es ist nicht möglich, eine entsprechende Einstellung vorzunehmen. Fröhliches Suchen in 5 Mill. items ist die Folge und ein ständiges Hinterherräumen. Einen grundlegenden Mangel der Datenbank lasse ich mir nicht als Freiheit verkaufen.
Vielleicht ist Wikidata in dem Sinne vergleichbar mit OpenStreetMap? Es gibt in OSM keine festen Zuweisungen, was an Werten erlaubt ist. Jeder kann alles taggen, es gibt Fehler und Inkonsistenzen, in der Summe entsteht jedoch eine freie Weltkarten, die ohne Probleme nutzbar ist. Findige Programmierer entwickeln Spezialkarten, um Fehler und Inkonsistenzen zu finden, die dann von den Mappern korrigiert werden.
Wenn es um Listen geht, muss sich aber dann doch eine Ontologie etabliert haben, richtig? Damit die 100 größten Städte aufgelistet werden, muss jede davon als "Stadt" markiert sein. Ich bin auf die Entwicklung, das Skalieren und die Konfliktlösungsmechanismen gespannt.
Weil Wikidata strukturierte Daten verwendet und es viel einfacher ist Änderungen auch in großem Maße zu automatisieren.
Wikitext ist frei gewachsen und unreparabel inkonsistent. Wieso wird das Wikidata nicht passieren?
[...] (Die deutsche Version dieses Artikels ist hier.) [...]