Die Welt begrenzen

#Technisches

Wikidata & Wikibase – die tragenden Säulen eines offenen Internets

Künstliche Intelligenz

Warum gibt es Wikimedia Enterprise?

Digitale Selbstbestimmung

Freie Social-Media-Alternativen – Kontrolle behalten statt Algorithmen folgen

Smartphone Apps: WhatsApp, Telegram, Line, WeChat, Signal

Digitale Selbsbestimmung

Freie Software, freie Kommunikation: Diesen Messenger-Alternativen können wir vertrauen

Kommentare

Wikipedia-Datenfundus Wikidata geht in die zweite Runde | virtualfiles.net
29. März 2013 um 05:26 Uhr

[...] Ontologie, also die möglichen Beziehungen zwischen den verschiedenen Wikidata-Objekten, ist nach Willen der Entwickler offen. So kann die Community flexibel entscheiden, welche Angaben zu einem Objekt in der Datenbank [...]

Antworten
Goldzahn
24. Februar 2013 um 06:44 Uhr

@Steffen Ich habe mir Freebase angesehen (http://www.freebase.com/docs/data). Da steht: "Freebase contains at this time of writing more than 10 million topics, more than 3000 types, and more than 30,000 properties." Ich habe mir auch durchgelesen wie man Infos auslesen kann - schon beeindruckend. Lustig ist allerdings, dass sie trotzdem ähnliche Probleme wie wir haben. Ich habe versucht die Seite zu Berlin zu finden. Es gab massig Seiten mit diesem Namen, genau wie bei uns. Genommen habe ich dann etwas anderes, weil ich es nicht gefunden habe, und von dort ging es dann (http://www.freebase.com/view/en/berlin) Ich denke man kann hier gut den Unterschied zu Wikidata sehen. Freebase ist Wikidata plus die Verlinkungen in der Wikipedia. Und die Daten dort sind mehr oder weniger bedeutungslos. Hier ist Wikidata besser, weil es auf die Anwendung Wikipedia ausgerichtet ist. Vielleicht ändert sich das bei Freebase, nachdem Google es gekauft hat. Oder vielleicht beerdigen sie Freebase auch demnächst, ähnlich wie Google Knol. Ich glaube, dass wir die von dir angesprochenen Mängel nachträglich noch beheben werden, aber sonst das einfachere und damit bessere System haben. Übrigens, da hat aktuell jemand ein Javascript-Programm geschrieben, mit dem man die Eingabe für z.B. P107 beschränken kann. (User:Tpt/validator.js) Vielleicht wird so etwas mal zur Standardeinstellung?

Antworten
Steffen
23. Februar 2013 um 15:56 Uhr

Es geht nicht darum, jedem Property zwangsweise feste Eingaben mitzuteilen, sondern um die Möglichkeit eine sinnvolle Auswahl zu treffen. Genauso unbefriedigend ist ein weiteres "Feature", auf das ich in auf den Diskussionsseiten gestoßen bin. Wer sich die Arbeit macht, Shakespeare seine wichtigsten Dramen zuzuordnen, kann später trotzdem unter "Hamlet" die Autorenangabe "Goethe" finden. Auch Ehepartner können einseitig verheiratet sind. A mit B, B aber lieber mit C. Andere Datenbanken (z.B. Freebase) beherrschen solche Grundfunktionen, wie die gegenseitige Verlinkung von Aussagen. Ich habe das Gefühl, das Wikidata an den Interessen der Autoren vorbeientwickelt wird.

Antworten
Goldzahn
23. Februar 2013 um 08:55 Uhr

Für P107 kann man bots einsetzen, die Fehlerlisten produzieren. Im Grunde kann man das auch bei anderen properties machen. Denkbar wäre ein lernender bot, der die Plausibilität ermittelt und Listen anlegt, wo Benutzer nachschauen könnten. Ansonsten soll ja eine Verknüpfung von Wikidata mit der Beobachtungsliste auf Wikipedia kommen. Das heißt, Falscheingaben dürften etwa so häufig werden, wie damals bevor das Sichten eingeführt wurde. Ein weiterer Punkt ist, dass wir möglicherweise etwas mit dem Missbrauchsfilter machen werden müssen. Der Alptraum wäre ein Vandal-bot. Ansonsten stimme ich dem Artikel voll zu. Jedem Property mögliche Eingaben mitzuteilen wäre eine nicht zu bewältigende Daueraufgabe, die auch zu komplex wäre. Zu Phase 3: Ausgehend von Wikidata:Phase_III bin ich auf den Artikel Technical_proposal in meta gestoßen. Dort steht, dass eine einfache "query language" entstehen soll. Nun, ich hatte als Sprache an Prolog, Lisp oder Erlang gedacht. Damit könnte man ein beliebig komplexes System bauen, dass mit den Daten von Wikidata arbeitet. Man könnte so etwas als Prototyp offline mal machen. Die Ausgabe einfacher Listen ist da eine einfache Aufgabe. Interessanter wird es schon, wenn man damit einen lernenden bot baut oder einen, der Umgangssprache versteht. Vorbild wäre hier das IBM-Programm Watson, dass bei der Quizsendung Jeopardy mitspielte und gewann. Laut WP bestand der Computer aus 90 Servern. Das heißt, das wird es nur mit etwas ähnlichem wie bei SETI@home geben können.

Antworten
Raymond
22. Februar 2013 um 20:37 Uhr

zu Steffens Kommentar: Es wäre zumindest sinnvoll, wenn Admins lokal ein Dropdown Menü mit den meistbenötigten/sinnvollsten Werten erstellen können. Ein davon abweichender Wert dürfte trotzdem gespeichert werden. Funktioniert in den (mit bekannten) OSM-Editoren auch recht gut.

Antworten
Steffen
22. Februar 2013 um 20:32 Uhr

Um das Beispiel mit den "main type of items" (P107) aufzugreifen. Hier sind nur sechs Werte sinnvoll, aber es ist nicht möglich, eine entsprechende Einstellung vorzunehmen. Fröhliches Suchen in 5 Mill. items ist die Folge und ein ständiges Hinterherräumen. Einen grundlegenden Mangel der Datenbank lasse ich mir nicht als Freiheit verkaufen.

Antworten
Raymond
22. Februar 2013 um 19:05 Uhr

Vielleicht ist Wikidata in dem Sinne vergleichbar mit OpenStreetMap? Es gibt in OSM keine festen Zuweisungen, was an Werten erlaubt ist. Jeder kann alles taggen, es gibt Fehler und Inkonsistenzen, in der Summe entsteht jedoch eine freie Weltkarten, die ohne Probleme nutzbar ist. Findige Programmierer entwickeln Spezialkarten, um Fehler und Inkonsistenzen zu finden, die dann von den Mappern korrigiert werden.

Antworten
Torsten
22. Februar 2013 um 16:44 Uhr

Wenn es um Listen geht, muss sich aber dann doch eine Ontologie etabliert haben, richtig? Damit die 100 größten Städte aufgelistet werden, muss jede davon als "Stadt" markiert sein. Ich bin auf die Entwicklung, das Skalieren und die Konfliktlösungsmechanismen gespannt.

Antworten
Lydia Pintscher
22. Februar 2013 um 15:50 Uhr

Weil Wikidata strukturierte Daten verwendet und es viel einfacher ist Änderungen auch in großem Maße zu automatisieren.

Antworten
Torsten
22. Februar 2013 um 15:36 Uhr

Wikitext ist frei gewachsen und unreparabel inkonsistent. Wieso wird das Wikidata nicht passieren?

Antworten
Wikimedia Blog » Blog Archive » Restricting the World
22. Februar 2013 um 15:17 Uhr

[...] (Die deutsche Version dieses Artikels ist hier.) [...]

Antworten

Cookie	Typ	Dauer	Beschreibung
cli_user_preference			Dieses Cookies speichert, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine personenbezogenen Daten.
cookielawinfo-checkbox-necessary		1 year	Zustimmung der Kategorie "Essenziell".
CookieLawInfoConsent		1 year	Dieses Cookies speichert, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine personenbezogenen Daten.
viewed_cookie_policy	ständig	1 Stunde	Dieses Cookies speichert, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine personenbezogenen Daten.

Cookie	Typ	Dauer	Beschreibung
cookielawinfo-checkbox-einstellungen	0	1 year	Zustimmung der Kategorie "Einstellungen"
pll_language	0	1 year	Das Cookie speichert den Sprachcode der zuletzt besuchten Seite.

Cookie	Typ	Dauer	Beschreibung
_pk_id.1.64ac	0	1 year	Cookie von Matomo
_pk_ses.1.64ac	0	30 minutes	Cookie von Matomo
cookielawinfo-checkbox-matomo		1 year	Zustimmung der Kategorie "Matomo"

Cookie	Typ	Dauer	Beschreibung
_pk_id.1.64ac	0	1 year	Cookie von Matomo
_pk_ses.1.64ac	0	30 minutes	Cookie von Matomo
cookielawinfo-checkbox-matomo-und-heatmap		1 year	Zustimmung der Kategorie "Matomo und Heatmap"

Verwandte Artikel

Wikidata & Wikibase – die tragenden Säulen eines offenen Internets

Warum gibt es Wikimedia Enterprise?

Freie Social-Media-Alternativen – Kontrolle behalten statt Algorithmen folgen

Freie Software, freie Kommunikation: Diesen Messenger-Alternativen können wir vertrauen

Kommentare

Schreibe einen Kommentar Antwort abbrechen

DSGVO Hinweis