Posts Tagged ‘Wikidata’



Die Digitalen Römer – Wikidata trifft Archäologie

 

Teilnehmer des Symposiums
Foto: Katja Ullrich (WMDE) CC-BY-SA 3.0

Am Samstag, den 16. März hat Wikidata die Archäologie getroffen.
Bei dem eintägigen Symposium zur Anwendung von Geodaten in den Alterswissenschaften wurde oft die Datenwelt rund um den Limes, den Grenzwall des Römischen Reiches zwischen dem 1. und dem 6. Jahrhundert n.Chr., als Beispiel für gelungene Ansätze der digitalen Wissensvermittlung herangezogen.

Für mich als in Hessen geborenes Präsidiumsmitglied, der oft das Kastell Saalburg in seiner Jugend besuchte, eine Möglichkeit in Erinnerungen zu schweben. Wir trafen uns, im Gegensatz zum ersten Treffen des Wikipedia-Limesprojekt nicht auf der Saalburg, sondern in der wunderbaren Bibliothek des Auswärtigen Amtes in Berlin.

 

Das Symposium war ein Kooperationsprojekt des Deutschen Archäologischen Instituts (DAI) und der Wikimedia Deutschland e.V. – Dank für die Möglichkeit in diesem Rahmen zu produktiver Arbeit zusammenzukommen geht an Nicole Kehrer, Pressereferentin des DAI, Prof. Dr. Reinhard Förtsch, dem wissenschaftlichen Direktor für Informationstechnologien am Deutschen Archäologischen Institut und der Spiritus Rector des Symposiums und an Barbara Fischer, Kuratorin für Kulturpartnerschaften bei der Wikimedia Deutschland e.V.

Bevor es am Schluss des Symposiums engagiert um die Zukunft der breiten Wissensvermittlung sowie die Chancen und Umsetzungsschritte einer offeneren Wissenschaft und Gesellschaft ging, wurden einige beeindruckende Tools und Plattformen vorgestellt. Diese zeigen auf unterschiedlichste Weise, wie mit dem offenen Austausch von Daten der Alterswissenschaften breite Bevölkerungskreise und interessierte Fachöffentlichkeit neue Wissenswelten betreten können.

Gerade die karten-basierte Darstellung von historischen Fakten in Raum und Zeit zeigt besonders schön die Potentiale für Wissen und Bildung, wenn offene strukturierte Datensätze zusammenfliessen. Ein wunderschönes Beispiel, das aus einer privaten Initiative entstanden ist, wurde von René Voorburg vorgestellt. Ursprünglich entwickelt, weil er mit seinen beiden Söhne unterwegs eine altertümliche Stätte des Limes gesehen hatte, entwickelte er mit großer Leidenschaft und später einigen Mitstreitern vici.org „Veni, vidi, [wi:ki:]“ Eine Online-Karte, auf der man die historischen Stätten verorten kann.

Bibliothek des Auswärtigen Amtes Berlin
Foto: Katja Ullrich (WMDE) CC-BY-SA 3.0

Dr. Elton Barker von der Open University, Southhampton präsentierte Pelagios (Pelagios: Enable Linked Ancient Geodata In Open Systems), einen Netzwerkknoten für Linked Open Data in der weiten See der Altertumswissenschaften. Eine weitere, bereits beeindruckend umfangreiche karten-basierte offene Datenbank wurde von Prof. Tom Elliot (University of Alabama, Tuscaloosa, USA) vorgestellt: Pelaides. In seinem Vortrag zeigte er beispielhaft, wie sich die verschiedensten offenen Datenbanken weltweit vernetzten und somit neue Chancen entstehen.

Im Rahmen des erst kürzlich weltweit gestarteten Wikidata-Projektes wurde vom RENDER-Team die interaktive Limes-Karte vorgestellt, mit der der User sehen kann, wie sich der Limes mit seinen Kastellen über die Jahrhunderte entwickelte. Das seit 7 Jahren in der Wikipedia laufende Limesprojekt wurde von seinem Initiator Hartmann Linge mit einer beeindruckenden (Zwischen)-Bilanz vorgestellt.

„Quo vadimus?“ – Zum Schluss des Symposium gab es noch eine lebendige Diskussion, in die sich auch Peter Henrich von der Deutschen Limes Kommission kritisch einbrachte. Es wurde die Notwendigkeit deutlich, dass unnötiger Streit auf der operativen Ebene einem neuen Bewusstsein weichen sollte. Einem Bewusstsein dafür, dass „altehrwürdige Gatekeeper“ und die Vertreter einer offeneren Wissenswelt aufeinander zugehen müssen, damit gesellschaftliche Ziele definiert werden können, wie wir verantwortungsvoll eine neue Qualität in der Wissensvermittlung und den Erkenntnisgewinn für jedermann und jedefrau in einer digital vernetzten Welt gestalten können. Wikidata, wenn auch noch jung, stellt hierfür eines der Werkzeuge dar, mit denen Wissensfelder und Sprachen überwunden werden können. Ein spannender Aufbruch, gemeinsam frisch ans Werk.

 

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Du kannst alle Daten haben!

Seit heute haben die ersten Wikipedien die Möglichkeit Daten aus Wikidata in ihren Artikeln einzubinden. Es sind die italienische, hebräische, ungarische, russische, türkische, ukrainische, usbekische, kroatische, bosnische, serbische und serbo-kroatische Wikipedien. Wenn du neugierig bist kannst du es auch auf test2.wikipedia.org ausprobieren. Das heißt, dass die Autoren auf diesen Wikipedien ab sofort die wachsende Menge an strukturierten Daten die auf Wikidata verfügbar ist als gemeinsame Datenbasis nutzen können. Es beinhaltet Dinge wie den Status auf der Roten Liste für eine Tier- oder Pflanzenart, die ISBN für ein Buch oder die Top-Level-Domain eines Landes.

Es gibt 2 Wege auf die Daten zuzugreifen:

  • Benutze eine Parserfunktion wie {{#property:p169}} im Wikitext des Artikels über Yahoo!. Das wird “Marissa Mayer” zurückgeben da sie der Chief Executive Officer der Firma ist.
  • Für kompliziertere Sachen kannst du Lua benutzen. Die Dokumentation dazu ist hier.

Wir arbeiten daran die Parserfunktion auszubauen damit du zum Beispiel {{#property:chief executive officer}} statt {{#property:p169}} nutzen kannst. Der vollständige Plan dafür ist hier.

Der nächste Schritt ist die Inbetriebnahme auf den restlichen Wikipedien. Wir werden die Performance genau beobachten und wenn es keine Probleme gibt werden sie innerhalb von ein oder zwei Wochen folgen.

Wir haben die häufigsten Fragen für dieses Deployment zusammengestellt und freuen uns auf dein Testen und deine Rückmeldungen. Der beste Ort für Rückmeldungen ist diese Diskussionsseite.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

You can have all the data!

(Die deutsche Version dieses Beitrags gibt es hier.)

Today the first 11 Wikipedias got the ability to include data from Wikidata in their articles. These are the Italian, Hebrew, Hungarian, Russian, Turkish, Ukrainian, Uzbek, Croatian, Bosnian, Serbian and Serbo-Croatian Wikipedias. If you are curious you can also try it out on test2.wikipedia.org. This means the editors on these Wikipedias are now able to make use of the growing amount of structured data that is available in Wikidata as a common dataset. It includes things like conservation status for a species, ISBN for a book or the top level domain of a country.

There are two ways to access the data:

  • Use a parser function like {{#property:p169}} in the wiki text of the article on Yahoo!. This will return “Marissa Mayer” as she is the chief executive officer of the company.
  • For more complicated things you can use Lua. The documentation for this is here.

We are working on expanding the parser function so you can for example use {{#property:chief executive officer}} instead of {{#property:p169}}. The complete plan for this is here.

The next step is the deployment on the other Wikipedias. We will carefully monitor performance and if there are no issues they will follow within a week or two.

We have prepared an FAQ for this deployment and are looking forward to your testing and feedback. The best place to leave feedback is this discussion page.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (4 Bewertungen, Durchschnitt: 4,50 von 5)
Loading...

Some data on Wikidata

(Die deutsche Version dieses Artikels ist hier.)

This weekend we saw the creation of the 7th Million item on Wikidata. We had already collected some data based on the Wikidata database dumps, but now we extended the scripts so that they can provide us with daily updates. We want to use this chance to publish a few statistics.

Within the last month – since statements got enabled – more than 660,000 of these items also got statements about them, resulting in more than 1.4 Million statements. The item with the most statements is the United Nations (Q1065), listing all member states. The growth of the number of statements is amazing and well beyond what we expected.

So far we have more than 22 Million links to Wikipedia articles. There are about 24-25 Million Wikipedia articles, which means that we have more than 90% of all links already in Wikidata. Assuming the bots continue working as efficiently as they did so far, all links could be transferred in about a month or two, and then the rapid growth in the number of items is expected to slow down considerably.

At the same time, the edits on Wikidata are increasing a lot. With more than 12.5 Million edits as of now, Wikidata is one of the most dynamic Wikimedia projects. One might say that this is all due to bot activity — but that would be very wrong. About 2 Million edits have been done by human editors, and actually the percentage of edits performed by human editors is increasing. More than 4,500 human editors have been active on Wikidata in the last thirty days.

Regarding labels and descriptions, Wikidata has collected more than 23 Million labels and more than 5 Million descriptions so far, in 333 languages. We see a great opportunity for external tools and websites to help us with collecting labels and descriptions, as they basically provide the translation of the content of Wikidata and make its content available in many languages simultaneously.

It is still too early to really understand what these numbers mean, but we can clearly state that the activity of the community exceeds the hopes of the development team. Although many features are still missing, the warm embrace of the Wikidata project in its current state by the Wikimedia communities is simply amazing, and I can only say „thank you“ to those thousands and thousands of editors for their contribution to free knowledge.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (1 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Ein paar Daten zu Wikidata

Am Wochenende wurde das 7-millionste Objekt in Wikidata angelegt. Wir hatten schon ein paar Daten basierend auf den Wikidata Datenbankexporten gesammelt, haben aber jetzt die Skripte so erweitert, dass sie uns täglich mit Updates versorgen können. Wir wollen diese Möglichkeit nutzen, um ein paar Statistiken zu veröffentlichen.

Vor einem Monat wurden Aussagen in Wikidata verfügbar gemacht. Inzwischen sind zu mehr als 660.000 Objekten auch Aussagen hinzugefügt worden, was im Endergebnis mehr als 1,4 Millionen Aussagen bedeutet. Das Objekt mit den meisten Aussagen ist das Objekt „Vereinte Nationen (Q1065)„, welches alle Mitgliedsstaaten auflistet. Das Wachstum der Aussagenmenge ist großartig und übertrifft unsere Erwartungen.

Bisher haben wir mehr als 22 Millionen Links zu Wikipedia Artikeln. Es gibt etwas 24 bis 25 Millionen Wikipedia-Artikel, was also bedeutet, dass wir bereits mehr als 90% aller Links in Wikidata haben. Angenommen die Bots arbeiten weiterhin so effizient wie bisher, sollten alle Links in einem oder zwei Monaten übertragen sein. Danach ist es zu erwarten, dass das Wachstum in der Anzahl der Objekte erheblich zurückgeht.

Zur gleichen Zeit gibt es mehr und mehr Bearbeitungen auf Wikidata. Mit bisher mehr als 12,5 Millionen Edits ist Wikidata eines der dynamischsten Wikimedia-Projekte. Man könnte jetzt sagen, dass das alles nur durch Botaktivität zustande kommt – aber das wäre falsch. Etwa 2 Millionen Bearbeitungen wurden von menschlichen Editoren vorgenommen und der Prozentsatz der Bearbeitungen durch Menschen steigt. Mehr als 4.500 menschliche Editoren waren in den letzten 30 Tagen auf Wikidata aktiv.

Zu Labels und Beschreibungen: Wikidata hat bisher mehr als 23 Millionen Labels und mehr als 5 Millionen Beschreibungen gesammelt, in 333 Sprachen. Wir sehen eine große Möglichkeit für externe Werkzeuge und Webseiten, uns beim Zusammentragen von Labels und Beschreibungen zu helfen, da diese die Übersetzung des Inhalts von Wikidata bereitstellen und seinen Inhalt in vielen Sprachen gleichzeitig zur Verfügung stellen.

Es ist noch zu früh, um wirklich zu verstehen, was diese Zahlen bedeuten, aber wir können ganz klar sagen, dass die Arbeit der Community die Hoffnungen des Entwicklungsteams bei Weitem übersteigen. Auch wenn noch viele Features fehlen, ist die warmherzige Begrüßung des Wikidata-Projekts durch die Wikimedia-Communitys einfach großartig und ich kann nur „Danke!“ an die tausenden Editoren sagen für ihren Beitrag zum Freien Wissen.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (5 Bewertungen, Durchschnitt: 4,20 von 5)
Loading...

Wikidata jetzt auf allen Wikipedien

Heute haben wir Wikidatas Sprachlinkunterstützung auf allen verleibenden Wikipedien freigeschalten. (Also alle verbleibenden 282 außer Ungarisch, Hebräisch, Italienisch und Englisch.) Das heißt, dass ab sofort die Links in der linken Seitenleiste die auf Artikel zum gleichen Thema in anderen Sprachen verlinken jetzt von Wikidata kommen.

Was heißt das genau?

  • Sprachlinks in der Seitenleiste kommen automatisch von Wikidata, wenn die entsprechende Seite auf Wikidata einen Link zum Artikel hat. Es ist keine spezielle Syntax notwendig.
  • Existierende Sprachlinks im Wikitext werden weiterhin funktionieren und überschreiben Links von Wikidata.
  • Für individuelle Artikel können Sprachlinks von Wikidata komplett unterbunden werden mit der Funktion noexternallanglinks.
  • Änderungen auf Wikidata die mit einem Artikel in der Wikipedia zu tun haben werden in Letzte Änderungen und Beobachtungsliste angezeigt, wenn die Option vom Nutzer aktiviert wurde. (Es gibt noch ein paar Probleme falls Erweiterte Letzte Änderungen aktiviert sind.)
  • Am Ende der Liste der Sprachlinks gibt es einen Link um die Sprachlinks zu editieren der dich zur verlinkten Seite auf Wikidata führt.
  • Du kannst ein Beispiel dafür im Artikel über den Eigentlichen Langohrigel sehen.
  • Die zweite Phase (Behauptungen/Infoboxen) ist auf Wikidata in Betrieb, kann aber noch nicht in den Wikipedien genutzt werden. Es soll gegen Ende des Monats auf den ersten Wikipedien freigeschalten werden. Der Rest wird kurz darauf folgen.

Eine Liste der am häufigsten gestellten Fragen gibt es hier und Dokumentation hier.

Auf dem Laufenden bleiben und mitmachen

Es gibt verschiedene Wege auf dem Laufenden zu bleiben über alles was rund um Wikidata passiert. Der wöchentliche Newsletter ist der Wichtigste. Du kannst dich hier eintragen um es auf deine Diskussionsseite geliefert zu bekommen. Es gibt auch Accounts auf Twitter, identi.ca, Facebook und Google+.
Wenn du bei Wikidata mitmachen willst ist diese Seite ein guter Start.

Sprechstunde im IRC

Diesen Freitag um 18:00 Uhr wird es eine Sprechstunde zu Wikidata im IRC geben. Mehr Details dazu gibt es auf Meta.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Wikidata now live on all Wikipedias

(Die deutsche Version dieses Eintrags ist hier.)

Today we have enabled Wikidata’s language link support on all remaining Wikipedias. (So all 282 remaining ones except Hungarian, Hebrew, Italian and English.) This means the links in the sidebar that link to articles on the same topic in other languages are now coming from Wikidata.

What does this mean exactly?

  • Language links in the sidebar are automatically coming from Wikidata, once the article is linked on Wikidata. No special syntax is needed for that.
  • Existing language links in the wikitext will continue to work and overwrite links from Wikidata.
  • For individual articles, language links from Wikidata can be suppressed completely with the noexternallanglinks magic word.
  • Changes on Wikidata that relate to articles on this Wikipedia show up in Recent Changes and Watchlist, if the option is enabled by the user. (There are still some issues with this when you have enhanced recent changes enabled.)
  • At the bottom of the language links list you will see a link to edit the language links that leads you to the linked page on Wikidata.
  • You can see an example of how it looks in the article about the long-eared hedgehog.
  • The second phase (which is about statements/infoboxes) is in use on Wikidata, but can’t yet be used on any Wikipedia. It is scheduled to be enabled on the first few Wikipedias at the end of the month. The rest will follow soon after that.

An FAQ for editors is here and documentation exists here.

Staying up-to-date and contributing

There are several ways to stay up-to-date on everything happening around Wikidata. The weekly status updates are the most important ones. You can add yourself here to have them delivered to your talk page on-wiki. There is also Twitter, identi.ca, Facebook and Google+.
If you’d like to contribute to Wikidata this page is a good start.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 4,29 von 5)
Loading...

Die Welt begrenzen

Dies ist der erste in einer kurzen Serie von Blogeinträgen, in denen ich einige Design-Entscheidungen für Wikidata erkläre. Dies sind persönliche Meinungen, aber sie haben einen großen Einfluss auf Features oder Non-Features von Wikidata. Diese sollen hier erklärt werden.

By Tomascastelazo (Own work)
CC-BY-SA-3.0,
via Wikimedia Commons

Eines der Features – andere Menschen nennen es Bug – ist, dass man jedes Objekt als Wert einer Eigenschaft festlegen kann. Viele davon ergeben keinen Sinn: Wenn man einen Artikel zu Paris hat und dann sagt, dass das zugehörige Land Ziegenkäse ist, ergibt nicht wirklich Sinn. Wäre es nicht toll, wenn Wikidata wüsste, welche Werte für ein Land sinnvoll sind und dir erlauben würde, nur diese auszuwählen anstatt alle möglichen anderen Werte zuzulassen? Wäre es nicht toll, wenn die Community entscheidet, dass eine Eigenschaft wie das vielgenutzte P107 auf die sechs Werte eingeschränkt wird, für die die Community sich entschieden hat?

Ich stimme dem absolut nicht zu.

Ein weiteres Feature – andere nennen es Bug – von Wikidata ist, dass du jede Eigenschaft für jedes Objekt verwenden kannst. Wenn du die Hauptstadt von Julius Caesar angeben willst, kannst du das tun. Wäre es nicht toll, wenn Wikidata wüsste, welche Eigenschaften für ein bestimmtes Objekt sinnvoll sind und dich dann nicht nur auf diese beschränkt, sondern sogar auflistet, welche Eigenschaften noch keine Werte haben? Wäre es nicht toll, wenn die Community Vorlagen mit allen Eigenschaften anlegen könnte, die für eine Person, für eine Stadt oder für ein Land angegeben werden müssen – und nichts anderes erlaubt wäre?

Ich stimme dem absolut nicht zu.

Ich bin der Meinung, dass schlauere Vorschläge großartig wären. Einige davon könnten relativ trivial zu implementieren sein: Zähle die Häufigkeit der Werte für eine bestimmte Eigenschaft und mache basierend darauf Vorschläge. Und was ist mit Vorschlägen für Eigenschaften? Es wird viel in diesem Bereich geforscht, im Prinzip so etwas wie „Objekte mit diesen Eigenschaften haben auch jene Eigenschaften“. Du hast das vielleicht schon auf einigen Shoppingseiten gesehen.

Ich bin absolut für bessere Vorschläge. Ich bin jedoch gegen harte Einschränkungen. Es gibt hier viel zu viel Raum für Drama und Edit-wars. Hat jedes Land eine Hauptstadt? Was ist überhaupt ein Land? Was sollen die möglichen Werte für die Eigenschaft Geschlecht sein? Was sind die richtigen Eigenschaften für Presidenten?

Nicht alles, was das System nutzt, um die Nutzeroberfläche und Hauptfunktionalität zu bauen – Bezeichnungen und Beschreibungen zum Beispiel, oder die Links zu Wikipedia-Seiten – kann Belege haben. Es gibt Dinge, die das System einfach „glaubt“. Wenn du aber die Aussage hinzufügst, dass Kosovo ein Land ist, dann kannst du  einen Beleg hinzufügen. Andere könnten behaupten, dass Kosovo ein Teil von Serbien ist. Du kannst auch dafür einen Beleg angeben. Aber sobald du willst, dass die Nutzeroberfläsche diese Information verwendet – zum Beispiel, wenn eine Eigenschaft auf Länder beschränkt ist, – muss das System entscheiden, ob Kosovo ein unabhängiges Land ist oder nicht. Das lässt keinen Raum für die Art von Wissensvielfalt, für die Wikidata gebaut ist.

Ich sehe die Gefahr, dass ein Teil von Wikidata im Bau einer Ontologie stecken bleiben könnte. Ich glaube, dass diese Übungen fundamental nicht lösbar sein können, und daher sollte es nicht Wikidatas Aufgabe sein, diese zu lösen. Wikidata sollte meiner Meinung nach auf einer weniger abstrakten Ebene arbeiten: Lasst uns die Autoren von Aerosmiths “I Don’t Want to Miss a Thing” angeben und nicht diskutieren, ob Urheberschaft auf ein Lied angewandt werden kann oder nicht. Lasst uns den Stammbaum der britischen Monarchen erstellen und nicht diskutieren, ob offizielle Posten nur von Personen begleitet werden können. Bist du sicher, dass kein Esel je römischer Senator war? Kannst du entscheiden, ob ein Drink einen Erfinder haben sollte?

Für Menschen und Bots bietet Wikidata einen einzigartigen Ort für Kollaboration. Noch viel mehr als Wikipedia, die schon ein erstaunliches Beispiel für eine solche Umgebung ist. In Wikipedia haben wir Bots, die nach veralteten Belegen auf Webseiten suchen, nach korrekter Interpunktion und so weiter. In Wikidata können wir Bots schreiben, die schauen, ob ein Lehrer tatsächlich vor dem Tod seiner Schüler lebte. Ob alle römischen Senatoren vor dem 6. Jahrhundert gelebt haben. Ob die Summe aller Bewohner der Städte eines Landes kleiner ist als die Anzahl der Bewohner des ganzen Landes. Und die Bots, die dies prüfen, müssen einen Weg finden, ihre Ergebnisse an Menschen zu melden, die dann prüfen können, ob sie echte Inkonsistenzen entdeckt haben – entweder in der realen Welt oder in Wikidata – oder nicht.

Die Welt ist komplex. Wikidatas Ziel ist es, strukturiertes Wissen über diese komplexe Welt zu sammeln. Die Wurzeln von Wikidata, wie der Name schon sagt, sind Wikis – und Wikis bedeuten Freiheit. Basierend auf diesem Erbe ist es weder das Ziel von Wikidata Einschränkungen für bestimmte Typen von Eigenschaften zu implementieren, noch Einschränkungen für mögliche Eigenschaften von Objekten festzulegen.

(Ich habe die langweiligen technischen Details übersprungen, warum es schwierig zu implementieren wäre und welche möglichen Probleme durch die Implementierung dieser Features auftreten könnten. Es gibt ernstzunehmende Probleme dabei, aber ich wollte bei den konzeptionellen Gründen bleiben.)

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (4 Bewertungen, Durchschnitt: 4,75 von 5)
Loading...

Restricting the World

(Die deutsche Version dieses Artikels ist hier.)

This is the first in a short series of blog entries in which I explain some of the design decisions for Wikidata. They are my personal opinion, but they have a strong impact on some features or non-features of Wikidata. This is to explain them.

By Tomascastelazo (Own work)
CC-BY-SA-3.0,
via Wikimedia Commons

One of the features – others call it a bug – of Wikidata is that you can choose any item as the value for a property. Many of them do not make sense: so, if you have the article on Paris, saying that its country is goat cheese does not really make sense. Wouldn’t it be great if Wikidata knew which values for a country would make sense, and only allow you to choose those, instead of allowing any possible value here? Wouldn’t it be great if the community decided that a property like the widely used P107 could actually be restricted to the six possible values they decided on?

I strongly disagree.

Another feature – others call it a bug – of Wikidata is that you can use any property on any item. If you want to add the capital city of Julius Caesar, you’re welcome to do so. Wouldn’t it be great if Wikidata knew which properties make sense for a given item, and would not only restrict you to use those but even list the ones that still have missing values? Wouldn’t it be great if the community could create templates of properties that should all be filled out for a person, or for a city, or a country – and not allowing anything else?

I strongly disagree.

I completely agree that smarter suggestions would be great. Some of these could be pretty trivial to implement: count the frequency for the values of a property and make a suggestion based on that. What about suggesting properties? There’s lots of research going on in that area, basically something like “items with these properties also have these properties” – you might have seen that on certain shopping sites.

I am all for better suggestions. What I am strongly disagreeing with are strong restrictions. It provides far too much space for drama and edit-warring. Does every country have a capital? What is a country anyway? What should the possible values for the property „gender“ be? What are the right properties for presidents?

Anything that the system uses for building its user interface and core functionality – labels and descriptions, for example, or the links to Wikipedia pages – can not have references. This is something the system simply “believes.” On the other hand, if you add a statement saying that Kosovo is a country, you can add a reference to it. Others might say that Kosovo is a part of Serbia. You can add a reference for that too. But if you want to make the user interface use this kind of information – for example when a property is restricted to countries – the system needs to make a call whether Kosovo is an independent country or not. There is no room for the kind of knowledge diversity that Wikidata is build for.

I perceive the danger that some parts of Wikidata might get stuck in an ontology engineering exercise. I think these exercises can be fundamentally unresolvable, and thus that Wikidata’s mandate should not be to solve them. Wikidata should, in my opinion, work on a less abstract level: Let us enter the authors of Aerosmith’s “I Don’t Want to Miss a Thing”, and not discuss whether authorship can apply to a song or not. Let us trace the genealogy of the British monarch, and not whether officials can only be persons. Are you sure that no donkey has ever become a Roman senator? Can you tell whether drinks should have inventors?

Wikidata allows for a unique collaborative space for humans and bots. Much more than Wikipedia, which already sports a pretty amazing example of such an environment. In Wikipedia, we have bots checking for outdated references to websites, for correct usage of punctuation, etc. In Wikidata we can create bots that check whether a teacher has indeed lived before the death of its student. Whether all Roman senators have lived before the 6th century. Whether the population of the cities of a country add up to be less than the population of the country as a whole. And the bots doing these checks will need to find a way to report their results to humans, who can then check whether the bots discovered genuine inconsistencies – either in the real world or in Wikidata – or not.

The world is complex. Wikidata aims to collect structured knowledge about this complex world. The root of Wikidata, as the name hints, are wikis – and wikis mean freedom. Based on this legacy, Wikidata as a software does not aim to implement restricted types for properties, nor restricting sets of properties for types of item anytime soon.

(I skipped the boring technical details about why it would be hard to implement and what kind of problems could arise from implementations of the suggested features. There are some serious problems with that, but I wanted to stick with the conceptual reasons.)

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 3,86 von 5)
Loading...

Die Zukunft von Wikidata

Fast genau vor einem Jahr, im März 2012, startete Wikimedia Deutschland mit Wikidata ein völlig neues Wikimedia-Projekt. Ziel von Wikidata ist eine offene Datenbank für das Wissen der Welt zu werden, an der jeder mitarbeiten kann.  Wikidata ist das größte technische Projekt, das jemals eine der 40 Länderorganisationen der Wikimedia-Bewegung in Angriff genommen hat.

Die initiale Entwicklung des Wikidata-Projekts steht kurz vor ihrem Abschluss. Viel wurde erreicht: Bereits jetzt werden die Sprachlinks aus Wikidata in vier Wikipedien (Ungarisch, Hebräisch, Italienisch und Englisch) verwendet, und die anderen Sprachversionen werden in den nächsten Tagen folgen. Der aktuelle Stand auf Wikidata selbst ist sehr schön am Beispiel der Seite zu Russland zu sehen. Mit der Hilfe von Mitarbeitern, Freiwilligen und großzügigen Spenden von [ai]², der Gordon and Betty Moore Foundation und Google wurde hiermit der Grundstein für das erste neue Wikimedia-Projekt seit 2006 gelegt: eine skalierende Infrastruktur, die es erlaubt, in einem zentralen Wiki Daten zu verwalten und diese den Wikipedien und darüber hinaus, zum Beispiel in Blogs oder auf Webseiten, zur Verfügung zu stellen.

Das Präsidium von Wikimedia Deutschland hat entschieden, die Entwicklung von Wikidata auch 2013 mit einem Team von acht Leuten weiterzuführen. Wikimedia Deutschland finanziert diese Entwicklung aus Spendeneinnahmen.

Für das nächste Jahr wird sich das Team mit der weiteren Entwicklung und dem Wachstum von Wikidata beschäftigen. Das beinhaltet unter anderem:

  • Inbetriebnahme der dritten Phase von Wikidata: das automatische Erstellen und Aktualisieren von Listen und Visualisierungen der Daten in Wikidata
  • Erweiterung um weitere Datentypen, wie Geodaten
  • Unterstützung der Community im Wachstum und Ausbau von Wikidata, auch in Anwendung außerhalb der Wikipedien
  • Die Möglichkeit, Wikidata in den anderen Wikimedia-Projekten einzusetzen, z.B. Wikimedia Commons oder Wikivoyage

Wir erwarten, dass sich Wikidata zu einem zentralen Bestandteil der Wikimedia-Bewegung entwickeln wird. Dazu war die hervorragende Zusammenarbeit mit der Wikimedia Foundation ein essentieller Bestandteil: die Wikimedia Foundation betreibt nicht nur Wikidata, sondern auch die zahlreichen Werkzeuge, die uns bei der Entwicklung halfen. Auch stand sie uns mit Rat und Tat zur Seite. Mit der weiteren Unterstützung des Projektes zeigen wir unser Vertrauen in das Projekt und dessen Ziele, und wir gewährleisten die weitere Entwicklung und Wartung.

Wikidata hat das Potenzial für weitere „große Sprünge“: ohne die Großspenden, die das erste Jahr finanzierten, wäre Wikidata nicht möglich gewesen. Wir hoffen, dass wir für den weiteren Ausbau wieder Partner gewinnen können, die mit uns gemeinsam an dem Ziel arbeiten, das Wissen der Menschheit jedem frei verfügbar zu machen.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (11 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...