Archiv für die ‘Technisches’ Kategorie



Wikidata all around the world

(Die deutsche Version dieses Artikels ist hier)

Since one month 11 Wikipedias have the ability to include data from Wikidata in their articles. Two days ago English Wikipedia was added to that group. Today the remaining 274 are joining. Usage examples are in the last blog entry. There is also an FAQ for this deployment.

This is a huge step for Wikidata and at the same time also another beginning. It’s a huge step because from now on all Wikipedias are able to collect, curate and use data together. For example every Wikipedia can query the ID of a movie on the Internet Movie Database and use it in their article as soon as someone added it to Wikidata. At the same time it is a beginning because there is still a lot to do. Accessing the data has to be made easier. More data has to be added to Wikidata (and translated where necessary). More sources have to be added to existing claims. More data types need to be made available – for example geocoordinates and time. Your help and your Feedback is very welcome and important there.

We’re looking forward to the next steps!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (1 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

And that makes 12

(Die deutsche Version dieses Beitrags gibt es hier.)

Today the English Wikipedia got the ability to include data from Wikidata. Four weeks ago the first 11 Wikipedias started testing this second phase of the project. This means by now 12 Wikipedias can make use of the shared data in their infoboxes for example. The available data includes things like conservation status for a species, ISBN for a book or the top level domain of a country.

A Request for Comments about how to use data from Wikidata is currently ongoing. Until the Request for Comments is closed you can continue to try it out on test2.wikipedia.org.

There are two ways to access the data:

  • Use a parser function like {{#property:p159}} in the wiki text of the article on the Wikimedia Foundation. This will return “San Francisco” as that is the current headquarters location of the non-profit.
  • For more complicated things you can use Lua. The documentation for this is here.

We are working on expanding the parser function so you can for example use {{#property:headquarters location}} instead of {{#property:p159}}. The complete plan for this is here.

The next step is the deployment on all remaining 274 Wikipedias. If there are no issues they will follow on Wednesday.

There is an FAQ for this deployment. Please help us with testing and feedback. The best place to leave feedback is this discussion page.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Und dann waren es 12

Ab sofort ist es möglich in der englischsprachigen Wikipedia Daten von Wikidata einzubinden. Vor vier Wochen haben die ersten 11 Wikipedien angefangen diese zweite Phase des Projekts zu testen. Das bedeutet, dass mittlerweile 12 Wikipedien die Daten zum Beispiel in ihren Infoboxen verwenden können. Die verfügbaren Daten beinhaltet Dinge wie den Status auf der Roten Liste für eine Tier- oder Pflanzenart, die ISBN für ein Buch oder die Top-Level-Domain eines Landes.

Es läuft aktuell ein Meinungsbild darüber wie Daten aus Wikidata genutzt werden sollen. Bis das Meinungsbild abgeschlossen ist kannst du es weiterhin zum Beispiel auf test2.wikipedia.org ausprobieren.

Es gibt 2 Wege auf die Daten zuzugreifen:

  • Benutze eine Parserfunktion wie {{#property:p159}} im Wikitext des Artikels über die Wikimedia Foundation. Das wird “San Francisco” zurückgeben da es der aktuelle Sitz der Foundation ist.
  • Für kompliziertere Sachen kannst du Lua benutzen. Die Dokumentation dazu ist hier.

Wir arbeiten daran die Parserfunktion auszubauen damit du zum Beispiel {{#property:Sitz der Hauptverwaltung}} statt {{#property:p159}} nutzen kannst. Der vollständige Plan dafür ist hier.

Der nächste Schritt ist die Inbetriebnahme auf den restlichen 274 Wikipedien. Vorrausgesetzt es treten keine Probleme auf wird dies am Mittwoch passieren.

Es gibt Antworten auf die häufigsten Fragen für dieses Deployment. Bitte hilf uns durch Testen und deine Rückmeldungen. Der beste Ort für Rückmeldungen ist diese Diskussionsseite.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Du kannst alle Daten haben!

Seit heute haben die ersten Wikipedien die Möglichkeit Daten aus Wikidata in ihren Artikeln einzubinden. Es sind die italienische, hebräische, ungarische, russische, türkische, ukrainische, usbekische, kroatische, bosnische, serbische und serbo-kroatische Wikipedien. Wenn du neugierig bist kannst du es auch auf test2.wikipedia.org ausprobieren. Das heißt, dass die Autoren auf diesen Wikipedien ab sofort die wachsende Menge an strukturierten Daten die auf Wikidata verfügbar ist als gemeinsame Datenbasis nutzen können. Es beinhaltet Dinge wie den Status auf der Roten Liste für eine Tier- oder Pflanzenart, die ISBN für ein Buch oder die Top-Level-Domain eines Landes.

Es gibt 2 Wege auf die Daten zuzugreifen:

  • Benutze eine Parserfunktion wie {{#property:p169}} im Wikitext des Artikels über Yahoo!. Das wird “Marissa Mayer” zurückgeben da sie der Chief Executive Officer der Firma ist.
  • Für kompliziertere Sachen kannst du Lua benutzen. Die Dokumentation dazu ist hier.

Wir arbeiten daran die Parserfunktion auszubauen damit du zum Beispiel {{#property:chief executive officer}} statt {{#property:p169}} nutzen kannst. Der vollständige Plan dafür ist hier.

Der nächste Schritt ist die Inbetriebnahme auf den restlichen Wikipedien. Wir werden die Performance genau beobachten und wenn es keine Probleme gibt werden sie innerhalb von ein oder zwei Wochen folgen.

Wir haben die häufigsten Fragen für dieses Deployment zusammengestellt und freuen uns auf dein Testen und deine Rückmeldungen. Der beste Ort für Rückmeldungen ist diese Diskussionsseite.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

You can have all the data!

(Die deutsche Version dieses Beitrags gibt es hier.)

Today the first 11 Wikipedias got the ability to include data from Wikidata in their articles. These are the Italian, Hebrew, Hungarian, Russian, Turkish, Ukrainian, Uzbek, Croatian, Bosnian, Serbian and Serbo-Croatian Wikipedias. If you are curious you can also try it out on test2.wikipedia.org. This means the editors on these Wikipedias are now able to make use of the growing amount of structured data that is available in Wikidata as a common dataset. It includes things like conservation status for a species, ISBN for a book or the top level domain of a country.

There are two ways to access the data:

  • Use a parser function like {{#property:p169}} in the wiki text of the article on Yahoo!. This will return “Marissa Mayer” as she is the chief executive officer of the company.
  • For more complicated things you can use Lua. The documentation for this is here.

We are working on expanding the parser function so you can for example use {{#property:chief executive officer}} instead of {{#property:p169}}. The complete plan for this is here.

The next step is the deployment on the other Wikipedias. We will carefully monitor performance and if there are no issues they will follow within a week or two.

We have prepared an FAQ for this deployment and are looking forward to your testing and feedback. The best place to leave feedback is this discussion page.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (4 Bewertungen, Durchschnitt: 4,50 von 5)
Loading...

Some data on Wikidata

(Die deutsche Version dieses Artikels ist hier.)

This weekend we saw the creation of the 7th Million item on Wikidata. We had already collected some data based on the Wikidata database dumps, but now we extended the scripts so that they can provide us with daily updates. We want to use this chance to publish a few statistics.

Within the last month – since statements got enabled – more than 660,000 of these items also got statements about them, resulting in more than 1.4 Million statements. The item with the most statements is the United Nations (Q1065), listing all member states. The growth of the number of statements is amazing and well beyond what we expected.

So far we have more than 22 Million links to Wikipedia articles. There are about 24-25 Million Wikipedia articles, which means that we have more than 90% of all links already in Wikidata. Assuming the bots continue working as efficiently as they did so far, all links could be transferred in about a month or two, and then the rapid growth in the number of items is expected to slow down considerably.

At the same time, the edits on Wikidata are increasing a lot. With more than 12.5 Million edits as of now, Wikidata is one of the most dynamic Wikimedia projects. One might say that this is all due to bot activity — but that would be very wrong. About 2 Million edits have been done by human editors, and actually the percentage of edits performed by human editors is increasing. More than 4,500 human editors have been active on Wikidata in the last thirty days.

Regarding labels and descriptions, Wikidata has collected more than 23 Million labels and more than 5 Million descriptions so far, in 333 languages. We see a great opportunity for external tools and websites to help us with collecting labels and descriptions, as they basically provide the translation of the content of Wikidata and make its content available in many languages simultaneously.

It is still too early to really understand what these numbers mean, but we can clearly state that the activity of the community exceeds the hopes of the development team. Although many features are still missing, the warm embrace of the Wikidata project in its current state by the Wikimedia communities is simply amazing, and I can only say „thank you“ to those thousands and thousands of editors for their contribution to free knowledge.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (1 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Ein paar Daten zu Wikidata

Am Wochenende wurde das 7-millionste Objekt in Wikidata angelegt. Wir hatten schon ein paar Daten basierend auf den Wikidata Datenbankexporten gesammelt, haben aber jetzt die Skripte so erweitert, dass sie uns täglich mit Updates versorgen können. Wir wollen diese Möglichkeit nutzen, um ein paar Statistiken zu veröffentlichen.

Vor einem Monat wurden Aussagen in Wikidata verfügbar gemacht. Inzwischen sind zu mehr als 660.000 Objekten auch Aussagen hinzugefügt worden, was im Endergebnis mehr als 1,4 Millionen Aussagen bedeutet. Das Objekt mit den meisten Aussagen ist das Objekt „Vereinte Nationen (Q1065)„, welches alle Mitgliedsstaaten auflistet. Das Wachstum der Aussagenmenge ist großartig und übertrifft unsere Erwartungen.

Bisher haben wir mehr als 22 Millionen Links zu Wikipedia Artikeln. Es gibt etwas 24 bis 25 Millionen Wikipedia-Artikel, was also bedeutet, dass wir bereits mehr als 90% aller Links in Wikidata haben. Angenommen die Bots arbeiten weiterhin so effizient wie bisher, sollten alle Links in einem oder zwei Monaten übertragen sein. Danach ist es zu erwarten, dass das Wachstum in der Anzahl der Objekte erheblich zurückgeht.

Zur gleichen Zeit gibt es mehr und mehr Bearbeitungen auf Wikidata. Mit bisher mehr als 12,5 Millionen Edits ist Wikidata eines der dynamischsten Wikimedia-Projekte. Man könnte jetzt sagen, dass das alles nur durch Botaktivität zustande kommt – aber das wäre falsch. Etwa 2 Millionen Bearbeitungen wurden von menschlichen Editoren vorgenommen und der Prozentsatz der Bearbeitungen durch Menschen steigt. Mehr als 4.500 menschliche Editoren waren in den letzten 30 Tagen auf Wikidata aktiv.

Zu Labels und Beschreibungen: Wikidata hat bisher mehr als 23 Millionen Labels und mehr als 5 Millionen Beschreibungen gesammelt, in 333 Sprachen. Wir sehen eine große Möglichkeit für externe Werkzeuge und Webseiten, uns beim Zusammentragen von Labels und Beschreibungen zu helfen, da diese die Übersetzung des Inhalts von Wikidata bereitstellen und seinen Inhalt in vielen Sprachen gleichzeitig zur Verfügung stellen.

Es ist noch zu früh, um wirklich zu verstehen, was diese Zahlen bedeuten, aber wir können ganz klar sagen, dass die Arbeit der Community die Hoffnungen des Entwicklungsteams bei Weitem übersteigen. Auch wenn noch viele Features fehlen, ist die warmherzige Begrüßung des Wikidata-Projekts durch die Wikimedia-Communitys einfach großartig und ich kann nur „Danke!“ an die tausenden Editoren sagen für ihren Beitrag zum Freien Wissen.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (5 Bewertungen, Durchschnitt: 4,20 von 5)
Loading...

Wikidata jetzt auf allen Wikipedien

Heute haben wir Wikidatas Sprachlinkunterstützung auf allen verleibenden Wikipedien freigeschalten. (Also alle verbleibenden 282 außer Ungarisch, Hebräisch, Italienisch und Englisch.) Das heißt, dass ab sofort die Links in der linken Seitenleiste die auf Artikel zum gleichen Thema in anderen Sprachen verlinken jetzt von Wikidata kommen.

Was heißt das genau?

  • Sprachlinks in der Seitenleiste kommen automatisch von Wikidata, wenn die entsprechende Seite auf Wikidata einen Link zum Artikel hat. Es ist keine spezielle Syntax notwendig.
  • Existierende Sprachlinks im Wikitext werden weiterhin funktionieren und überschreiben Links von Wikidata.
  • Für individuelle Artikel können Sprachlinks von Wikidata komplett unterbunden werden mit der Funktion noexternallanglinks.
  • Änderungen auf Wikidata die mit einem Artikel in der Wikipedia zu tun haben werden in Letzte Änderungen und Beobachtungsliste angezeigt, wenn die Option vom Nutzer aktiviert wurde. (Es gibt noch ein paar Probleme falls Erweiterte Letzte Änderungen aktiviert sind.)
  • Am Ende der Liste der Sprachlinks gibt es einen Link um die Sprachlinks zu editieren der dich zur verlinkten Seite auf Wikidata führt.
  • Du kannst ein Beispiel dafür im Artikel über den Eigentlichen Langohrigel sehen.
  • Die zweite Phase (Behauptungen/Infoboxen) ist auf Wikidata in Betrieb, kann aber noch nicht in den Wikipedien genutzt werden. Es soll gegen Ende des Monats auf den ersten Wikipedien freigeschalten werden. Der Rest wird kurz darauf folgen.

Eine Liste der am häufigsten gestellten Fragen gibt es hier und Dokumentation hier.

Auf dem Laufenden bleiben und mitmachen

Es gibt verschiedene Wege auf dem Laufenden zu bleiben über alles was rund um Wikidata passiert. Der wöchentliche Newsletter ist der Wichtigste. Du kannst dich hier eintragen um es auf deine Diskussionsseite geliefert zu bekommen. Es gibt auch Accounts auf Twitter, identi.ca, Facebook und Google+.
Wenn du bei Wikidata mitmachen willst ist diese Seite ein guter Start.

Sprechstunde im IRC

Diesen Freitag um 18:00 Uhr wird es eine Sprechstunde zu Wikidata im IRC geben. Mehr Details dazu gibt es auf Meta.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Wikidata now live on all Wikipedias

(Die deutsche Version dieses Eintrags ist hier.)

Today we have enabled Wikidata’s language link support on all remaining Wikipedias. (So all 282 remaining ones except Hungarian, Hebrew, Italian and English.) This means the links in the sidebar that link to articles on the same topic in other languages are now coming from Wikidata.

What does this mean exactly?

  • Language links in the sidebar are automatically coming from Wikidata, once the article is linked on Wikidata. No special syntax is needed for that.
  • Existing language links in the wikitext will continue to work and overwrite links from Wikidata.
  • For individual articles, language links from Wikidata can be suppressed completely with the noexternallanglinks magic word.
  • Changes on Wikidata that relate to articles on this Wikipedia show up in Recent Changes and Watchlist, if the option is enabled by the user. (There are still some issues with this when you have enhanced recent changes enabled.)
  • At the bottom of the language links list you will see a link to edit the language links that leads you to the linked page on Wikidata.
  • You can see an example of how it looks in the article about the long-eared hedgehog.
  • The second phase (which is about statements/infoboxes) is in use on Wikidata, but can’t yet be used on any Wikipedia. It is scheduled to be enabled on the first few Wikipedias at the end of the month. The rest will follow soon after that.

An FAQ for editors is here and documentation exists here.

Staying up-to-date and contributing

There are several ways to stay up-to-date on everything happening around Wikidata. The weekly status updates are the most important ones. You can add yourself here to have them delivered to your talk page on-wiki. There is also Twitter, identi.ca, Facebook and Google+.
If you’d like to contribute to Wikidata this page is a good start.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 4,29 von 5)
Loading...

Die Welt begrenzen

Dies ist der erste in einer kurzen Serie von Blogeinträgen, in denen ich einige Design-Entscheidungen für Wikidata erkläre. Dies sind persönliche Meinungen, aber sie haben einen großen Einfluss auf Features oder Non-Features von Wikidata. Diese sollen hier erklärt werden.

By Tomascastelazo (Own work)
CC-BY-SA-3.0,
via Wikimedia Commons

Eines der Features – andere Menschen nennen es Bug – ist, dass man jedes Objekt als Wert einer Eigenschaft festlegen kann. Viele davon ergeben keinen Sinn: Wenn man einen Artikel zu Paris hat und dann sagt, dass das zugehörige Land Ziegenkäse ist, ergibt nicht wirklich Sinn. Wäre es nicht toll, wenn Wikidata wüsste, welche Werte für ein Land sinnvoll sind und dir erlauben würde, nur diese auszuwählen anstatt alle möglichen anderen Werte zuzulassen? Wäre es nicht toll, wenn die Community entscheidet, dass eine Eigenschaft wie das vielgenutzte P107 auf die sechs Werte eingeschränkt wird, für die die Community sich entschieden hat?

Ich stimme dem absolut nicht zu.

Ein weiteres Feature – andere nennen es Bug – von Wikidata ist, dass du jede Eigenschaft für jedes Objekt verwenden kannst. Wenn du die Hauptstadt von Julius Caesar angeben willst, kannst du das tun. Wäre es nicht toll, wenn Wikidata wüsste, welche Eigenschaften für ein bestimmtes Objekt sinnvoll sind und dich dann nicht nur auf diese beschränkt, sondern sogar auflistet, welche Eigenschaften noch keine Werte haben? Wäre es nicht toll, wenn die Community Vorlagen mit allen Eigenschaften anlegen könnte, die für eine Person, für eine Stadt oder für ein Land angegeben werden müssen – und nichts anderes erlaubt wäre?

Ich stimme dem absolut nicht zu.

Ich bin der Meinung, dass schlauere Vorschläge großartig wären. Einige davon könnten relativ trivial zu implementieren sein: Zähle die Häufigkeit der Werte für eine bestimmte Eigenschaft und mache basierend darauf Vorschläge. Und was ist mit Vorschlägen für Eigenschaften? Es wird viel in diesem Bereich geforscht, im Prinzip so etwas wie „Objekte mit diesen Eigenschaften haben auch jene Eigenschaften“. Du hast das vielleicht schon auf einigen Shoppingseiten gesehen.

Ich bin absolut für bessere Vorschläge. Ich bin jedoch gegen harte Einschränkungen. Es gibt hier viel zu viel Raum für Drama und Edit-wars. Hat jedes Land eine Hauptstadt? Was ist überhaupt ein Land? Was sollen die möglichen Werte für die Eigenschaft Geschlecht sein? Was sind die richtigen Eigenschaften für Presidenten?

Nicht alles, was das System nutzt, um die Nutzeroberfläche und Hauptfunktionalität zu bauen – Bezeichnungen und Beschreibungen zum Beispiel, oder die Links zu Wikipedia-Seiten – kann Belege haben. Es gibt Dinge, die das System einfach „glaubt“. Wenn du aber die Aussage hinzufügst, dass Kosovo ein Land ist, dann kannst du  einen Beleg hinzufügen. Andere könnten behaupten, dass Kosovo ein Teil von Serbien ist. Du kannst auch dafür einen Beleg angeben. Aber sobald du willst, dass die Nutzeroberfläsche diese Information verwendet – zum Beispiel, wenn eine Eigenschaft auf Länder beschränkt ist, – muss das System entscheiden, ob Kosovo ein unabhängiges Land ist oder nicht. Das lässt keinen Raum für die Art von Wissensvielfalt, für die Wikidata gebaut ist.

Ich sehe die Gefahr, dass ein Teil von Wikidata im Bau einer Ontologie stecken bleiben könnte. Ich glaube, dass diese Übungen fundamental nicht lösbar sein können, und daher sollte es nicht Wikidatas Aufgabe sein, diese zu lösen. Wikidata sollte meiner Meinung nach auf einer weniger abstrakten Ebene arbeiten: Lasst uns die Autoren von Aerosmiths “I Don’t Want to Miss a Thing” angeben und nicht diskutieren, ob Urheberschaft auf ein Lied angewandt werden kann oder nicht. Lasst uns den Stammbaum der britischen Monarchen erstellen und nicht diskutieren, ob offizielle Posten nur von Personen begleitet werden können. Bist du sicher, dass kein Esel je römischer Senator war? Kannst du entscheiden, ob ein Drink einen Erfinder haben sollte?

Für Menschen und Bots bietet Wikidata einen einzigartigen Ort für Kollaboration. Noch viel mehr als Wikipedia, die schon ein erstaunliches Beispiel für eine solche Umgebung ist. In Wikipedia haben wir Bots, die nach veralteten Belegen auf Webseiten suchen, nach korrekter Interpunktion und so weiter. In Wikidata können wir Bots schreiben, die schauen, ob ein Lehrer tatsächlich vor dem Tod seiner Schüler lebte. Ob alle römischen Senatoren vor dem 6. Jahrhundert gelebt haben. Ob die Summe aller Bewohner der Städte eines Landes kleiner ist als die Anzahl der Bewohner des ganzen Landes. Und die Bots, die dies prüfen, müssen einen Weg finden, ihre Ergebnisse an Menschen zu melden, die dann prüfen können, ob sie echte Inkonsistenzen entdeckt haben – entweder in der realen Welt oder in Wikidata – oder nicht.

Die Welt ist komplex. Wikidatas Ziel ist es, strukturiertes Wissen über diese komplexe Welt zu sammeln. Die Wurzeln von Wikidata, wie der Name schon sagt, sind Wikis – und Wikis bedeuten Freiheit. Basierend auf diesem Erbe ist es weder das Ziel von Wikidata Einschränkungen für bestimmte Typen von Eigenschaften zu implementieren, noch Einschränkungen für mögliche Eigenschaften von Objekten festzulegen.

(Ich habe die langweiligen technischen Details übersprungen, warum es schwierig zu implementieren wäre und welche möglichen Probleme durch die Implementierung dieser Features auftreten könnten. Es gibt ernstzunehmende Probleme dabei, aber ich wollte bei den konzeptionellen Gründen bleiben.)

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (4 Bewertungen, Durchschnitt: 4,75 von 5)
Loading...