Das RENDER-Projekt erzielte beim Review exzellente Ergebnisse

Jetzt ist es ganz offiziell vorbei. Gestern, am 21. November 2013, fand das finale Reviewmeeting des RENDER-Projekts vor Vertretern der Europäischen Kommission und externen Reviewern statt. Mein Kollege Kai Nissen und ich nahmen daran für Wikimedia Deutschland teil. Dieses Treffen diente der Bewertungen der Leistungen dieses EU-geförderten Forschungsprojekts.

Bereits am Dienstag trafen wir uns mit unseren anderen Partnern in den Räumen unseres Projektkoordinators Karlsruher Instituts für Technologie. Am Dienstag und Mittwoch besprachen wir unsere Präsentationen, korrigierten letzte Fehler und probten den Durchlauf. Das eigentliche Review fand dann am Donnerstag statt. Alle Partner stellten ihre Ergebnisse des Projekts und vor allem die Arbeiten innerhalb des letzten Jahres vor. Beispielsweise zeigte Andreas Thalhammer vom STI ein spannendes Analysewerkzeug TweetVis. Mit diesem Tool kann man Tweets des eigenen oder anderer Twitter-Profile nach Themen analysieren oder herausfinden, ob diese eher positiv oder negativ formuliert sind. Kai und ich stellten die finalen Fassungen unserer Unterstützungswerkzeuge für Wikipedia vor und gaben kurze Einblicke in die Evaluationsergebnisse und unsere Pläne für die Zukunft. Unsere Präsentationsfolien sind auf Commons abrufbar.

Leider kann ich hier nicht alle Werkzeuge und Dokumente im Detail vorstellen, die während des Projekts entstanden sind. Aber diese findet man auf der Projektseite. Wer ein bisschen Zeit und Lust hat mehr zu erfahren und auszutesten, sollte diese unbedingt besuchen.

Diese anstrengenden Tage haben sich gelohnt, denn die abschließende Bewertung der Reviewer lautete:

Das RENDER-Projekt hat exzellente Ergebnisse erreicht. Die Zusammenarbeit des Konsortiums sowie die verwirklichten Werkzeuge in allen Anwendungsfällen sind bemerkenswert für ein Forschungsprojekt.

Diese Auszeichnung erhalten Projekte in ihrer Abschlussbewertung wohl nur äußerst selten. Der schriftliche Bericht wird uns in den nächsten Wochen zugestellt, dann können wir das alles noch mal in Ruhe nachlesen.

Heute startet die WikiCon in Karlsruhe. Beim Workshop am Samstagnachmittag mit dem Titel “RENDER – Wie geht’s weiter?” werde ich zusammen mit meinem Kollegen Johannes Kroll über die Weiterentwicklung des Artikelmonitors und des Artikellistengenerators sprechen. Denn diese Tools sollen jetzt keinesfalls in der Schublade verschwinden, sondern noch besser in Wikipedia integriert und bedarfsgerecht erweitert werden. Wir freuen uns dort eure Fragen zu beantworten oder auch gerne per Mail.

Zu guter Letzt möchte ich mich noch mal bei allen bedanken, die uns während der letzten drei Jahre mit Ideen, Anregungen, Fragen oder auch konstruktiven Kritiken unterstützt haben. Vielen Dank!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (14 Bewertungen, Durchschnitt: 5,00 von 5)
Loading ... Loading ...

Offener Sonntag bei Wikimedia Deutschland!

Am 1. Dezember ist es soweit: Wir öffnen am Tag nach der Mitgliederversammlung die neuen Räume von Wikimedia Deutschland für einen Tag voller Diskussionen und Workshops zu Themen eurer Wahl. Am Offenen Sonntag haben alle die Möglichkeit, ein Thema vorzustellen oder einen Workshop abzuhalten. Der Open Space als methodischer Rahmen wird einen Raum schaffen, in dem wir gemeinschaftlich, selbstorganisiert und selbstverantwortlich an allen Themen des Wikiversums arbeiten können. Jeder kann ein Anliegen, das ihm besonders am Herzen liegt, vorantreiben. Das können abstrakte und informative, aber auch persönliche Fragen und Themen sein. Das genaue Programm wird erst am Sonntagmorgen (beim Brunch!) formuliert, einige interessante Angebote sind aber schon angekündigt:

  • Offener Sonntag 2013 – Bild von Sandra Muellrick Lizenz cc-by-sa 3.0

    Landkarte der Konflikte
    Wikipedia ist ein Freiwilligenprojekt. Entsprechend zentral ist die Frage der Motivation bzw. der Demotivation. Denn die Antwort auf diese Frage bestimmt, ob Arbeiten in Wikipedia erledigt werden – oder nicht. Die Landkarte der Konflikte möchte die zentralen Punkte der Demotivation visualisieren.

  • “It’s all on Meta” – Beteiligung in der internationalen Wikimedia-Welt
    In diesem Workshop werden Tim Moritz Hector und Nicole Ebber internationale Informationskanäle vorstellen, Interesse an Themen abklopfen, Bedarf an internationaler Beteiligung identifizieren, deutschsprachige Informationsangebote diskutieren und den zukünftigen Dialog der Interessierten – untereinander und mit den Zielgruppen – anstoßen. Denn obwohl “It’s all on Meta” in der internationalen Wikimedia-Welt schon ein geflügeltes Wort ist und alles ist theoretisch irgendwo auf Meta zu finden, findet sich dort kaum jemand zurecht.

 

…und vieles andere mehr! Los geht es um 10:00 Uhr. Sebastian Wallroth wird den Open Space wieder moderieren und für euer leibliches Wohl ist den ganzen Tag über gesorgt. Der Eintritt ist frei und es gibt bei Bedarf Kinderbetreuung. Bringt gerne Freundinnen, Bekannte oder Nachbarn mit, auch Wikimedia- und Wikipedia-Neulinge sind herzlich willkommen.

Bitte gebt uns Bescheid, ob ihr kommt, das erleichtert uns die Planung und Sicherung der Essensversorgung. Alles weitere findet ihr auf der Meta-Seite und zur Anmeldung geht es auf http://wmde.org/mv13-anmeldung. Wir freuen uns auf inspirierenden Austausch!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 4,43 von 5)
Loading ... Loading ...

Daten für Alle!

In der ersten Session des ersten Wikimania präsentierte ich die Idee, Wikipedia mit strukturierten Daten anzureichern. Auf die Frage, wie lange es dauern würde das umzusetzen, antwortete ich: “Zwei Wochen, wenn man die MediaWiki-Software gut kennt.”

Das war 2005. Wie sich herausstellte lag ich leicht daneben.


Jetzt, im Jahr 2013, haben wir endlich angefangen strukturierte Daten aus Wikidata in den Wikipedien zu nutzen. Das Projekt ist noch in den Kinderschuhen, aber ich bin schon jetzt sehr stolz auf das Wikidata Team und was es erreicht hat. Ich bin den vielen, vielen Menschen, die uns geholfen haben dahin zu kommen wo wir heute sind, sehr dankbar (ich habe angefangen sie alle aufzuzählen, aber dieser Beitrag wurde zu lang). Es gibt noch viel zu tun, aber die grobe Skizze von dem was Wikidata ist und nicht ist ist gezogen worden und ich denke wir haben ein sehr interessantes neues Projekt angelegt. Ich bin sehr zuversichtlich für Wikidata und seine Zukunft, sonst würde ich nicht gehen.


Viele Menschen haben gewaltige Erwartungen an Wikidata. Es wird da viel Enttäuschungen geben: Wikidata ist kein Allheilmittel für alle Probleme und es ist nichts magisches. Aber ich habe auch bemerkt, dass mehr und mehr Menschen die Grenzen des Systems verstehen und zu schätzen wissen und innerhalb dieser Grenzen abrieten und Dinge erreichen, die fast magisch sind. Wikidata ist nirgendwo in der Nähe natürlicher Sprache wenn es um Expressivität geht, und wird es für eine lange Zeit sein. Aber mit Unterstützung für mehr Datentypen, für Abfragen, Wikimedia Commons und Wiktionary auf der Roadmap könnte Wikidata möglicherweise die weltweit wichtigste Sammlung von freien Wissens werden, und vielleicht sogar das Fundament für eine künstliche Intelligenz, an der jeder teilenhaben kann. Wir können die Entwicklung einer künstlichen Intelligenz entweder Unternehmen überlassen – oder wir können versuchen dies offen zu tun wo jeder in der Lage ist teilzuhaben. Und meiner Meinung nach ist der einzige Ort, den ich im Moment sehe, der dieser Aufgabe möglicherweise gewachsen ist ist die Wikimedia Bewegung.

Diese Woche hat Wikidata den Meilenstein von 20 Millionen Aussagen überschritten. Wir haben mehr als 750.000 Koordinaten und 250.000 Zeitpunkte. Wir haben erst begonnen die Möglichkeiten der Visualisierung dieser Daten oder die Integration mit externen Datensätze für eine noch reichere Erfahrung zu erforschen. Die tief verwurzelte Unterstützung für viele Sprachen bietet uns neue Datensätze, die in vielen unterschiedlichen Situationen verwendet werden können. Ich gehe davon aus, dass Referenzen für Aussagen zu einem wichtigen Input für NLP Training-Algorithmen werden. Wikidata wurde entwickelt, um zu ermöglichen und um zu neuen Algorithmen und Anwendungen zu führen, und wir haben bisher hier nur an der Oberfläche gekratzt.

Eine Visualisierung aller Daten in Wikidata, mit dem Jetzt in der Mitte. Der Ort eines Datenobjekts definiert seinen Winkel. Die Farbe wird durch die Art des Datenobjekts bestimmt. Zeit und Ort propagieren zu verknüpften Datenobjekten, denen diese Informationen fehlen.


Was ist meiner Meinung nach das größte Risiko für Wikidata?

Nicht verwendet zu werden.

Verwendet zu werden bedeutet, dass die Daten sichtbar werden. Fehler und Auslassungen werden auffällig und verlangen korrigiert zu werden. Verwendet zu werden stellt die Qualität der Daten sicher. Wenn eine App Daten tausend Anwendern zeigt, werden vielleicht fünfzig einen Fehler bemerken, und einer von ihnen wird vielleicht hingehen und ihn beheben. Und das ist genug – das ist das Schöne an einem zentralen Wissensspeicher.

Verwendet zu werden nimmt auch die Gefahr des Overengineerings der Ontologie. Ein Schwerpunkt auf dem Finden der “richtigen” Ontologie könnte eine Menge kostbare Zeit und Energie der Editoren kosten mit unklarem Nutzen. Die Nutzung der Daten lenkt die Vollständigkeit und Schema-Erstellung und Diskussionen auf einen viel klareren Weg. Anforderungen, die von Nutzung der Daten in Wikipedia und sekundär in externen Anwendungen kommen, bringen einen viel höheren Nutzen. Ein weiterer Vorteil, der zunehmend sichtbar werden wird, ist die Tatsache, dass Wikidata viel zugänglicher für Bot-gesteuertes “Daten Refactoring” ist als Wikipedia es je sein könnte.

Verwendet zu werden wird auch dazu führen, dass mehr Menschen Wikidata nutzen und beitreten wollen. Sei es die Nutzung von QIDs, Wikidata-Identifier, um zu einer zentralen, webbasierten Wissensbasis zu linken, sei es um eine kleine Anwendung oder Webseite intelligenter zu machen, sei es um völlig neuartigen Anwendungen zu erstellen: Je mehr Wikidata verwendet wird, desto mehr Augen sind auf ihm, direkt oder indirekt, desto mehr Energie wird für die Verbesserung und Aufrechterhaltung von Wikidata aufgebracht werden.

Ich bin überaus zufrieden mit dem Wachstum der Wikidata-Community. Ich sehe noch nicht den breiten Einsatz in der Datennutzung. Entscheidend wird sein, dies in Zukunft zu erhöhen – und ich habe keinen Zweifel daran, dass die Pläne für Wikidata dafür gut aufgestellt sind.


Was sind die größten Stärken von Wikidata?

Die Community. Das sagt alles. Sie ist einfach unglaublich. Unglaublich fantastisch. Mein tiefster Dank geht an die Community.

Die enge Integration mit Wikipedia und anderen Wikimedia-Projekten. Dies gab uns einen enormen Vorsprung gegenüber vergleichbaren Projekten und die positiven Effekte können nicht überschätzt werden. Ohne die unmittelbare Anbindung an Wikipedia, sei es durch die Sprachlinks, die verwendet wurden um eine Objektdatenbank zu erstellen, seien es die Infoboxen, die verwendet werden, um die Erstellung der Wisensbasis zu leiten, wäre eine Menge Energie verpufft. Und die Gruppe der Menschen die Zeit und Energie investieren wäre viel kleiner gewesen.

Die extreme Flexibilität des Wissensmodells und die solide Erdung seiner Semantik in Standards wie OWL. Wikidata an Wiki-Prinzipien zu binden und auf der MediaWiki-Software aufzubauen hat uns eine riesige Palette an getesteten, community-orientierten Werkzeugen und Grundsätzen gegeben. So viele Einschränkungen wie möglich von der Community durchsetzen zu lassen und nicht von der Software selbst ermöglichte ein Wachstum weit über die engen Grenzen der Phantasie des Entwickler.


Die Veröffentlichung dieser Beitrag ist meine letzte Aktion als Direktor des Wikidata Projekt. Es war eine tolle Zeit, und ich freue mich darauf, zu sehen, wie sich Wikidata entwickeln wird. Von nun an bin ich ein Mitglied der Community und ich bin gespannt zu sehen wie es weiter wächst.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 4,71 von 5)
Loading ... Loading ...

Data for the people!

(Die deutsche Version dieses Beitrags ist hier.)

In the first session of the first Wikimania, I presented the idea of enriching Wikipedia with structured data. Asked how long it would take to implement this, I answered: “Two weeks, if you know the MediaWiki software well.”

That was in 2005. It turned out, I would be slightly off.


Now, in 2013, we finally started using structured data from Wikidata in the Wikipedias. The project is still in its infancy, but I am already extremely proud of the Wikidata team and what they have achieved. I am very thankful to the many, many people that helped us get to where we are today (I started listing them explicitly, but this post became too long). There are still many things that need to be done, but the rough sketch of what Wikidata is and is not has been drawn, and I think we have created a very interesting new project. I am confident enough about Wikidata and its future, or else I would not be leaving.


Many people are projecting formidable expectations onto Wikidata. There will be plenty of disappointments there: Wikidata is not a panacea to all problems, and it is nothing magical. But I also notice more and more people understanding and appreciating the limits of the system, and working within these limits and achieving things that are close to magical. Wikidata is nowhere near natural language in expressivity, and won’t be for a long time. But with support for more datatypes, for queries, Wikimedia Commons and Wiktionary on the roadmap, Wikidata could possibly become the world’s most important repository of free knowledge, and maybe even a foundation for an artificial intelligence in which everyone can share in. We can leave the development of an artificial intelligence either to companies — or we can try to have this happen in the open with everyone able to join. And in my opinion, the only place that I currently see that is possibly up to this task, is the Wikimedia movement.

This week, Wikidata crossed the milestone of 20 Million statements. We have more than 750,000 coordinates and 250,000 points in time. We only started exploring the possibilities of visualizing this data or integrating it with external datasets for an even richer experience. The deeply-ingrained support for many languages provides us with novel datasets that can be used in many different circumstances. I expect references for statements to become a major input for NLP training algorithms. Wikidata has been devised to become an enabler and to lead to novel algorithms and applications, and we only scratched the surface here.

A visualization of all Wikidata data, with the present in the center and the location defining the angle of an item. The color is given by the type of the item. Time and location propagates to connected items that lack this information.


What is the biggest risk for Wikidata in my opinion?

Not to be used.

To be used means that the data becomes visible. Errors and omissions become glaring, and beg to be corrected. To be used ensures the quality of the data. If an app displays data to a thousand users, maybe fifty will notice an error, and maybe one of them will actually go ahead and fix it. And that is enough — this is the beauty of a central knowledge repository.

To be used also will remove the risk of overengineering the ontology. A focus on getting the ontology “right” could use up a lot of precious contributor time and energy with unclear benefits. Usage of the data will drive completeness and schema creation and discussions in a much clearer way. Requirements that come from Wikipedia’s usage of the data and, secondary, from external applications will yield a much higher benefit. Another advantage that will play out increasingly is the fact that Wikidata is much more amenable to bot-driven “data refactoring” than Wikipedia ever could be.

To be used will also lead to visibility, and thus to more people using it, thus to more people wanting to join Wikidata. Be it by using Qids, Wikidata-Identifiers, to link to a central, Web-based knowledge base, be it by using Wikidata to make a small application or Website more intelligent, be it by using Wikidata to create completely novel applications: the wider Wikidata is used, the more eyeballs are on it, directly or indirectly, the more energy will be spent in improving and maintaining Wikidata.

I am extremely happy with the growth of the Wikidata-Community. I am not seeing yet the wide adoption in data usage. It will be crucial to increase this in the future — and I have no doubt that the plans for Wikidata are set up well for that.


What are the biggest strengths of Wikidata?

The community. ‘nuff said. They are simply amazing. Unbelievably amazing. My deepest gratitude goes to them.

The tight integration with Wikipedia and the other Wikimedia projects. This gave us a huge head start over comparable projects, and the positive effects of that cannot be overestimated. Without the immediate connection to Wikipedia, be it the language links that were used to build an entity base, be it the infoboxes that are used to guide the creation of the knowledge, a lot of energy would have dissipated. And the group of people investing time and energy would have been much smaller.

The extreme flexibility of the knowledge model, and it the sound grounding of its semantics in standards like OWL. Keeping Wikidata tied to wiki-principles and building on the MediaWiki software gave us a huge array of tested, community oriented tools and principles. To let as many restrictions as possible be enforced by the community and not by the software allowed for a growth well beyond the tight limitations of the developers’ imagination.


Publishing this post is my last action as director of the Wikidata project. It was a great time, and I am looking forward to see how Wikidata will develop. From now on, I am a member of the community, and I am excited to see it grow.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 5,00 von 5)
Loading ... Loading ...

Raum für Freies Wissen & Friends

Platz für Treffen und Workshops bei Wikimedia Deutschland – Photo by Dr. Bernd Gross [CC-BY-SA-3.0], via Wikimedia Commons

Die Räume von Wikimedia Deutschland sind nicht nur ein Büro, sondern funktionieren für kleinere Treffen und Workshops auch als Projektspace für die Wikimedia-Communitys und weitere Freundinnen und Freunde freien Wissens.

Bekannt geworden z.B. durch die Offenen Sonntage im Barcamp-Format oder einige Arbeitsgruppentreffen, wird diese Möglichkeit immer häufiger genutzt. Eine kleine Zusammenstellung der nächsten Aktivitäten stelle ich Euch heute vor. Noch mehr spannende Termine findet Ihr auf wikimedia.de/wiki/Veranstaltungen

An diesem Wochenende zum Beispiel haben wir ganz besonders musikalische Gäste. Die musicbrainz singen bei ihrem Summit aber nicht, sondern arbeiten gemeinsam an der Verbesserung der größten freien Datenbanksammlung von Informationen rund um Musik. musicbrainz.org/doc/MusicBrainz_Summit/13

Am Wahlsonntagabend (diesen Sonntag, am 22.9., aber das wisst Ihr ja alle schon) wird der Space dann zu einer temporären Fotoredaktion für das Fotoprojekt zur Bundestagswahlde.wikipedia.org/wiki/Wikipedia:Fotoprojekt/Bundestagswahl_2013

Am Donnerstag, 26. September, findet dann um 19 Uhr die nächste Ausgabe “Offenes Editieren” statt. Ob Neueinsteiger oder alte Häsin, gemeinsam wird an Wikipedia-Artikeln gearbeitet – auch ohne Anmeldung für Gäste offen! de.wikipedia.org/wiki/Wikipedia:Berlin#Offenes_Editieren

Am Wochenende danach trifft sich am selben Ort das Board von KDE e.V. zum halbjährlichen Meeting, um die weitere Ausgestaltung der Unterstützung der KDE-Community zu entwickeln. KDE produziert Freie Software für Linux, Mac und Windows, unter anderem einen grafischen Desktop für Linux, ein naturalistisches Zeichenprogramm und einen Desktop-Globus. de.wikipedia.org/wiki/KDE

Am Mittwoch, 16.10. ab 16 Uhr veranstaltet die Open Knowledge Foundation (u.a. Betreiberin von fragdenstaat.de) einen Workshop zum Thema Informationsfreiheit. (Save the Date, noch ohne Link.)

Und Anfang November begrüßen wir dann die  Entwicklercommunity der Videolan Association, die im Space an der Weiterentwicklung von VLC und anderer freier Multimedia-Software arbeiten wird. www.videolan.org/projects/

Und weil es ganz schön aufwendig ist, für ein offenes Abend-Treffen mit Community-Mitglieder kurzfristig z.b. aus NRW extra nach Berlin zu kommen, unterstützen wir aktuell verschiede lokale Gruppen beim Schaffen von weiteren Möglichkeiten für solche Veranstaltungen und Projekträume an Orten außerhalb Berlins. Am Sonntag, 6.10. findet dazu ein Workshop in, nein, nicht in Berlin, sondern in der Jugendherberge Köln-Deutz statt. de.wikipedia.org/wiki/Wikipedia:Workshop_Köln

Wenn Ihr selber Ideen für solche Veranstaltungen habt, ob in den Räumen der Geschäftsstelle in Berlin oder in anderen Stadt- oder Landregionen: Meldet Euch gerne. Entweder bei mir direkt sebastian.sooth@wikimedia.de oder bei community@wikimedia.de.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 5,00 von 5)
Loading ... Loading ...

Freiwillige berichten vom Fotoflug im Sauerland

Blick auf das Kloster Grafschaft
(Schmallenberg, Sauerland)
Foto: Teta, CC-BY-SA 3.0* (via Wikimedia Commons)

 

Ein Gastbeitrag von Falkmart

Auf Initiative des Wikiprojekts Sauerland wurde am 6. Juli über dem östlichen Sauerland ein erster Fotoflug durchgeführt. Die Region erstreckt sich über Teile von Nordrhein-Westfalen und Hessen. Beim ersten Flug wurden unter anderem Berge, Seen, Gebäude und Orte im östlichen Sauerland, insbesondere im Hochsauerlandkreis und Hessischen Upland, abgelichtet. Finanziert wurde der Flug aus dem Community Budget von Wikimedia Deutschland.
Innerhalb von drei Stunden folg die gecharterte Donier Do27 rund 600 Kilometer. An Bord befanden sich neben dem Piloten, ein Navigator und zwei Fotografen. 1350 Fotos wurden danach bei Commons hochgeladen. Abschließend gelang es den Projektmitarbeitern die  enstandenen Bilder innerhalb von fünf Wochen zu lokalisieren, die Fotos zu beschriften und zu kategorisieren. Bis zum 20. August wurden außerdem 268 Fotos in deutschsprachige Artikel der Wikipedia eingefügt. In den nächsten Jahren sollen drei weitere Flüge durchgeführt werden, um die Region vollständig abzudecken, wobei natürlich auch wieder Objekte aufgenommen werden, die knapp außerhalb der Region liegen.

* CC-BY-SA 3.0: http://creativecommons.org/licenses/by-sa/3.0/de/

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 5,00 von 5)
Loading ... Loading ...