Archiv für die ‘Freies Wissen’ Kategorie



Evaluierung von govdata.de und Bitte zur Teilnahme

Anfang des Jahres hat sich Wikimedia Deutschland an der gemeinsamen Erklärung  “Den Standard endlich auf ‘offen’ setzen!” beteiligt. Anlass dieser Erklärung war unsere Kritik an der Lizenzpolitik von govdata.de, dem vom Bundesinnenministerium gestarteten Datenportal für Verwaltungsdaten aus Bund, Ländern und Kommunnen. Acht Monate nach dem Beta-Start von govdata.de soll das Portal einer ausführlichen Evaluation unterzogen werden, ausgeführt von Capgemini. Teil dieser Evaluation ist auch ein Onlinefragebogen, der bis Ende Oktober 2013 beantwortet werden kann. Wir geben gerne die Bitte des Innenministeriums weiter, sich zahlreich an der Beantwortung dieses Fragebogens zu beteiligen.

Der Fragebogen ist sehr kurz, eine Beantwortung innerhalb von unter 10 Minuten möglich. Lizenzfragen werden ausgespart, allerdings gibt es eine letzte offene Frage für weitere Anmerkungen.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (Noch keine Bewertungen)
Loading...Loading...

Der Himmel über Berlin…. ist seit heute frei

Zwei Ereignisse sind heute für Berlin von Relevanz: Der 60. Geburtstag des Regierenden Bürgermeisters Klaus Wowereit und das Inkrafftreten der neuen Preise und Bezugsbedingungen für die amtlichen Karten und weiteren Produkte der Geoinformation. Das erste Ereignis erhält die ihm gebührende allgemeine Aufmerksamkeit, wir wollen nun dazu beitragen, Letzteres ans Licht der Öffentlichkeit zu bringen.

Die Änderung ist eine kleine Revolution: Seit dem 1. Oktober 2013 ist die Nutzung der Geodaten und Geodatendienste des Landes Berlin sowohl für kommerzielle wie nichtkommerzielle kostenfrei möglich. Die (Meta-)Daten dürfen  insbesondere vervielfältigt, ausgedruckt, präsentiert, bearbeitet sowie an Dritte übermittelt, mit eigenen Daten und Daten Anderer zusammengeführt, zu selbständigen Datensätzen verbunden, in interne und externe Geschäftsprozesse und Anwendungen in öffentlichen und nicht öffentlichen elektronischen Netzwerken eingebunden werden. Dies alles mit Quellenvermerkspflicht.

Berlin (Symbolbild), Ausschnitt aus dem FIS-Broker, Geoportal Berlin / Kartenanzeige Digitale farbige Orthofotos 2011 (DOP20RGB) http://fbinter.stadt-berlin.de/fb/

 

Quelle dieses Wandels ist das Amtsblatt Berlins, Nr. 42 vom 20. September 2013 auf Seite 1977. Eine Open-Data-Version dieses Amtsblattes gibt es ironischerweise unseres Wissens noch nicht, dafür eine zeitlich begrenzt verfügbare Version bei einem Verlag.

Damit ist Berlin im Wortsinne über Nacht zu einem der Spitzenreiter bei der Bereitstellung von Open Data aus dem Geoinformationsbereich geworden. Dies vielleicht auch deshalb, weil es sonst noch größtenteils zappenduster aussieht und gerade bei Geodaten die Bereitschaft zur Freigabe bei der Landesverwaltung erschütternd schwach ist. Begründet wird dies gerne mit der finanziellen Situation, den Einnahmen aus Geodatenlizenzierung und drohenden finanziellen Ausfällen bei einer Freigabe.

Wie gut, dass man diese Einnahmen auch erfragen kann. So geschehen im April 2012 durch den Abgeordneten Dr. Simon Weiß mittels Kleiner Anfrage Drucksache 17/10461. So wissen wir, dass im Jahr 2010 das Land Berlin aus der entgeltlichen Bereitstellung von Geobasisdaten ca 1.072.000 Euro und im Jahr 2011 ca. 1.056.000 Euro erwirtschaftet hat. In der Antwort des Senats wird nicht im Detail ausgeführt, dass ein nicht unerheblicher Teil dieser Einnahmen aus den Lizenzzahlungen von Firmen stammt, die im Eigentum der Öffentlichen Hand sind. Der Fachausdruck hierfür lautet “Linke Tasche, Rechte Tasche”.

Wikimedia Deutschland applaudiert dem Land Berlin zur neuen Freigabepolitik von Geodaten und hofft auf viele Nachahmer, die wahlweise dem Preispolitikmodell des Landes Berlin folgen, dem Modell des Bundes über Änderung des Geodatenzugangsgesetzes oder dem Hamburger Modell einer allgemeinen Freigabeklausel im Transparenzgesetz (§10 Abs 3.). Alle diese Wege haben ihren eigenen Charme und sind grundsätzlich miteinander kompatibel.

Bonuspunkte hätte es für die Landesvermessung für zwei Aspekte gegeben:

  1. Die Daten sind dauerhaft kostenfrei nachnutzbar, allerdings derzeit ohne die Verwendung von Standardlizenzen. Dies schafft Heterogenität und zwingt einen Nachnutzer mit Geodaten aus vielen Ländern, immer wieder wesengleiche aber im Detail unterschiedliche Nutzungsbedingungen zu lesen und zu kombinieren. Das ist kein Drama und es wird mit Sicherheit Lösungen geben, die solche Lizenzen miteinander kombiniert bequem nachnutzbar machen.
  2. Viele der seit heute frei nutzbaren Daten sind derzeit noch nicht im Netz verfügbar oder wenn, nur über Kartenserver und nicht als Komplettpaket zum Download. Obwohl wir schon von diesem Freigabetermin wussten und entsprechende Bitten zur Abgabe auf einem Datenträger formuliert hatten, steht die eigentliche Bereitstellung dieser Daten noch aus. Wer wie wir so lange auf eine Freigabe gewartet hat, der hält auch noch ein paar zusätzliche Wochen aus.

Herzlichen Glückwunsch und Danke an alle innerhalb und außerhalb der Verwaltung, die durch ihre Arbeit diese Freigabe ermöglicht haben, insbesondere auch der Open Knowledge Foundation und den Freunden von Open Data im Abgeordnetenhaus und im Berliner Senat.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (12 Bewertungen, Durchschnitt: 4,67 von 5)
Loading...Loading...

Social Media Week 2013

Photo by Sofiaperesoa [CC-BY-SA-3.0], via Wikimedia Commons

Wir freuen uns sehr, die Social Media Week 2013 aktiv mitzugestalten! Wir sind dort am 25. September mit einem Wikipedia-Diversity-Schwerpunkt und zwei Veranstaltungen vertreten:

10:00 – 10:45 Uhr: Gender Diversity in der Wikipedia – ein Balanceakt – Vortrag und Diskussion, Prof. Dr. Ilona Buchem, Gastprofessorin für Digitale Medien und Diversität an der Beuth Hochschule für Technik Berlin und Conrad Nutschan, Wikipedianer.

11.00 – 13.00 Uhr: Women edit” goes to Social Media Week, Workshop “Wikipedia für Einsteiger_innen” und Informationen zu “Women edit” mit Silvia Stieneker, Journalistin und Wikipedianerin sowie Sibylle Würz, Konzeptentwicklerin im Bereich Social Media im Frauen Computer Zentrum Berlin

Beide Veranstaltungen finden in der Design Akademie Berlin im Aufbau Haus am U-Bhf Moritzplatz in Kreuzberg statt.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (11 Bewertungen, Durchschnitt: 2,45 von 5)
Loading...Loading...

Raum für Freies Wissen & Friends

Platz für Treffen und Workshops bei Wikimedia Deutschland – Photo by Dr. Bernd Gross [CC-BY-SA-3.0], via Wikimedia Commons

Die Räume von Wikimedia Deutschland sind nicht nur ein Büro, sondern funktionieren für kleinere Treffen und Workshops auch als Projektspace für die Wikimedia-Communitys und weitere Freundinnen und Freunde freien Wissens.

Bekannt geworden z.B. durch die Offenen Sonntage im Barcamp-Format oder einige Arbeitsgruppentreffen, wird diese Möglichkeit immer häufiger genutzt. Eine kleine Zusammenstellung der nächsten Aktivitäten stelle ich Euch heute vor. Noch mehr spannende Termine findet Ihr auf wikimedia.de/wiki/Veranstaltungen

An diesem Wochenende zum Beispiel haben wir ganz besonders musikalische Gäste. Die musicbrainz singen bei ihrem Summit aber nicht, sondern arbeiten gemeinsam an der Verbesserung der größten freien Datenbanksammlung von Informationen rund um Musik. musicbrainz.org/doc/MusicBrainz_Summit/13

Am Wahlsonntagabend (diesen Sonntag, am 22.9., aber das wisst Ihr ja alle schon) wird der Space dann zu einer temporären Fotoredaktion für das Fotoprojekt zur Bundestagswahlde.wikipedia.org/wiki/Wikipedia:Fotoprojekt/Bundestagswahl_2013

Am Donnerstag, 26. September, findet dann um 19 Uhr die nächste Ausgabe “Offenes Editieren” statt. Ob Neueinsteiger oder alte Häsin, gemeinsam wird an Wikipedia-Artikeln gearbeitet – auch ohne Anmeldung für Gäste offen! de.wikipedia.org/wiki/Wikipedia:Berlin#Offenes_Editieren

Am Wochenende danach trifft sich am selben Ort das Board von KDE e.V. zum halbjährlichen Meeting, um die weitere Ausgestaltung der Unterstützung der KDE-Community zu entwickeln. KDE produziert Freie Software für Linux, Mac und Windows, unter anderem einen grafischen Desktop für Linux, ein naturalistisches Zeichenprogramm und einen Desktop-Globus. de.wikipedia.org/wiki/KDE

Am Mittwoch, 16.10. ab 16 Uhr veranstaltet die Open Knowledge Foundation (u.a. Betreiberin von fragdenstaat.de) einen Workshop zum Thema Informationsfreiheit. (Save the Date, noch ohne Link.)

Und Anfang November begrüßen wir dann die  Entwicklercommunity der Videolan Association, die im Space an der Weiterentwicklung von VLC und anderer freier Multimedia-Software arbeiten wird. www.videolan.org/projects/

Und weil es ganz schön aufwendig ist, für ein offenes Abend-Treffen mit Community-Mitglieder kurzfristig z.b. aus NRW extra nach Berlin zu kommen, unterstützen wir aktuell verschiede lokale Gruppen beim Schaffen von weiteren Möglichkeiten für solche Veranstaltungen und Projekträume an Orten außerhalb Berlins. Am Sonntag, 6.10. findet dazu ein Workshop in, nein, nicht in Berlin, sondern in der Jugendherberge Köln-Deutz statt. de.wikipedia.org/wiki/Wikipedia:Workshop_Köln

Wenn Ihr selber Ideen für solche Veranstaltungen habt, ob in den Räumen der Geschäftsstelle in Berlin oder in anderen Stadt- oder Landregionen: Meldet Euch gerne. Entweder bei mir direkt sebastian.sooth@wikimedia.de oder bei community@wikimedia.de.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

“Dermaßen selbstverständlich” – Wie die zur Bundestagswahl antretenden Parteien auf unsere Fragen antworten und damit neue aufwerfen

Bild von Nutzer: Rama, Wikimedia Commons, Creative Commons CC-by-sa 2.0 France

Am 22. September ist bekanntlich Bundestagswahl, wenngleich uns an diesen Umstand weniger feurige inhaltliche Debatten und eher drollige Formatinnovationen im Fernsehen erinnern. Auf dem Schreibtisch von Wikimedia Deutschland liegen zehn an der Grenze zur Lesbarkeit eng bedruckte Seiten mit 80.000 Zeichen Wahlprüfsteinantworten. Das Format, das WMDE erstmals vor vier Jahren erprobte, wird mittlerweile recht routiniert gehandhabt. Insgesamt haben uns 11 zur Wahl zugelassene Parteien geantwortet, eine sehr erfreuliche Rücklaufquote.

Für uns sind Wahlprüfsteine eine gute Gelegenheit, eine Konversation mit den Parteien über die uns wichtigen Themen zu eröffnen. Wir können jetzt auch im Zeitverlauf über mehrere Jahre erkennen, wie sich Parteien in den für uns wichtigen Themen aufgestellt haben und welchen Wert sie diesen Themen zusprechen. Es ist nicht unsere Aufgabe, Euch eine Wahlempfehlung zu geben – gleichzeitig nehmen wir uns die Freiheit heraus, die eingegangenen Antworten in Inhalt und Form zu bewerten.

Die Lektüre der kompletten Antworttexte ist bei uns im Meta-Wiki für jede/n möglich. Mit eurer Hilfe hatten wir im Juli eine Prioritätenliste für Themen erstellt, anhand derer wir insgesamt 11 Fragen erstellt haben, die dann an alle zur Wahl zugelassenen Parteien verschickt wurden.

Allgemeine Eindrücke

Viele Parteien haben unterschiedlich ausgeprägte Hemmungen, auf spezifische Fragen eine konkrete Antwort zu geben. Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (12 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

Wikidata quality and quantity

One of the goals of the Wikidata development project is a community that is strong enough to maintain the content in Wikidata. The community is – as with all other Wikimedia projects – the only guarantee of quality and sustainability.

None of the objectives of the Wikidata development project is to be the largest collection of data on the net. The sheer number of statements in Wikidata is not a metric that is indicative of healthy growth or quality. Since it is an easy to get and understandable number it is nontheless used a lot, but we should not attach too much importance to it.

This leads to the question, which metrics are meaningful for quality in Wikidata? And I have to admit: we do not know. This may seem particularly ironic since my dissertation was on the topic of quality measurement of knowledge structures. But it is not surprising: the opportunity to make statements in Wikidata exists since about half a year. The site is in continuous development, and some important pieces for quality assurance that are planned for Wikidata are not yet developed – including, for example, ranks for statements, web links as a data type, the protection of individual statements and aggregated views of the data. How to make quality measurable in Wikidata, which metrics correlate with quality – it has simply not yet been investigated sufficiently. I expect that science will provide some answers in the coming months and years.

To get an overview of the development of Wikidata, we must temporarily take assumptions about what numbers likely indicate quality. I do hereby call the community to make suggestions and discuss. A few first thoughts below.

The number of data elements (items) seems to not be a useful measure. This number is so far almost exclusively characterized in that items are required for the storage of language links. Accordingly, there was initially strong growth, while the links were transferred, and in recent months, the number is relatively stable.

The number of edits per page seems to be more meaningful. Last week it went above 5.0 and is rising quickly. The number of edits alone in Wikidata is less meaningful than in many other Wikimedia projects as an extraordinarily high proportion of the edits are done by bots. Bots are programs written by users to automatically or semi-automatically make changes. The bots are controlled by a group of about 80 users. This leads many to the idea that Wikidata is only written by bots. But that’s not true: every month 600000-1 million edits are performed by human user. These are numbers that can be reached only by the most active Wikipedias – including their own bot edits. Worries about Wkidata’s growth being too fast and that the quality of the data would suffer, have so far, except for anecdotes, not proven true.

Perhaps the simplest metric is the number of active users. Active users in Wikimedia projects are defined as the users who contributed at least five edits in a given month. Wikidata has nearly 4,000 active users, making it rank 6th among the most active of the Wikimedia projects together with the Japanese and Russian Wikipedia behind only the English Wikipedia, Commons, the German, French and Spanish Wikipedia. In other words, Wikidata has more active users than 100 smaller Wikipedias combined! Whenever the smaller Wikipedias access Wikidata, they rely on a knowledge base that is maintained by a much larger community than their own Wikipedia. But the advantages don’t end there: by using the content of Wikidata in the Wikipedias it becomes more visible, gets more attention, and errors are more likely to be found (although we still lack the technical means to then correct the error easily from Wikipedia – but that is on the development plan). This mainly benefits the smaller Wikipedias.

But it also already has useful advantages for the larger Wikipedias: An exciting – and for me completely unexpected – opportunity for quality assurance came when the English Wikipedia decided not to simply take IMDB IDs from Wikidata but instead load them from Wikidata to compare them with the existing numbers in Wikipedia, and in the case of inconsistency to add a hidden category to the article. This way difficult to detect errors and easily vandalisable data got an additional safety net: it may well be that you have a typo in the number on the English Wikipedia, or some especially funny person switched the ID for Hannah Montana’s latest film with that ofNatural Born Killers in the French Wikipedia – but now these situations are detected quickly and automatically. This data that is validated in several ways can then be used by the smaller Wikipedias with little concern.

As mentioned earlier, a lot is still missing and Wikidata is a very young project. Many of the statements in Wikidata are without a source. Even in the German Wikipedia the statement, Paris is the capital of France, does not have a source. We impose much stricter rules on a much smaller project after such a short time? But, then one may interject, if a statement has no source, I can not use it in my Wikipedia. And that is perfectly okay: it is already possible now, to just use data from Wikidata if they have a source of a certain type.

There are two ways to ensure the long term quality of Wikipedia: Allow user to be more effective or attract more users. We should continue to pursue both ways and Wikidata uses both ways very effectively: the mechanisms described above aim to give users the means to make more powerful tools and processes to build quality assurance, simultaneously Wikidata has already brought more than 1300 new users to the Wikimedia projects who had not edited in the other Wikimedia projects before.

Wikidatas main goal is to support the Wikimedia projects: it should enable higher quality of the content and reduce the effort required for the same. We need more metrics that capture this goal, and show how we evolve. The simple metrics all indicate that the initial growth in width has come to an end after months, and that the project is gaining in depth and quality. There are useful applications both for small as well as for large projects. But it is also clear that I am an avid supporter of Wikidata and so have a bias, and therefore start a call for ideas to track Wikidata’s effect critically and accurately.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

Wahlprüfsteine zur Landtagswahl in Hessen

Zeitgleich zur Bundestagswahl am 22. September dürfen etwas über vier Millionen Wahlberechtigte in Hessen auch über die Zusammensetzung ihres Landtages entscheiden. Wahlumfragen aus Hessen bestätigen den Ruf des Landes, es in Sachen Mehrheitsfindung spannend zu machen. Wikimedia Deutschland hat allen in Hessen antretenden Parteien Wahlprüfsteine mit 10 Fragen geschickt; die Antworten haben wir nun veröffentlicht.

Insgesamt haben wir Antworten von sechs Parteien erhalten: CDU, SPD, FDP, Bündnis 90/Die Grünen, Die Linke und Piratenpartei. Umfang und Form der Antworten unterscheiden sich ganz erheblich. Bemerkenswert ist, dass es auch für größere Parteien mitunter nicht möglich ist, auf eine Frage auch eine inhaltliche Antwort zu geben. Wir sind insbesondere für Meinungen und Vorschläge dankbar, wie wir als Verein mit solch einer Situation umgehen sollen, ohne zu tief in den Bereich der politischen Wertung zu gehen.

Open Data:

Zwei Fragen beschäftigen sich mit Open Government Data: Erstens mit der generellen Lizenzpolitik und der Einhaltung z.B. der Principles of Open Governemnt und zweitens konkret mit dem Umgang mit denjenigen Datensätzen, die nicht unter Freien Lizenzen veröffentlicht werden. Aus dem Antworttext der CDU lassen sich keine Aussagen zu beiden Fragen finden, statt Richtlinien bevorzugt man hier die Einzelfallbetrachtung. SPD, FDP, Grüne, Linke und Piraten benennen klarer die Kriterien, nach denen Daten freigegeben werden sollen, zum Teil mit deutlichen Abstufungen. Nur Linke und Piraten sprechen sich explizit dafür aus, Inhalte unter unfreien Lizenzen aus “Open Data”-Portalen fernzuhalten, sie aber dann separat zu veröffentlichen.

Staatliche Werke:

Wir fragen – über Open Government Data  hinaus – zu allen staatlichen Werken nach der von der Partei befürworteten Lizenzierungspraxis. Die Antworten sind hier relativ heterogen und enthalten quer durch alle Parteien Aussagen zu anderen Themen oder zum Urheberrecht insgesamt. Zur Frage der Notwendigkeit einer Ausweitung des §5 UrhG (Gemeinfreiheit amtlicher Werke) gibt es hingegen eine erfrischende Klarheit: CDU und SPD sehen dazu keine Notwendigkeit, Grüne, Linke möchten dies prüfen, die Piraten sind dafür und die FDP möchte diesen Punkt in den Koalitionsverhandlungen klären.

Öffentlich-rechtlicher Rundfunk: 

Nicht nur der Staat schafft Werke, auch der aus einem Gebührensystem finanzierte Öffentlich-rechtliche Rundfunk finanziert die Erstellung von primär audiovisuellen Medien. Von Einzelfällen abgesehen erhalten die Gebührenzahler keine Rechte zur Nutzung, die über den privaten Konsum hinausgehen. Wenn wir nach der Lizenzierung von Öffentlich-rechtlichen Inhalten unter Freien Lizenzen fragen, erhalten wir von SPD und CDU nur allgemeine Ausführungen über den Rundfunk selbst, die FDP sieht Probleme in der Umsetzung, die Grünen in Hessen befürworten immerhin unfreie CC-Lizenzen. Linke und Piraten sind für Freie Lizenzen. Auch bei diesem Thema war es wieder hilfreich, eine sehr klare und binär beantwortbare Frage zu stellen: Abschaffung der Depublikationspflicht. Zustimmung zur Abschaffung kommt von Grünen, Linken und Piraten, von der CDU kommt das Verständnis zum Problem und der abstrakte Wunsch zur Anpassung. Die SPD möchte prüfen, die FDP möchte genau prüfen.

Transparenzgesetz:

Von allen Parteien sticht die CDU mit einer konsequent ablehnenden Haltung zur Informationsfreiheit heraus, sie hält Informationsfreiheit insgesamt für bürokratisch, kostenintensiv und unverhältnismäßig. Zudem reichten laut CDU einzelne spezialgesetzliche Zugangsrechte aus. Alle anderen Parteien sprechen sich für ein Informationsfreiheitsgesetz aus, die FDP allerdings mit einigen Einschränkungen. Linke, SPD und Grüne bieten jeweils Drucksachen für Gesetzesinitiativen der abgelaufenen Legislaturperiode an. Auf die gestellte Frage konkret geantwortet haben hingegen ausschließlich die Grünen. Die Hamburger Regelung zur Nachnutzung unterstützen Grüne, Linke und Piraten.

Werke unter Freier Lizenz:

Unser Fragenkatalog endet mit zwei sehr konkreten Beispielen zur Lizenzpolitik eines Landes. Wir knüpfen hierbei an die Thematik Open Educational Ressources an. Konkret fragen wir nach der Bereitschaft, sich dem im Koalitionsvertrag von NRW festgestellten Modellversuch für OER anzuschliessen. Die Antwort der CDU bezieht sich hingegen auf die Verhandlungen zwischen Kultusministerkonferenz und Verwertungsgesellschaften über die (vergütete) Schranke zur Vervielfältigung von Werken für Unterrichtszwecke. Alle anderen Parteien möchten prüfen bzw. sprechen sich im Fall der Linken und der Piraten für OER aus. Unsere konkrete Frage nach der (freien) Lizenzierung von Luftbildern der Landesvermessung wird positiv von Grünen, Linken und Piraten beantwortet, CDU und FDP lehnen ab.

Fazit:

Es lässt sich für Hessen ein gewisses Gefälle in der Qualität der Antworten im Vergleich zu den (identischen) Fragen für die Parteien zu den Landtagswahlen Bayern und Niedersachsen erkennen. In der Tendenz bleibt es bei inhaltlich ähnlichen Antworten der einzelnen Parteien. Keines der Themen wird für sich genommen in der kommenden Legislaturperiode ein Selbstläufer sein, jedoch sind bei allen denkbaren Wahlausgängen Verbesserungen der jetztigen Situation möglich.

 

 

 

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (5 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

Wikidata Qualität und Quantität

Eines der Ziele des Wikidata-Entwicklungsprojektes ist eine Community, die stark genug ist, die Inhalte in Wikidata zu pflegen. Die Community ist – wie für alle anderen Wikimedia-Projekte auch – der einzige Garant für Qualität und Nachhaltigkeit.

Keines der Ziele des Wikidata-Entwicklungsprojektes ist es, die größte Sammlung von Daten im Netz zu werden. Die schiere Anzahl der Aussagen in Wikidata ist keine Metrik, die auf gesunden Wachstum oder Qualität schließen lässt. Da sie eine leicht berechenbare und verständliche Zahl ist, wird sie dennoch gerne genannt, aber wir sollten ihr nicht zuviel Bedeutung beimessen.

Das führt zu der Frage, welche Metriken denn aussagekräftig für Qualität in Wikidata sind? Und da muss ich zugestehen: wir wissen es nicht. Das mag besonders ironisch erscheinen, da meine Dissertation das Thema Qualitätsmessung von Wissensstrukturen hatte. Aber es ist nicht überraschend: die Möglichkeit, Aussagen in Wikidata zu machen, gibt es seit etwa einem halben Jahr. Die Seite ist in stetiger Entwicklung, und manche Herzstücke der Qualitätssicherung wie sie in Wikidata geplant sind, sind noch nicht entwickelt – dazu gehören zum Beispiel Ränge für Aussagen, Weblinks als Datentyp, der Schutz einzelner Aussagen und aggregierte Sichten auf die Daten. Wie man Qualität in Wikidata messbar macht, welche Metriken mit Qualität korrelieren – es wurde schlicht noch nicht hinreichend untersucht. Ich setze hier sehr darauf, dass in den kommenden Monaten und Jahren die Wissenschaft ein paar Antworten liefern wird.

Um überhaupt einen Überblick über die Entwicklung Wikidatas zu haben, müssen wir vorläufig Annahmen darüber treffen, welche Zahlen wahrscheinlich auf Qualität hinweisen. Ich will hiermit auch die Community aufrufen, Vorschläge zu machen und zu diskutieren. Ein paar erste Gedanken diskutiere ich im Folgenden.

Die Anzahl der Datenelemente (Items) scheint kein brauchbares Maß. Diese Zahl ist bislang fast ausschließlich dadurch gegeben, dass die Items für das Speichern von Sprachenlinks notwendig sind. Entsprechend gab es zunächst ein starkes Wachstum, während die Links übertragen wurden, und seit einigen Monaten ist die Zahl relativ stabil.

Deutlich aussagekräftiger scheint die Zahl der Bearbeitungen pro Seite zu sein. Die hat letzte Woche 5,0 überschritten, und steigt recht schnell. Die Zahl der Bearbeitungen alleine ist in Wikidata weniger aussagekräftig als in vielen anderen Wikimediaprojekten, da ein außerordentlich hoher Anteil der Bearbeitungen von Bots erledigt wird. Bots sind Programme, von Benutzern geschrieben, die automatisch oder halb-automatisch Änderungen vornehmen. Die Bots werden von einer Gruppe von etwa 80 Benutzern gesteuert. Das führt bei vielen Beobachtern zu dem Gedanken, dass Wikidata nur von Bots geschrieben wird. Aber das stimmt nicht: jedem Monat werden zwischen 600,000 und 1 Million Bearbeitungen durch menschliche Benutzer durchgeführt. Das sind Zahlen, die nur von den aktivsten Wikipedien erreicht werden – inklusive ihre eigenen Botbearbeitungen. Warnrufe darüber, dass Wikidatas Wachstum viel zu schnell sei und die Qualität der Daten auf der Strecke bliebe, wurden bislang, außer durch Anekdoten, nicht belegt.

Die vielleicht einfachste Metrik ist die Zahl der aktiven Benutzer. Aktive Benutzer werden in Wikimediaprojekten definiert als die Benutzer, die zumindest fünf Bearbeitungen im Monat beitrugen. Wikidata hat knapp 4000 aktive Benutzer, und ist damit mit der Japanischen und Russischen Wikipedia auf Rang 6 der aktivsten Wikimediaprojekte, nur hinter der Englischen Wikipedia, Commons, der Deutschen, Französischen und Spanischen Wikipedia. Oder anders gesagt: Wikidata hat mehr aktive Benutzer als 100 kleinere Wikipedien zusammengezählt! Wann auch immer die kleineren Wikipedien auf Wikidata zugreifen, greifen sie auf eine Wissensbasis zurück, die von einer deutlich größeren Community gewartet wird als ihre eigene Wikipedia. Aber damit erschöpft sich der Vorteil noch nicht: durch das Darstellen der Inhalte von Wikidata in den Wikipedien werden die Inhalte sichtbarer, erhalten mehr Aufmerksamkeit, und Fehler werden wahrscheinlicher gefunden (auch wenn es noch an der technischen Möglichkeit fehlt, die Fehler dann auch leicht aus der Wikipedia heraus zu korrigieren – aber auch das steht im Entwicklungsplan). Das nutzt vor allem den kleineren Wikipedien.

Aber auch die größeren Wikipedien haben jetzt schon handfeste Vorteile: eine spannende – und für mich vollkommen unterwartete – Möglichkeit zur Qualitätssicherung ergab sich, als die Englische Wikipedia entschloss, IMDB IDs nicht einfach aus Wikidata zu übernehmen, sondern vielmehr aus Wikidata zu laden, mit den vorhandenen Zahlen in Wikipedia zu vergleichen, und im Fall einer Inkonsistenz den Artikel mit einer versteckten Kategorie zu versehen. Dadurch könne gerade schwer zu entdeckende Fehler und leicht vandalisierbare Daten mit einem mehrfachen Sicherheitsnetz versehen werden: es kann ja sein, dass man einen Zahlendreher in der Englischen Wikipedia hat, oder das ein Spaßvogel in der Französischen Wikipedia die ID für Hanna Montanas neuesten Film mit der von Natural Born Killers vertauscht – aber nun werden solche Situationen schnell und automatisch erkannt. Diese mehrfach validierten Daten können dann auch mit wenig Bedenken von den kleineren Wikipedien genutzt werden.

Wie anfangs erwähnt, vieles fehlt noch, und Wikidata ist ein sehr junges Projekt. Viele der Aussagen in Wikidata stehen ohne Quelle da. Auch in der Deutschen Wikipedia hat die Aussage, Paris sei die Hauptstadt Frankreichs, keine Quelle. Verlangen wir von einem viel kleineren Projekt strengere Regeln nach so kurzer Zeit? Aber, mag man dann einwerfen, wenn eine Aussage keine Quelle hat, kann ich sie in meiner Wikipedia nicht verwenden. Und das ist vollkommen in Ordnung: es ist jetzt bereits möglich, Daten aus Wikidata nur zu übernehmen, wenn sie eine Quelle einer bestimmten Art haben.

Es gibt zwei Möglichkeiten, die Qualität der Wikipedien langfristig zu sichern: Benutzer effektiver werden lassen oder mehr Benutzer gewinnen. Beide Wege sollten wir weiterhin verfolgen, und Wikidata verfolgt beide Wege sehr effektiv: die oben beschriebenen Mechanismen zielen daraufhin, den Benutzern die Mittel zu geben, mächtigere Werkzeuge und Prozesse zur Qualitätssicherung aufbauen zu lassen, gleichzeitig hat Wikidata bereits mehr als 1300 neue Benutzer zu den Wikimediaprojekten geführt, die bislang nicht in den anderen Wikimediaprojekten editierten.

Wikidatas Hauptziel ist die Wikimediaprojekte zu unterstützen: es soll eine höhere Qualität der Inhalte ermöglichen und gleichzeitig den dafür benötigten Aufwand senken. Wir brauchen mehr Metriken, die dieses Ziel erfassen, und die zeigen, wie wir uns dahingehend entwickeln. Die einfachen Metriken deuten alle darauf hin, dass der anfängliche Wachstum in der Breite seit Monaten zu einem Abschluss gekommen ist, und dass das Projekt in Tiefe und Qualität gewinnt. Es gibt nützliche Anwendungen sowohl für die kleinen wie auch für die großen Projekte. Aber es ist auch klar, dass ich ein eifriger Verfechter Wikidatas bin, damit einen Bias habe, und deswegen einen Aufruf starte, nach Möglichkeiten, Wikidatas Effekt kritisch und genau verfolgen zu können.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (1 Bewertungen, Durchschnitt: 1,00 von 5)
Loading...Loading...

Konsultation der Europäischen Kommission

Vom 30. August bis zum 22. Januar 2013 läuft ein Konsultationsverfahren der Europäischen Kommission zur Anwendung der überarbeiteten Public Sector Information Directive (Richtlinie über die Weiterverwendung von Informationen des öffentlichen Sektors), die im Sommer 2013 verabschiedet wurde und in den kommenden Jahren in nationales Recht überführt werden muss.  Privatpersonen, Verbände und staatliche Einrichtungen können bei dieser Konsultation einen Onlinefragebogen ausfüllen; dieser erstreckt sich über vier Seiten. Eine gewissenhafte Beantwortung des Fragebogens ist in weniger als 30 Minuten möglich, wir bitten um rege Teilnahme.

Warum ist die PSI-Richtlinie und diese Konsultation wichtig?

Unter dem Stichwort “Open Government Data” wird nach neuen Möglichkeiten gesucht, die von der Öffentlichen Hand erstellten Werke für die Nachnutzung durch Dritte zur Verfügung zu stellen, wenn bestimmte Bedingungen (darunter Schutz von personenbezogenen Daten und Betriebs- oder Staatsgeheimnissen) erfüllt sind. Wenn beispielsweise eine Behörde eh auf der Grundlage einer Verordnung von allen deutschen Tankstellen die aktuellen Spritpreise erhebt, sind viele naheliegende Anwendungen möglich, die weit über den ursprünglichen Zweck zur Aufdeckung von Preiskartellen hinausgehen. Der Anbieter eines Navigationssystems könnte einen Autofahrer also genauso so zu seinem Ziel leiten, dass er an einer Tankstelle mit derzeit günstigen Preisen vorbeikommt. Ein schlaues Navigationssystem würde zudem schauen, ob der Mehrverbrauch für einen Umweg noch in Relation zur Ersparnis (oder gar dem zeitlichen Mehraufwand) stünde.  Überall dort, wo der Staat Werke schafft, besteht die Möglichkeit, dass diese bereits vom Steuerzahler finanzierte Arbeit auf eine zusätzliche Weise nachgenutzt werden kann, wenn es entsprechend einfachen Zugang zu diesen Werken gibt. Die Europäische Union schuf 2003 mit der Public Sector Information Directive ein Instrument, um zumindest den gleichen und geregelten Zugang zu diesen Werken bzw. das Verfahren zur Einräumung von Nutzungsrechten daran festzulegen. Mit der alten PSI-Directive war noch kein besonders starker Druck verbunden, diese Werke tatsächlich auch für jedermann für beliebige Zwecke nachnutzbar zu machen. Mit der überabeiteten Richtlinie wird Open Government Data zum Normalfall, von dessen Abweichung her es einer Begründung bedarf. So darf eine Stelle z.B. gewisse Gebühren einfordern, deren Höhe allerdings gedeckelt ist und die sich an den Kosten zur Erstellung dieser Werke orientiert.

Realistisch gesprochen ist für den weitaus größten Teil der Regierungsdaten eine Refinanzierung über den freien Markt unrealistisch. In den meisten Fällen dürfte der administrative Aufwand zur Verwertung für die Öffentliche Hand teurer sein als die zu erwartenden Gewinne. Darum ist es ein Zeichen von vernünftigem wirtschaftlichen Handeln, geeignete Daten der Verwaltung grundsätzlich kostenfrei zur rechtssicheren Nachnutzung bereitzustellen.

Wikimedia Deutschland befürwortet kurzfristig den Einsatz von Standardlizenzen wie CC-by oder CC Zero für die Einräumung von umfangreichen Nutzungsrechten an staatlichen Werken. Gleichzeitig setzen wir uns für die Reform des Urheberrechts ein, um den Kreis der nach §5 UrhG gemeinfreien Werke zu erweitern. Beide Ansätze sind nicht deckungsgleich, überschneiden sich aber in der Praxis.

PS: Die Verordnung zur Markttransparenzstelle für Kraftstoffe (MTS-Kraftstoff-Verordnung) ist ein gutes Beispiel dafür, wie Open Government Data nicht geht. Ohne Not wird hier in der Verordnung und in den schriftlich fixierten Hinweisen zur Umsetzung die Nachnutzbarkeit der erhobenen Daten eingeschränkt.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

Frei wie in Freibier, Freistaat und Freies Wissen

Wir haben heute Antworten auf die Fragen in unseren Wahlprüfsteinen veröffentlicht, die wir an die in Bayern zur Landtagswahl kandidierenden Parteien verschickt haben – nebst einer kleinen Auswertung zu Inhalt und Form.

Geantwortet haben innerhalb der gesetzen Frist die Christlich-Soziale Union in Bayern e.V. (CSU), FREIE WÄHLER Bayern (FREIE WÄHLER), Freie Demokratische Partei (FDP), DIE LINKE (DIE LINKE), Piratenpartei Deutschland (PIRATEN), die Sozialdemokratische Partei Deutschlands (SPD), BÜNDNIS 90/DIE GRÜNEN (GRÜNE), DIE REPUBLIKANER (REP) und die Ökologisch-Demokratische Partei (ÖDP). Wenn gewünscht, haben wir auf Nachfrage zusätzliche Tage für die Beantwortung der Wahlprüfsteinfragen eingeräumt, davon haben zwei Parteien Gebrauch gemacht.

Wie in einem früheren Blogeintrag geschrieben, sind die Fragen zur Bayerischen Landtagswahl identisch zu den Wahlprüfsteinfragen, die wir am Anfang des Jahres nach Niedersachsen und quasi zeitgleich mit Bayern an die hessischen Parteien geschickt haben. Damit haben wir zum ersten Mal drei Bundesländer mit drei im gleichen Kalenderjahr stattfindenden Landtagswahlen und vergleichbarer Ausgangslage. Es galt, je zwei Fragen aus fünf Themenbereichen zu beantworten, von denen eine eher allgemein gehalten und eine andere möglichst konkret formuliert war. Im Einzelnen:

Open Data:

Auf den ersten Blick Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (4 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...