Wikipedianer gehen in Braunschweig unter die Römer

Braunschweigisches Landesmuseum (Foto: M. Kruszewski; CC-BY-SA 3.0)

Kommendes Wochenende reisen rund 20 Wikipedianer nach Braunschweig, um im Vorfeld der großen Landesausstellung “Die Römer kommen! Roms vergessener Feldzug” alles über das römische Schlachtfeld am Harzhorn zu erfahren.
Die Veranstaltung findet im Rahmen des Projekts GLAM on Tour statt, das lokale Kulturkooperationen mit Wikipedia-Gruppen fördert. Drei Tage lang öffnet das Braunschweigische Landesmuseum für die Wikipedianer seine Pforten, um einen Überblick über die sensationellen Funde der Grabungsstelle bei Kalefeld zu geben, die in der Fachwelt für Aufsehen sorgen. 2008 wurden hier Fundstücke entdeckt, die auf ein Gefecht zwischen Römern und Germanen im 3. Jhd. n.C. hindeuten.

Ein willkommener Anlass, um GLAM-Aktivisten und Wikipedianer aus dem Raum Braunschweig einzuladen, die Grabungsstelle im Vorfeld zu erkunden, mit Artikelarbeit zu beginnen, zu fotografieren und mit Wissenschaftlern, Archäologen und Museumsmitarbeitern ins Gespräch zu kommen. Im Zentrum der dreitägigen Veranstaltung stehen ein Vortrag zur Wikipedia und ein Musketiertreffen für Interessierte und Wikipedia-Neulinge. Besonders vergnüglich und ertragreich für die Artikel- und Fotoarbeit wird sicherlich die gemeinsame Bus-Exkursion zum Schlachtfeld (einige Plätze sind noch vorhanden, bei Interesse hier anmelden). Das Programm ist umfangreich, die Fachliteratur für die Quellenarbeit und die Fundstücke zum Fotografieren im Museum bereitgestellt, WLAN und Hashtag eingerichtet, die Sinne geschärft. Man darf gespannt sein!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (6 Bewertungen, Durchschnitt: 4,83 von 5)
Loading...

Keine Wundertüte: Urheberrechtspaket auf dem Weg

100 Tage vor der Bundestagswahl bzw. 11 Tage vor dem Beginn der Parlamentsferien schließt sich das Fenster, um noch Gesetzgebungsvorhaben über die Bühne zu bringen. Ein solches Vorhaben ist das Gesetz zur Nutzung verwaister und vergriffener Werke und einer weiteren Änderung des Urheberrechtsgesetzes, das von der Bundesregierung eingebracht wurde. Hierin enthalten sind zwei Themen des Urheberrechtes, die uns die ganze Legislaturperiode über begleitet haben:

  1. Die Umsetzung der Richtlinie 2012/28/EU zur Nutzung verwaister Werke
  2. Die Einführung eines unabdingbaren Zweitveröffentlichungsrechts

Wikimedia Deutschland hat zu beiden Themen in der Vergangenheit öffentlich und insbesondere auch in Stellungnahmen gegenüber dem Bundesministerium der Justiz seine Haltung deutlich gemacht. Für alle Neudazugekommenen gibt es dazu folgende stark verknappte Zusammenfassung:

  1. Verwaiste Werke sind urheberrechtlich geschützte Werke, deren Rechteinhaber nicht auffindbar sind und die daher bislang nicht genutzt (z.B. digitalisiert bzw. im Netz veröffentlicht) werden dürfen. Die EU-Richtlinie bestimmt, unter welchen eng gezogenen Bedingungen eine solche Nutzung dennoch möglich sein soll. Die EU-Mitgliedsstaaten erhalten Zeit bis Oktober 2014, diese Richtlinie in nationales Recht umzusetzen. Nach der Richtlinie wird es nicht möglich sein, verwaiste Werke in Wikimedia-Projekten zu nutzen, weil die erlaubten Nutzungshandlungen zu restriktiv sein werden.
  2. Ein unabdingbares Zweitveröffentlichungsrecht ist das Recht eines Autors, auch dann sein eigenes Werk z.B. auf seiner eigenen Homepage zu veröffentlichen, wenn er im Rahmen eines „Total Buyout“-Vertrages alle Nutzungsrechte an einen Verlag übertragen hat. Je nach Lesart soll dieses Zweitveröffentlichungsrecht es ermöglichen, die Zahl der Open-Access-verfügbaren Forschungspublikationen zu erhöhen.

Am 10. Juni fand im Rechtsausschuss des Bundestages eine Anhörung von Sachverständigen zu dem Gesetzesentwurf der Bundesregierung und den Entwürfen der Oppositionsfraktionen statt. Die Stellungnahmen der Sachverständigen sind – mit einer Ausnahme – ebenfalls online verfügbar.

Während es bei den Verwaisten Werken vorwiegend um die Umsetzung einer EU-Richtlinie in nationales Recht geht und daher die Gestaltungsmöglichkeiten stark begrenzt sind, entzündete sich bei dem zweiten Thema ein teilweise quer zu Regierungskonstellationen verlaufender Streit über das Ob und die Frage, wer hier nun davon profitieren werde. Unstrittig unter allen Sachverständigen war, dass der vorgeschlagene §38 Abs. 4 UrhG nur einen sehr kleinen Kreis an Urhebern betreffen wird, ohne dass handfeste Gründe für eine solche enge Definition vorliegen.

Von Oppositionsseite ist kein Widerstand mit Händen und Füßen gegen dieses Gesetz zu erwarten, insbesondere für den Bereich Verwaiste Werke ist sogar von einigen redaktionellen Formulierungen und Präzisierungen abgesehen Konsens zur Regelung. Beim Zweitveröffentlichungsrecht ist die Situation bizarrer, da es ja insbesondere ein Wunsch der Oppositionsfraktionen war, Urheber gegenüber Verlagen in ihrer Position zu stärken und etwas zur Förderung von Open-Access-Publikationen zu unternehmen. Dass die Regierung die Forderungen der Opposition in einer Schmalspurvariante übernimmt, die nahezu keine praktische Relevanz entfalten wird, ist mehr als ein Kuriosum. Es offenbart vielmehr die völlig entgegengesetzten Vorstellungen über den Freiheitsbegriff und die Waffengleichheit zwischen Urhebern und Verlegern.

 

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (4 Bewertungen, Durchschnitt: 4,25 von 5)
Loading...

Wikimedia:Woche 24/2013

Die Wikimedia:Woche ist die wöchentliche Zusammenfassung von aktuellen Nachrichten aus der internationalen Wikimedia-Bewegung. Der gemeinschaftliche Mailing-Newsletter von Freiwilligen und Wikimedia Deutschland wird immer donnerstags – aufgrund des Feiertags ausnahmsweise diese Woche am Freitag – in Wikipedia, auf der Mailingliste des Vereins und auch hier im Blog veröffentlicht.

Interessierte sind herzlich eingeladen, bei der Zusammenstellung von interessanten Links und Themen mitzumachen. Bis zum jeweils folgenden Donnerstag wird hier gesammelt.

Viel Spaß beim Lesen!

= Wikimedia:Woche 24/2013 =

Frühere Ausgaben sind archiviert unter:

Die Liste der Beitragenden kann der Versionsgeschichte der jeweiligen Ausgabe im Archiv in der Wikipedia entnommen werden.

Foundation und Organisationen

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (Noch keine Bewertungen)
Loading...

Die Datenwüste und das Wasser (update 13. Juni)

Michel Vorsprach; Deich in Lostau Lizenz: Creative Commons cc-by-sa 2.0

Tagelange Regenfälle haben seit Mai in Mitteleuropa zu schweren Hochwassern geführt. Während sich Bürger in süddeutschen Ländern schon an die Aufräumarbeiten wagen können, bereiten sich ihre Nachbarn in Niedersachsen auf das Eintreffen der Flutwelle vor. An einigen Orten wurden die höchsten Pegelstände seit Aufzeichnungsbeginn gemessen, nach Behördenangaben verloren bis heute mindestens 21 Menschen ihr Leben, die Zahl der von Evakuierungen betroffenen Menschen ist um ein Vielfaches höher. Zu den Schäden in Milliardenhöhe kommen zusätzliche Kosten für den Bau neuer Deichanlagen, die in Zukunft für Schutz vor dem Wasser bieten sollen.

Zusätzlich zu den vielen Helfern von Feuerwehr, THW, DLRG und Bundeswehr arbeiten Behörden des Bundes und der Länder daran, Hilfe für Betroffene zu organisieren. Ein wichtiger Baustein ist die Beschaffung, Pflege und Verteilung von Informationen zur aktuellen Situation. Für Bürgerinnen stehen Hochwasserportale bereit, die Pegelstände zusammenfassen und auf Länderportale verweisen. Wie die eigentlichen Daten bereitgestellt werden, ist je nach Bundesland höchst unterschiedlich, in den meisten Fällen ist der gedachte Anwendungsfall nur das Ansehen, nicht das Weiternutzen der Daten. Eine für Betroffene besonders interessante Seite ist das Zentrum für Satellitengestützte Kriseninformation, das vom vom Deutschen Fernerkundungsdatenzentrums des DLR betrieben wird. Auf den Seiten des ZKI werden tagesaktuell Karten mit Hochwassersituationen betroffener Regionen bereitgestellt. Ein Download der Daten in geringer und mittlerer Auflösung ist erlaubt, die höchste Auflösung ist derzeit für Bürgerinnen nicht verfügbar.

Da die für die Kartenerstellung verwendeten Geodaten nicht ausschliesslich Geodaten des Bundes sind, findet die noch relativ junge Geodatennutzungsverordnung keine Anwendung, die die kostenlose Freigabe von Geodaten des Bundes an jedermann für beliebige – auch kommerzielle – Zwecke vorsieht.  Michel Vorsprach machte uns heute auf einen Emailwechsel zwischen ihm und dem Bundesinnenministerium aufmerksam, in dem er die Freigabe dieses hochauflösenden Kartenmaterials für seine Heimatregion anfragte. Die Antwort des Innenministeriums ist für einen von der Flut betroffenen Bürger nicht erbaulich:

Sofern Sie darüber hinausgehend einen Bedarf an einem ZKI-Produkt in einer höheren Auflösung, wie sie z.B. den Einsatz- und Krisenstäbe oder Hilfsorganisationen vor Ort bereitgestellt werden, begründen können, weise ich vorsorglich darauf hin, dass das BMI nach § 63 Abs. 3 der Bundeshaushaltsordnung (BHO) dazu verpflichtet ist, Vermögensgegenstände nur zu ihrem vollen Wert zu veräußern. Dazu gehören auch die Dateien (Karten). Wir gehen dabei von einem Wert pro Kartenprodukt von ca. 800 Euro aus.

Wikimedia Deutschland hat mit Michel Vorsprach, dem DLR (das wir als sehr offen gegenüber Freien Lizenzen erleben konnten) und dem Referat O 7 des Bundesinnenministeriums Kontakt aufgenommen. Wir setzen uns für die Bereitstellung von verfügbarem Kartenmaterial für jedermann ein. Dazu gehört kurzfristig das Kartenmaterial für jedermann wenigstens zur Ansicht und mittelfristig unter Verwendung Freier Lizenzen, auch in Vektorformaten und als Rohdaten zur Weiternutzung. Die Rechnung des BMI halten wir für wenig plausibel und haben unsere Gründe dargelegt, warum es bereits auf heutiger Rechtsgrundlage möglich ist, Michel Vorsprach die gewünschte Karte zu einem deutlich niedrigeren Betrag als 800 Euro zu übermitteln; auch eine kostenfreie Abgabe halten wir für rechtlich möglich.

Nach unserer Auffassung gibt es keinen Bedarf nach Spezialvorschriften, die situativ den Datenbedarf stillen, wie beispielsweise ein Hochwasserinformationsweiterverarbeitungsgesetz oder eine Open Data-Verordnung spezifisch für den Katastrophenschutz. Die Weiterentwicklung von Informationsfreiheitsgesetzen (auf europäischer Ebene: Die Direktive über Public Sector Information) und eine Reform des Urheberrechts an staatlichen Werken würde helfen, rechtliche Hürden bei der Weitergabe von allen relevanten Behördendaten zu reduzieren. Im Falle der Geodaten ist das DLR zwar formal ein eingetragener Verein, seine Mittel kommen jedoch überwiegend aus dem Bundeshaushalt und die Arbeit des DLR bei der Erforschung des Alls und der Erde wurden bereits von den Steuerzahlern einmal finanziert.

Weiterführende Links:

[update 13. Juni 2013: Michel Vorsprach schreibt in einem Blog, dass das Bundesinnenministerium ihm kostenfrei eine hochaufgelöstde Version der ZKI-Karte seiner Region zugeschickt hat]

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (6 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Eure Chance: Die WMF-Wahlen haben begonnen!

tl;dr: Die wichtigsten Wahlen in der Wikimedia-Universum haben begonnen. Alle Kandidierenden samt Fragen und Antworten (in deutscher Sprache!) sowie den Link zum Wahlinterface auf Meta.

Q&A with the board of the Wikimedia Foundation by Pierre-Selim via Wikimedia Commons, CC-BY-SA

Mit einer Woche Verzögerungen haben am Samstagmorgen die wichtigsten Wahlen im Wikimedia-Universum begonnen: Alle Mitglieder der Community sind dazu aufgerufen, drei Vertreter für das Board of Trustees und zwei neue Mitglieder für den Spendenverteilungssauschuss (FDC) plus eine Ombudsperson zu wählen. Der Wahlzeitraum geht bis zum 22. Juni 2013, die Ergebnisse sollen zwischen dem 25. und 28. Juni veröffentlicht werden.

In den vergangenen Jahren waren Interesse und Beteiligung der deutschsprachigen Communities an den Wahlen eher verhalten. Das ist schade, denn im Grunde wird hier eine tolle Möglichkeit verspielt, sich in die Gestaltung der Arbeit von Board und FDC und damit auch in die Entwicklung des Wikimedia-Universums aktiv einzubringen. Die deutschsprachigen Communities haben das begründete Bedürfnis, auf dem internationalen Wikimedia-Parkett mitzumischen. In unterschiedlichen Debatten gab es immer wieder Reibungspunkte und den Wunsch nach mehr Mitsprache und Mitwirkung. Gerade für eine der größten Communitys ist diese Wahl eine gute Chance, sich mehr Gehör für die eigenen Anliegen, Vorstellungen, Sorgen und Wünsche zu verschaffen.

Gibt es deutschsprachige Kandidierende?

Ja, gibt es!

Delphine Ménard (Benutzerin:Notafish), derzeit stellvertretende Vorsitzende von Wikimedia Deutschland, kandidiert für eine der beiden Plätze im Funds Dissemination Committee. Des Weiteren geben verschiedene Kandidierende an, dass sie zumindest grundlegende Sprachkenntnisse des Deutschen verfügen: Jeromy-Yu Chan (Yuyu), Samuel Klein (Sj), und Michel Aaij (Drmies).

Aber da ist ja alles auf Englisch!

Vieles ist auf Englisch, zugegeben. Dennoch haben wir – die Stabsstelle Internationales, zur Zeit bestehend aus Cornelius Kibelka, der mich als Werkstudent unterstützt, und mir – daran gearbeitet, viele der Seiten auch auf Deutsch zugänglich zu machen. Alle Vorstellungen der Kandidatinnen und Kandidaten sind ins Deutsche übersetzt worden. Des Weiteren haben wir zumindest einen Großteil der zahlreichen Fragen an die Kandidierenden samt Antworten übersetzt. Und natürlich ist das Wahl-Interface selbst auch auf Deutsch verfügbar.

Damit haben nun alle die Chance, sich auf Deutsch über ihre Wunschkandidaten zu informieren und sich aktiv an der Wahl zu beteiligen. Anschließend möchten wir dann gerne auswerten, ob dieses Vorgehen für euch als Wahlberechtigte hilfreich war und gemeinsam überlegen, für welche weiteren Anlässe solche umfassenden Übersetzungen sinnvoll sein können.

Ok, verstanden, aber wo ist denn jetzt der Wahllink?

Wahlen (Abbildung ähnlich); Bundesarchiv, Egon Steiner, CC-BY-SA via Wikimedia Commons.

Alle Links im Banner, die derzeit in allen Wikimedia-Wikis zu sehen sind, führen auf die deutschsprachige Meta-Seite zur Wahl. Von dort aus ist es nur ein Klick weiter zum Wahl-Interface.

Bin ich denn überhaupt stimmberechtigt?

Du kannst von jedem registrierten Benutzerkonto abstimmen, das du auf einem Wikimedia-Wiki besitzt. Du darfst nur einmal abstimmen, egal wie viele Accounts du hast. Du bist wahlberechtigt, wenn du:

  • nicht in mehr als einem Projekt gesperrt bist,

  • nicht im Projekt, von dem aus du wählst, gesperrt bist,

  • kein Bot bist,

  • in den Wikimedia-Wikis mindestens 300 Bearbeitungen vor dem 15. April 2013 getätigt hast (Bearbeitungen auf mehreren Wikis können zusammengefasst werden, wenn deine Konten in einem globalen Konto zusammengefasst sind),

  • und mindestens 20 Bearbeitungen zwischen dem 15. Dezember 2012 und dem 30. April 2013 getätigt hast.

Was macht das Board of Trustees?*

Das Board of Trustees, zu Deutsch in etwa mit „Kuratorium“ zu übersetzen, ist nach amerikanischem Stiftungsrecht das höchste Organ der Wikimedia Foundation und trifft alle maßgeblichen Entscheidungen über die Zukunft der Wikimedia-Projekte. In welche Richtung werden sich die Wikipedia, die Commons und ihre Schwesterprojekte sowie die gesamte Bewegung in Zukunft entwickeln? Welche Maßnahmen werden getroffen, um neue Autoren zu gewinnen? Welche technischen Neuerungen werden finanziell vorangetrieben? All diese Fragen und noch viele weitere beschäftigen die Mitglieder des Kuratoriums und sind auch für die lokalen Communities höchst interessant. Deswegen haben die Communities das Recht, ihre Vertreter in diesem Gremium selbst zu bestimmen (fünf der zehn Kuratoriumsmitglieder werden direkt durch die Community gewählt, von diesen stehen aktuell drei Plätze zur Wahl) und damit auch die Richtung vorzugeben, die sie für die Richtige halten.

Was macht das Funds Dissemination Committee?

Das Funds Dissemination Committee, zu Deutsch in etwa „Spendenverteilungsausschuss“, arbeitet eng mit dem Board of Trustees zusammen und legt diesem Vorschläge vor, in welcher Art und Weise die zur Verfügung stehenden Mittel verwendet und verteilt werden sollen. Jährlich durchlaufen viele Wikimedia Chapter – auch Wikimedia Deutschland – einen vom FDC koordinierten Prozess, um im Rahmen einer Förderung Gelder zugewiesen zu bekommen, mit denen lokale Projekte umgesetzt werden können. Das FDC überwacht des Weiteren regelmäßig die Verwendung der gewährten Mittel durch die Geldempfänger und sichert so einen verantwortungsvollen Umgang mit den Spendenmitteln der Wikimedia-Bewegung.

Was macht die Ombudsperson?

Die Ombudsperson – derzeit ist es mit Susana Morais eine Ombudsfrau – dient als Schlichterin zwischen den verschiedenen Beteiligten im Prozess des FDC, also zwischen Bewerberinnen, Empfängerinnen, dem Verteilungssauschuss selbst, dem Board of Trustees und den Mitarbeiterinnen der Foundation. Die Ombudsperson dokumentiert die Prozesse und nimmt jederzeit Kritiken und Beschwerben in Bezug auf den Verteilungsprozess an. Im letzten Jahr wurden die Ombudsperson bspw. bei zweiten Runden des Förderprozesses angerufen, nachdem die Bewerbungen von Wikimedia Hongkong und Wikimedia Tschechien keinen Erfolg hatten.

Und wenn ich noch andere Fragen habe?

Wenn du allgemeine Frage hast, kannst du diese jederzeit auf der Diskussionseite im Meta-Wiki (egal in welcher Sprache) stellen.

Wenn du technische Probleme hast, kannst du dem Wahlkommittee gerne direkt eine Mail schreiben (board-elections@wikimedia.org). Ralf Roletschek ist Mitglied im Wahlkommittee und beantwortet dir die Fragen gerne auch in deutscher Sprache.

Und natürlich stehe ich in der Stabsstelle Internationales (nicole.ebber@wikimedia.de) für Fragen und Anregungen ebenfalls gerne zur Verfügung. Mich interessiert besonders eure Rückmeldung zur erstmaligen Übersetzung der Q&A und ich bin neugierig, ob und wie ihr generell dem Geschehen rund um die Wahl folgt. Jedenfalls: Go vote! :)

 

* Einige der Texte stammen aus einer Mail von Thomas Planinger (WMAT), vielen Dank für die schöne Vorlage!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (5 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Wikimedia:Woche 23/2013

Die Wikimedia:Woche ist die wöchentliche Zusammenfassung von aktuellen Nachrichten aus der internationalen Wikimedia-Bewegung. Der gemeinschaftliche Mailing-Newsletter von Freiwilligen und Wikimedia Deutschland wird immer donnerstags – aufgrund des Feiertags ausnahmsweise diese Woche am Freitag – in Wikipedia, auf der Mailingliste des Vereins und auch hier im Blog veröffentlicht.

Interessierte sind herzlich eingeladen, bei der Zusammenstellung von interessanten Links und Themen mitzumachen. Bis zum jeweils folgenden Donnerstag wird hier gesammelt.

Viel Spaß beim Lesen!

= Wikimedia:Woche 23/2013 =

Frühere Ausgaben sind archiviert unter:

Die Liste der Beitragenden kann der Versionsgeschichte der jeweiligen Ausgabe im Archiv in der Wikipedia entnommen werden.

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (Noch keine Bewertungen)
Loading...

Großspende für Wikidata

Heute hält Denny Vrandecic vom Wikidata-Team einen Vortrag auf der Semantic Technology and Business Conference in San Francisco. Dabei kann er neben den vielen inhaltlichen Punkten, die das Team in der ganzen Welt vor Datenenthusiasten präsentiert, auch auf großartige finanzielle Unterstützung verweisen: Das Wikidata-Team und Wikimedia Deutschland freuen sich, eine Großespende über 150.000 Euro durch den Suchmaschinenbetreiber Yandex verkünden zu können. Mit diesen zusätzlichen Mitteln können Kernfunktionen des Projekts weiterentwickelt werden. Details sowie Kommentare von Denny und Pavel Richter sind in unserer Pressemitteilung zur Spende nachzulesen.

Yandex wurde 1997 gegründet und betreibt heute die meistgenutzte Suchmaschine Russlands. Das Unternehmen gehört zu den fünf größten Anbietern weltweit und ist mit seinen Angeboten auch in der Ukraine, Kasachstan, Weißrussland und der Türkei vertreten. Über die Motivation für das Engagement von Yandex sagt Alexander Shubin, verantwortlich für Web-Standards:

Es ist eine ambitionierte Aufgabe, Objekte der realen Welt und die Beziehungen zwischen ihnen verstehen zu wollen. Für Forscher ergeben sich zahlreiche Hürden dabei. Eine davon ist es, dass eine vollständige und hochwertige Datenbank verfügbar sein muss, die solche Objekte und ihre Eigenschaften und Beziehungen enthält. Niemand kann so etwas allein erstellen. Dafür ist ein gemeinschaftlicher Ansatz nötig, mit der Unterstützung tausender Menschen. Deshalb freuen wir uns, Wikidata unterstützen zu können – denn das Projekt ist ein gemeinschaftlicher und offener Versuch, genau so eine Datenbank zu schaffen.

Die Spende ist keinem festen Zweck innerhalb des Wikidata-Projekts zugewiesen, sondern vergrößert die Möglichkeiten für das Entwickler-Team, die anstehenden Aufgaben zu bewältigen. Hier im Vereinsblog gibt es unter http://blog.wikimedia.de/tag/wikidata/ alle Neuigkeiten und Berichte der letzten Wochen zum nachlesen.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (5 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Von Wahrheiten und Lügen

Dies ist der zweite in einer kurzen Serie von Blogeinträgen, in denen ich einige der Design-Entscheidungen hinter Wikidata erkläre. Der erste Blogeintrag beleuchtete die Einschränkung von Eigenschaften und ihren Werten. Diese Essays stellen meine persönliche Meinung dar, und sollten nicht als offizielle Stellungnahme des Wikidata-Projekts verstanden werden.

Datenbanken haben eine Aura der Richtigkeit. Wenn wir eine Abfrage an eine Datenbank stellen, erwarten wir, dass das Ergebnis, das zurück kommt, im Grunde Die Antwort und Die Wahrheit ist. Frag Amazons Datenbank nach dem Autor der Bibel. Frag IMDB nach dem Regisseur von Adaption. Du erwartest nicht eine mögliche Antwort, oder verschiedene Blickwinkel – du erwartest eine definitive Antwort.

Wikidata sammelt strukturierte Daten über die Welt. Es ist im Grunde eine crowdgesourcte Datenbank. Im Gegensatz zu Text, fehlt strukturierten Daten notwendigerweise und leider Nuance. Während es möglich ist, über die Staatlichkeit des Kosovo in einer NPOV-weise in natürlicher Sprache zu sprechen, würde ein naiver Ansatz das in strukturierten Daten darzustellen scheitern: Entweder sagen wir Kosovo ist ein Staat oder wir tun es nicht. Es gibt keine Grautöne.

Glücklicherweise liegen einige der Wurzeln von Wikidata in einem EU-Forschungsprojekt namens RENDER. Das Ziel dieses Projekts ist es die Vielfalt des Wissens im Web zu erforschen und zu unterstützen. Render verwirft die Annahme einer einfachen, einzigen Wahrheit – und dies wurde vom Wikidata Datenmodell geerbt. Statt Fakten zu sammeln, sammeln wir Aussagen. Wir definieren Aussagen als Behauptungen die Referenzen haben. Eine Referenz belegt die Behauptung. Ein schönes Beispiel ist Ethanol bei dem die CAS Nummer – eine Standard-Kennung für chemische Verbindungen – angegeben ist mir einer Referenz auf die Quelle inklusive der entsprechenden Seitenzahl.

Im Gegensatz zu vielen anderen Datenbanken kann Wikidata widersprüchliche Aussagen enthalten die von verschiedenen Referenzen unterstützt werden. Im Gegensatz zum natürlichen Text in Wikipedia, bietet Wikidata nicht die Möglichkeit, diese Unterschiede in Einklang zu bringen und in Prosa zu erklären um den verschiedenen Blickwinkeln das ihnen zustehende Gewicht zu verleihen. Die Verantwortung liegt beim Leser und Weiterverwender von Wikidata zu entscheiden welchen Quellen er vertraut. Ich gehe davon aus, dass es in den nächsten Jahren ziemlich viel Forschung und Untersuchungen zu dieser Frage geben wird. Die ersten Nachnutzer, die sich mit diesen Fragen befassen sind die Wikipedia Communities, die sich entscheiden Daten aus Wikidata zu verwenden.

In den nächsten Wochen und Monaten werden wir noch ein paar weitere Features hinzufügen, die die Vielfalt der Aussagen in Wikidata unterstützen.

Derzeit ist der naheliegendste Mängel das Fehlen von Datentypen um Zahlen, Text und URLs angeben. Nur mit diesen Datentypen wird es möglich sein Referenzen in ihrer vollen Pracht zu nutzen. Eine weitere Möglichkeit – sobald URLs zur Verfügung stehen – wäre Content Locators für Text in HTML-Seiten durch XPath, oxPath, CSS-Selektoren oder ähnliches zur Verfügung zu stellen, sodass Bots überprüfen können, ob die angegebenen Referenzen noch gültig sind. Ich bin sehr gespannt, wie sich die Verwendung von Referenzen und Quellen in und um Wikidata entwickelt.

Ein weiteres wichtiges Feature, das im Laufe dieses Jahres eingeführt wird, ist die Möglichkeit, Aussagen einen Rang zuzuweisen: nicht alle Aussagen sollen als gleichwertig betrachtet werden. Wir werden drei Ränge einführen und jede Aussage wird in einem von ihnen sein: bevorzugt, normal und überholt.

„Bevorzugte“ Aussagen sollten die aktuellsten und am weitesten akzeptierten Aussagen sein. Es kann mehrere bevorzugte Aussagen für das gleiche Objekt und Eigenschaft geben.

„Überholte“ Aussagen sind die, die aus irgendeinem Grund als nicht zuverlässig angesehen werden. Sie werden aber erwähnt, weil sie eine solide Quelle haben die sie unterstützen oder weil sie aus irgendeinem Grund weit verbreitet aber eigentlich nicht mehr akzeptiert sind. Beispiele können Tippfehler in einflussreichen Lehrbücher sein — zum Beispiel zum Eisengehalt von Spinat, oder der Länge des Rheins – – oder Zahlen, die durch irgendeine Form von Propaganda verbreitet wurden und heute nicht mehr als korrekt angesehen werden.

„Normale“ Aussagen sind also die, die übrig bleiben, also weder „bevorzugt“ noch „überholt“ sind. Dies wird oft für historische Aussagen (die Bevölkerung von Rom in der Zeit von Julius Caesar, ehemalige Hauptstädte von Russland, etc.) gelten.

Technisch werden wir zuerst nur bevorzugte Aussagen für die Beantwortung von Anfragen verwenden (dh, wenn du nach allen Hauptstädten mit einer Bevölkerung von weniger als 500.000 fragen, dann wirst du keine Resultate erhalten bei denen die Stadt eine Bevölkerung von 120.000 im 16. Jahrhundert hatte). Außerdem werden nur diese von der Eigenschaften-Parserfunktion zurückgegeben werden. Die Lua-Schnittstelle hat Zugang zu allen Aussagen und bieten damit volle Flexibilität. Es ist geplant die Abfragemöglichkeiten später zu erweitern um komplexere Abfragen zuzulassen, an welchem ​​Punkt wir uns über die Einbeziehung der anderen Ränge Gedanken machen müssen.

Die Ränge sollten offenere Regeln in Wikidata ermöglichen, sodass eine breitere Vielfalt von Wissen abgedeckt werden kann.

Um eine Vorstellung vom Zeitplan zu geben: Wir werden zunächst die noch fehlenden Datentypen implementieren, und dann, als Voraussetzung für Ränge, die Möglichkeit Aussagen zu ordnen. Danach werden Ränge das nächste verfügbare Feature in Wikidata sein.

Ränge führen einen neuen Vektor in die Debatte ein, den es in Wikidata bisher noch nicht gibt. Die Frage verschiebt sich von „sollte diese Aussage aufgenommen werden?“ zu „was soll der Rang dieser Aussage sein?“ Dies scheint ein notwendiger Schritt zu sein: Im Gegensatz zu natürlichem Text, könnte Wikidata sonst keine Aussagen aufnehmen, bei denen man sich geeinigt hat, dass sie falsch sind aber einen historischen oder anderen Wert haben. Dies macht es umso wichtiger, sich daran zu erinnern, dass es bei Wikidata nicht um die Wahrheit geht, sondern um das Sammeln belegter Aussagen in einer sekundären Datenbank. Das Kriterium für die Aufnahme sollte nicht Wahrhaftigkeit sondern Überprüfbarkeit sein – eine Politik, die Wikipedia sehr gut gediehnt hat.

Wikidata wird immer – und das ist sowohl eine Notwendigkeit als auch im Design anerkannt – weniger können als Wikipedia in vielen Aspekten. Wikipediaartikel können kausale und informellen Verbindungen beleuchten, sie können Neugier wecken und sie können eine der wichtigsten Formen des Wissenstransfers zwischen Menschen unterstützen: Geschichtenerzählen. Wikidata hat andere, einzigartige Vorteile: Es kann einige Grunddaten über ein Thema von Interesse in vielen Sprachen leichter zur Verfügung stellen, und es stellt die Daten in einer Weise bereit, die für Bots und Apps viel leichter zugänglich ist. Es könnte ein Schritt in Richtung Entlastung einiger Wikipedien von einer Menge Bot-erstellter Artikel sein, die nie von einem menschlichen Editor berührt wurden, die letzten Änderungen fluten und Statistiken verzerren.

Ohne die Fähigkeit, eine Vielzahl von Aussagen zu einem Objekt zum Ausdruck zu bringen – auch wenn sie nur von einigen als Wahrheiten und von anderen als Lügen angesehen werden – würde Wikidata einer der wichtigsten Säulen der Wikipedia nicht gerecht werden: dem Neutral Point of View und der Möglichkeit gegensätzlichen Standpunkte zu integrieren.

Ich hoffe, dass die technische Plattform, die wir als Entwickler bauen, und die Regeln und Verfahren der Communities in Wikidata, den Wikipedien und andere Wikimedia-Projekten ein nützliches Ökosystem schaffen, mit dem Verständnis der Grenzen der einzelnen Projekte und dem Willen zu entdecken, wie wir einander am effektivsten helfen können. Und das bedeutet, die eigenartige Beziehung zwischen Wikidata und Der Wahrheit zu verstehen.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (10 Bewertungen, Durchschnitt: 4,80 von 5)
Loading...

On truths and lies

(Die deutsche Version dieses Artikels ist hier.)

This is the second in a short series of blog entries in which I explain some of the design decisions behind Wikidata. The first one was about restricting property values or properties. The essays represent my personal opinion, and are not to be understood as the official opinion of the Wikidata project.

Databases have an aura of correctness. When we query a database, we expect the result that comes back to basically be The Answer and The Truth. Ask Amazon’s database about the author of the Bible. Ask IMDB about the director of Adaptation. You are not expecting to get a possible answer, or different points of view – you expect one definitive answer.

Wikidata is collecting structured data about the world. It is basically a crowdsourced database. Unlike text, structured data necessarily and unfortunately lacks in nuance. Whereas it is possible to talk about the statehood of Kosovo in an NPOV way in natural language, a naive approach to represent that in structured data would fail: either we say Kosovo is a state, or we do not. There are no shades of grey.

Fortunately some of the roots of Wikidata lie in an EU research project called RENDER. The goal of this project is to explore and support the diversity of knowledge on the Web. RENDER discards the assumption of a simple, single truth – and this was inherited by the Wikidata data model. Instead of collecting facts, we collect statements. We define statements as claims that can have references. A reference supports the claim. A beautiful example is for example Ethanol, where the CAS number – a standard identifier for chemical compounds – is given with a reference to the actual standard, pointing out the page in the source.

Unlike many other databases, Wikidata can contain contradicting statements, supported by different references. Unlike the natural text in Wikipedia, Wikidata does not offer the possibility to reconcile and explain the differences in prose, providing due weight to the different points of view. The responsibility lies with the Wikidata reader and reuser to deal with deciding which sources to trust. I expect quite a bit of research and exploration to deal with this question in the following years. The first reusers to deal with these issues will be the Wikipedia communities that opt to choose data from Wikidata.

In the next few weeks and months we will add a few more features to support the diversity of statements in Wikidata.

Currently, the most obvious omission is a lack of datatypes to specify numbers, text and URLs. Only with these datatypes it will be possible to actually write down references in their full glory. Another opportunity – once URLs are available – would be to provide content locators for text in HTML pages through XPath, oxPath, CSS selectors, or something similar, thus enabling bots to check if the given references are still valid. I am very curious to see how the usage of references and sources will develop in and around Wikidata.

Another major feature that will be introduced in the course of this year is the possibility to rank statements: not all statements are to be regarded equally. We will introduce three ranks, and every statement will be in one of them: preferred, normal, and deprecated.

“Preferred” statements should be the most current and most widely accepted statements. There can be several preferred statements for the same item and property.

“Deprecated” statements are those that are considered to be not reliable for some reason. They are mentioned though because they might have a strong source supporting it, or they are widely spread for some reason, but actually not accepted anymore. Examples can include typos from influential textbooks – for example regarding the iron content of spinach, or the length of the Rhine – or numbers spread by some form of propaganda that are considered not correct today anymore.

“Normal” statements are thus the ones left, which are neither “preferred” nor “deprecated”. This will often apply for historic statements (the population of Rome in the time of Julius Caesar, former capitals of Russia, etc.).

Technically, we will start with using only preferred statements for answering queries (i.e. when you ask for all capitals with a population of less than 500,000, then you won’t get answers where the city had a population of 120,000 in the 16th century). Also only they will be returned by the property-parserfunction. The Lua interface will have access to all statements and thus provide full flexibility. It is planned to extend query answering later to support more complex queries, at which point we will have to think about integrating other ranks.

The ranks should allow for a more inclusive policy in Wikidata, allowing to reflect a wider diversity of knowledge.

To give an idea of the time scale: we will first implement the datatypes that are still missing, and then, as a prerequisite for ranks, the possibility to reorder statements. After that, ranks will be the next feature to land in Wikidata.

Ranks introduce a vector for debate, which has not been there in Wikidata yet. The question moves from “should this statement be included?” to “what should be the rank of this statement?” This seems like a necessary step: unlike natural text, Wikidata otherwise could not include statements that are agreed on to be bogus but that have historical or other value. This makes it even more important to remember that Wikidata is not about truth, but about collecting referenced statements in a secondary database. The criterion for inclusion should not be veracity, but verifiability – a policy that has served Wikipedia very well.

Wikidata will always – and that is both a necessity as well as acknowledged by design – run short of Wikipedia in many aspects. Wikipedia articles can explore causal and informal connections, they can inspire curiosity, and they can support one of the major modes of knowledge transfer between humans: storytelling. Wikidata has other, unique advantages: it can provide some ground data about a topic of interest in many languages more easily, and it provides the data in a way that is much more accessible for bots and apps. It could be a step towards relieving some Wikipedias from a lot of bot-created articles, never touched by a human editor, cluttering recent changes, and skewed statistics.

Without the ability to express a plurality of statements about an item – even if they are considered truths only by some and lies by others – Wikidata would fall short of one of the major pillars of Wikipedia, the Neutral Point of View and the possibility of integrating conflicting points of view.

I hope that the technical platform that we as developers are building, and the rules and processes of the communities in Wikidata, the Wikipedias, and other Wikimedia projects, are establishing a useful ecosystem, understanding the limitations of each project, and discovering how we can most effectively help each other. And this means understanding the peculiar relationship between Wikidata and the Truth.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Monatsbericht Mai 2013

POLITIK UND GESELLSCHAFT

Zur Bundestagswahl: Faktencheck mit ZDF und Phoenix

Tim Moritz Hector ist nun „Wikipedian in Residence“ des Projekts und hat gemeinsam mit der Redaktion aus Mitarbeitern des ZDF und Phoenix die ersten zwei Wochen der Pilotphase des ZDFchecks erfolgreich durchlaufen. Ein Bericht darüber ist im Blog erschienen. Außerdem wurden die ersten Infografiken in Wikimedia Commons hochgeladen. Zum Beispiel beleuchtet eine der Grafiken die Steuereinnahmen in Deutschland in ihrer Verteilung nach Gebietskörperschaften. Für Juni ist ein Vortrag und eine Schulung zu den Wikimedia-Projekten und bevorzugten Lizenzen für die Mitarbeiter des ZDF-Hauptstadtstudios geplant.

Das Vorhaben gehört zum Jahresprojekt Exzellente Partnerschaften.

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (4 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Empfiehl diese Seite