zurück

Analyse der Diversität in Wikipedia – Das RENDER-Toolkit

WMDE allgemein

27. März 2012

Im Forschungsprojekt RENDER gibt es Neuigkeiten. Wie ich vor einiger Zeit hier angekündigt habe, gibt es nun erste Einblicke in unsere Analysen und Möglichkeiten zum Ausprobieren: das RENDER Toolkit auf dem Wikimedia Toolserver.

Dieses Toolkit enthält verschiedene Werkzeuge, die im Rahmen des Projekts von uns bzw. unseren Partnern entwickelt werden. Mit Hilfe dieser einzelnen Tools analysieren wir verschiedene Aspekte der Informationsvielfalt (Diversität) in Wikipedia und können gezielt Hinweise zur Verbesserung liefern.

Das Toolkit befindet sich in einem kontinuierlichen Entwicklungsprozess und weitere Analysewerkzeuge werden folgen. Gegenwärtig sind diese vier Werkzeuge enthalten:

  • LEA (Link ExtrActor): Dieses Tool berechnet für einen Wikipedia-Artikel in einer Sprachversion die wichtigsten Konzepte, also die Begriffe, die von hoher Bedeutung für dieses Thema sind. Weiterhin liefert es Hinweise darüber, welche Verlinkungen ergänzt werden bzw. welche Artikel in einer angefragten Sprachversion fehlen könnten. Die Berechnung erfolgt auf einer Analyse der Wiki-Links eines Artikels im Vergleich zu anderen Sprachversionen.
  • Change Detector: Dieses Werkzeug zeigt die Liste der Artikel, die in einer Sprachversion nicht bearbeitet wurden, obwohl in der Mehrzahl der anderen Sprachversionen signifikante Änderungen festgestellt wurden.
  • Die Wikipedia Map ist in erster Linie ein Visualisierungswerkzeug, dass alle geo-getaggten Wikipedia-Artikel in einer Sprachversion auf einer Karte anzeigt. Mit Hilfe dieser Map können aber auch sprachspezifische Besonderheiten der Artikelverteilung beobachtet werden.
  • Corpex (Wikipedia Corpora Explorer): ist ein Visualisierungswerkzeug, das die Verteilung und Häufigkeit von Wörtern, Buchstabenkombinationen und kurzen Zwei-Wort-Kombinationen in verschiedenen Sprachversionen darstellt. Damit können beispielsweise Entwicklungen in eine bestimmte politische Richtung durch die Identifikation charakteristischer Ausdrücke im zeitlichen Verlauf ermittelt werden.

Diese Analysen werden den Nutzern als selbständige Instrumente zur Verfügung stehen. Darüber hinaus werden die Ergebnisse im weiteren Verlauf des Projekts in zwei verschiedene Unterstützungswerkzeuge integriert. Zum einen in ein Qualitätsübersichtswerkzeug, das für jeden Wikipedia-Artikel einen schnellen Überblick zu Qualität und Zustand sowie Hinweise auf weiterführende Informationen liefert. Die zweite geplante Applikation ist ein Arbeitslistengenerator. Mit diesem kann sich ein Wikipedia-Autor Listen verbesserungswürdiger Artikeln generieren und dabei einen bestimmten Themenbereich bzw. seine bevorzugte Kategorie wählen.

Wir freuen uns über Rückmeldungen, Verbesserungsvorschläge und weitere Anregungen auf der Diskussionsseite zu RENDER in Wikipedia bzw. auch unter render@wikimedia.de

Kommentare

  1. […] ersten Tag des Treffens präsentierten wir den aktuellen Stand des RENDER-Toolkits. Darüber hinaus diskutierten wir unsere aktuellen Analysen zur Neutralität und Aktualität von […]

  2. […] und der thematischen Vollständigkeit von Wikipedia-Artikeln gearbeitet. Vor einigen Tagen konnte hier das RENDER Toolkit auf dem Wikimedia-Toolserver vorgestellt und die derzeit enthalten Werkzeuge […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert