•  

    • expand2012 (88)
    • expand2011 (171)
    • expand2010 (105)
    • expand2009 (84)
    • expand2008 (60)
    • expand2007 (11)

Archiv für die ‘RENDER’ Kategorie



RENDER-Projekt-Treffen in Madrid

Distrito Telefónica (Madrid), Foto: Luis García (Zaqarbal), CC-BY-SA 3.0 via Wikimedia Commons

Neues vom RENDER Forschungsprojekt:
Am 3. und 4. Mai nahmen Kai Nissen und ich am Projekttreffen aller Partner bei Telefónica in Madrid teil. Diese Treffen finden einmal pro Quartal statt und werden jeweils von einem anderen Projektpartner organisiert. Diese persönlichen Begegnungen ermöglichen einen direkten Austausch und die Gelegenheit über aktuelle Arbeiten zu sprechen. Außerdem kann schnell und unkompliziert an u.a. technischen Problemen getüftelt werden.
Während des letzten Meetings in Innsbruck wurde eine Änderung des Ablaufs für die kommenden Treffen beschlossen: der erste Tag wird für die Präsentationen der aktuellen Arbeiten sowie die Planung weiterer Arbeitsschritte verwendet, die notwendig sind um aktuelle Aufgabenpakete erfolgreich abschließen zu können. Am zweiten Tag, dem Programmiertag, nutzen wir die Zeit zur Besprechung konkreter technischer Schwierigkeiten mit einzelnen Partnern und notwendiger, gemeinsamer Programmierungen.

Der Präsentationstag

Am ersten Tag des Treffens präsentierten wir den aktuellen Stand des RENDER-Toolkits.
Darüber hinaus diskutierten wir unsere aktuellen Analysen zur Neutralität und Aktualität von Wikipedia-Artikeln.
Dabei verfolgen wir folgende Ideen:
Für die Messung von Neutralität untersuchen wir derzeit Bundestagsprotokolle um Ausdrücke identifizieren zu können, die prototypisch von einer bestimmten Partei bzw. Fraktion verwendet werden. Mit Hilfe dieser Ergebnisse werden wir in der deutschen Wikipedia nach politische Tendenzen suchen und auch die Entwicklungen über die Zeit auswerten.
Die Aktualität von Wikipedia-Artikeln berechnen wir gegenwärtig durch die Auswertung von Edit-Zahlen unter Beachtung verschiedener Sprachversionen eines Artikels. Diesen Ansatz, der im Change Detector-Tool auf dem Toolserver ausgetestet werden kann, wollen wir in einem weiteren Schritt mit Informationen aus externen Quellen wie z.B. Nachrichtenartikeln kombinieren. Unser Projektpartner JSI wird bei der Umsetzung dieser Idee eng mit uns zusammenarbeiten und stellte in Madrid seinen News-Crawler vor. Einen ersten Eindruck des Prototypen bekommt man auf dieser Demoseite.

Der Programmiertag

Am zweiten Tag spezifizierten wir mit JSI unsere technischen Anforderungen zur Auswertung der Aktualität durch die Verwendung zusätzlicher Informationen aus Nachrichten-Artikeln. Darüberhinaus definierten wir einen weiteren Ansatz zur Neutralitätsanalyse besonders in deutschsprachigen Wikipedia-Artikeln. Hierfür extrahierten wir für JSI einen Datensatz, das wir in den nächsten Tagen auch auf die Toolkitseite laden werden. JSI verwendet diese Daten um mit Hilfe von maschinellen Lernverfahren charakteristische Muster von “Nicht-Neutralität” in Artikeln zu identifizieren. Diese Arbeiten werden wir in den kommenden Monaten vertiefen.
Die Verbesserung des Toolkits war ein weiterer wichtiger Schwerpunkt an diesem Tag. Das “Viel-Augen-Prinzip” brachte auch hier wertvolle Vorschläge und Ideen.

Wir brauchen eure Unterstützung

Wir würden uns sehr über eure Rückmeldungen zum Toolkit freuen. Gebt uns doch bitte bescheid, wenn beispielsweise Beschreibungen unverständlich sind, Funktionen fehlen oder die Ergebnisse nicht nachvollziehbar sind. Das Toolkit ist in einem ständigen Erweiterungs- und Verbesserungsprozess – dafür brauchen wir auch eure Ideen!

Zur Vervollständigung unseres Teams suchen wir noch Software- und Web-EntwicklerInnen.
Meldet euche gerne bei Interesse und bitte unbedingt weitersagen!!

Bei weiteren Fragen und Anregungen freue ich mich über eure Nachricht an render@wikimedia.de!

Noch ein abschließendes Wort zu Madrid

Es soll eine tolle Stadt sein, hab ich gehört. Leider haben haben mich 14 Grad und Dauerregen nicht so richtig überzeugt. Aber das Telefónica-Hauptgebäude war ziemlich beeindruckend (siehe Foto)!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (8 Bewertungen, Durchschnitt: 4,88 von 5)
Loading ... Loading ...

Analyse der Diversität in Wikipedia – Das RENDER-Toolkit

Im Forschungsprojekt RENDER gibt es Neuigkeiten. Wie ich vor einiger Zeit hier angekündigt habe, gibt es nun erste Einblicke in unsere Analysen und Möglichkeiten zum Ausprobieren: das RENDER Toolkit auf dem Wikimedia Toolserver.

Dieses Toolkit enthält verschiedene Werkzeuge, die im Rahmen des Projekts von uns bzw. unseren Partnern entwickelt werden. Mit Hilfe dieser einzelnen Tools analysieren wir verschiedene Aspekte der Informationsvielfalt (Diversität) in Wikipedia und können gezielt Hinweise zur Verbesserung liefern.

Das Toolkit befindet sich in einem kontinuierlichen Entwicklungsprozess und weitere Analysewerkzeuge werden folgen. Gegenwärtig sind diese vier Werkzeuge enthalten:

  • LEA (Link ExtrActor): Dieses Tool berechnet für einen Wikipedia-Artikel in einer Sprachversion die wichtigsten Konzepte, also die Begriffe, die von hoher Bedeutung für dieses Thema sind. Weiterhin liefert es Hinweise darüber, welche Verlinkungen ergänzt werden bzw. welche Artikel in einer angefragten Sprachversion fehlen könnten. Die Berechnung erfolgt auf einer Analyse der Wiki-Links eines Artikels im Vergleich zu anderen Sprachversionen.
  • Change Detector: Dieses Werkzeug zeigt die Liste der Artikel, die in einer Sprachversion nicht bearbeitet wurden, obwohl in der Mehrzahl der anderen Sprachversionen signifikante Änderungen festgestellt wurden.
  • Die Wikipedia Map ist in erster Linie ein Visualisierungswerkzeug, dass alle geo-getaggten Wikipedia-Artikel in einer Sprachversion auf einer Karte anzeigt. Mit Hilfe dieser Map können aber auch sprachspezifische Besonderheiten der Artikelverteilung beobachtet werden.
  • Corpex (Wikipedia Corpora Explorer): ist ein Visualisierungswerkzeug, das die Verteilung und Häufigkeit von Wörtern, Buchstabenkombinationen und kurzen Zwei-Wort-Kombinationen in verschiedenen Sprachversionen darstellt. Damit können beispielsweise Entwicklungen in eine bestimmte politische Richtung durch die Identifikation charakteristischer Ausdrücke im zeitlichen Verlauf ermittelt werden.

Diese Analysen werden den Nutzern als selbständige Instrumente zur Verfügung stehen. Darüber hinaus werden die Ergebnisse im weiteren Verlauf des Projekts in zwei verschiedene Unterstützungswerkzeuge integriert. Zum einen in ein Qualitätsübersichtswerkzeug, das für jeden Wikipedia-Artikel einen schnellen Überblick zu Qualität und Zustand sowie Hinweise auf weiterführende Informationen liefert. Die zweite geplante Applikation ist ein Arbeitslistengenerator. Mit diesem kann sich ein Wikipedia-Autor Listen verbesserungswürdiger Artikeln generieren und dabei einen bestimmten Themenbereich bzw. seine bevorzugte Kategorie wählen.

Wir freuen uns über Rückmeldungen, Verbesserungsvorschläge und weitere Anregungen auf der Diskussionsseite zu RENDER in Wikipedia bzw. auch unter render@wikimedia.de

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (5 Bewertungen, Durchschnitt: 4,80 von 5)
Loading ... Loading ...

RENDER: 5. Projekttreffen in Innsbruck

Im Forschungsprojekt RENDER, bei dem Wikimedia Deutschland als Anwendungspartner teilnimmt, findet einmal pro Quartal ein Treffen aller Partner statt. Die Quartalstreffen werden jedes Mal von einem anderen Partner ausgerichtet. Wir selbst waren beim vierten Plenum Ende September 2011 die Gastgeber.

Wie ich im letzten Monatsbericht kurz geschrieben hatte, fand das fünfte Projekttreffen am 26. und 27. Januar in Innsbruck beim Partner STI statt. Zu diesem Treffen begleitete mich dieses Mal Anselm, mein neuer Kollege im RENDER-Team.

Natürlich stand zu Beginn das Gutachten des Review-Meetings und die daraus resultierenden Aufgaben auf der Tagesordnung. Danach stellten einzelne Partner Ergebnisse ihrer aktuellen Arbeiten vor. Wobei vor allem diejenigen Arbeitspakete im Fokus standen, deren Abgabefrist bereits Ende März ist. Beispielsweise wurden die aktuellen Änderungen an der vom STI entwickelten Ontologie vorgestellt und diskutiert: die so genannte Knowledge Diversity Ontology sowie deren Einbindung in das Analyse-Tool Enrycher des slowenischen Partners Jožef Stefan Institute (JSI).

Unser größtes Aufgabenpaket im zweiten Projektjahr ist “Tools for diversity management in Wikipedia” (D5.1.2). Hierbei entwickeln und testen wir Werkzeuge, die die Analyse-Ergebnisse (unserer Tools bzw. der anderen Projektpartner) zu Aktualität, Faktenabdeckung, Objektivität und Editorenverhalten für die Wikipedia-Nutzer visualisieren. Mit Hilfe dieser Unterstützungswerkzeuge können wir den Lesern und Autoren Hinweise liefern, in welchen Artikeln möglicherweise ein Handlungsbedarf besteht, z.B. im Artikel über Politiker XY fehlt die Information über dessen kürzlichen Rücktritt, in 15 anderen Sprachversionen wurde dieser Fakt vor Kurzem ergänzt. Erste Entwürfe dieser Unterstützungswerkzeuge haben wir beim Review-Meeting in Luxemburg vorgestellt und sind im Folienset im Abschnitt Mock-ups dargestellt.

Beim Meeting in Innsbruck besprachen wir vor allem mit JSI die Anforderungen und Möglichkeiten weiterer Analysen zur Überprüfung der thematischen bzw. faktischen Abdeckung in Wikipedia-Artikeln. Außerdem stellten wir den Entwicklungsstand zweier Tools vor, an denen wir derzeit arbeiten. Deren Ergebnisse wollen wir zur Überprüfung der Aktualität und der thematischen Abdeckung eines Wikipedia-Artikels einsetzen. Beide Tools sind voraussichtlich Ende Februar in einem präsentablen und testbaren Zustand. Dazu werden wird es einen separaten Beitrag geben, in dem wir die Tools näher vorstellen und euch auch zum Testen einladen wollen.

Anfang Mai wird die nächste Zusammenkunft in Barcelona beim Partner Telefónica stattfinden. Dort werden wir erstmals den Ablauf des Treffen ändern. Bisher lag der Schwerpunkt während der beiden Tage vorwiegend auf der Präsentation der Arbeitsfortschritte durch die jeweiligen Partner. Um die Zeit noch effektiver nutzen zu können, wurde beschlossen zukünftig mehr Raum zum gemeinschaftlichen “Hacken” und Lösen konkreter meist technischer Aufgaben (wie Probleme bei der Integration der Werkzeuge o.ä.) einzuplanen.

Weitere Fragen oder Anregungen könnt ihr gerne an render@wikimedia.de bzw. Angelika direkt richten.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 5,00 von 5)
Loading ... Loading ...

Erstes RENDER Review Meeting in Luxemburg

Im Forschungsprojekt RENDER haben wir gerade das erste Projektjahr abgeschlossen. Vor einiger Zeit hatten wir hier über unseren Beitrag im Projekt sowie die geplanten Ergebnisse und den Nutzen für Wikipedia berichtet.

Zur Überprüfung der Entwicklung des Projektes findet am Ende jedes Projektjahres ein Review-Treffen vor der Europäischen Kommission statt.

Das Review zum ersten Projektjahr fand letzte Woche in Luxemburg statt. Dabei waren Vertreter der Europäischen Kommission anwesend sowie zwei Forscher als Reviewer, die gegenüber der Kommission die fachliche Leistung des Konsortiums beurteilen. Das heißt, es wurden die inhaltlichen Arbeiten überprüft, die in den jeweiligen Arbeitspaketen vereinbart waren und deren Berichte im ersten Projektjahr veröffentlicht wurden. Die Kommission interessierte sich darüber hinaus aber auch für Details des Finanzreportings der einzelnen Partner.

Die Anwesenheit für alle Projektpartner ist bei diesem Treffen verpflichtend. Mathias Schindler und ich waren für Wikimedia Deutschland vor Ort.

Bereits am Dienstag, den 29. November, haben wir uns mit Vertretern aller Projektpartner in Luxemburg getroffen. Wir haben gemeinsam die letzten technischen Arbeiten erledigt, die Präsentationsfolien durchgesehen und finalisiert. Am Mittwoch wurde der Review-Tag in Echtzeit “geprobt”. Dabei gaben wir uns gegenseitig Vorschläge und Hinweise zur Optimierung.

Der eigentliche Review fand am Donnerstag den 1. Dezember statt. Alle Partner präsentierten ihre Arbeiten und standen für Rückfragen zur Verfügung. Am Ende des Tages gaben die Reviewer den Projektpartnern eine kurze, erste Einschätzung: das Gesamtprojekt wurde als positiv und fortsetzungswürdig bewertet. Zusätzlich bekam das gesamte Projektkonsortium eine Reihe von Empfehlungen und Verbesserungsvorschlägen für das kommende Jahr. Der offizielle und ausführliche Bewertungsbericht steht noch aus und wird in den nächsten Wochen zugestellt.

Wer einen kurzen Eindruck gewinnen möchte, kann sich unsere Präsentationsfolien zur Wikipedia Fallstudie auf Commons ansehen. Dieses Folienset beinhaltet sowohl unsere Arbeiten und Ansätze, als auch die Untersuchungen unserer Partner vom Institute Jožef Stefan (JSI) und Karlsruher Institute für Technologie (KIT) innerhalb der Wikipedia Fallstudie. Delia Rusu vom JSI stellte die aktuellen Untersuchungen zu nicht-neutralen Artikeln vor. Fabian Flöck vom KIT berichtete über die Entwicklungen seiner Arbeit zum Thema Editorenverhalten.

Bei weiteren Fragen und Anregungen wendet euch gerne an angelika.adam@wikimedia.de bzw. render@wikimedia.de.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (9 Bewertungen, Durchschnitt: 4,22 von 5)
Loading ... Loading ...

Wikipedia als Datenbasis: Das RENDER-Projekt

Nachdem mich Pavel in seinem Beitrag schon vorgestellt hat, möchte ich an dieser Stelle noch ein bisschen über meinen Hintergrund und die geplanten Aufgaben rund ums RENDER-Projekt berichten.

Ich habe Computerlinguistik an der Universität Potsdam studiert. Was ist das eigentlich genau? Üblicherweise antworte ich auf diese Frage: “Wir verarbeiten menschliche Sprache mit Hilfe des Computers”.

Meine Studienschwerpunkte waren u.a. Wissensverarbeitung und Semantikrepräsentation. Dabei begegneten mir Wikipedia-Inhalte immer wieder als Datenbasis bei Themengebieten wie z.B. Text Mining und Information Retrieval. Natürlich verwende ich Wikipedia ganz selbstverständlich als Nachschlagewerk und Möglichkeit mir schnell einen ersten Überblick zu einem Thema zu verschaffen. Auch bei meiner Arbeit in einem kleinen Kreuzberger Start-Up-Unternehmen spielte Wikipedia eine wichtige Rolle. Wir extrahierten Fakten aus verschiedenen Wikipedia-Sprachversionen und visualisierten Bedeutungszusammenhänge. Ich beschäftigte mich unter anderem mit den Besonderheiten der Wiki-Syntax in Infoboxen, Tabellen und Geodaten zur Extraktion und Weiterverarbeitung der Fakten. Dazu nutzte ich auch Wiktionary-Informationen im Tokenisierungs- und Parsingprozess.

Wikipedia ist allgegenwärtig. Ich war letzte Woche Mittwoch mit Mathias auf der CeBit in Hannover. Bei mehreren Ausstellern fanden wir Wikipedia oder DBPedia als Datengrundlage der Entwicklung. Diese Beobachtung verdeutlichte wieder, Wikipedia wird nicht nur als Enzyklopädie genutzt, sondern ist darüber hinaus eine häufig verwendete Datenbasis vielfältiger Forschungen und Entwicklungen gerade im Bereich der Sprachtechnologie und Computerlinguistik. Deshalb freue ich mich besonders die Arbeit der Geschäftsstelle für das Forschungsprojekt RENDER unterstützen zu können.

Im Folgenden möchte ich kurz das Projekt vorstellen und insbesondere die Aufgaben von Wikimedia.

Das RENDER-Projekt

Im WWW stehen riesige Datenmengen zur Verfügung. Zu jedem denkbaren Thema werden Informationen, Hintergründe, verschiedene Sichtweisen und Standpunkte veröffentlicht, verbreitet und ausgetauscht. Allerdings ist es für Nutzer schwierig sich zu einem Thema umfassend zu informieren. Denn mit Zunahme der Informationsmengen wurden auch immer mehr Mechanismen entwickelt, die Wissen nach persönlichen Einstellungen, Vorlieben oder Profilen „vorfiltern“. Genau an dieser Stelle setzt das Projekt an und will Lösungen für dieses Problem liefern.

RENDER – Reflecting Knowledge Diversity – ist ein EU-gefördertes Forschungsprojekt an dem neben Wikimedia Deutschland e.V. sechs weitere europäische Projektpartner teilnehmen. Die Projektkoordination obliegt dem KIT (Karlsruher Institut für Technologie). Es ist geplant Methoden und Datenmodelle zu entwickeln um verschiedene Perspektiven eines Themas zu verstehen und diese beschreib- und auswertbar zu machen. Dabei werden Open-Source Erweiterungen bekannter kommunikativer und kollaborativer Dienste wie z.B. MediaWiki und WordPress entstehen. Die Forschungsergebnisse und entwickelten Methoden werden in drei Fallstudien unter Leitung von Wikimedia Deutschland, Google Ireland Ltd. und Telefonica I+D eingesetzt und deren Nutzen evaluiert.

Die Aufgabenpakete von Wikimedia

Neben der Bereitstellung der Daten und der Zugriffsinformationen liegt unsere Hauptaufgabe in der Durchführung der Fallstudie. In der ersten Phase entwickeln wir Metriken und Messmethoden um die Entwicklungen in / von Wikipedia zu beurteilen und zu verstehen. Das betrifft u.a. Fragen der Qualitätsbeurteilung von Wikipedia-Artikeln, das Verstehen von Konflikten zu einem Artikel bzw. Artikelabschnitten und das Erkennung von Anomalien im Inhalt und Editionsverlauf eines Artikels. Die gewonnenen Erkenntnisse wollen wir und unsere Projektpartner nutzen um geeignete Werkzeuge zu entwickeln. Diese sollen einerseits die Arbeit bzw. die Zusammenarbeit der Autoren erleichtern, andererseits den Lesern ermöglichen Sachverhalte mit verschiedenen Standpunkten nachzuvollziehen und dadurch auch die Motivation zur Mitarbeit zu steigern. Dabei können auch Techniken aus dem Bereich der Computerlinguistik zum Einsatz kommen. Beispielsweise könnte eine Sentiment Analyse dafür genutzt werden, subjektiv formulierte Passagen in einem Artikel automatisiert zu identifizieren. Die neuen Werkzeuge wollen wir frühzeitig gemeinsam mit Euch evaluieren. Darum ist gerade auch euer Feedback zu Nutzen und Verwendbarkeit besonders wichtig für unsere Arbeit. Unser großes, persönliches Ziel innerhalb des RENDER-Projekts ist es die Qualität, die Wertschätzung und das Vertrauen in Wikipedia zu erhöhen.

Ich freue mich auf meine spannenden neuen Aufgaben und bin bei Fragen oder Feedback unter angelika.adam@wikimedia.de erreichbar.

Weitere Informationen zum Thema RENDER findet ihr unter:
http://render-project.eu
http://www.facebook.com/renderproject
http://twitter.com/renderproject

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (14 Bewertungen, Durchschnitt: 4,71 von 5)
Loading ... Loading ...