Veröffentlicht von
Angelika Mühlbauer am Montag, 18. Februar 2013, 13:04 Uhr

Stuttgart Jugendhaus Mitte
Gemeinsamer Artikel von Christoph Jackel und Angelika Mühlbauer.
Die Wikimedia-Foren-Reihe zum Thema RENDER und Team Communitys hat am 14. Februar begonnen. An mehreren Abenden stellten wir die Unterstützungswerkzeuge vor, die im Rahmen des RENDER-Projekts entstanden sind, und gaben anschließend einen Einblick in die Projekte des Teams Communitys.
Zum Auftakt in Nürnberg setzten wir uns unter anderem mit dem Orgateam des 12. Fotoworkshops im Coworking Nürnberg zusammen.
Einen Tag später in Stuttgart, unserer zweiten Station, trafen wir auf Wiki(m/p)edianern im Jugendhaus Mitte. Vielen Dank an Rudolf für die wunderbare Vorbereitung dieses Abends.
Die letzte Station im Süden Deutschlands führte uns nach München. Dort fand am Samstag ein Einsteiger-Workshop im Cafe Netzwerk statt. Im Anschluss konnten wir dort unsere Projekte vorstellen und mit den Anwesenden diskutieren.
Diese ersten drei Termine waren für uns sehr spannend. Besonders hat uns die direkte Möglichkeit zum Austausch vor Ort gefallen. Außerdem hat sich ein Mal mehr gezeigt, dass wir solche Treffen viel häufiger machen sollten.
Das nächste Forum zu diesem Thema wird am 2. März in Dresden stattfinden. Wer Lust hat mehr darüber zu erfahren, ist dazu ganz herzlich eingeladen. Weitere Termine sind in Planung. Fragen oder Anregungen könnt ihr gerne an renderATwikimedia.de senden.
Tags: Förderung, RENDER, Team Communitys, Werzeuge, Wikimedia-Forum
Veröffentlicht in Freiwillige, RENDER | 3 Kommentare »

Loading ...
Veröffentlicht von
Angelika Mühlbauer am Freitag, 23. November 2012, 20:43 Uhr
Das zweite von drei Projektjahren im RENDER-Projekt ist abgeschlossen. In diesem Jahr haben wir viele Dinge umgesetzt: verschiedene Analyse-Ansätze implementiert, das RENDER Toolkit zur Veranschaulichung dieser Tools und verschiedener Daten-Sets realisiert, die Prototypen der Unterstützungswerkzeuge für Wikipedia entwickelt und durch zahlreiche Rückmeldungen kontinuierlich weiterentwickelt. Unsere Arbeiten haben wir in unserem Arbeitsbericht dokumentiert.
Gestern, am 22. November, fand in Luxemburg das Review zum zweiten Projektjahr vor Vertretern der Europäischen Kommission und zwei externen Gutachtern statt, an dem ich zusammen mit meinem Kollegen Kai Nissen teilnahm.
Das Ziel dieses Treffens war es, die Entwicklung der Arbeiten im Projekt zu bewerten und somit über dessen Fortführung zu entscheiden. Die Gutachter hatten zu diesem Zeitpunkt bereits alle Berichte gelesen.
Alle Partner zeigten während des Tages einige Hightlights ihrer Arbeiten und beantworteten weiterführende inhaltliche und finanzielle Fragen. Beispielsweise präsentierten unsere Projektkollegen von Google und JSI die erste Demo ihres DiversiNews-Werkzeuges. Mit diesem interaktiven Instrument kann ein Nutzer Nachrichtentexte zu einem Thema aus verschiedenen Perspektiven – wie positiv oder negativ – anfragen.
Wir stellten in unserer Präsentation das ASQM-Tool vor, das einem Nutzer verschiedene Statistiken und Qualitäts-Analyse-Ergebnisse zu einem Wikipedia-Artikel anzeigt. Darüber hinaus beleuchteten wir zwei darin enthaltene Analysen genauer – den LinkExtractor und WikiGini, das vom Projektpartner KIT entwickelt wurde.
Eine Übersicht aller im Projekt entwickelten Tools und Demos findet sich auf unserer EU-Projektseite.
Nun aber zum eigentlichen Ergebnis:
Das Projekt bekam auch in diesem Jahr eine gute Bewertung. Die Reviewer sprachen von einer weiteren Verbesserung im Vergleich zum Vorjahr und sind schon auf unsere Abschlussvorstellung im nächsten Herbst gespannt. Das Konsortium erhielt noch einige Verbesserungsvorschläge um einen sehr guten Abschluss sicherzustellen. Nach dieser Vorabeinschätzung wird uns das offizielle Gutachten in einigen Wochen zugeschickt.
Wir sind sehr froh über den Verlauf dieses Treffens und konzentrieren uns nun auf die nächsten anstehenden Arbeiten – den Ausbau der Werkzeuge entsprechend der Bedürfnisse der Wikipedia-Nutzer als auch die abschließende Evaluation.
Wer noch mehr über das Projekt, das Review, die Werkzeuge und die nächsten Aufgaben wissen möchte, kann uns gerne unter render@wikimedia kontaktieren. Oder besucht uns am kommenden Sonntag, den 25. November, in der Geschäftsstelle zum Offenen Sonntag bei WMDE!
Tags: Qualität, RENDER, Review, Statistik, Unterstützungswerkzeuge
Veröffentlicht in RENDER | 2 Kommentare »

Loading ...
Veröffentlicht von
Gerrit Holz am Dienstag, 3. Juli 2012, 07:04 Uhr
Vom 22. bis zum 24. Juni fand die WebScience 2012 in Evanston, etwa zwölf Meilen nördlich von Chicago, statt. Zu der seit 2009 jährlich stattfindenden Konferenz treffen sich Wissenschaftler, um die junge Disziplin WebScience voran zu bringen. WebScience verbindet Theorien und Methoden aus Informatik, Psychologie und Sozialwissenschaft, um die Datenschätze zu analysieren, die beispielsweise durch Facebook, Twitter und Wikipedia entstehen.
Unsere Einreichung mit dem Titel „A Knowledge Diversity Dashboard for Wikipedia“ wurde angenommen und in Form eines Posters präsentiert. Das Poster stellt das RENDER Toolkit vor, eine Sammlung von Analyse-Werkzeugen auf dem Wikimedia Toolserver.
Diejenigen, die mit wissenschaftlichen Konferenzen vertraut sind, können diesen Abschnitt überspringen. Für alle anderen: Wissenschaftliche Konferenzen bestehen aus unterschiedlichen Formaten. Es gibt Keynotes und Panels, Paper Sessions und Poster Sessions. Wir waren auf der Poster Session vertreten, wobei in diesem Fall insgesamt etwa 50 Poster in zwei Phasen präsentiert wurden. Dieses Format ist interaktiv: Man stellt das eigene Poster vor, um mit Interessenten an Hand der Darstellung einzelne Aspekte zu diskutieren, Anregungen einzuholen und die Arbeit der Fachkollegen kennen zu lernen. So konnten zahlreiche Rückmeldungen zu unseren Analysen und zum Toolkit gesammelt werden.
Abschließend eine persönliche Bemerkung: Besonders beeindruckend war die Closing Keynote vom Luis von Ahn. Er stellte reCaptcha und Duolingo vor. Von Ahn gelingt es, zwei Anliegen, die auf den ersten Blick nichts gemeinsam haben, auf sehr gewinnbringende Weise zu verbinden: reCaptcha ermittelt, ob ein Mensch oder ein Skript eine Webseite besucht und verbessert zugleich automatische Texterkennung, Duolingo verknüpft das Lernen einer Fremdsprache mit der Crowdsourcing-Übersetzung von Texten aus dem Web. Genial!
Tags: Diversität, Knowledge Diversity, RENDER, Toolkit, WebScience, Wissen
Veröffentlicht in RENDER, Technisches, Toolserver, Wissenschaft | Kommentare deaktiviert

Loading ...
Veröffentlicht von
Angelika Mühlbauer am Dienstag, 26. Juni 2012, 22:00 Uhr

Johannes Kroll (Foto: Phillip Wilke / CC-BY-SA 3.0)
Seit dem 15.06. verstärkt Johannes Kroll als Software-Entwickler das Team des RENDER-Projekts bei Wikimedia Deutschland. In den kommenden Monaten wird Johannes das Projekt besonders bei der Entwicklung der geplanten Supporting Tools unterstützen. Diese Werkzeuge ermöglichen es Nutzern der Wikipedia, unausgewogen formulierte und nicht-neutrale Artikel zu finden, zu verstehen und zu verbessern.
Johannes arbeitet seit vielen Jahren als freiberuflicher Entwickler und hat bereits für Wikimedia an der Entwicklung für GraphCore und GraphServ gearbeitet. Sein Wissen und seine Expertise auf diesem Gebiet werden für die kommenden Aufgaben eine große Bereicherung sein. Herzlich Willkommen!
Als überzeugter Autodidakt, der sich ständig weiterbilden will und
muss, weiß ich den Zugang zu freiem Wissen besonders zu schätzen. Das
ist ein Grund, warum ich gern für und mit Wikimedia arbeite.”
Tags: Graphserv, RENDER, Software-Entwickler, Supporting Tools
Veröffentlicht in RENDER | 1 Kommentar »

Loading ...
Veröffentlicht von
Angelika Mühlbauer am Freitag, 11. Mai 2012, 18:55 Uhr

Distrito Telefónica (Madrid), Foto: Luis García (Zaqarbal), CC-BY-SA 3.0 via Wikimedia Commons
Neues vom RENDER Forschungsprojekt:
Am 3. und 4. Mai nahmen Kai Nissen und ich am Projekttreffen aller Partner bei Telefónica in Madrid teil. Diese Treffen finden einmal pro Quartal statt und werden jeweils von einem anderen Projektpartner organisiert. Diese persönlichen Begegnungen ermöglichen einen direkten Austausch und die Gelegenheit über aktuelle Arbeiten zu sprechen. Außerdem kann schnell und unkompliziert an u.a. technischen Problemen getüftelt werden.
Während des letzten Meetings in Innsbruck wurde eine Änderung des Ablaufs für die kommenden Treffen beschlossen: der erste Tag wird für die Präsentationen der aktuellen Arbeiten sowie die Planung weiterer Arbeitsschritte verwendet, die notwendig sind um aktuelle Aufgabenpakete erfolgreich abschließen zu können. Am zweiten Tag, dem Programmiertag, nutzen wir die Zeit zur Besprechung konkreter technischer Schwierigkeiten mit einzelnen Partnern und notwendiger, gemeinsamer Programmierungen.
Der Präsentationstag
Am ersten Tag des Treffens präsentierten wir den aktuellen Stand des RENDER-Toolkits.
Darüber hinaus diskutierten wir unsere aktuellen Analysen zur Neutralität und Aktualität von Wikipedia-Artikeln.
Dabei verfolgen wir folgende Ideen:
Für die Messung von Neutralität untersuchen wir derzeit Bundestagsprotokolle um Ausdrücke identifizieren zu können, die prototypisch von einer bestimmten Partei bzw. Fraktion verwendet werden. Mit Hilfe dieser Ergebnisse werden wir in der deutschen Wikipedia nach politische Tendenzen suchen und auch die Entwicklungen über die Zeit auswerten.
Die Aktualität von Wikipedia-Artikeln berechnen wir gegenwärtig durch die Auswertung von Edit-Zahlen unter Beachtung verschiedener Sprachversionen eines Artikels. Diesen Ansatz, der im Change Detector-Tool auf dem Toolserver ausgetestet werden kann, wollen wir in einem weiteren Schritt mit Informationen aus externen Quellen wie z.B. Nachrichtenartikeln kombinieren. Unser Projektpartner JSI wird bei der Umsetzung dieser Idee eng mit uns zusammenarbeiten und stellte in Madrid seinen News-Crawler vor. Einen ersten Eindruck des Prototypen bekommt man auf dieser Demoseite.
Der Programmiertag
Am zweiten Tag spezifizierten wir mit JSI unsere technischen Anforderungen zur Auswertung der Aktualität durch die Verwendung zusätzlicher Informationen aus Nachrichten-Artikeln. Darüberhinaus definierten wir einen weiteren Ansatz zur Neutralitätsanalyse besonders in deutschsprachigen Wikipedia-Artikeln. Hierfür extrahierten wir für JSI einen Datensatz, das wir in den nächsten Tagen auch auf die Toolkitseite laden werden. JSI verwendet diese Daten um mit Hilfe von maschinellen Lernverfahren charakteristische Muster von “Nicht-Neutralität” in Artikeln zu identifizieren. Diese Arbeiten werden wir in den kommenden Monaten vertiefen.
Die Verbesserung des Toolkits war ein weiterer wichtiger Schwerpunkt an diesem Tag. Das “Viel-Augen-Prinzip” brachte auch hier wertvolle Vorschläge und Ideen.
Wir brauchen eure Unterstützung
Wir würden uns sehr über eure Rückmeldungen zum Toolkit freuen. Gebt uns doch bitte bescheid, wenn beispielsweise Beschreibungen unverständlich sind, Funktionen fehlen oder die Ergebnisse nicht nachvollziehbar sind. Das Toolkit ist in einem ständigen Erweiterungs- und Verbesserungsprozess – dafür brauchen wir auch eure Ideen!
Zur Vervollständigung unseres Teams suchen wir noch Software- und Web-EntwicklerInnen.
Meldet euche gerne bei Interesse und bitte unbedingt weitersagen!!
Bei weiteren Fragen und Anregungen freue ich mich über eure Nachricht an render@wikimedia.de!
Noch ein abschließendes Wort zu Madrid
Es soll eine tolle Stadt sein, hab ich gehört. Leider haben haben mich 14 Grad und Dauerregen nicht so richtig überzeugt. Aber das Telefónica-Hauptgebäude war ziemlich beeindruckend (siehe Foto)!
Tags: Aktualität, Diversität, Neutralität, RENDER, Research
Veröffentlicht in RENDER | 1 Kommentar »

Loading ...
Veröffentlicht von
Angelika Mühlbauer am Dienstag, 27. März 2012, 20:13 Uhr
Im Forschungsprojekt RENDER gibt es Neuigkeiten. Wie ich vor einiger Zeit hier angekündigt habe, gibt es nun erste Einblicke in unsere Analysen und Möglichkeiten zum Ausprobieren: das RENDER Toolkit auf dem Wikimedia Toolserver.
Dieses Toolkit enthält verschiedene Werkzeuge, die im Rahmen des Projekts von uns bzw. unseren Partnern entwickelt werden. Mit Hilfe dieser einzelnen Tools analysieren wir verschiedene Aspekte der Informationsvielfalt (Diversität) in Wikipedia und können gezielt Hinweise zur Verbesserung liefern.
Das Toolkit befindet sich in einem kontinuierlichen Entwicklungsprozess und weitere Analysewerkzeuge werden folgen. Gegenwärtig sind diese vier Werkzeuge enthalten:
- LEA (Link ExtrActor): Dieses Tool berechnet für einen Wikipedia-Artikel in einer Sprachversion die wichtigsten Konzepte, also die Begriffe, die von hoher Bedeutung für dieses Thema sind. Weiterhin liefert es Hinweise darüber, welche Verlinkungen ergänzt werden bzw. welche Artikel in einer angefragten Sprachversion fehlen könnten. Die Berechnung erfolgt auf einer Analyse der Wiki-Links eines Artikels im Vergleich zu anderen Sprachversionen.
- Change Detector: Dieses Werkzeug zeigt die Liste der Artikel, die in einer Sprachversion nicht bearbeitet wurden, obwohl in der Mehrzahl der anderen Sprachversionen signifikante Änderungen festgestellt wurden.
- Die Wikipedia Map ist in erster Linie ein Visualisierungswerkzeug, dass alle geo-getaggten Wikipedia-Artikel in einer Sprachversion auf einer Karte anzeigt. Mit Hilfe dieser Map können aber auch sprachspezifische Besonderheiten der Artikelverteilung beobachtet werden.
- Corpex (Wikipedia Corpora Explorer): ist ein Visualisierungswerkzeug, das die Verteilung und Häufigkeit von Wörtern, Buchstabenkombinationen und kurzen Zwei-Wort-Kombinationen in verschiedenen Sprachversionen darstellt. Damit können beispielsweise Entwicklungen in eine bestimmte politische Richtung durch die Identifikation charakteristischer Ausdrücke im zeitlichen Verlauf ermittelt werden.
Diese Analysen werden den Nutzern als selbständige Instrumente zur Verfügung stehen. Darüber hinaus werden die Ergebnisse im weiteren Verlauf des Projekts in zwei verschiedene Unterstützungswerkzeuge integriert. Zum einen in ein Qualitätsübersichtswerkzeug, das für jeden Wikipedia-Artikel einen schnellen Überblick zu Qualität und Zustand sowie Hinweise auf weiterführende Informationen liefert. Die zweite geplante Applikation ist ein Arbeitslistengenerator. Mit diesem kann sich ein Wikipedia-Autor Listen verbesserungswürdiger Artikeln generieren und dabei einen bestimmten Themenbereich bzw. seine bevorzugte Kategorie wählen.
Wir freuen uns über Rückmeldungen, Verbesserungsvorschläge und weitere Anregungen auf der Diskussionsseite zu RENDER in Wikipedia bzw. auch unter render@wikimedia.de
Veröffentlicht in RENDER | 2 Kommentare »

Loading ...
Veröffentlicht von
Angelika Mühlbauer am Sonntag, 5. Februar 2012, 11:00 Uhr
Im Forschungsprojekt RENDER, bei dem Wikimedia Deutschland als Anwendungspartner teilnimmt, findet einmal pro Quartal ein Treffen aller Partner statt. Die Quartalstreffen werden jedes Mal von einem anderen Partner ausgerichtet. Wir selbst waren beim vierten Plenum Ende September 2011 die Gastgeber.
Wie ich im letzten Monatsbericht kurz geschrieben hatte, fand das fünfte Projekttreffen am 26. und 27. Januar in Innsbruck beim Partner STI statt. Zu diesem Treffen begleitete mich dieses Mal Anselm, mein neuer Kollege im RENDER-Team.
Natürlich stand zu Beginn das Gutachten des Review-Meetings und die daraus resultierenden Aufgaben auf der Tagesordnung. Danach stellten einzelne Partner Ergebnisse ihrer aktuellen Arbeiten vor. Wobei vor allem diejenigen Arbeitspakete im Fokus standen, deren Abgabefrist bereits Ende März ist. Beispielsweise wurden die aktuellen Änderungen an der vom STI entwickelten Ontologie vorgestellt und diskutiert: die so genannte Knowledge Diversity Ontology sowie deren Einbindung in das Analyse-Tool Enrycher des slowenischen Partners Jožef Stefan Institute (JSI).
Unser größtes Aufgabenpaket im zweiten Projektjahr ist “Tools for diversity management in Wikipedia” (D5.1.2). Hierbei entwickeln und testen wir Werkzeuge, die die Analyse-Ergebnisse (unserer Tools bzw. der anderen Projektpartner) zu Aktualität, Faktenabdeckung, Objektivität und Editorenverhalten für die Wikipedia-Nutzer visualisieren. Mit Hilfe dieser Unterstützungswerkzeuge können wir den Lesern und Autoren Hinweise liefern, in welchen Artikeln möglicherweise ein Handlungsbedarf besteht, z.B. im Artikel über Politiker XY fehlt die Information über dessen kürzlichen Rücktritt, in 15 anderen Sprachversionen wurde dieser Fakt vor Kurzem ergänzt. Erste Entwürfe dieser Unterstützungswerkzeuge haben wir beim Review-Meeting in Luxemburg vorgestellt und sind im Folienset im Abschnitt Mock-ups dargestellt.
Beim Meeting in Innsbruck besprachen wir vor allem mit JSI die Anforderungen und Möglichkeiten weiterer Analysen zur Überprüfung der thematischen bzw. faktischen Abdeckung in Wikipedia-Artikeln. Außerdem stellten wir den Entwicklungsstand zweier Tools vor, an denen wir derzeit arbeiten. Deren Ergebnisse wollen wir zur Überprüfung der Aktualität und der thematischen Abdeckung eines Wikipedia-Artikels einsetzen. Beide Tools sind voraussichtlich Ende Februar in einem präsentablen und testbaren Zustand. Dazu werden wird es einen separaten Beitrag geben, in dem wir die Tools näher vorstellen und euch auch zum Testen einladen wollen.
Anfang Mai wird die nächste Zusammenkunft in Barcelona beim Partner Telefónica stattfinden. Dort werden wir erstmals den Ablauf des Treffen ändern. Bisher lag der Schwerpunkt während der beiden Tage vorwiegend auf der Präsentation der Arbeitsfortschritte durch die jeweiligen Partner. Um die Zeit noch effektiver nutzen zu können, wurde beschlossen zukünftig mehr Raum zum gemeinschaftlichen “Hacken” und Lösen konkreter meist technischer Aufgaben (wie Probleme bei der Integration der Werkzeuge o.ä.) einzuplanen.
Weitere Fragen oder Anregungen könnt ihr gerne an render@wikimedia.de bzw. Angelika direkt richten.
Veröffentlicht in RENDER | 2 Kommentare »

Loading ...
Veröffentlicht von
Angelika Mühlbauer am Donnerstag, 8. Dezember 2011, 13:01 Uhr
Im Forschungsprojekt RENDER haben wir gerade das erste Projektjahr abgeschlossen. Vor einiger Zeit hatten wir hier über unseren Beitrag im Projekt sowie die geplanten Ergebnisse und den Nutzen für Wikipedia berichtet.
Zur Überprüfung der Entwicklung des Projektes findet am Ende jedes Projektjahres ein Review-Treffen vor der Europäischen Kommission statt.
Das Review zum ersten Projektjahr fand letzte Woche in Luxemburg statt. Dabei waren Vertreter der Europäischen Kommission anwesend sowie zwei Forscher als Reviewer, die gegenüber der Kommission die fachliche Leistung des Konsortiums beurteilen. Das heißt, es wurden die inhaltlichen Arbeiten überprüft, die in den jeweiligen Arbeitspaketen vereinbart waren und deren Berichte im ersten Projektjahr veröffentlicht wurden. Die Kommission interessierte sich darüber hinaus aber auch für Details des Finanzreportings der einzelnen Partner.
Die Anwesenheit für alle Projektpartner ist bei diesem Treffen verpflichtend. Mathias Schindler und ich waren für Wikimedia Deutschland vor Ort.
Bereits am Dienstag, den 29. November, haben wir uns mit Vertretern aller Projektpartner in Luxemburg getroffen. Wir haben gemeinsam die letzten technischen Arbeiten erledigt, die Präsentationsfolien durchgesehen und finalisiert. Am Mittwoch wurde der Review-Tag in Echtzeit “geprobt”. Dabei gaben wir uns gegenseitig Vorschläge und Hinweise zur Optimierung.
Der eigentliche Review fand am Donnerstag den 1. Dezember statt. Alle Partner präsentierten ihre Arbeiten und standen für Rückfragen zur Verfügung. Am Ende des Tages gaben die Reviewer den Projektpartnern eine kurze, erste Einschätzung: das Gesamtprojekt wurde als positiv und fortsetzungswürdig bewertet. Zusätzlich bekam das gesamte Projektkonsortium eine Reihe von Empfehlungen und Verbesserungsvorschlägen für das kommende Jahr. Der offizielle und ausführliche Bewertungsbericht steht noch aus und wird in den nächsten Wochen zugestellt.
Wer einen kurzen Eindruck gewinnen möchte, kann sich unsere Präsentationsfolien zur Wikipedia Fallstudie auf Commons ansehen. Dieses Folienset beinhaltet sowohl unsere Arbeiten und Ansätze, als auch die Untersuchungen unserer Partner vom Institute Jožef Stefan (JSI) und Karlsruher Institute für Technologie (KIT) innerhalb der Wikipedia Fallstudie. Delia Rusu vom JSI stellte die aktuellen Untersuchungen zu nicht-neutralen Artikeln vor. Fabian Flöck vom KIT berichtete über die Entwicklungen seiner Arbeit zum Thema Editorenverhalten.
Bei weiteren Fragen und Anregungen wendet euch gerne an angelika.adam@wikimedia.de bzw. render@wikimedia.de.
Veröffentlicht in RENDER | 2 Kommentare »

Loading ...
Veröffentlicht von
Angelika Mühlbauer am Mittwoch, 9. März 2011, 12:12 Uhr
Nachdem mich Pavel in seinem Beitrag schon vorgestellt hat, möchte ich an dieser Stelle noch ein bisschen über meinen Hintergrund und die geplanten Aufgaben rund ums RENDER-Projekt berichten.
Ich habe Computerlinguistik an der Universität Potsdam studiert. Was ist das eigentlich genau? Üblicherweise antworte ich auf diese Frage: “Wir verarbeiten menschliche Sprache mit Hilfe des Computers”.
Meine Studienschwerpunkte waren u.a. Wissensverarbeitung und Semantikrepräsentation. Dabei begegneten mir Wikipedia-Inhalte immer wieder als Datenbasis bei Themengebieten wie z.B. Text Mining und Information Retrieval. Natürlich verwende ich Wikipedia ganz selbstverständlich als Nachschlagewerk und Möglichkeit mir schnell einen ersten Überblick zu einem Thema zu verschaffen. Auch bei meiner Arbeit in einem kleinen Kreuzberger Start-Up-Unternehmen spielte Wikipedia eine wichtige Rolle. Wir extrahierten Fakten aus verschiedenen Wikipedia-Sprachversionen und visualisierten Bedeutungszusammenhänge. Ich beschäftigte mich unter anderem mit den Besonderheiten der Wiki-Syntax in Infoboxen, Tabellen und Geodaten zur Extraktion und Weiterverarbeitung der Fakten. Dazu nutzte ich auch Wiktionary-Informationen im Tokenisierungs- und Parsingprozess.
Wikipedia ist allgegenwärtig. Ich war letzte Woche Mittwoch mit Mathias auf der CeBit in Hannover. Bei mehreren Ausstellern fanden wir Wikipedia oder DBPedia als Datengrundlage der Entwicklung. Diese Beobachtung verdeutlichte wieder, Wikipedia wird nicht nur als Enzyklopädie genutzt, sondern ist darüber hinaus eine häufig verwendete Datenbasis vielfältiger Forschungen und Entwicklungen gerade im Bereich der Sprachtechnologie und Computerlinguistik. Deshalb freue ich mich besonders die Arbeit der Geschäftsstelle für das Forschungsprojekt RENDER unterstützen zu können.
Im Folgenden möchte ich kurz das Projekt vorstellen und insbesondere die Aufgaben von Wikimedia.
Das RENDER-Projekt
Im WWW stehen riesige Datenmengen zur Verfügung. Zu jedem denkbaren Thema werden Informationen, Hintergründe, verschiedene Sichtweisen und Standpunkte veröffentlicht, verbreitet und ausgetauscht. Allerdings ist es für Nutzer schwierig sich zu einem Thema umfassend zu informieren. Denn mit Zunahme der Informationsmengen wurden auch immer mehr Mechanismen entwickelt, die Wissen nach persönlichen Einstellungen, Vorlieben oder Profilen „vorfiltern“. Genau an dieser Stelle setzt das Projekt an und will Lösungen für dieses Problem liefern.
RENDER – Reflecting Knowledge Diversity – ist ein EU-gefördertes Forschungsprojekt an dem neben Wikimedia Deutschland e.V. sechs weitere europäische Projektpartner teilnehmen. Die Projektkoordination obliegt dem KIT (Karlsruher Institut für Technologie). Es ist geplant Methoden und Datenmodelle zu entwickeln um verschiedene Perspektiven eines Themas zu verstehen und diese beschreib- und auswertbar zu machen. Dabei werden Open-Source Erweiterungen bekannter kommunikativer und kollaborativer Dienste wie z.B. MediaWiki und WordPress entstehen. Die Forschungsergebnisse und entwickelten Methoden werden in drei Fallstudien unter Leitung von Wikimedia Deutschland, Google Ireland Ltd. und Telefonica I+D eingesetzt und deren Nutzen evaluiert.
Die Aufgabenpakete von Wikimedia
Neben der Bereitstellung der Daten und der Zugriffsinformationen liegt unsere Hauptaufgabe in der Durchführung der Fallstudie. In der ersten Phase entwickeln wir Metriken und Messmethoden um die Entwicklungen in / von Wikipedia zu beurteilen und zu verstehen. Das betrifft u.a. Fragen der Qualitätsbeurteilung von Wikipedia-Artikeln, das Verstehen von Konflikten zu einem Artikel bzw. Artikelabschnitten und das Erkennung von Anomalien im Inhalt und Editionsverlauf eines Artikels. Die gewonnenen Erkenntnisse wollen wir und unsere Projektpartner nutzen um geeignete Werkzeuge zu entwickeln. Diese sollen einerseits die Arbeit bzw. die Zusammenarbeit der Autoren erleichtern, andererseits den Lesern ermöglichen Sachverhalte mit verschiedenen Standpunkten nachzuvollziehen und dadurch auch die Motivation zur Mitarbeit zu steigern. Dabei können auch Techniken aus dem Bereich der Computerlinguistik zum Einsatz kommen. Beispielsweise könnte eine Sentiment Analyse dafür genutzt werden, subjektiv formulierte Passagen in einem Artikel automatisiert zu identifizieren. Die neuen Werkzeuge wollen wir frühzeitig gemeinsam mit Euch evaluieren. Darum ist gerade auch euer Feedback zu Nutzen und Verwendbarkeit besonders wichtig für unsere Arbeit. Unser großes, persönliches Ziel innerhalb des RENDER-Projekts ist es die Qualität, die Wertschätzung und das Vertrauen in Wikipedia zu erhöhen.
Ich freue mich auf meine spannenden neuen Aufgaben und bin bei Fragen oder Feedback unter angelika.adam@wikimedia.de erreichbar.
Weitere Informationen zum Thema RENDER findet ihr unter:
http://render-project.eu
http://www.facebook.com/renderproject
http://twitter.com/renderproject
Tags: CeBIT, Forschung, RENDER
Veröffentlicht in Highlights, RENDER | 5 Kommentare »

Loading ...