Archiv für die ‘Wissenschaft’ Kategorie



Die finalen Versionen der RENDER-Tools sind da

Artikellistengenerator

Seit heute sind die finalen Versionen der Unterstützungswerkzeuge online verfügbar. Diese wurden im Rahmen des RENDER-Projekts entwickelt und ermöglichen es Wikipedia-Nutzern den Status von Artikeln zu verstehen sowie Artikel zu finden, die möglicherweise einer Bearbeitung bedürfen. In den letzten Wochen haben wir Vorschläge und Anmerkungen, die wir während der RENDER-Team Communities-Tour gesammelt haben, sowie Erkenntnisse unserer Tests eingebaut und die Werkzeuge entsprechend angepasst.

Der Artikellistengenerator enthält neben einer Reihe kleinerer Anpassungen zwei neue Filter. Jetzt ist es möglich zusätzlich nach Artikeln zu suchen, die seit mehr als 12 Stunden nicht gesichtet wurden, sowie nach verwaisten Seiten, also Artikeln, die von keinem anderen Artikel aus erreicht werden können. Im Artikelmonitor haben wir einige vor allem strukturelle Veränderungen vorgenommen. An dieser Stelle danken wir nochmals allen, die uns mit Hinweisen, Fragen und Ideen unterstützt haben.

Alle Entwicklungen von RENDER laufen nun auch auf Wikimedia Labs. Nachdem die von uns benötigten Datenbanken seit kurzem zur Verfügung stehen, konnten wir den Umzug realisieren. Wer zu diesem Prozess mehr wissen möchte, kann seine Fragen gerne an Johannes Kroll richten.

Was kommt als Nächstes? RENDER selbst wird noch bis Ende September 2013 weiterlaufen. In der verbleibenden Zeit werden wir noch eine Reihe von Tests durchführen und unsere Ergebnisse dokumentieren. Während der diesjährigen Wikimania in Hong Kong werden wir die fertigen Tools vorstellen und über die nächsten Schritte sprechen, um die Nutzeroberflächen der Werkzeuge auch in anderen Sprachversionen verfügbar zu machen. Die Werkzeuge werden auch nach Projektende noch verfügbar sein und nach Bedarf angepasst und erweitert werden. Bei weiteren Fragen meldet euch gerne unter render@wikimedia.de.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (12 Bewertungen, Durchschnitt: 3,25 von 5)
Loading...

Wikipedianer gehen in Braunschweig unter die Römer

Braunschweigisches Landesmuseum (Foto: M. Kruszewski; CC-BY-SA 3.0)

Kommendes Wochenende reisen rund 20 Wikipedianer nach Braunschweig, um im Vorfeld der großen Landesausstellung “Die Römer kommen! Roms vergessener Feldzug” alles über das römische Schlachtfeld am Harzhorn zu erfahren.
Die Veranstaltung findet im Rahmen des Projekts GLAM on Tour statt, das lokale Kulturkooperationen mit Wikipedia-Gruppen fördert. Drei Tage lang öffnet das Braunschweigische Landesmuseum für die Wikipedianer seine Pforten, um einen Überblick über die sensationellen Funde der Grabungsstelle bei Kalefeld zu geben, die in der Fachwelt für Aufsehen sorgen. 2008 wurden hier Fundstücke entdeckt, die auf ein Gefecht zwischen Römern und Germanen im 3. Jhd. n.C. hindeuten.

Ein willkommener Anlass, um GLAM-Aktivisten und Wikipedianer aus dem Raum Braunschweig einzuladen, die Grabungsstelle im Vorfeld zu erkunden, mit Artikelarbeit zu beginnen, zu fotografieren und mit Wissenschaftlern, Archäologen und Museumsmitarbeitern ins Gespräch zu kommen. Im Zentrum der dreitägigen Veranstaltung stehen ein Vortrag zur Wikipedia und ein Musketiertreffen für Interessierte und Wikipedia-Neulinge. Besonders vergnüglich und ertragreich für die Artikel- und Fotoarbeit wird sicherlich die gemeinsame Bus-Exkursion zum Schlachtfeld (einige Plätze sind noch vorhanden, bei Interesse hier anmelden). Das Programm ist umfangreich, die Fachliteratur für die Quellenarbeit und die Fundstücke zum Fotografieren im Museum bereitgestellt, WLAN und Hashtag eingerichtet, die Sinne geschärft. Man darf gespannt sein!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (6 Bewertungen, Durchschnitt: 4,83 von 5)
Loading...

Die Digitalen Römer – Wikidata trifft Archäologie

 

Teilnehmer des Symposiums
Foto: Katja Ullrich (WMDE) CC-BY-SA 3.0

Am Samstag, den 16. März hat Wikidata die Archäologie getroffen.
Bei dem eintägigen Symposium zur Anwendung von Geodaten in den Alterswissenschaften wurde oft die Datenwelt rund um den Limes, den Grenzwall des Römischen Reiches zwischen dem 1. und dem 6. Jahrhundert n.Chr., als Beispiel für gelungene Ansätze der digitalen Wissensvermittlung herangezogen.

Für mich als in Hessen geborenes Präsidiumsmitglied, der oft das Kastell Saalburg in seiner Jugend besuchte, eine Möglichkeit in Erinnerungen zu schweben. Wir trafen uns, im Gegensatz zum ersten Treffen des Wikipedia-Limesprojekt nicht auf der Saalburg, sondern in der wunderbaren Bibliothek des Auswärtigen Amtes in Berlin.

 

Das Symposium war ein Kooperationsprojekt des Deutschen Archäologischen Instituts (DAI) und der Wikimedia Deutschland e.V. – Dank für die Möglichkeit in diesem Rahmen zu produktiver Arbeit zusammenzukommen geht an Nicole Kehrer, Pressereferentin des DAI, Prof. Dr. Reinhard Förtsch, dem wissenschaftlichen Direktor für Informationstechnologien am Deutschen Archäologischen Institut und der Spiritus Rector des Symposiums und an Barbara Fischer, Kuratorin für Kulturpartnerschaften bei der Wikimedia Deutschland e.V.

Bevor es am Schluss des Symposiums engagiert um die Zukunft der breiten Wissensvermittlung sowie die Chancen und Umsetzungsschritte einer offeneren Wissenschaft und Gesellschaft ging, wurden einige beeindruckende Tools und Plattformen vorgestellt. Diese zeigen auf unterschiedlichste Weise, wie mit dem offenen Austausch von Daten der Alterswissenschaften breite Bevölkerungskreise und interessierte Fachöffentlichkeit neue Wissenswelten betreten können.

Gerade die karten-basierte Darstellung von historischen Fakten in Raum und Zeit zeigt besonders schön die Potentiale für Wissen und Bildung, wenn offene strukturierte Datensätze zusammenfliessen. Ein wunderschönes Beispiel, das aus einer privaten Initiative entstanden ist, wurde von René Voorburg vorgestellt. Ursprünglich entwickelt, weil er mit seinen beiden Söhne unterwegs eine altertümliche Stätte des Limes gesehen hatte, entwickelte er mit großer Leidenschaft und später einigen Mitstreitern vici.org „Veni, vidi, [wi:ki:]“ Eine Online-Karte, auf der man die historischen Stätten verorten kann.

Bibliothek des Auswärtigen Amtes Berlin
Foto: Katja Ullrich (WMDE) CC-BY-SA 3.0

Dr. Elton Barker von der Open University, Southhampton präsentierte Pelagios (Pelagios: Enable Linked Ancient Geodata In Open Systems), einen Netzwerkknoten für Linked Open Data in der weiten See der Altertumswissenschaften. Eine weitere, bereits beeindruckend umfangreiche karten-basierte offene Datenbank wurde von Prof. Tom Elliot (University of Alabama, Tuscaloosa, USA) vorgestellt: Pelaides. In seinem Vortrag zeigte er beispielhaft, wie sich die verschiedensten offenen Datenbanken weltweit vernetzten und somit neue Chancen entstehen.

Im Rahmen des erst kürzlich weltweit gestarteten Wikidata-Projektes wurde vom RENDER-Team die interaktive Limes-Karte vorgestellt, mit der der User sehen kann, wie sich der Limes mit seinen Kastellen über die Jahrhunderte entwickelte. Das seit 7 Jahren in der Wikipedia laufende Limesprojekt wurde von seinem Initiator Hartmann Linge mit einer beeindruckenden (Zwischen)-Bilanz vorgestellt.

„Quo vadimus?“ – Zum Schluss des Symposium gab es noch eine lebendige Diskussion, in die sich auch Peter Henrich von der Deutschen Limes Kommission kritisch einbrachte. Es wurde die Notwendigkeit deutlich, dass unnötiger Streit auf der operativen Ebene einem neuen Bewusstsein weichen sollte. Einem Bewusstsein dafür, dass „altehrwürdige Gatekeeper“ und die Vertreter einer offeneren Wissenswelt aufeinander zugehen müssen, damit gesellschaftliche Ziele definiert werden können, wie wir verantwortungsvoll eine neue Qualität in der Wissensvermittlung und den Erkenntnisgewinn für jedermann und jedefrau in einer digital vernetzten Welt gestalten können. Wikidata, wenn auch noch jung, stellt hierfür eines der Werkzeuge dar, mit denen Wissensfelder und Sprachen überwunden werden können. Ein spannender Aufbruch, gemeinsam frisch ans Werk.

 

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

RENDER und Team Communitys auf Deutschland-Tour

Stuttgart Jugendhaus Mitte

Gemeinsamer Artikel von Christoph Jackel und Angelika Mühlbauer.

Die Wikimedia-Foren-Reihe zum Thema RENDER und Team Communitys hat am 14. Februar begonnen. An mehreren Abenden stellten wir die Unterstützungswerkzeuge vor, die im Rahmen des RENDER-Projekts entstanden sind, und gaben anschließend einen Einblick in die Projekte des Teams Communitys.

Zum Auftakt in Nürnberg setzten wir uns unter anderem mit dem Orgateam des 12. Fotoworkshops im Coworking Nürnberg zusammen.
Einen Tag später in Stuttgart, unserer zweiten Station, trafen wir auf Wiki(m/p)edianern im Jugendhaus Mitte. Vielen Dank an Rudolf für die wunderbare Vorbereitung dieses Abends.
Die letzte Station im Süden Deutschlands führte uns nach München. Dort fand am Samstag ein Einsteiger-Workshop im Cafe Netzwerk statt. Im Anschluss konnten wir dort unsere Projekte vorstellen und mit den Anwesenden diskutieren.

Diese ersten drei Termine waren für uns sehr spannend. Besonders hat uns die direkte Möglichkeit zum Austausch vor Ort gefallen. Außerdem hat sich ein Mal mehr gezeigt, dass wir solche Treffen viel häufiger machen sollten.

Das nächste Forum zu diesem Thema wird am 2. März in Dresden stattfinden. Wer Lust hat mehr darüber zu erfahren, ist dazu ganz herzlich eingeladen. Weitere Termine sind in Planung. Fragen oder Anregungen könnt ihr gerne an renderATwikimedia.de senden.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (6 Bewertungen, Durchschnitt: 4,33 von 5)
Loading...

Synchronisation von Wikipedia-Inhalten – Einladung zum CoSyne-Präsentationstag

Am 1. Februar findet in Amsterdam der CoSyne-Präsentationstag statt. An diesem Tag werden die Ergebnisse des CoSyne Projekts, einzelne Teilkomponenten der Analyse- und Übersetzungsprozesse, sowie das Demosystem vorgestellt werden.
Wir präsentieren in diesem Kontext auch unsere Arbeiten im RENDER-Projekt und besprechen mögliche Verknüpfung unserer Ergebnisse und Entwicklungen. Alle Interessierten sind herzlich dazu eingeladen. Die Teilnahme ist kostenlos.

CoSyne ist ein spannendes Forschungsprojekt mit Wikimedia Niederlande als Partner. Dabei geht es um multilinguale Sychronisation von Informationen in Wikis. Das System nutzt dabei Sprachverarbeitungstechnologien und maschinelle Übersetzungsmethoden um fehlende Informationen zu erkennen und Vorschläge zur Ergänzung zu geben. Dieses Video gibt einen Einblick in das Projekt.

Wikimedia Niederlande hat sich kurzfristig bereit erklärt, vier deutschsprachigen Wikipedianern die Anreise und Übernachtungskosten zu sponsern. Bei Interesse meldet euch bitte bei uns unter angelika.muehlbauer@wikimedia.de. Bitte stellt in eurer Anfrage kurz dar, warum ihr gerne daran teilnehmen möchtet. Wir stellen dann den Kontakt zu WMNL für euch her.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Das RENDER-Projekt hat das zweite Projektjahr erfolgreich bestanden

Das zweite von drei Projektjahren im RENDER-Projekt ist abgeschlossen. In diesem Jahr haben wir viele Dinge umgesetzt: verschiedene Analyse-Ansätze implementiert, das RENDER Toolkit zur Veranschaulichung dieser Tools und verschiedener Daten-Sets realisiert, die Prototypen der Unterstützungswerkzeuge für Wikipedia entwickelt und durch zahlreiche Rückmeldungen kontinuierlich weiterentwickelt. Unsere Arbeiten haben wir in unserem Arbeitsbericht dokumentiert.

Gestern, am 22. November, fand in Luxemburg das Review zum zweiten Projektjahr vor Vertretern der Europäischen Kommission und zwei externen Gutachtern statt, an dem ich zusammen mit meinem Kollegen Kai Nissen teilnahm.
Das Ziel dieses Treffens war es, die Entwicklung der Arbeiten im Projekt zu bewerten und somit über dessen Fortführung zu entscheiden. Die Gutachter hatten zu diesem Zeitpunkt bereits alle Berichte gelesen.

Alle Partner zeigten während des Tages einige Hightlights ihrer Arbeiten und beantworteten weiterführende inhaltliche und finanzielle Fragen. Beispielsweise präsentierten unsere Projektkollegen von Google und JSI die erste Demo ihres DiversiNews-Werkzeuges. Mit diesem interaktiven Instrument kann ein Nutzer Nachrichtentexte zu einem Thema aus verschiedenen Perspektiven – wie positiv oder negativ – anfragen.
Wir stellten in unserer Präsentation das ASQM-Tool vor, das einem Nutzer verschiedene Statistiken und Qualitäts-Analyse-Ergebnisse zu einem Wikipedia-Artikel anzeigt. Darüber hinaus beleuchteten wir zwei darin enthaltene Analysen genauer – den LinkExtractor und WikiGini, das vom Projektpartner KIT entwickelt wurde.
Eine Übersicht aller im Projekt entwickelten Tools und Demos findet sich auf unserer EU-Projektseite.

Nun aber zum eigentlichen Ergebnis:

Das Projekt bekam auch in diesem Jahr eine gute Bewertung. Die Reviewer sprachen von einer weiteren Verbesserung im Vergleich zum Vorjahr und sind schon auf unsere Abschlussvorstellung im nächsten Herbst gespannt. Das Konsortium erhielt noch einige Verbesserungsvorschläge um einen sehr guten Abschluss sicherzustellen. Nach dieser Vorabeinschätzung wird uns das offizielle Gutachten in einigen Wochen zugeschickt.

Wir sind sehr froh über den Verlauf dieses Treffens und konzentrieren uns nun auf die nächsten anstehenden Arbeiten – den Ausbau der Werkzeuge entsprechend der Bedürfnisse der Wikipedia-Nutzer als auch die abschließende Evaluation.

Wer noch mehr über das Projekt, das Review, die Werkzeuge und die nächsten Aufgaben wissen möchte, kann uns gerne unter render@wikimedia kontaktieren. Oder besucht uns am kommenden Sonntag, den 25. November, in der Geschäftsstelle zum Offenen Sonntag bei WMDE!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (12 Bewertungen, Durchschnitt: 4,33 von 5)
Loading...

Gib Lesern eine Stimme – Artikel-Feedback in neuem Gewand

Ein Blogbeitrag von Angelika Adam und Denis Barthel.

Ein Nachhall von der Wikimania: Dort stellte Fabrice Florin, Entwickler der Wikimedia Foundation, am zweiten Tag in einem Vortrag mit dem Titel Giving Readers a Voice: Lessons from Article Feedback v5 die Version 5 des Article Feedback Tools vor.  Zugleich präsentierte er Untersuchungsergebnisse zur Frage, wie das AFT (die Abkürzung sei erlaubt) sich eigentlich im praktischen Einsatz bewährt.

Eine doppelt interessante Fragestellung, insbesondere für deutschsprachige Wikipedianer. Wem dies alles nichts sagt (ist ja auch schon lang her): das AFT ist ein Werkzeug in der Tradition eines Tools, das 2008 in der deutschen Wikipedia live geschaltet wurde. Anhand eines schulnotenartigen Schemas sollte damals Lesern die Möglichkeit gegeben werden, einzelne Merkmale der Artikel zu beurteilen. Die deutschsprachige Community äußerte damals in einem Meinungsbild nicht zuletzt starke Zweifel an der Zweckmäßigkeit solcher Beurteilungen und setzte die Abschaltung dieses Tools durch.

Das war auch ein klares Signal gegen das Article Feedback Tool, da es ebenfalls die schematisierte Beurteilung der Qualität eines Wikipedia-Artikel erlaubte und daher in der deutschen Wikipedia nie zum Einsatz kam. In der englischen Wikipedia wurde die Version 4 im Juli 2011 vollständig eingebunden, Leser konnten seither dort die Artikel bewerten, indem sie für vier verschiedene Parameter jeweils 1 (besonders schlecht) bis 5 (besonders gut) Sterne vergaben. Die Parameter waren

  • Trustworthy – Ist dieser Artikel und seine enthaltenen Quellen vertrauenswürdig?
  • Objective – Ist der Artikel ausgewogen und umfassend formuliert?
  • Complete – Beinhaltet dieser Artikel die wichtigsten Informationen zu diesem Thema?
  • Well-Written – Ist der Artikel gut strukturiert und geschieben?

Die von Fabrice und seinem Team vorgenommenen Untersuchungen zu den Auswirkungen dieser Methode bestätigten die damaligen Befürchtungen der deutschen Wikipedianer: die Bewertungen wurden selten wirklich objektiv vorgenommen, vielmehr beurteilten Leser, ob sie das Thema oder den Hauptautoren mögen oder eben auch nicht. Und so zogen die Entwickler für die neue Version 5 die entsprechenden Konsequenzen. Diese neue Version arbeitet nicht mehr mit der Sternevergabe, sondern gibt den Lesern die Möglichkeit zusätzlich zu einer Einschätzung als positiv, neutral oder negativ einen Kommentar zu schreiben.

Diese direkte Möglichkeit zum Feedback ist offensichtlich zugänglicher als die Diskussionsseite. Zugleich bietet sie weitere Funktionen. So ist es möglich, vorherige Feedbacks zum Artikel zu bewerten, um sie zu priorisieren. Am meisten zeigt sich der Wert des Tools aber darin, dass es die Leser deutlich mehr zum eigenständigen Editieren ermuntert, so die Studien des Teams um Fabrice Florin.

In diesem kleinen, englischsprachigen Video kann man sich die Funktionalität des AFT kurz zusammen gefasst ansehen. Derzeit ist die Version in etwa 3% der englischen WP eingebunden, wer das Ganze einmal praktisch sehen möchte, kann es z.B. am Artikel zu Barack Obama probieren. Bis Ende Juli sollen 10% der englischen Wikipedia eingebunden sein und Ende September die gesamte englische Wikipedia. Ob die deutschsprachige Wikipedia das AFT einführt, obliegt der Community. Die bisher beanstandeten Fehler jedenfalls sind erfreulicherweise durch die neue Version gegenstandslos geworden.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 4,50 von 5)
Loading...

Herzlich willkommen bei Wikimedia Deutschland, Manuel Merz

Manuel wird uns künftig mit gezielter empirischer Forschung und Evaluation zur Seite stehen: Mit seiner umfangreichen Erfahrung in diesen Bereichen wird er Wikimedia Deutschland beispielsweise dabei unterstützen, Projekte systematisch zu evaluieren um ihre Effektivität zu optimieren. Manuel wird uns außerdem bei strategischen Fragestellungen beraten und dort, wo für uns der größte Informationsbedarf besteht, empirische Forschungsprojekte initiieren oder selbst durchführen. Gleich zu Anfang steht die Beratung bei der Erstellung des Wirtschaftsplans 2013, sowie bei Fragestellungen rund um die Themen „Autorinnengewinnung“ und gezielter Unterstützung der bestehenden Autorengemeinschaft.

Manuel verfügt über 8 Jahre Erfahrung in der Internet- und Wikipediaforschung und promoviert derzeit an der Technischen Universität Ilmenau zum Thema „Entwicklung einer Typologie der Autorinnen und Autoren der deutsch- und englischsprachigen Wikipedia-Communities“. Auch schon in seiner Diplomarbeit („Aktive Beteiligung an Wikipedia aus sozial-kognitiver Perspektive“) und während seines Studiums der Kommunikationswissenschaft hatte Manuel sich intensiv mit Wikipedia auseinandergesetzt. Er ist außerdem freiberuflicher Softwareunternehmer und Autor eines Buchs über „Wahlkampf im Internet“. Seit 2005 engagiert Manuel sich aktiv für Wikipedia, zuletzt hat er in Koordination mit Wikimedia Deutschland die „Wikipedia Benutzerumfrage 2011“ durchgeführt (www.wikipediaforschung.de).

Manuel wird zunächst in Teilzeit für den Verein arbeiten und parallel seine Promotion weitertreiben. Ich freue mich sehr darüber, dass Manuel für Wikimedia Deutschland arbeiten wird und uns mit seiner Erfahrung unterstützt!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (15 Bewertungen, Durchschnitt: 4,40 von 5)
Loading...

RENDER bei der WebScience 2012

Vom 22. bis zum 24. Juni fand die WebScience 2012 in Evanston, etwa zwölf Meilen nördlich von Chicago, statt. Zu der seit 2009 jährlich stattfindenden Konferenz treffen sich Wissenschaftler, um die junge Disziplin WebScience voran zu bringen. WebScience verbindet Theorien und Methoden aus Informatik, Psychologie und Sozialwissenschaft, um die Datenschätze zu analysieren, die beispielsweise durch Facebook, Twitter und Wikipedia entstehen.

Unsere Einreichung mit dem Titel „A Knowledge Diversity Dashboard for Wikipedia“ wurde angenommen und in Form eines Posters präsentiert. Das Poster stellt das RENDER Toolkit vor, eine Sammlung von Analyse-Werkzeugen auf dem Wikimedia Toolserver.

Diejenigen, die mit wissenschaftlichen Konferenzen vertraut sind, können diesen Abschnitt überspringen. Für alle anderen: Wissenschaftliche Konferenzen bestehen aus unterschiedlichen Formaten. Es gibt Keynotes und Panels, Paper Sessions und Poster Sessions. Wir waren auf der Poster Session vertreten, wobei in diesem Fall insgesamt etwa 50 Poster in zwei Phasen präsentiert wurden. Dieses Format ist interaktiv: Man stellt das eigene Poster vor, um mit Interessenten an Hand der Darstellung einzelne Aspekte zu diskutieren, Anregungen einzuholen und die Arbeit der Fachkollegen kennen zu lernen. So konnten zahlreiche Rückmeldungen zu unseren Analysen und zum Toolkit gesammelt werden.

Abschließend eine persönliche Bemerkung: Besonders beeindruckend war die Closing Keynote vom Luis von Ahn. Er stellte reCaptcha und Duolingo vor. Von Ahn gelingt es, zwei Anliegen, die auf den ersten Blick nichts gemeinsam haben, auf sehr gewinnbringende Weise zu verbinden: reCaptcha ermittelt, ob ein Mensch oder ein Skript eine Webseite besucht und verbessert zugleich automatische Texterkennung, Duolingo verknüpft das Lernen einer Fremdsprache mit der Crowdsourcing-Übersetzung von Texten aus dem Web. Genial!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (19 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...

Google stellt historische Infobox-Daten zur Verfügung

Guillermo Garrido (NLP Group, UNED, Spanien) und Enrique Alfonseca von Google Research Zürich, einem unserer Projektpartner im RENDER-Projekt, haben ein Datenset extrahiert, das alle Attribut-Wert-Paare von Infoboxen in der englischsprachigen Wikipedia-Artikeln seit 2003 enthält.

Das WHAD-Set (Wikipedia Historical Attribute Data) ist auf der Downloadseite im RENDER-Toolkit abrufbar. Das 5,5 GB große Datenset steht unter der Lizenz CC-BY-SA und ist als Trainingsdatenmenge für Forscher im Bereich überwachtes maschinelles Lernen besonders interessant.

Ausführlichere Informationen zum WHAD-Datenset finden sich auf Enrique Alfonsecas Webseite.

Wir freuen uns besonders auf Enriques Teilnahme an der Wikipedia Academy. Seine Arbeiten zum WHAD-Datenset stellt er am Samstag während der Paper Session III: Analyzing Wikipedia Article Data vor.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (1 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...