•  

    • expand2013 (115)
    • expand2012 (309)
    • expand2011 (171)
    • expand2010 (105)
    • expand2009 (84)
    • expand2008 (60)
    • expand2007 (11)

Posts Tagged ‘Toolserver’



Google stellt historische Infobox-Daten zur Verfügung

Guillermo Garrido (NLP Group, UNED, Spanien) und Enrique Alfonseca von Google Research Zürich, einem unserer Projektpartner im RENDER-Projekt, haben ein Datenset extrahiert, das alle Attribut-Wert-Paare von Infoboxen in der englischsprachigen Wikipedia-Artikeln seit 2003 enthält.

Das WHAD-Set (Wikipedia Historical Attribute Data) ist auf der Downloadseite im RENDER-Toolkit abrufbar. Das 5,5 GB große Datenset steht unter der Lizenz CC-BY-SA und ist als Trainingsdatenmenge für Forscher im Bereich überwachtes maschinelles Lernen besonders interessant.

Ausführlichere Informationen zum WHAD-Datenset finden sich auf Enrique Alfonsecas Webseite.

Wir freuen uns besonders auf Enriques Teilnahme an der Wikipedia Academy. Seine Arbeiten zum WHAD-Datenset stellt er am Samstag während der Paper Session III: Analyzing Wikipedia Article Data vor.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (1 Bewertungen, Durchschnitt: 5,00 von 5)
Loading ... Loading ...

Tätigkeitsbericht 2010 jetzt online

2010 stand unter dem Motto Wachstum. Nicht nur die Anzahl der Mitarbeiter, der Spender, Leser und Freiwilligen ist gestiegen, auch Projekte und Initiativen von Wikimedia sind im letzten Jahr weiter gewachsen. Der Tätigkeitsbericht von Wikimedia Deutschland beschreibt ausführlich dieses Wachstum und informiert über die Vereinsarbeit in 2010.

Das vergangene Jahr war ein überaus ereignisreiches für Wikimedia Deutschland. Nicht nur langjährige Aktivitäten wie das Wikipedia-Schulprojekt oder das Literatur-Stipendium konnten erfolgreich ausgebaut werden, auch neue Projekte wurden ins Leben gerufen und fanden sehr großen Anklang in der Community, darunter der Ideenwettbewerb WissensWert und das Wikipedia-Buchprojekt. Technische Infrastruktur, Freiwilligenförderung oder Presse- und Öffentlichkeitsarbeit werden im Tätigkeitsbericht 2010 ausführlich erläutert. Darüber hinaus berichten wir über die Spendenkampagne sowie die Finanzierung und Mittelverwendung des Vereins.

Der Tätigkeitsbericht 2010 kann hier als PDF eingesehen werden. Zusammen mit den Berichten der früheren Jahre steht er außerdem als Online-Version auf unserer Vereinsseite zum Herunterladen bereit. Wer lieber die gedruckte Version liest,  kann den Tätigkeitsbericht 2010 auch gern bei uns bestellen.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (15 Bewertungen, Durchschnitt: 4,73 von 5)
Loading ... Loading ...

Bessere Betreuung für den Toolserver

Der Toolserver hat jetzt einen hauptamtlichen Admin:  Wikimedia Deutschland hat River Tarnell ab dem 1. Februar mit der Betreuung und Wartung des Toolservers beauftragt. River hat den Toolserver mit aufgebaut und war stets sehr aktiv dort. Aber wenn man so etwas in der Freizeit macht, ist nicht immer Zeit für alles, dann bleibt schon mal was liegen. Dies führte in der Vergangenheit immer wieder zu Ausfällen des Servers. Das soll mit dem Auftrag an River nun verbessert werden. Zusätzliche Absprachen über das Vorgehen in Notfällen sorgen dafür, das der Toolserver in Zukunft zu mindestens 99% verfügbar sein wird.

Die Verpflichtung eines hauptamtlichen Admins wird auch die ehrenamtlichen Administratoren und Mitarbeiter des Toolservers von nervigen Routineaufgaben entlasten, um die sich in Zukunft River kümmern wird. Ehrenamtliche Mitarbeit wird auch weiterhin eine der tragenden Säulen eines erfolgreichen und produktiven Toolservers sein.

Wir danken allen Mitarbeitern für den großartigen Einsatz bislang, und freuen uns auf eine noch bessere Zusammenarbeit in Zukunft!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (21 Bewertungen, Durchschnitt: 3,71 von 5)
Loading ... Loading ...

Neue Server für den Toolserver und OpenStreetMap

Gestern hat Wikimedia Deutschland fünf neue Server bestellt. Drei davon werden für das OpenStreetMap-Projekt verwendet, und drei werden den Toolserver Cluster erweitern. Müssten es dann nicht sechs sein? Nein, denn einer der Server wird für OpenStreetMap im Toolserver Cluster eingesetzt! Und das ist wohl auch der interessanteste:

Auf diesem neuen “Map-Toolserver” werden interessierte Programmierer die Gelegenheit haben, mit den Daten des OpenStreetMap-Projekts zu arbeiten und Werkzeuge bereitzustellen, die diese Daten nutzen. Zugang zu dem neuen Server wird, ähnlich wie bislang auch für andere Toolserverprojekte, auf Anfrage gewährt. Wir hoffen, der OpenStreetMap-Community auf diese Weise bei der Entwicklung neuer Werkzeuge helfen zu können.

Besonders interessant ist natürlich die Integration von OpenStreetMap in Wikipedia, die bereits beim Entwicklertreffen besprochen wurde. Sie soll automatisch Karten zu Ortsartikeln generieren und auch interaktive Karten bereitstellen, auf denen sich der Benutzer frei bewegen kann. Für diese Integration werden die übrigen zwei neuen OpenStreetMap-Server benutzt.

Die zwei verbleibenden Server für den Toolserver Cluster sind eine Investition in die Stabilität und Leistungsfähigkeit des Toolservers: ein Server wird unseren ältesten Datenbankserver ablösen, dem zunehmend die Puste ausgeht. Der zweite wird dafür sorgen, dass künftig mehr Rechenleistung für Bots zur Verfügung steht.

Insgesamt hoffen wir mit dieser Anschaffung die Stabilität des Toolserver-Projekts zu erhöhen, die OpenStreetMap-Community zu unterstützen und die Integration von interaktiven Karten in Wikipedia zu erlauben.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (17 Bewertungen, Durchschnitt: 4,29 von 5)
Loading ... Loading ...

Wenn man die Kamera im Nacken spürt…

“Behavioral Targeting” ist der Fachbegriff für die Auswahl möglichst passender und interessanter Inhalte (meistens Werbung), basierend auf dem Verhalten und den Nutzungsgewohnheiten eines Menschen.

Per se ist das eigentlich gar keine schlechte Idee. So sollte der Nutzen bei werbefinanzierten Angeboten nicht nur für den Anbieter, sondern auch für den Besucher größer werden, da die Werbung – zumindest in der Theorie – eher seinen Interessen entspricht. Gleichzeitig muss einem jedoch bewusst sein, dass dabei eine Menge Daten anfallen, die ein relativ genaues Bild von einem aufzeigen.

Unabhängig vom Nutzen sollte aber eines gewährleistet sein: Jeder sollte für sich selbst bestimmen können, ob er an dieser Form der Datenanalyse teilnehmen möchte oder nicht. Und nicht nur das: Er sollte sein explizites Einverständnis dazu geben.

Diese Grundannahme wird von dem Unternehmen Phorm unterlaufen. Phorm setzt nicht auf der Verbraucherseite an, sondern greift entsprechende Daten direkt bei Internetprovidern ab. In Großbritannien hat Phorm mit mehreren großen Providern eine Allianz geschlossen, so dass es sich Zugriff auf die Surfgewohnheiten von mehr als 70 % aller Haushalte mit Breitbandanschluss gesichert hat.

Im Gegensatz zu einem Anbieter, der auf seinen eigenen Seiten Behavioral-Targeting-Techniken nutzt, hat Phorm keinen Zugriff auf die Inhalte anderer Anbieter und die Klickstreams der Nutzer. Um dieses “Problem” zu umgehen setzten die mit Phorm zusammenarbeitenden Provider Deep packet inspection (DPI) ein und greifen damit tief in die Privatsphäre der Nutzer, sowie in die Funktionalität und die Freiheit des Internets ein.

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (18 Bewertungen, Durchschnitt: 4,33 von 5)
Loading ... Loading ...