Archiv für die ‘Toolserver’ Kategorie



RENDER bei der WebScience 2012

Vom 22. bis zum 24. Juni fand die WebScience 2012 in Evanston, etwa zwölf Meilen nördlich von Chicago, statt. Zu der seit 2009 jährlich stattfindenden Konferenz treffen sich Wissenschaftler, um die junge Disziplin WebScience voran zu bringen. WebScience verbindet Theorien und Methoden aus Informatik, Psychologie und Sozialwissenschaft, um die Datenschätze zu analysieren, die beispielsweise durch Facebook, Twitter und Wikipedia entstehen.

Unsere Einreichung mit dem Titel „A Knowledge Diversity Dashboard for Wikipedia“ wurde angenommen und in Form eines Posters präsentiert. Das Poster stellt das RENDER Toolkit vor, eine Sammlung von Analyse-Werkzeugen auf dem Wikimedia Toolserver.

Diejenigen, die mit wissenschaftlichen Konferenzen vertraut sind, können diesen Abschnitt überspringen. Für alle anderen: Wissenschaftliche Konferenzen bestehen aus unterschiedlichen Formaten. Es gibt Keynotes und Panels, Paper Sessions und Poster Sessions. Wir waren auf der Poster Session vertreten, wobei in diesem Fall insgesamt etwa 50 Poster in zwei Phasen präsentiert wurden. Dieses Format ist interaktiv: Man stellt das eigene Poster vor, um mit Interessenten an Hand der Darstellung einzelne Aspekte zu diskutieren, Anregungen einzuholen und die Arbeit der Fachkollegen kennen zu lernen. So konnten zahlreiche Rückmeldungen zu unseren Analysen und zum Toolkit gesammelt werden.

Abschließend eine persönliche Bemerkung: Besonders beeindruckend war die Closing Keynote vom Luis von Ahn. Er stellte reCaptcha und Duolingo vor. Von Ahn gelingt es, zwei Anliegen, die auf den ersten Blick nichts gemeinsam haben, auf sehr gewinnbringende Weise zu verbinden: reCaptcha ermittelt, ob ein Mensch oder ein Skript eine Webseite besucht und verbessert zugleich automatische Texterkennung, Duolingo verknüpft das Lernen einer Fremdsprache mit der Crowdsourcing-Übersetzung von Texten aus dem Web. Genial!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (18 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

Bessere Betreuung für den Toolserver

Der Toolserver hat jetzt einen hauptamtlichen Admin:  Wikimedia Deutschland hat River Tarnell ab dem 1. Februar mit der Betreuung und Wartung des Toolservers beauftragt. River hat den Toolserver mit aufgebaut und war stets sehr aktiv dort. Aber wenn man so etwas in der Freizeit macht, ist nicht immer Zeit für alles, dann bleibt schon mal was liegen. Dies führte in der Vergangenheit immer wieder zu Ausfällen des Servers. Das soll mit dem Auftrag an River nun verbessert werden. Zusätzliche Absprachen über das Vorgehen in Notfällen sorgen dafür, das der Toolserver in Zukunft zu mindestens 99% verfügbar sein wird.

Die Verpflichtung eines hauptamtlichen Admins wird auch die ehrenamtlichen Administratoren und Mitarbeiter des Toolservers von nervigen Routineaufgaben entlasten, um die sich in Zukunft River kümmern wird. Ehrenamtliche Mitarbeit wird auch weiterhin eine der tragenden Säulen eines erfolgreichen und produktiven Toolservers sein.

Wir danken allen Mitarbeitern für den großartigen Einsatz bislang, und freuen uns auf eine noch bessere Zusammenarbeit in Zukunft!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (21 Bewertungen, Durchschnitt: 3,71 von 5)
Loading...Loading...

Wikimedia Foundation unterstützt den Toolserver mit 30.000 EUR

Im April haben wir bei der Foundation Geld dafür beantragt, den Toolserver stabiler gegen Ausfälle zu machen (Antragstext, englisch). Hintergrund ist, dass eine der Hauptfunktionen des Toolservers besonders fehleranfällig ist. Der Toolserver hat Kopien der Daten von allen knapp 780 Wikis der Wikimedia Foundation, also den Wikipedias in allen Sprachen und allen anderen Wikimedia-Projekten wie den Wiktionaries, Wikibooks, Commons, etc. Diese Daten werden live auf den Toolserver gespielt, hierbei sollte es allenfalls ein paar Sekunden Verzug geben. Allerdings fällt diese “Datenreplikation” manchmal aus, oder schlimmer, arbeitet fehlerhaft. Dann wird es notwendig, den gesamten Bestand noch einmal zu kopieren und die Replikation neu anzufahren. Das kann Tage und Wochen dauern – und in dieser Zeit haben Benutzer des Toolservers keine aktuellen Daten. Und, noch schlimmer, gibt es während dieser Zeit kein aktuelles Backup der Daten außerhalb des Datencenters in Tampa.

Diese etwas wackelige Situation soll nun verbessert werden: wir wollen von jeder Datenbank zwei Kopien haben, statt nur einer. So bleibt eine verfügbar wenn die andere ausfällt, die Tools haben aktuelle Daten und es gibt immer ein Backup “off site” in Amsterdam. Um das zu erreichen, brauchen wir drei neue Datenbank-Server – und die können wird mit den 40.000 Dollar (knapp 30.000 Euro) von der Foundation jetzt kaufen. Bis die Online sind, wird es zwar noch ein paar Monate dauern, aber wir freuen uns jetzt schon!

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (13 Bewertungen, Durchschnitt: 4,54 von 5)
Loading...Loading...

Neue Server für den Toolserver und OpenStreetMap

Gestern hat Wikimedia Deutschland fünf neue Server bestellt. Drei davon werden für das OpenStreetMap-Projekt verwendet, und drei werden den Toolserver Cluster erweitern. Müssten es dann nicht sechs sein? Nein, denn einer der Server wird für OpenStreetMap im Toolserver Cluster eingesetzt! Und das ist wohl auch der interessanteste:

Auf diesem neuen “Map-Toolserver” werden interessierte Programmierer die Gelegenheit haben, mit den Daten des OpenStreetMap-Projekts zu arbeiten und Werkzeuge bereitzustellen, die diese Daten nutzen. Zugang zu dem neuen Server wird, ähnlich wie bislang auch für andere Toolserverprojekte, auf Anfrage gewährt. Wir hoffen, der OpenStreetMap-Community auf diese Weise bei der Entwicklung neuer Werkzeuge helfen zu können.

Besonders interessant ist natürlich die Integration von OpenStreetMap in Wikipedia, die bereits beim Entwicklertreffen besprochen wurde. Sie soll automatisch Karten zu Ortsartikeln generieren und auch interaktive Karten bereitstellen, auf denen sich der Benutzer frei bewegen kann. Für diese Integration werden die übrigen zwei neuen OpenStreetMap-Server benutzt.

Die zwei verbleibenden Server für den Toolserver Cluster sind eine Investition in die Stabilität und Leistungsfähigkeit des Toolservers: ein Server wird unseren ältesten Datenbankserver ablösen, dem zunehmend die Puste ausgeht. Der zweite wird dafür sorgen, dass künftig mehr Rechenleistung für Bots zur Verfügung steht.

Insgesamt hoffen wir mit dieser Anschaffung die Stabilität des Toolserver-Projekts zu erhöhen, die OpenStreetMap-Community zu unterstützen und die Integration von interaktiven Karten in Wikipedia zu erlauben.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (17 Bewertungen, Durchschnitt: 4,29 von 5)
Loading...Loading...

Wenn man die Kamera im Nacken spürt…

“Behavioral Targeting” ist der Fachbegriff für die Auswahl möglichst passender und interessanter Inhalte (meistens Werbung), basierend auf dem Verhalten und den Nutzungsgewohnheiten eines Menschen.

Per se ist das eigentlich gar keine schlechte Idee. So sollte der Nutzen bei werbefinanzierten Angeboten nicht nur für den Anbieter, sondern auch für den Besucher größer werden, da die Werbung – zumindest in der Theorie – eher seinen Interessen entspricht. Gleichzeitig muss einem jedoch bewusst sein, dass dabei eine Menge Daten anfallen, die ein relativ genaues Bild von einem aufzeigen.

Unabhängig vom Nutzen sollte aber eines gewährleistet sein: Jeder sollte für sich selbst bestimmen können, ob er an dieser Form der Datenanalyse teilnehmen möchte oder nicht. Und nicht nur das: Er sollte sein explizites Einverständnis dazu geben.

Diese Grundannahme wird von dem Unternehmen Phorm unterlaufen. Phorm setzt nicht auf der Verbraucherseite an, sondern greift entsprechende Daten direkt bei Internetprovidern ab. In Großbritannien hat Phorm mit mehreren großen Providern eine Allianz geschlossen, so dass es sich Zugriff auf die Surfgewohnheiten von mehr als 70 % aller Haushalte mit Breitbandanschluss gesichert hat.

Im Gegensatz zu einem Anbieter, der auf seinen eigenen Seiten Behavioral-Targeting-Techniken nutzt, hat Phorm keinen Zugriff auf die Inhalte anderer Anbieter und die Klickstreams der Nutzer. Um dieses “Problem” zu umgehen setzten die mit Phorm zusammenarbeitenden Provider Deep packet inspection (DPI) ein und greifen damit tief in die Privatsphäre der Nutzer, sowie in die Funktionalität und die Freiheit des Internets ein.

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (18 Bewertungen, Durchschnitt: 4,33 von 5)
Loading...Loading...