Archiv für die ‘Technisches’ Kategorie



Internship at Wikimedia Deutschland e. V.

Wie es ist, bei Wikimedia Deutschland im Bereich Software Entwicklung Praktikant zu sein, erzählt uns Andrew Pekarek-Kostka in diesem Gastbeitrag auf Englisch. Andrew berichtet über seine Vorstellungen vor dem Praktikum, der Arbeitsatmosphäre, wie er sich an unsere Prozesse der agilen Softwareentwicklung angepasst hat und an welchen Wikiprojekten er arbeitete.

First Impression

Sandra Müllrick, „WMDE Softwareentwicklung2“, CC BY-SA 4.0

Before starting at Wikimedia Deutschland e. V., being a 17-year old with no previous work experience, I was under the impression that working for such a big organization would be similar to the way a typical work day was portrayed in the famed 90s movie “Office Space”: boring, dull, and uninteresting. However, when I walked into the office for the first time the contrast between the rather dark and grim weather in Berlin and the ecstatic attitude of the office was huge. The overall working atmosphere is welcoming and spirited with a perfect balance of fun and professionalism. It was a positive opposite of what I was expecting.

 

My Welcome

My first few days at Wikimedia were spent going through a process called “onboarding” which enabled me to get ready for my following 7 weeks. This consisted of prepping my machine, my software, and getting all my accounts setup along with a quick tour which gave me the opportunity to briefly meet most of my colleagues from all departments. If I had any questions or needs, I always knew I could ask one of my colleagues for assistance. Following the setup came a series of meetings through which I gained valuable insight into the various different departments and simultaneously meet the many interesting people who, together make Wikimedia Deutschland possible.

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (14 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

EnthusiastiCon: Programmieren ist persönlich, spannend und begeistert

Ein Beitrag von Julia Schuetze

Technisch und persönlich ging es auf der ersten EnthusiastiCon am 18. bis 21. Juni 2015 zu. 30 Begeisterte kamen zu Wikimedia Deutschland, um sich einmal für ein ganzes Wochenende auf eine etwas andere Weise dem Programmieren zu widmen.

Die persönliche Note verliehen die Teilnehmenden der Konferenz: Ein bunter Mix von Programmierenden und Interessierten schaffte es, die verschiedensten Seiten des Themas vielfältig zu beleuchten. Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (4 Bewertungen, Durchschnitt: 4,75 von 5)
Loading...Loading...

Technische Wünsche werden wahr — Bausteine für eine Zusammenarbeit von Communitys in den Wikimedia-Projekten und der Software-Entwicklung bei Wikimedia Deutschland

Freies Wissen in der Wikipedia und anderen Wikimedia-Projekten wird mit Hilfe von Software eingegeben, bearbeitet und verbessert. In einem Konzeptpapier stellt Wikimedia Deutschland Rahmenbedingungen vor, wie diese Software von den Communitys verbessert werden kann und neue Anregungen von Autorinnen und Autoren aufgenommen werden können. Der Prozess, in dem diese Rahmenbedingungen entwickelt wurden, ist selbst hoch kollaborativ und entstand über Monate aus Veranstaltungen vor Ort mit Freiwilligen und Diskussionen im Netz. Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

EnthusiastiCon vom 19.-21. Juni: Eine Konferenz zum Thema Begeisterung für das Programmieren

Nur noch wenige Tage bis zur EnthusiastiCon! Haltet euch das Wochenende frei!!!

Liebe Programmerinnen und Programmierer, liebe digital Interessierte,

nächstes Wochenende vom 19.-21 Juni ist es endlich soweit! Die erste EnthusiastiCon findet in den Räumen der Wikimedia Deutschland statt.
Be there or be
def square(x): print(x**2)

 

Eine Veranstaltung nur zum Thema Programmieren mit Vorträgen, Interaktion und viel Zeit zum persönlichen Austausch. Teilt eure Leidenschaft mit anderen und kommt vorbei. Auf SourceCode Berlin findet ihr den Ablaufplan und einen Sneak-Peak zu den Themen, die uns begeistern werden.

Zum Beispiel habt ihr euch schon einmal überlegt, dass Impro-Theater aus euch einen besseren Entwickler machen könnte? Wie es einfacher ist, wartbaren Code zu schreiben? Wie ein Betriebsystem aussehen kann, dass von Grund auf sauber entwickelt wird? Dies und viel viel mehr wird auf der EnthusiastiCon diskutiert.

Hier geht’s zum Ablaufplan: https://sourcecode.berlin/enthusiasticon/

Die Veranstaltung findet auf Englisch statt.

Wir freuen uns auf euch! Bis ganz bald…der Countdown läuft.

 

Euer EnthusiastiCon Team

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 2,33 von 5)
Loading...Loading...

Visualizing history with automated event maps

German summary: Fred Johansen hat eine Webseite erstellt mit der sich, basierend auf Daten in Wikidata, einfach historische Ereignisse zeitlich und räumlich einordnen lassen. Hier erzählt er über die Seite und seine Arbeit daran.


The following post is a guest blog by Fred Johansen about EventZoom.

Just as today’s online maps are being continually updated, historical maps can be automatically generated and updated to reflect our ever-evolving knowledge about the past. As an example, please allow me to tell you about a project that I’m working on. Recently I implemented an event visualization site which accepts geolocation data combined with info about time spans of events, and renders the input as points on a map zoomable in time and space. Each such point is an object with a title, description, latitude / longitude and a time, as well as a reference back to its source. But what source should be used to fill this framework with data? Even though this is a tool born outside of the Wikimedia world, so far the best content I’ve found for it is Wikidata – more specifically, the Wikidata API. By importing data about events that are part of larger events all defined in Wikidata, with the restriction that they contain a start or end date as well as a location, that’s all the data that’s needed for representation in this kind of dynamic historical map.

Extracting data from the Wikidata API works like a charm. Sometimes, of course, some data might be missing from Wikidata. For example, an event may contain an end date, but no start date. So, what’s fantastic about Wikidata is that it’s easy to simply extend its data by adding the missing fact. In addition to helping in increasing the data of Wikidata, this also improves the overall possibilities for visualization.

This very activity serves as a positive feedback loop: The visualization on a map of, for example, the events of a war makes errors or omissions quite obvious, and serves as an incentive to update Wikidata, and finally to trigger the re-generation of the map.

The site I’m referring to here is EventZoom.net – currently in Beta and so far containing 82 major event maps and growing. You can extend it yourself by triggering the visualization of new maps: When you do a search for an event, for example a war, and the Search page reports it as missing, you can add it directly. All you need is its Q-ID from Wikidata. Paste this ID into the given input field, and the event will be automatically imported from the Wikidata API, and a map automatically generated – with the restriction that there must exist some ‘smaller’ events that contain time & location data and are part (P361) of the major event. Those smaller events become the points on our map, with automatic links back to their sources. As for the import itself, for the time being, it also depends on wdq.wmflabs.org, but I expect that will change in the future.

Although you can always click Import to get the latest info from Wikidata, an automatic update is also in the pipeline, to trigger a re-import whenever the event or any of its constituent parts have changed in Wikidata. As for other plans, at the very least our scope should encompass all the major events of history. Here, wars represent a practical starting point, in so far as they consist of events that are mostly bounded by very definite time spans and locations, and so can be defined by those characteristics. The next step would be to extend the map visualization to other kinds of events – as for Wikidata, it could be interesting to visualize all kinds of items that can be presented with a combination of geolocations and temporal data, and that can be grouped together in meaningful ways.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 3,33 von 5)
Loading...Loading...

Tech on Tour: Technikunterstützung für die Communities vor Ort

In diesem Jahr geht die Technik auf Touren. In Zusammenarbeit mit den Communities sollen in Workshops vor Ort Rahmenbedingungen entwickelt und diskutiert werden, wie Software-Entwicklung eingesetzt werden kann, um Bedürfnisse von Freiwilligen zu erfüllen.

Dabei geht es nicht nur um kleine Nicklichkeiten im Alltag mit der Wiki-Software, die im Englischen auch gerne als Paper cut bugs bezeichnet werden und oft schnell behoben sind. Es soll auch groß gedacht werden: Wo wollen wir (technisch) hin? Und wie können Bedürfnisse strukturiert aufgenommen und transparent abgearbeitet werden?

Technik, die begeistert auf dem Weg zu den Communities

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (7 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

EnthusiastiCon: Eine Konferenz über die Begeisterung für das Programmieren

Vom 19. bis zum 21. Juni veranstaltet Wikimedia Deutschland im Rahmen von sourcecode.berlin eine Konferenz für die Community der Programmiererinnen und Programmierer mit dem Namen EnthusiastiCon. In einer Reihe von kleinen, 10-minütigen Vorträgen geht es um Begeisterung für das Schreiben von Software: Interessantes, Seltsames und Schönheit im Code und schlaue Lösungen für ungewöhnliche Probleme. Vorträge können eingereicht werden zu den unterschiedlichsten Themen wie zum Beispiel hardwarenahe Programmierung bei Embedded Devices, Web-Entwicklung oder Kindern beizubringen zu programmieren. Wichtig ist nur, dass es begeistert und diese Begeisterung in 10 Minuten auf das Publikum übertragen werden kann.

Die Einreichungsphase für die EnthusiastiCon beginnt ab sofort. Der Einreichungsprozess ist – in der Konferenzsprache Englisch – auf der Konferenzseite erläutert.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 4,00 von 5)
Loading...Loading...

Improving data quality on Wikidata – checking what we have

German summary: Ein Team von Studenten des Hasso Plattner Instituts in Potsdam arbeitet aktuell mit Wikimedia Deutschland an Werkzeugen um die Datenqualität auf Wikidata zu verbessern und zu sichern. In diesem Beitrag stellen sie ihre beiden Projekte vor: die Prüfung von Wikidatas Daten auf Konsistenz mit sich selbst sowie die Prüfung von Wikidatas Daten gegen andere Datenbanken.

 

 Hello, we are the Wikidata Quality Team. We are a team of students from Hasso Plattner Institute in Potsdam, Germany. For our bachelor project we are working together with the Wikidata development team to ensure high quality of the data on Wikidata.

Wikidata provides a lot of structured data open to everyone. Quite a lot. Actually, they are providing an enormous amount of data approaching the mark of 13.5 million items, each of which has numerous statements. The data got into the system by diligent people and by bots, and neither people nor bots are known for infallibility. Errors are made and somehow we have to find and correct them. Besides erroneous data, incomplete data is another problem. Imagine you are a resident of Berlin and want to improve the Wikidata item about the city. You go ahead and add its highest point (Müggelberge), its sister cities (Los Angeles, Madrid, Istanbul, Warsaw and 21 others) and its new head of government (Michael Müller). As you do it the correct way, you are using qualifiers and references. Good job, but did you think of adding Berlin as the sister city of 25 cities? Although the data you entered is correct, it is incomplete and you have—both unwilling and unknowingly—introduced an inconsistency. And that’s only, assuming you used the correct items and properties and did not make a typo while entering a statement. And thirdly, things change. Population numbers vary, organizations are dissolved and artists release new albums. Wikidata has the huge advantage that this change only has to be made in one place, but still: Someone has to do it and even more importantly, someone has to become aware of it.

Facing the problems mentioned above, two projects have emerged. People using Wikidata are adding identifiers of external databases like GND, MusicBrainz and many more. So why not make use of them? We are developing a tool that scans an item for those identifiers and then searches in the linked databases for data against which it compares the items statements. This does not only help us verify Wikidata’s content and find mismatches that could indicate errors, but also makes us aware of changes. MusicBrainz is a specialist for artists and composers, GND for data related to people, and these specialists‘ data is likely to be up to date. Using their databases to cross-check, we hope to be able to have the latest data of all fields represented in Wikidata.

The second projects focuses on using constraints on properties. Here are some examples to illustrate what this means:

  • Items that have the property “date of death” should also have “date of birth“, and their respective values should not be more than 150 years apart
  • Properties like “sister city“ are symmetric, so items referenced by this statement should also have a statement “sister city“ linking back to the original item
  • Analogously, properties like “has part” and “part of” are inverse and should be used on both items in a lot of cases
  • Identifiers for IMDb, ISBN, GND, MusicBrainz etc. always follow a specific pattern that we can verify
  • And so on…

Checking these constraints and indicating issues when someone visits an items page, helps identify which statements should be treated with caution and encourages editors to fix errors. We are also planning to provide ways to fix issues (semi-)automatically (e.g. by adding the missing sister city when he is sure, that the city really has this sister city). We also want to check these constraints when someone wants to save a new entry. This hopefully prevents errors from getting into the system in the first place.

That’s about it – to keep up with the news visit our project page. We hope you are fond of our project and we appreciate your feedback! Contact information can also be found on the project page.

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (11 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

Platypus, a speaking interface for Wikidata

PPP (Projet Pensées Profondes)  is a student project aiming to build an open question answering platform. Its demo, Platypus (http://askplatyp.us) is massively based on Wikidata content. 

At the École normale supérieure de Lyon we have to do a programming project during the first part of your master degree curriculum. Some of us were very interested in working on natural language processing and others on knowledge bases. So, we tried to find a project that could allow us to work on both sides and, quickly, the idea of an open source question answering tool came up.
This tool has to answer to a lot of different questions so one of the requirements of this project was to use a huge generalist knowledge base in order to have a usable tool quickly. As one of us was already a Wikidata contributor and inspired by the example of the very nice but ephemeral Wiri tool of Magnus Manske, we quickly chose to use Wikidata as our primary data source.

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (3 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...

Platypus, eine Schnittstelle zu Wikidata in natürlicher Sprache

PPP (Projet Pensées Profondes)  ist ein Projekt von Studierenden mit dem Ziel eine offene Frage-Antwort-Plattform zu bauen. Die dabei entstandene Demo-Anwendung Platypus (http://askplatyp.us) stützt sich in erster Linie auf Inhalte von Wikidata. In einem Gastbeitrag berichten die Menschen hinter Platypus von ihrem Projekt, Wikidata das Sprechen beizubringen. 

An der École normale supérieure de Lyon steht im ersten Teil des Masterstudiengangs ein Software-Praktikum auf dem Plan. Einige von uns waren an natürlicher Sprachverarbeitung interessiert, andere an Wissensdatenbanken. Wir suchten also ein Projekt, an dem beide Seiten arbeiten konnten und kamen recht schnell auf die Idee einer offenen Frage-Antwort-Plattform. Dieses Werkzeug sollte eine Menge unterschiedlicher Fragen beantworten können und brauchte deshalb eine einen riesigen Datenfundus an Weltwissen, damit wir schnell loslegen konnten. Jemand bei uns war schon Wikidata-Editor und inspiriert von dem schicken, aber mittlerweile nicht mehr gepflegten Wiri-Tool von Magnus Manske stand schnell fest, dass wir Wikidata als primäre Datenquelle nutzen wollten.

Weiterlesen »

1 Stern2 Sterne3 Sterne4 Sterne5 Sterne (2 Bewertungen, Durchschnitt: 5,00 von 5)
Loading...Loading...