zurück

Datenpartnerschaften mit Wikidata: beaTunes

Ein Interview mit Hendrik Schreiber von beaTunes darüber, wie Wikidata in einem kommerziellen Software-Produkt zum Einsatz kommt.

Jens Ohlig

25. Juli 2017

This blogpost is also available in English.

Datenpartnerschaften bei Wikidata können verschiedene Formen annehmen. In Form von Datenspenden können Institutionen, Organisationen und Einzelpersonen Inhalte zu der freien Wissensdatenbank beitragen, aber Nachnutzungen von Daten ist genauso interessant, denn auch sie tragen zu dem Ökosystem des Freien Wissens bei und geben mehr Menschen mehr Zugriff zu mehr Wissen.

beaTunes ist eine Anwendung für den Mac, mit der man Playlisten für die eigene Musiksammlung erstellen kann. Die Anwendung benutzt Wikidata auf vielfältige Art und Weise zur Anreicherung der Musikdaten.

Die freie Lizenz von Wikidata erlaubt auch die kommerzielle Nachnutzung. Wir haben mit Hendrik Schreiber von beaTunes darüber gesprochen, wie Wikidata in einem kommerziellen Software-Produkt zum Einsatz kommt.

Kannst du dich kurz vorstellen?

Hendrik Schreiber Foto: Pascal Nordmann CC BY-SA 4.0

Ich bin ein unabhängiger Software-Entwickler mit fast zwanzigjähriger Berufserfahrung. Ich wohne in Köln und habe mich auf Music Information Retrieval (MIR) spezialisiert.

Was ist beaTunes? Wie funktioniert es und welche Probleme löst es?

Vor mehr als zehn Jahren habe ich beaTunes als Projekt zum Spaß angefangen zu schreiben. Zu der Zeit hatte ich mehrere Jahre als selbstständiger Dienstleister in der Software-Entwicklung gearbeitet und fühlte mich vom täglichen Geackere ein bisschen ausgebrannt. Ich wollte einfach mal etwas Kreatives zum Spaß machen. So kam ich auf die Idee, ein Tool für intelligente Musikbibliotheksverwaltung und Audio-Analyse zu schreiben. Die erste Version war nur auf Englisch und lief exklusiv auf OS X. Java war als Programmiersprache erste Wahl für mich. Damals glaubte ich noch an Steve Jobs berühmtes Versprechen, dass der Mac die beste Java-Plattform aller Zeiten werden sollte. Naja, das lief dann irgendwie anders, wie wir wissen.

Mit den Jahren wurde beaTunes dann mehr als ein Hobby und ist mittlerweile zu meinem Hauptberuf geworden.

Wofür kann beaTunes eingesetzt werden?

Mit Konsistenzchecks und als Referenzdatenbank können Metadaten, die in Textform vorliegen (Künstler, Album, Titel) ergänzt werden. Die Datenbank enthält einen Mix aus Benutzerbeiträgen und Daten aus Quellen wie MusicBrainz und Discogs (Identifikationsnummern für MusicBrainz und Discogs sind beide in Wikidata verlinkt). Aber Text-Metadaten sind nur ein Teil der Geschichte. Andere wichtige musikalische Eigenschaften sind Tonart, Tempo (BPM), Klangfarbe, Lautstärke usw. Diese Eigenschaften kann beaTunes direkt aus dem Audiosignal extrahieren. Wenn man Playlisten mit ähnlich klingenden Songs erstellen will, ist das ungemein hilfreich. Und das ist dann auch gleich die dritte Hauptfunktionalität: mit umfassenden Metadaten toll klingende Playlisten erstellen.

Das bedeutet, dass beaTunes eine ziemlich diverse Benutzerschaft anspricht. Allen ist natürlich gemein, dass sie Musik lieben. Aber einige wollen Metadaten vervollständigen, andere brauchen gute Tonart- und Tempoerkennung für ihren nächsten DJ-Auftritt, weil die Beats und Harmonien aufeinander abgestimmt werden müssen. Und dann gibt es noch eine Gruppe, die fit bleiben wollen und Stücke entdecken will, die zu ihrem Lauf- oder Radfahrrhythmus passen.

Welche Probleme löst Wikidata für dich? Wie bist du auf Wikidata gestoßen?

beaTunes benutzt Wikidata in verschiedenerlei Hinsicht.

Wenn Metadaten manuell editiert werden, werden andere Schreibweisen und zusätzliche Daten aus unterschiedlichen Quellen einbezogen. beaTunes ist sozusagen eine Rechtschreibkorrektur, die auf Musik-Metadaten spezialisiert ist. Wikidata ist eine der Referenzquellen. Dadurch, dass Wikidata nach  MusicBrainz- und Discogs-IDs durchsucht werden kann, funktioniert das ziemlich direkt und einfach. Weil Wikidata den Zugriff auf Daten in  DBpedia oder Wikipedia so einfach macht, wird Wikidata auch benutzt, um Zusatzinformationen zu Alben, TV-Sendungen oder Filmen nachzuschlagen — beaTunes zeigt einfach einen Anrisstext aus dem entsprechenden Wikipedia-Artikel an.  Da Informationen in Wikidata typisiert vorliegen, ist das alles ziemlich hilfreich bei der Vermeidung von Mehrdeutigkeiten.

Neben Daten in Textform aus dem Wikiversum verwendet beaTunes auch Datenbeziehungen. Wikidata wird benutzt, um ähnliche Künstler nachzuschlagen, Künstler aus der gleichen Region, die Musik in einem bestimmten Genre produzieren und zu einer bestimmten Zeit aktiv sind oder waren. Zusätzliche Informationen wie Bandmitgliedschaften können ebenfalls herangezogen werden. Um dann abschließend eine Rangliste der Künstler zu erstellen, die nach diesen Kriterien gefunden wurden, benutzt beaTunes einen einfachen Machine-Learning-Algorithmus.

Last but not least: beaTunes benutzt Wikidata, um Fragen zu Genre-Beziehungen zu beantworten. Weil Wikidata eine Subgenre-Beziehung herstellt, kann leicht erschlossen werden, dass Hard Rock ein Subgenre von Rock ist, aber Calypso nicht. Die Genre-Verknüpfungen haben auch dazu geführt, dass ich Wikidata entdeckt habe. Ich habe versucht, Beziehungsgraphen von Genres aus einer anderen Datenbank zu erschließen und brauchte einen “objektiven” Referenzgraphen.  Bei der Erschließung habe ich sowohl Wikidata als auch DBpedia  benutzt (siehe http://www.tagtraum.com/learned_ontologies.html). Wikidatas klare Struktur sprach mir sehr zu.

Bist du zufrieden mit der API, dem Datenbestand, der Dokumentation? Hast du Wünsche für mögliche Weiterentwicklungen?

Mehr semantische Daten zu Musik fände ich ganz toll. Alle Beatles-Songs liegen zum Beispiel fertig annotiert vor, mit Tonart, Akkorden, Tempo etc.(siehe http://isophonics.net/content/reference-annotations-beatles). Die Daten sind bereits alle da, sie sind nur von Wikidata aus noch nicht abfragbar.

Freies Wissen und kommerzielle Produkte — das muss kein Widerspruch sein, auch wenn es für viele Menschen nicht der erste Gedanke ist, der ihnen in den Sinn kommt. Wie stellt sich für dich die Arbeit mit Materialien unter freien Lizenzen dar? Wie können beide Seiten voneinander profitieren?

Zunächst einmal bin ich unglaublich dankbar für die freien Daten da draußen. Nicht nur Wikidata, auch Projekte wie MusicBrainz und AcousticBrainz. Sie alle sind unglaubliche Schatzkästchen Freien Wissens, die auf Nachnutzung warten. Je mehr interessante Anwendungen wir dafür haben, desto mehr Aufmerksamkeit bekommen sie und desto besser wird auch das Ökosystem des Wissens. Öffentliche Wharnehmung, ob von kommerzieller oder freier Seite, ist notwendig für den Erfolg von freien Daten.

Nebenbei bemerkt kann die Nachnutzung freier Daten in einem Produkt auch zu Verbesserung der Datenbasis beitragen. Für beaTunes habe ich gerade ein kleines Plugin veröffentlicht, mit dem man extrem einfach Beiträge zu AcousticBrainz hinzufügen kann (siehe http://blog.beatunes.com/2017/06/acousticbrainz-plugin-available-now.html). Und für Wikidata hat beaTunes die Funktion “Open in…”  mit der man die Wikidata-Seite zu dem markierten Song oder Künstler öffnen kann. Wenn jemand etwas beitragen will, ist er oder sie damit genau am richtigen Startpunkt. Daten fließen also nicht nur in eine Richtung. Auch eine kommerzielle Anwendung wie beaTunes kann so zu der freien Wissensdatenbank beitragen.

Kommentare

  1. […] Dieser Beitrag ist auch auf Deutsch verfügbar. […]

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert