zurück

Wikipedianer in der PND-Redaktion der Deutschen Nationalbibliothek

raymond

26. November 2008

Seit drei Jahren besteht eine Zusammenarbeit zwischen der deutschsprachigen Wikipedia und der Deutschen Nationalbibliothek (DNB), Standort Frankfurt am Main. Fehlerhafte Daten in der Personennamendatei (PND) oder fehlende individuelle PNDs werden seit November 2005 auf der Projektseite Wikipedia:PND/F von vielen Wikipedianern zusammengetragen und von dort von einem Mitarbeiter der DNB ausgewertet.

Die PND-Redaktion der DNB hatte nun erstmalig einige Wikipedianer zu einem Informationsbesuch in die DNB nach Frankfurt am Main eingeladen. Am 24. November 2008 trafen sich Mathias Schindler, Tim Bartel (Avatar), Daniel Kinzler (Duesentrieb), Christian Thiele (APPER) und Raimond Spekking  (Raymond) mit der PND-Redaktion zu einem Informationsaustausch.

Dr. Bauman beim Vortrag über die Verschlagwortung

Begrüßt wurden wir von Barbara Pfeifer. Nach einer Vorstellungsrunde aller Anwesenden – auf Seiten der DNB-Mitarbeiter war das Interesse sehr groß, die Menschen hinter der Wikipedia kennenzulernen – hielt Frau Pfeifer einen Einführungsvortrag über die Geschichte und Aufgabe der Deutschen Nationalbibliothek. Über 24 Millionen Werke wurden in den vergangenen Jahrzehnten gesammelt, jährlich kommen ungefähr 200.000 Werke hinzu.

Ihr Vortrag, den sie zusammen mit Stefan Senftleben hielt, ging direkt in die Erläuterung der verschiedenen Normdateien über: Von der für uns wichtigsten, der PND, gibt es ungefähr 3 Millionen. Davon sind 1,6 Millionen individualisiert, d.h. einer bestimmten Person zugeordnet. Daneben gibt es noch die Schlagwortnormdatei (SWD) und die Gemeinsamen Körperschaftsdatei (GKD). Mittelfristig werden diese drei Normdateien in die Gemeinsame Normdatei (GND) zusammengeführt. Über das Projekt Virtual International Authority File (VIAF) werden in Zukunft auch Verknüpfungen mit der Library of Congress und der Bibliothèque nationale de France ermöglicht.

Dr. Christian Baumann referiert über die Sacherschließung Anschließend führte uns Dr. Christian Baumann in den Komplex der Sacherschließung neuer Werke ein. Täglich werden 1.200 Werke in der DNB neu erfasst, für jedes Werk stehen im Schnitt 20 Minuten zur Aufnahme zur Verfügung. Wichtig ist die korrekte Zuordnung zu einem Sachthema, damit das Werk später auch thematisch gefunden werden kann. Als Beispiel nannte er ein Buch, das „… weißes Gold …“ im Titel hat. Ohne Sacherschließung weiß man nicht, ob es sich um Elfenbein aus Südafrika oder Porzellan aus Meißen handelt.

Nach einem Mittagessen in der Kantine übernahm Philipp Höhler, unser Ansprechpartner in der PND-Redaktion. Unsere Meldungen haben mittlerweile einen solchen Umfang erreicht, dass ihm 20 Wochenstunden für die Abarbeitung zur Verfügung gestellt wurden.

Bildschirmmaske

An Hand mehrerer Beispiele führte er uns vor, wieviel Aufwand bisweilen hinter einer einfachen Fehlermeldung („Werk xyz ist fälschlich dem Autor Müller zugeordnet, es gehört aber zum Autor Schmidt“) stecken kann:

  • Verknüpfung zwischen Werk und Autor aufheben
  • Passenden Tp suchen (falls vorhanden)
  • Aus Tn weitere Werke des Autors Schmidt extrahieren
  • Lebensdaten/Beruf recherchieren ggfs.
  • Originalwerke aus dem Magazin anfordern
  • ggfs. Tp erstellen und Werke zuordnen

Philipp Höhler bei KorrekturarbeitenWir nannten diese Arbeitsvervielfachung scherzhaft den „Höhler-Effekt“. Im Prinzip kennt ihn jeder Wikipedianer: „Mal eben schnell was Aufräumen wollen“ und schon hat man sich in 10 Kategorien „verdröselt“.

Ein auf der Fehlermeldungsseite öfter angesprochenes Problem der nachträglichen Verschlagwortung von Werken über eine Person wurde ebenfalls diskutiert. Leider reichen die Kapazitäten der DNB dafür nach wie vor nicht aus.

Änderungen am PND-Datenbestand stehen dann auch innerhalb weniger Minuten live für alle Benutzer zur Verfügung, über eine OAI-Schnittstelle auch Partnerinstituten.

Herr Höhler hat noch ausdrücklich die hohe Qualität unserer Fehlermeldungen gelobt.

Seit einigen Wochen verlinkt die DNB auch auf die Wikipedia zurück. Beispiel: Friedrich Schiller (rechte Seite: „Zugehöriger Artikel in Wikipedia“). Bisher wurde nur einmalig ein Datenbankauszug mit der Relation PND↔WP-Artikelname der DNB übermittelt.

Christian Thiele, vielen als Benutzer:APPER als Toolserver-Programmierer bekannt, stellt jedoch seit kurzem eine täglich automatisch aktualisierte Liste zur Verfügung. Ein Ergebnis des Treffens ist, dass die DNB künftig die Daten für die Rückverlinkung automatisch einspielen wird.

Diskutiert wurden auch einige Prüfungen, die APPER durchführen wird, um Inkonsistenzen in der Wikipedia, in der DNB und zwischen der Wikipedia und der DNB aufzuspüren:

  • Sterbejahr in der Wikipedia bekannt, im PND-Datensatz noch nicht eingetragen
  • Person hat weniger als x Jahre oder länger als y Jahre gelebt

Zum Thema Sterbejahre: Es fällt auf, dass das Sterbejahr kürzlich Verstorbener oft sehr schnell in den PND-Datensätzen ergänzt wird. Sollte jedoch nach einer Woche der Sterbejahr noch nicht nachgetragen sein, so können wir sehr gerne über die Fehlermeldungsseite das Todesjahr der DNB melden.

Aus obigen Überlegungen (Prüfprogramme) ergab sich im Laufe der Diskussion der Wunsch, die Fehlermeldungsseite aufzuteilen für Meldungen einfacher Art (fehlende Lebensdaten, Berufe),  die in Zukunft dann auch von studentischen Hilfskräften bearbeitet werden können sollen, und den komplizierteren Fällen (Namensansetzungen, Neuanlage von Tps usw.), die weiterhin von Herrn Höhler bearbeitet werden.

Danach stellte Anke Meyer die neuen Portalseiten der DNB vor. Permalinks ermöglichen den direkten Aufruf eines Datensatz: Friedrich Schiller. Es wurde dann angeregt darüber diskutiert, wie permanent Permalinks sind :-)

Mathias Schindler ging noch kurz auf eine neue Kooperation ein, bei der die PND ebenfalls eine zentrale Rolle spielen wird. Details dazu werden am 5. Dezember 2008 veröffentlicht.

Zum Abschluss wurde noch eine Kurzführung durch das Magazin und den Lesesaal angeboten, die wir gerne wahrnahmen.

Fazit des Informationsbesuches in der DNB: Sehr spannende Stunden, angeregte Diskussionen, viele Ideen, wie man die Zusammenarbeit zum Vorteile der Wikipedia und der DNB ausbauen kann. Für das 1. Quartal 2009 ist ein weiteres Treffen geplant, zu dem auch weitere am Thema interessierte aktive Wikipedianer eingeladen werden sollen.

Kommentare

  1. […] der Wikipedia-Personendaten und der Personennamendatei der Deutschen Nationalbibliothek, unserem Kooperationspartner seit 2003. Dieses Matching erzeugt im Idealfall einen Datensatz, der anzeigt, […]

  2. […] den Lesern der Wikipedia einen direkten Zugang auf weiterführende Literaturangaben. Auch hier reifen gerade Pläne für den Ausbau der Zusammenarbeit mit dem bibliographischen Zentrum Deutschlands.Für diesen […]

  3. Superbass
    27. November 2008 um 23:25 Uhr

    Schließe mich den Vorrednern und insbesondere Marcus an – es wäre (wenn der Rahmen so etwas hergibt) schön, wenn interessierte Wikipedianer sich zu solchen Treffen anmelden könnten.

  4. Marcus Cyron
    27. November 2008 um 12:01 Uhr

    Schade, daß das nicht für einen größeren Rahmen gemacht wurde. Hätte mich auch interessiert.

  5. Joergens.mi
    27. November 2008 um 00:12 Uhr

    Interessanter Beitrag und es freut mich, das hier die Zusammenarbeit so gut klappt und so erfolgreich ist. Kann wirklich als gutes Beispiel gelten. Man kann nur hoffen das andere öffentliche Organisationen diesem Beispiel folgen.

  6. Cornelius
    26. November 2008 um 19:22 Uhr

    Hört sich klasse an! Ich freue mich, dass die DNB so erfolgreich mit uns zusammenarbeitet.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert