Wikimedia Enterprise
Wikidata-Daten via Enterprise APIs: Ein neuer Zugang für große Datennutzer
Zarah Ziadi
1. April 2026
Freies Wissen funktionierte lange nach einer einfachen Gleichung: Menschen schreiben ehrenamtlich Inhalte, andere können sie lesen und frei weiterverwenden. Crawler und Bots gab es zwar schon immer, doch sie bewegten sich im Hintergrund in einem überschaubaren Rahmen – etwa zur Indexierung für Suchmaschinen oder andere Wissensplattformen. Viele Nachnutzer, wie beispielsweise Suchmaschinen oder Sprachassistenten, führten Nutzer*innen zudem wieder zurück zu Wikipedia und anderen Projekten. So entstand ein funktionierendes Ökosystem, in dem Nutzung und Mitwirkung sich gegenseitig verstärkten.
In den vergangenen Jahren hat sich dieses Gleichgewicht jedoch grundlegend verschoben. Mit dem Aufkommen generativer KI-Systeme ist der Datenverkehr durch Crawler und Bots großer KI-Anbieter sprunghaft angestiegen. Sie analysieren Inhalte, extrahieren Daten und nutzen sie, um eigene Systeme zu betreiben oder zu trainieren – ohne dabei etwas an die Wikimedia-Projekte zurückzugeben.
Für die technische Infrastruktur, die über Jahre hinweg für menschliche Nutzung, Wissenssuche und ehrenamtliche Zusammenarbeit aufgebaut wurde, stellt das eine enorme Herausforderung dar: Automatisierte Zugriffe belasten Server, verlangsamen Werkzeuge und beanspruchen genau die Ressourcen, die die Community von Wikipedia oder Wikidata für ihre Arbeit benötigt.
Wenn Nutzung zur Belastung wird
In diesem Umfeld trägt Wikimedia Enterprise dazu bei, wieder etwas Balance herzustellen. Die Initiative der Wikimedia Foundation verfolgt zwei zentrale Ziele:
- Erstens soll sie die Arbeit der Community und die Stabilität der Infrastruktur für Freies Wissen schützen.
- Zweitens bietet sie großen Technologieunternehmen einen skalierbaren Zugang zu Wikimedia-Inhalten – in Formaten, die sich besser für deren technische Anforderungen eignen, für die Nutzung durch Menschen aber oft weniger relevant sind.
Damit folgt Wikimedia Enterprise den Empfehlungen der Wikimedia Movement Strategie, die auf mehr Nachhaltigkeit innerhalb der Bewegung und eine Verbesserung der Nutzererfahrung abzielen. Diese Empfehlungen wurden zwischen 2018 und 2020 in einem kollaborativen Prozess mit Wikimedia-Organisationen und den Communitys weltweit erarbeitet.
Über die APIs von Wikimedia Enterprise erhalten Nutzer*innen strukturierte und verlässliche Daten. Für kommerzielle Anwendungen mit hohem Datenbedarf bietet das Angebot unter anderem höhere Abfragekapazitäten, Zugriff auf Echtzeit-Änderungen in großem Umfang sowie professionellen 24/7-Support. Das Preismodell ist dabei so gestaltet, dass alle Funktionen grundsätzlich auch über einen kostenlosen Zugang im Sinne der Projektprinzipien verfügbar sind – größere Nutzungskontingente sind jedoch kostenpflichtig.
Die Einnahmen aus Wikimedia Enterprise fließen zurück in die Wikimedia-Projekte und unterstützen langfristig Infrastruktur, Softwareentwicklung und Community-Arbeit. Gleichzeitig wird sichergestellt, dass die öffentlichen Schnittstellen, die von Ehrenamtlichen und Leser*innen genutzt werden, nicht zusätzlich belastet werden. Textbasierte Wikimedia-Projekte wie Wikipedia, Wikivoyage oder Wiktionary sind bereits über Enterprise verfügbar – nun kommt mit Wikidata ein weiterer zentraler Baustein hinzu.
Wikidatas Inhalte als Teil des Enterprise-Angebots
Wikidata nimmt im Wikimedia-Ökosystem eine besondere Rolle ein. Anders als klassische Wikipedia-Artikel besteht es aus strukturierten Aussagen – sogenannten Tripeln –, die Beziehungen zwischen Dingen beschreiben: Subjekt → Prädikat → Objekt, zum Beispiel: Marie Curie → Beruf → Physikerin. Dadurch sind die Daten nicht nur für Menschen lesbar, sondern auch direkt maschinell weiterverarbeitbar. Genau deshalb sind sie für Suchmaschinen, KI-Systeme und Wissensdatenbanken besonders wertvoll.
Da Wikidata-Daten nun auch über die Enterprise-APIs verfügbar sind, können kommerzielle Nutzer*innen gezielt einzelne Datensätze abrufen, Änderungen in Echtzeit verfolgen oder große Datenmengen nahtlos in ihre Systeme integrieren – ohne die offenen Schnittstellen der Community zu überlasten. Für Unternehmen bedeutet das vor allem: planbare Verfügbarkeit, konsistente Datenformate und technische Unterstützung für den Einsatz in produktiven Anwendungen.
In dieser ersten Phase liegt der Fokus auf einem Beta-Zugang, über den Daten entweder in Echtzeit – also direkt bei Änderungen – oder gezielt auf Anfrage abgerufen werden können. Vollständige Datensätze („Snapshots“) werden in einem späteren Schritt ergänzt. Weitere Details zu den technischen Funktionen finden sich im Ankündigungsblog.
Neue Arbeitsteilung hinter den Kulissen
Für die Community ist diese Entwicklung vor allem deshalb relevant, weil sie die Zugriffsstrukturen neu ordnet. Wenn große Crawler und Bots künftig verstärkt über Wikimedia Enterprise auf die Daten zugreifen, reduziert sich die direkte Belastung der technischen Infrastruktur von Wikidata und Wikipedia. Das sorgt für stabilere Tools, weniger Ausfälle und insgesamt mehr Verlässlichkeit für alle, die an den Wiki-Projekten arbeiten.
Gleichzeitig bleiben die bestehenden Zugänge zu Wikidata – etwa der SPARQL Query Service oder die REST-API – unverändert bestehen. Laut Wikimedia Foundation werden sie weiterhin der zentrale Zugang für Community-Tools, Forschung und experimentelle Anwendungen bleiben. Wikimedia Enterprise ersetzt diese Schnittstellen nicht, sondern ergänzt sie um ein Angebot für hochvolumige, kommerzielle Nutzung.
Dass diese Trennung notwendig geworden ist, hängt auch mit der veränderten Rolle von Wikidata zusammen. Der Wissensgraph ist längst mehr als ein internes Hilfsmittel für Wikipedia und andere Schwesterprojekte – er ist zu einer globalen Infrastruktur für strukturierte Informationen geworden, die von zahlreichen externen digitalen Projekten genutzt wird.
Mit über 120 Millionen Einträgen und Verbindungen zu externen Normdatenbanken wie VIAF (einer internationalen Datei zur eindeutigen Identifikation von Personen und Werken) oder GND (der Gemeinsamen Normdatei, die vor allem im deutschsprachigen Bibliothekswesen genutzt wird) ist Wikidata zu einem zentralen Knotenpunkt im offenen Daten-Ökosystem geworden. Entsprechend wichtig ist eine stabile und verlässliche Infrastruktur, auf die sich viele Menschen und Anwendungen verlassen können.
Community first
Die Integration von Wikidata in Wikimedia Enterprise wirft in der Community verständlicherweise auch Fragen auf: Bleiben die offenen Daten langfristig wirklich frei, wenn sie über kostenpflichtige Schnittstellen bereitgestellt werden? Können auch nicht-kommerzielle Projekte mit sehr hohem Datenbedarf auf die Wikidata-Daten über die Enterprise-APIs zugreifen? Und entstehen der Community gegenüber Unternehmen tatsächlich keine Nachteile?
Die kurze Antwort auf alle diese Fragen ist laut Wikimedia Foundation: Ja.
Alle Daten in Wikidata bleiben weiterhin unter der freien Lizenz CC0 verfügbar und alle bisherigen Zugänge bleiben bestehen. Enterprise schafft keinen exklusiven Zugriff, sondern bietet lediglich einen alternativen Weg für Akteure mit sehr hohem Datenbedarf. Das Motto der Wikimedia Foundation dabei ist: „Das Wissen ist frei – die Infrastruktur ist es nicht.”
Deshalb können die Wikimedia Enterprise APIs in kleinerem Umfang auch von allen kostenlos genutzt werden, oder über die Wikimedia Cloud Services auf Echtzeitdaten zugreifen. Wenn nicht-kommerzielle Projekte und Partner, die unsere Mission teilen, mit großen Datenmengen arbeiten und erweiterte Anforderungen haben, können sie kostenfreien Zugang zu erweiterten Nutzungsmöglichkeiten beantragen – ähnlich wie kommerzielle Nutzer*innen. So nutzt beispielsweise die gemeinnützige Organisation Internet Archive, die alle Internetinhalte archiviert und eine wichtige Rolle bei der Bewahrung von Wissen im Internet spielt, den Echtzeit-Stream von Wikimedia-Inhalten über die Enterprise APIs kostenlos. Wer sich dazu im Detail informieren will, findet hier mehr Informationen.
Auch wenn sich das Angebot von Wikimedia Enterprise stärker an externe, auch kommerzielle Zielgruppen richtet, steht im Kern etwas anderes im Mittelpunkt: der Schutz der Arbeit der Community und die Sicherung Freien Wissens. Für Community-Mitglieder und Leser*innen entstehen dadurch keine Einschränkungen – im Gegenteil: Das Angebot soll gerade dazu beitragen, solche Einschränkungen langfristig zu vermeiden.