Wikimedia Enterprise

Wikidata-Daten via Enterprise APIs: Ein neuer Zugang für große Datennutzer

Christie Rixford, Wikimedia Enterprise und Wikidata logo, CC BY-SA 4.0

Wikipedia, Wikidata und andere Wikimedia-Plattformen verzeichnen seit einiger Zeit einen massiven Anstieg automatisierter Zugriffe – vor allem durch Bots und Crawler, die im Kontext generativer KI eingesetzt werden. Anders als menschliche Nutzung belastet diese Art von Traffic die Server der Projekte erheblich. Die Wikimedia-Bewegung hat früh erkannt, dass es für große kommerzielle Nutzer eigene Zugangswege braucht – einerseits, um deren spezifischen Anforderungen gerecht zu werden, und andererseits, um die Infrastruktur Freien Wissens zu schützen. Daraus entstand 2021 Wikimedia Enterprise. Ab sofort ist auch Wikidata Teil des Angebots. Warum das die Systeme weiter entlastet und Freies Wissen langfristig stärkt, erklärt dieser Artikel.

Zarah Ziadi

1. April 2026

Freies Wissen funktionierte lange nach einer einfachen Gleichung: Menschen schreiben ehrenamtlich Inhalte, andere können sie lesen und frei weiterverwenden. Crawler und Bots gab es zwar schon immer, doch sie bewegten sich im Hintergrund in einem überschaubaren Rahmen – etwa zur Indexierung für Suchmaschinen oder andere Wissensplattformen. Viele Nachnutzer, wie beispielsweise Suchmaschinen oder Sprachassistenten, führten Nutzer*innen zudem wieder zurück zu Wikipedia und anderen Projekten. So entstand ein funktionierendes Ökosystem, in dem Nutzung und Mitwirkung sich gegenseitig verstärkten.

In den vergangenen Jahren hat sich dieses Gleichgewicht jedoch grundlegend verschoben. Mit dem Aufkommen generativer KI-Systeme ist der Datenverkehr durch Crawler und Bots großer KI-Anbieter sprunghaft angestiegen. Sie analysieren Inhalte, extrahieren Daten und nutzen sie, um eigene Systeme zu betreiben oder zu trainieren – ohne dabei etwas an die Wikimedia-Projekte zurückzugeben.

Für die technische Infrastruktur, die über Jahre hinweg für menschliche Nutzung, Wissenssuche und ehrenamtliche Zusammenarbeit aufgebaut wurde, stellt das eine enorme Herausforderung dar: Automatisierte Zugriffe belasten Server, verlangsamen Werkzeuge und beanspruchen genau die Ressourcen, die die Community von Wikipedia oder Wikidata für ihre Arbeit benötigt.

Wenn Nutzung zur Belastung wird

In diesem Umfeld trägt Wikimedia Enterprise dazu bei, wieder etwas Balance herzustellen. Die Initiative der Wikimedia Foundation verfolgt zwei zentrale Ziele:

Erstens soll sie die Arbeit der Community und die Stabilität der Infrastruktur für Freies Wissen schützen.
Zweitens bietet sie großen Technologieunternehmen einen skalierbaren Zugang zu Wikimedia-Inhalten – in Formaten, die sich besser für deren technische Anforderungen eignen, für die Nutzung durch Menschen aber oft weniger relevant sind.

Damit folgt Wikimedia Enterprise den Empfehlungen der Wikimedia Movement Strategie, die auf mehr Nachhaltigkeit innerhalb der Bewegung und eine Verbesserung der Nutzererfahrung abzielen. Diese Empfehlungen wurden zwischen 2018 und 2020 in einem kollaborativen Prozess mit Wikimedia-Organisationen und den Communitys weltweit erarbeitet.

Über die APIs von Wikimedia Enterprise erhalten Nutzer*innen strukturierte und verlässliche Daten. Für kommerzielle Anwendungen mit hohem Datenbedarf bietet das Angebot unter anderem höhere Abfragekapazitäten, Zugriff auf Echtzeit-Änderungen in großem Umfang sowie professionellen 24/7-Support. Das Preismodell ist dabei so gestaltet, dass alle Funktionen grundsätzlich auch über einen kostenlosen Zugang im Sinne der Projektprinzipien verfügbar sind – größere Nutzungskontingente sind jedoch kostenpflichtig.

Die Einnahmen aus Wikimedia Enterprise fließen zurück in die Wikimedia-Projekte und unterstützen langfristig Infrastruktur, Softwareentwicklung und Community-Arbeit. Gleichzeitig wird sichergestellt, dass die öffentlichen Schnittstellen, die von Ehrenamtlichen und Leser*innen genutzt werden, nicht zusätzlich belastet werden. Textbasierte Wikimedia-Projekte wie Wikipedia, Wikivoyage oder Wiktionary sind bereits über Enterprise verfügbar – nun kommt mit Wikidata ein weiterer zentraler Baustein hinzu.

Wikidatas Inhalte als Teil des Enterprise-Angebots

Wikidata nimmt im Wikimedia-Ökosystem eine besondere Rolle ein. Anders als klassische Wikipedia-Artikel besteht es aus strukturierten Aussagen – sogenannten Tripeln –, die Beziehungen zwischen Dingen beschreiben: Subjekt → Prädikat → Objekt, zum Beispiel: Marie Curie → Beruf → Physikerin. Dadurch sind die Daten nicht nur für Menschen lesbar, sondern auch direkt maschinell weiterverarbeitbar. Genau deshalb sind sie für Suchmaschinen, KI-Systeme und Wissensdatenbanken besonders wertvoll.

Da Wikidata-Daten nun auch über die Enterprise-APIs verfügbar sind, können kommerzielle Nutzer*innen gezielt einzelne Datensätze abrufen, Änderungen in Echtzeit verfolgen oder große Datenmengen nahtlos in ihre Systeme integrieren – ohne die offenen Schnittstellen der Community zu überlasten. Für Unternehmen bedeutet das vor allem: planbare Verfügbarkeit, konsistente Datenformate und technische Unterstützung für den Einsatz in produktiven Anwendungen.

In dieser ersten Phase liegt der Fokus auf einem Beta-Zugang, über den Daten entweder in Echtzeit – also direkt bei Änderungen – oder gezielt auf Anfrage abgerufen werden können. Vollständige Datensätze („Snapshots“) werden in einem späteren Schritt ergänzt. Weitere Details zu den technischen Funktionen finden sich im Ankündigungsblog.

Neue Arbeitsteilung hinter den Kulissen

Für die Community ist diese Entwicklung vor allem deshalb relevant, weil sie die Zugriffsstrukturen neu ordnet. Wenn große Crawler und Bots künftig verstärkt über Wikimedia Enterprise auf die Daten zugreifen, reduziert sich die direkte Belastung der technischen Infrastruktur von Wikidata und Wikipedia. Das sorgt für stabilere Tools, weniger Ausfälle und insgesamt mehr Verlässlichkeit für alle, die an den Wiki-Projekten arbeiten.

Gleichzeitig bleiben die bestehenden Zugänge zu Wikidata – etwa der SPARQL Query Service oder die REST-API – unverändert bestehen. Laut Wikimedia Foundation werden sie weiterhin der zentrale Zugang für Community-Tools, Forschung und experimentelle Anwendungen bleiben. Wikimedia Enterprise ersetzt diese Schnittstellen nicht, sondern ergänzt sie um ein Angebot für hochvolumige, kommerzielle Nutzung.

Dass diese Trennung notwendig geworden ist, hängt auch mit der veränderten Rolle von Wikidata zusammen. Der Wissensgraph ist längst mehr als ein internes Hilfsmittel für Wikipedia und andere Schwesterprojekte – er ist zu einer globalen Infrastruktur für strukturierte Informationen geworden, die von zahlreichen externen digitalen Projekten genutzt wird.

Mit über 120 Millionen Einträgen und Verbindungen zu externen Normdatenbanken wie VIAF (einer internationalen Datei zur eindeutigen Identifikation von Personen und Werken) oder GND (der Gemeinsamen Normdatei, die vor allem im deutschsprachigen Bibliothekswesen genutzt wird) ist Wikidata zu einem zentralen Knotenpunkt im offenen Daten-Ökosystem geworden. Entsprechend wichtig ist eine stabile und verlässliche Infrastruktur, auf die sich viele Menschen und Anwendungen verlassen können.

Community first

Die Integration von Wikidata in Wikimedia Enterprise wirft in der Community verständlicherweise auch Fragen auf: Bleiben die offenen Daten langfristig wirklich frei, wenn sie über kostenpflichtige Schnittstellen bereitgestellt werden? Können auch nicht-kommerzielle Projekte mit sehr hohem Datenbedarf auf die Wikidata-Daten über die Enterprise-APIs zugreifen? Und entstehen der Community gegenüber Unternehmen tatsächlich keine Nachteile?

Die kurze Antwort auf alle diese Fragen ist laut Wikimedia Foundation: Ja.

Alle Daten in Wikidata bleiben weiterhin unter der freien Lizenz CC0 verfügbar und alle bisherigen Zugänge bleiben bestehen. Enterprise schafft keinen exklusiven Zugriff, sondern bietet lediglich einen alternativen Weg für Akteure mit sehr hohem Datenbedarf. Das Motto der Wikimedia Foundation dabei ist: „Das Wissen ist frei – die Infrastruktur ist es nicht.”

Deshalb können die Wikimedia Enterprise APIs in kleinerem Umfang auch von allen kostenlos genutzt werden, oder über die Wikimedia Cloud Services auf Echtzeitdaten zugreifen. Wenn nicht-kommerzielle Projekte und Partner, die unsere Mission teilen, mit großen Datenmengen arbeiten und erweiterte Anforderungen haben, können sie kostenfreien Zugang zu erweiterten Nutzungsmöglichkeiten beantragen – ähnlich wie kommerzielle Nutzer*innen. So nutzt beispielsweise die gemeinnützige Organisation Internet Archive, die alle Internetinhalte archiviert und eine wichtige Rolle bei der Bewahrung von Wissen im Internet spielt, den Echtzeit-Stream von Wikimedia-Inhalten über die Enterprise APIs kostenlos. Wer sich dazu im Detail informieren will, findet hier mehr Informationen.

Auch wenn sich das Angebot von Wikimedia Enterprise stärker an externe, auch kommerzielle Zielgruppen richtet, steht im Kern etwas anderes im Mittelpunkt: der Schutz der Arbeit der Community und die Sicherung Freien Wissens. Für Community-Mitglieder und Leser*innen entstehen dadurch keine Einschränkungen – im Gegenteil: Das Angebot soll gerade dazu beitragen, solche Einschränkungen langfristig zu vermeiden.

#Wikidata #Künstliche Intelligenz

Echt oder KI? Wie wir Bildern und Videos im Netz noch trauen können

Community

Wikipedia und KI – so geht es weiter

Wikimedia Futures Lab

Stark und zukunftsfähig – Wikipedia reagiert auf die Herausforderungen des Internets

Künstliche Intelligenz

Cookie	Typ	Dauer	Beschreibung
cli_user_preference			Dieses Cookies speichert, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine personenbezogenen Daten.
cookielawinfo-checkbox-necessary		1 year	Zustimmung der Kategorie "Essenziell".
CookieLawInfoConsent		1 year	Dieses Cookies speichert, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine personenbezogenen Daten.
viewed_cookie_policy	ständig	1 Stunde	Dieses Cookies speichert, ob der Benutzer der Verwendung von Cookies zugestimmt hat oder nicht. Es speichert keine personenbezogenen Daten.

Cookie	Typ	Dauer	Beschreibung
cookielawinfo-checkbox-einstellungen	0	1 year	Zustimmung der Kategorie "Einstellungen"
pll_language	0	1 year	Das Cookie speichert den Sprachcode der zuletzt besuchten Seite.

Cookie	Typ	Dauer	Beschreibung
_pk_id.1.64ac	0	1 year	Cookie von Matomo
_pk_ses.1.64ac	0	30 minutes	Cookie von Matomo
cookielawinfo-checkbox-matomo		1 year	Zustimmung der Kategorie "Matomo"

Cookie	Typ	Dauer	Beschreibung
_pk_id.1.64ac	0	1 year	Cookie von Matomo
_pk_ses.1.64ac	0	30 minutes	Cookie von Matomo
cookielawinfo-checkbox-matomo-und-heatmap		1 year	Zustimmung der Kategorie "Matomo und Heatmap"

Wikimedia Enterprise

Wikidata-Daten via Enterprise APIs: Ein neuer Zugang für große Datennutzer

Wenn Nutzung zur Belastung wird

Wikidatas Inhalte als Teil des Enterprise-Angebots

Neue Arbeitsteilung hinter den Kulissen

Community first

Verwandte Artikel

Echt oder KI? Wie wir Bildern und Videos im Netz noch trauen können

Wikipedia und KI – so geht es weiter

Stark und zukunftsfähig – Wikipedia reagiert auf die Herausforderungen des Internets

Warum gibt es Wikimedia Enterprise?

Schreibe einen Kommentar Antwort abbrechen

DSGVO Hinweis