Franziska Kelch
19. Februar 2026
Freies Wissen für jeden Zweck
Wikipedia ist ein Projekt von Menschen für Menschen. Die Inhalte sind durch die Creative Commons Lizenz zu jedem Zweck für alle frei nachnutzbar. Und alle heißt, alle: Egal ob es Menschen sind, die Informationen zu ihrem Lieblingskünstler oder einem aktuellen Ereignis suchen, Forschende, gemeinnützige Organisationen oder kleine wie große Unternehmen.
Technologieunternehmen nutzen Wikipedia schon lange. Sprachassistenten wie Alexa oder Siri sowie Googles Infobox – das sogenannte Knowledge Panel – greifen auf die Inhalte zu. YouTube und Facebook verweisen als Gegengewicht zu Desinformation auf Wikipedia. Sie verbessern oder entwickeln also Produkte basierend auf der ehrenamtlichen Arbeit hunderttausender Menschen weltweit.
Das Wissen ist frei – die Infrastruktur nicht
Mit dem Aufkommen der KI-Chatbots hat die Nutzung von Wikipedia-Inhalten neue Dimensionen angenommen. Die Sprachmodelle, auf denen ChatGPT und Co. basieren, müssen mit Texten trainiert werden. Nur so können sie Sprachmuster lernen und reproduzieren. Daher grasen Bots und Crawler von KI-Unternehmen auf der Suche nach Trainingsdatenfutter die Wikimedia Projekte ab. Diese massiven Datenabrufe belasten die Server enorm. Die Infrastruktur des Freien Wissens ist vorrangig auf menschliche Nutzung ausgelegt – und sie wird überwiegend mit Spendengeldern der Menschen finanziert, die Wikipedia im Alltag nutzen.
Es sind aber nicht nur Tech-Konzerne, die freie Inhalte von Wikipedia und Co. nutzen. Auch Forschende oder Software-Entwickler*innen, die ehrenamtlich Apps entwickeln nutzen sie. Schon bevor es Enterprise gab, hat die Wikimedia Foundation regelmäßig Daten-Dumps der Wikipedia veröffentlicht, die jede*r herunterladen und für eigene Projekte nutzen konnte. Das entspricht der Philosophie der weltweiten Wikimedia Bewegung: Verlässliches Wissen soll für alle frei zugänglich sein.
Ein Lösungsansatz: Wikimedia Enterprise
Wie gelingt es also, dass Millionen Nutzer*innen Wikipedia im Alltag störungsfrei nutzen können? Dass Forschende, Start-ups, gemeinnützige Organisationen ebenso wie große Unternehmen die Inhalte der freien Enzyklopädie für eigene Projekte weiterverwenden? Und dass all dies möglich ist, ohne dass die Wikimedia-Bewegung die hohen Kosten für Betrieb und Infrastruktur alleine tragen muss?
Mit Wikimedia Enterprise hat die Wikimedia Foundation bereits 2022 ein Angebot entwickelt, um diesen Spagat zu schaffen. Klar ist: Forschende, Softwareentwickler*innen und Unternehmen, die Inhalte aus Wikimedia-Projekten nutzen, haben ganz andere Anforderungen als Menschen, die Wikipedia im Alltag lesen.
Forschende benötigen häufig den gesamten Datenbestand der Wikipedia in komprimierter Form, um damit arbeiten zu können. Softwareentwickler*innen und Technologieunternehmen hingegen brauchen die Inhalte so aufbereitet, dass Maschinen sie verarbeiten können – also als strukturierte Daten in maschinenlesbaren Formaten wie JSON. Unternehmen, die Suchmaschinen betreiben, brauchen Zugriff auf einzelne Artikel, während KI-Entwickler*innen ständig neue Daten für das Training ihrer KI-Modelle suchen: Für sie ist vor allem das Streaming jeder einzelnen Änderung an Wikipedia relevant.
Für diese unterschiedlichen Anforderungen stellt Wikimedia Enterprise drei Programmierschnittstellen, sogenannte APIs, bereit. Sie liefern dieselben Daten – aber jeweils in der Form und über die Abrufmethode, die den jeweiligen Nutzungsszenarien entsprechen.
Was bieten die APIs?
Mit der Snapshot API ist der Abruf von Massendaten möglich. Nutzende können kostenfrei Momentaufnahmen von Wikimedia-Projekten als Datei herunterladen. Dazu gehört Wikipedia ebenso wie Wikibooks, Wikivoyage und andere. Alle zwei Wochen kann eine neue Momentaufnahme heruntergeladen werden.
Einzelne Artikel können in der On-demand API abgerufen werden. Sie ermöglicht den Abruf von mindestens 5.000 einzelnen Artikeln pro Monat und den Abruf von Structured Content Articles. Die Inhalte sind dann so strukturiert, dass Maschinen sie verstehen und weiterverarbeiten können.
Die kostenpflichtige Realtime API wurde für Unternehmen entwickelt, die auf die Inhalte der Wikimedia-Projekte in einer Weise zugreifen, die zu einer kostenintensiven Nutzung der Infrastruktur führen oder die Dienstleistungen und Beratung beim Umgang mit den Daten brauchen.
Wer die Realtime API nutzt, kann sowohl bestehende Inhalte als auch Veränderungen an Wikimedia Projekten in Echtzeit streamen. Das funktioniert mit der sogenannten Firehose. Eine digitale Technologie, die einen dauerhaften, sehr schnellen und hochvolumigen Datenstrom liefert. Hinzu kommen Support-Leistungen und Dienstleistungen von Wikimedia-Softwareingenieur*innen.
Das bedeutet, dass Spenden von Lesenden nicht dazu verwendet werden, die Belastung zu decken, die kommerzielle Wiederverwender von Wikimedia-Inhalten auf die technische Infrastruktur ausüben. Die Einnahmen von Wikimedia Enterprise gehen an die Wikimedia Foundation. Sie sind auf 30 % der Gesamteinnahmen der Wikimedia Foundation begrenzt, die zum Betrieb der Infrastruktur und zur Förderung von Freiwilligen genutzt werden.
Wer nutzt Wikimedia Enterprise?
Neben der bekannten Partnerschaft mit Google, die Enterprise für das Knowledge-Panel in Google-Suchergebnissen nutzt, und Amazon, Microsoft und den Unternehmen aus dem KI-Sektor gibt es zahlreiche andere.
Dazu gehört auch das Internet Archive. Es kann den Echtzeit-Stream der Wikimedia-Inhalte kostenlos nutzen. Denn das Archiv für alle Internet-Inhalte ist eine gemeinnützige Organisation und leistet einen wichtigen Beitrag dazu, Wissen im Netz zu sichern.
2025 haben Wikimedia Enterprise und die Suchmaschine Ecosia bekanntgegeben, dass sie zusammenarbeiten. Ecosia ist eine Suchmaschine aus Berlin, die mit ihren Gewinnen Bäume pflanzt. Statt selbst komplette Wikipedia-Inhalte herunterzuladen und zu verarbeiten, nutzt Ecosia die Enterprise APIs, um fertige, strukturierte Daten zu erhalten. Ecosia kann damit über drei Millionen Suchanfragen täglich mit verlässlichen Informationen aus Wikipedia anreichern – zum Beispiel in Form von Infoboxen (Knowledge Panels) über Personen, Orte und Ereignisse. Indem Ecosia die kostenpflichtige Variante der Snapshot API nutzt, kann die Suchmaschine tägliche Schnappschüsse der Wikipedia-Inhalte nutzen.
Im Gegenzug arbeitet Ecosia mit Wikimedia Enterprise am Beta-Testing und hilft so, neue technische Funktionen zu testen und weiterzuentwickeln, bevor sie allgemein verfügbar sind.
Wikimedia Enterprise agiert damit nach dem Prinzip: Das Wissen ist frei – die Infrastruktur ist es nicht.
Im Blog von Wikimedia Enterprise finden sich weitere Informationen dazu, wer die APIs nutzt und was damit möglich ist.