Axel Springer, OpenAI und die New York Times

Axel Springer, OpenAI und die New York Times

Warum der der Deal von Axel Springer mit OpenAI ein Geniestreich sein könnte… oder eine verpasste Chance. Ein Gedankenexperiment.

 

Am 13. Dezember 2023 geben Axel Springer und OpenAI einen Deal bekannt, den die deutsche Verlagsgruppe hoffnungsfroh als „globale Partnerschaft, um unabhängigen Journalismus im Zeitalter der Künstlichen Intelligenz zu stärken“ bezeichnet.

Genau zwei Wochen später, am 27. Dezember, reicht die New York Times bei einem US-Bundesgericht in Manhattan Klage gegen OpenAI und Microsoft ein. Der Vorwurf: Die Unternehmen sollen Millionen von Zeitungsartikeln ohne Erlaubnis verwendet haben, um ihre Chatbots zu trainieren.

Zwei Verlagshäuser, zwei völlig unterschiedliche Vorgehensweisen im Umgang mit der rasant wachsenden Bedeutung von Chatbots, wie Chat-GPT von OpenAI, dem Microsoft Copilot oder Bard von Google.

Die Deutschen suchen den Schulterschluss, die Amerikaner den Rechtsstreit.

Wie kommt es zu diesem Kontrast? Oder anders gefragt, was ist der bessere Weg für die Verlage, um ihr Geschäftsmodell für die Zukunft zu sichern?

Eins ist klar: Es geht um viel. Nicht nur für die Verlage, auch für unsere Gesellschaft: Wer schafft in Zukunft Fakten - recherchierende Journalisten oder Maschinen? Wie werden Urheber- und Verwertungsrechte geschützt, ergo: Wie wird guter Journalismus vergütet - und damit überhaupt möglich gemacht?


KI-Innovation vs. Schutz kreativer Inhalte

Viel spricht dafür, dass der Ausgang des Prozesses der New York Times gegen OpenAI und Microsoft eine Präzedenz in einer der großen Rechtsfragen unserer Zeit schaffen wird:

•       Der Abwägung zwischen dem Schutz kreativer Inhalte und der Zukunft von KI-Innovationen

Um es klar zu sagen: Der Schutz kreativer Inhalte ist wichtig, sehr wichtig. Kein KI-Unternehmen sollte damit durchkommen, urheberrechtlich geschützte Werke anderer ungefragt auszuwerten. Doch, welches Gut hier Vorrang haben sollte, ist eine rechtsphilosophische Abwägung, die ich Menschen mit mehr Expertise überlassen möchte, wie etwa Cecilia Ziniti (New York Times vs OpenAI) oder den von Venturebeat zitierten Experten: Copyright vs KI-Innovation.


Der Deal

Mich interessiert, warum Springer sein Heil darin sucht, eine Partnerschaft mit OpenAI einzugehen, während die NYT genau das Gegenteil tut. Um das zu beantworten, lohnt ein Blick auf die Details des Deals. Viel ist noch nicht bekannt. Doch zumindest die Eckpfeiler der Zusammenarbeit mit OpenAI lassen sich aus der dürren Pressemitteilung von Springer herauslesen (PM Axel Springer):

•       Springer soll von OpenAI für die bereitgestellten Inhalte vergütet werden. Die Financial Times berichtete über mehrere zehnmillionen Euro im Jahr (NYT Copyright Case)

•       Durch die Partnerschaft bekommen ChatGPT-Nutzer Nachrichteninhalte von Springer Titeln in ihren Antworten angezeigt, wie etwa von Bild, Welt, Politico und Business Insider

•       Hierzu gehören auch kostenpflichtige Inhalte (welche via ChatGPT kostenfrei zugänglich sein sollen - was meiner Meinung nach sehr entscheidend ist, dazu unten mehr)

•       Die Antworten von ChatGPT auf Nutzeranfragen sollen Quellenangaben und Links zu den vollständigen Artikeln enthalten

•       OpenAI soll Springer bei der Entwicklung eigener KI-Anwendungen unterstützen

 

First Mover oder falsch abgebogen?

Zugegeben, das ist nur ein sehr grob skizzierter Rahmen, die Details der Partnerschaft werden sich erst in der Praxis zeigen. Trotzdem wage ich eine Prognose, in welche Richtung sich die Kooperation für Springer entwickeln könnte.

Um es gleich vorweg zu sagen: In meinen Augen gibt es starke Argumente dafür, dass das traditionsreiche Verlagshaus hier eine Weichenstellung in eine riskante Richtung vornimmt - zugunsten des Ziels als (deutscher) First Mover auf den KI-Zug aufzuspringen. Und mehr noch: Springer könnte hier eine große Chance verspielen, die die KI-Revolution dem Journalismus eröffnet.

Auf der anderen Seite gibt es Argumente dafür, dass Springer sich mit diesem Schritt als erstes europäisches Verlagshaus perfekt für die Umwälzungen im KI Zeitalter positioniert hat. Beide Sichtweisen werde ich skizzieren, zunächst was gegen eine rosige Zukunft von Springer an der Seite von OpenAI spricht.

 

LLMs sind keine Suchmaschinen

Dafür wird es zunächst kurz technisch: Large Language Models (LLMs), also jene KIs, die hinter Chatbots wie ChatGPT stehen, sind keine Suchmaschinen. Oder zumindest nicht so, wie wir sie bisher verstanden haben. Wenn ein Nutzer eine Frage bei Chat-GPT eingibt, baut das Programm eine Antwort zusammen - aus allen Trainingsdaten, die ihm zur Verfügung stehen. Dazu können Daten aus dem Internet gehören, wie zum Beispiel Texte von Bild.de oder Nytimes.com, das muss aber nicht sein. Viele LLMs arbeiten ausschließlich mit Daten, die sie nicht „live“ aus dem Internet ziehen - so wie auch ChatGPT die längste Zeit. Erst die Version ChatGPT 4 crawled oder „durchsucht“ das Internet seit September 2023 bei bestimmten Fragestellungen.

Entscheidend ist hier aber ein anderer Aspekt: Die Art wie LLMs ihre Antworten erstellen. Sie verwenden dafür nicht eine Quelle, aus der sie die passende Antwort zitieren. Stattdessen bauen sie die Antwort aus allem zusammen, was sie in ihren Trainingsdaten zur jeweiligen Fragestellung finden, also aus diversen Quellen. Wie die Antwort ausfällt, ist keine Frage von Sinn oder Bedeutung, sondern allein von Wahrscheinlichkeiten: Das LLM berechnet, welches Wort oder welcher Buchstabe auf den aktuellen folgen sollte, um eine möglichst richtige Aussage zu treffen und setzt den Antworttext so Stück für Stück zusammen (wie das im Detail funktioniert: Financial Times - Transformer).

 

Die wahrscheinlich richtigste Antwort

Mit anderen Worten: Chatbots kompilieren Antworten. Das, was der Nutzer auf seine Frage als Antwort präsentiert bekommt, ist eine Art Best of der Trainingsdaten, das was am wahrscheinlichsten richtig ist. Manchmal ist das vollkommen zutreffend und deckt sich mit dem, was wir allgemein als faktisch richtig betrachten, manchmal sind die Antworten aber nur mittelgut und manchmal schlicht Bullshit.

Damit ist die Art wie Chatbots ihre Antworten finden und liefern so ziemlich das Gegenteil von Journalismus: Der den Anspruch auf möglichst wahrhaftige Berichterstattung hat. Hier zählt nicht, was wahrscheinlich ist, sondern schlicht, was richtig ist.

 

LLMs sind nicht auf Drogen, sie Konfabulieren

Das Problem wird dadurch verschärft, dass LLMs zu etwas neigen, was oft als Halluzinieren bezeichnet wird. gemeint ist das Ausfüllen von Wissenslücken mit herbeifantasiertem Inhalt. Fillipe Neyl Walecki nennt diese Schummeleien treffender Konfabulationen, ein Begriff aus der Psychologie. Während Halluzination sich auf das Empfangen von fehlerhaftem sensorischem Input (z.B. Hören nicht existierender Stimmen) bezieht, bezeichnet Konfabulieren den Akt, wenn jemand Dinge erfindet, um Lücken im Gedächtnis zu füllen.

Also genau das, was LLMs tun. Wenn sie konfabulieren, hören sie keine Stimmen, sie sind ja nicht auf Drogen, nein, sie erfinden schlicht random Inhalte, weil sie keine passende Antwort in ihren Trainingsdaten finden. Manchmal erfinden sie auch nur Teile einer Antwort (welche Teile behalten sie dabei für sich). Mit diesem Vorgehen entfernt sich der gemeine Chatbot jedoch weiter von journalistischer Arbeitsweise als - sagen wir - Claas Relotius, der über Jahre fiktionalisierte Texte für den Spiegel schrieb (Der Fall Relotius).

Beides, das Kompilieren und auch das Konfabulieren ist nur schlecht mit den Ansprüchen an journalistische Arbeit in Bezug auf Wahrhaftigkeit, Vollständigkeit und Ausgewogenheit zu vereinbaren. Weshalb ich glaube, dass es der Vertrauenswürdigkeit der Nachrichten aus den Springer Redaktionen, schaden wird, wenn der Nutzer sie von einem Chatbot ausgeliefert bekommt.

Zugegeben: Es ist möglich, dass OpenAI für die Partnerschaft mit Springer einen neuen technischen Modus aufsetzt. Sozusagen ein Springer-News-LLM, das immer dann im Hintergrund anspringt, wenn ein Nutzer eine Frage an Chat-GPT stellt, bei der Springer Inhalte zur Antwort hinzugezogen werden. Ein Modus, der mehr Faktentreue garantiert. Mir fehlen die Informationen dazu, ob es so einen Modus geben wird.

Ich halte das jedoch nicht für sehr wahrscheinlich. Auch, weil es bereits eine ähnliche Kooperation zwischen OpenAI und der Nachrichtenagentur Reuters gibt. Die Ergebnisse, die Chat-GPT liefert, wenn man Fragen zu Reuters Themen stellt, sind nach meinem Dafürhalten Zusammenfassungen, wie man sie von ChatGPT standardmäßig erwarten würde, und kein spezieller Reuters-Modus. Mit der Ausnahme, dass hier Links zu den Reuters-Artikeln als Quellen angegeben werden.

 

LLMs werden die neuen Suchmaschinen - aber die Fast Food Variante

Und darum vermute ich, dass Springer vor allem auf diese Links setzt, um journalistische Standards zu gewährleisten - so liest es sich auch in der Pressemitteilung von Springer zum Deal mit OpenAI. Dort heißt es, das Bereitstellen von Quellenangaben in Form von Links solle für „Transparenz und weiterführende Informationen“ sorgen.

Das wird jedoch seine Wirkung weitgehend verfehlen, denke ich. Der Grund dafür ist ein sehr menschlicher: Die Art wie wir LLMs in Zukunft nutzen werden oder einfacher gesagt: Unsere Bequemlichkeit. Nur ein sehr kleiner Teil der Nutzer wird auf einen weiterführenden Link klicken, um eine Antwort von ChatGPT gegenzuchecken.

Wie gesagt, LLMs sind (noch) keine Suchmaschinen. Aber sie werden sich aller Wahrscheinlichkeit nach über kurz oder lang dazu entwickeln. Die Tatsache, dass Chat-GPT kompilierte Antworten liefert, ist zwar eine seiner großen Schwächen, aber es ist auch seine größte Stärke. Der Nutzer bekommt eine kompakte Antwort statt einer langen Linkliste wie bei den Suchmaschinen, die wir seit Ende des letzten Jahrtausends kennen. Das ist schnell und bequem. LLMs werden die Fast Food Version der Suchmaschinen wie wir sie bislang kannten. Statt langes Durchforsten von Trefferlisten nach der richtigen Antwort gibts hier nur noch: Frage, Antwort, nächste Frage.

Und je mehr die Chatbots sich zu Assistenten im Alltag entwickeln (The Economist - Future Chatbots), denen wir Fragen stellen wie einem Menschen, desto weniger werden wir deren Antworten hinterfragen - wie wir es vielleicht bei einer Maschine tun sollten, die zum Erfinden von Tatsachen neigt.

Ich nehme an, dass das auch den SpezialistInnen bei Springer klar ist. Weshalb ich denke, dass man die Verlinkungen ins Springer Universum eher als Traffic-Treiber denn als Garanten für journalistische Qualität betrachtet (mehr dazu unten).

 

ChatGPT-News statt Springer Schlagzeilen

So oder so: Am Ende wird ChatGPT sehr wahrscheinlich Nachrichteninhalte unter dem Springer Siegel verbreiten, die nicht in dieser Form oder nur in Teilen aus den Redaktionen des Verlags stammen. Und noch viel entscheidender: Nutzer werden originäre Springer-News nicht länger auf Webseiten des Verlags lesen, sondern in einem Chatverlauf mit ChatGPT.


AI-Fakes - warum das „woher kommts?“ immer wichtiger wird

Und das ist in meinen Augen die größte Schwäche des Deals, weil hier eine große Chance vertan wird. 2024 wird das Jahr der KI-gepowerten Fake News. Eine Welle von falschen AI-Videos, gefakten Tondokumenten und irreführenden Texten wird die sozialen Medien überschwemmen. Selbst vormals anspruchsvolle Video-Fakes mit Gesichtern und Stimmen von PolitikerInnen sind inzwischen so einfach herzustellen, dass die wir uns schon sehr bald nach Ankerpunkten im Meer des Fake-Müll sehnen werden.

Das ist die Stunde des Qualitätsjournalismus. Je größer die Fake-Welle wird, desto lauter wird der Ruf nach vertrauensvollen Quellen werden, die Glaubwürdigkeit garantieren.

Die Theorie, dass starke journalistische Marken Orientierung im Meinungsmüll der Sozialen Medien bieten, ist ja nicht neu. Sie wurde auch schon beim Aufkommen der sozialen Netzwerke und dem damit verbundenen Wegbrechen der klassischen Erlösmodelle von den Verlagen rauf- und runtergebetet, um ihre Existenzberechtigung zu untermauern.

Ich glaube jedoch, dass die Lage jetzt etwas anders ist. Es geht nicht allein um journalistische „Marken“, sondern um klare Absenderschaft. Und zwar technische. Ganz konkret: Der Ort, wo wir in Zukunft eine Nachricht, ein Video oder Tondokument finden, wird über seine Vertrauenswürdigkeit entscheiden.

 In dem Moment, da Videos oder Audiodateien ohne großen Aufwand so gefälscht werden können, dass sie wirken, als würden sie von Tagesschau Sprechern stammen (Falsche Audios) reicht die Marke Tagesschau allein als Beleg nicht mehr aus. In Zukunft wird nur die Tatsache, dass wir einen Inhalt direkt auf einer vertrauenswürdigen Website wie Tagesschau.de finden, seine Richtigkeit garantieren.

 Bald wird die Frage, wenn es um Glaubwürdigkeit geht nicht mehr lauten: Von wem stammt das Video - sondern: Wo hast Du es gesehen?

 Ich vermute, was zunächst eine große Herausforderung für die Nachrichtenredaktionen sein wird, wenn sie unter der enormen Menge der Verifizierungen von KI-Fakes ächzen, wird am Ende ein Glücksfall für sie: Die Chance sich als eine der wenigen verbliebenen verlässlichen Quellen zu positionieren.

 Und diese Chance vergibt Springer durch die Kooperation mit OpenAI - wenn die Texte von Welt, Politico und Business Insider in Zukunft von Nutzern als erstes über ChatGPT angesteuert werden – wo sie im Umfeld von halbrichtigen Informationen oder im schlimmsten Fall sogar Fake News stehen.

 

Die größte Suchmaschine der Welt - mit Link zu Springer

Vielleicht läuft es aber auch ganz anders. Der Deal mit OpenAI hat natürlich auch großes Potential. Zum einen steht da die technische Unterstützung, die OpenAI Springer liefern soll, um die Entwicklung von KI-Anwendungen voran zu treiben. Mit diesem Technologievorsprung kann Springer viele neue Erlösquellen aufbauen.

Zum anderen der Traffic. Chat-GPT wird sich neben Bard von Google mit hoher Wahrscheinlichkeit zu einer der größten Suchmaschinen der Welt entwickeln. Die bevorzugte Ausspielung von Springer Inhalten innerhalb ChatGPTs (die mit hoher Wahrscheinlichkeit Teil des Deals ist) wird viele Nutzer ins Springer Universum leiten. Dass das Verlagshaus sich hier so früh positioniert hat, könnte ihm einen entscheidenden Vorteil gegenüber anderen Verlagen verschaffen.

Darin liegen jedoch ein paar Tücken. Vor allem sehe ich hier die Umgehung der Pay-Wall. Springer sagt selber, dass Nutzer über ChatGPT kostenfrei Zugang zu Springer Inhalten bekommen sollen, die eigentlich für zahlende Kunden vorbehalten sind. Eine Pay-Wall, die löchrig ist, lässt sich aber langfristig nicht aufrecht erhalten. Kein Abonnent wird bereit sein, für Texte eine Springer Publikation zu bezahlen, wenn er sie über ChatGPT kostenlos haben kann.

Laut Medieninsider steht dahinter zwar ein Rückvergütungsmodell, innerhalb dessen OpenAI Springer für jedes ausgespielte Content-Piece kompensiert (Details des Deals). Doch wie auch immer es läuft: Ich vermute, dass die Verlinkungen unweigerlich dazu führen, dass Springer seine mühevoll etablierten Pay-Walls nach und nach einreißen muss. Ein riskanter Strategiewechsel. Der sich in meinen Augen nur rechtfertigen lässt, wenn die Partnerschaft mit OpenAI eine massive Steigerung der Reichweiten mit sich bringt. Davon auszugehen ist - Stand heute - allerdings eine große Wette.

 

Die Identität der New York Times

Zum Schluss ein Blick auf die New York Times und ihre Klage gegen OpenAI und Microsoft. Die NYT fordert laut Klageschrift von beiden Unternehmen Ersatz für Schäden in Milliardenhöhe, die durch ungefragte Nutzung von New York Times Artikeln zu Trainingszwecken der Chatbots entstanden sein sollen.

Ein Grund, warum die NYT den Klageweg beschreitet und Axel Springer nicht, könnten die unterschiedlichen Erfolgsaussichten sein. Für die NYT war es sehr viel einfacher einen Gerichtsstand in den USA für eine Klage gegen zwei andere US-Unternehmen zu finden, als es für das deutsche Verlagshaus Springer gewesen wäre (falls eine Klage dort überhaupt zur Debatte stand). Zudem führt die Praxis des Strafschadensersatzes in den USA zu deutlich höheren Kompensationszahlungen als sie bei einer vergleichbaren Klage vor einem deutschen Gericht.

Es gibt in meinen Augen aber noch einen wichtigeren Grund, warum die NYT auf eine Klage statt Kooperation mit OpenAI setzt. Die renommierte US-Zeitung baut stark auf die journalistische Qualität ihrer Inhalte und den wirtschaftlichen Wert der daraus erwächst. In einem Strategiepapier des Blattes heißt es, dass es nicht darum ginge Klicks zu maximieren: „Wir glauben, dass die beste Geschäftsstrategie für die Times darin besteht, einen so starken Journalismus anzubieten, dass mehrere Millionen Menschen auf der ganzen Welt bereit sind, dafür zu bezahlen.“ (Journalism that stands apart).

Mit dieser Haltung navigiert die NYT sehr gut durch die Untiefen, in denen sich das Verlagswesen im Zuge der Digitalisierung seit Jahren bewegt und ist so zur erfolgreichsten Digitalzeitung der Welt geworden (NZZ - NYT erfolgreichste Digitalzeitung). Ich vermute, dass das Bewusstsein der NYT für ihre journalistische Identität eine große Rolle bei der Entscheidung gespielt hat, OpenAI juristisch die Stirn zu bieten. Die eigenen Inhalte scheinen zu wertvoll, als dass man sie den Datenfressern der LLMs kampflos preisgibt.

Springer dagegen prescht nach vorne, die Kooperation mit OpenAI scheint für das deutsche Verlagshaus der erfolgsversprechendere Weg zu sein.

Wobei viele vermuten, dass auch die NYT nach Abschluss des Verfahrens eine Kooperation mit OpenAI und Microsoft anstreben wird. Dann aber wahrscheinlich aus einer Position der Stärke heraus - sofern das Traditionsblatt die Nase beim Urteilsspruch vorn haben sollte.

 

Die unmögliche Zukunft

Das alles sind natürlich nur meine persönlichen Annahmen. Zutreffende Prognosen sind ja ohnehin ein Ding der Unmöglichkeit, bei der rasanten Entwicklung der Künstlichen Intelligenz umso mehr. Es ist gut möglich, dass ich mit all meinen Annahmen komplett daneben liege und der Deal mit OpenAI ein genialer Schachzug von Springer war, der dem Haus den Weg in die Zukunft geebnet hat - was ich der Springer Gruppe bei allen Vorbehalten gegen die Bild-Titel sehr wünsche.

 

 #OpenAI #IPLaw #Copyright #Axelspringer #NYTimes



Quellen:

 

 

 

Zum Anzeigen oder Hinzufügen von Kommentaren einloggen

Weitere Artikel von Tobias Haucke

Ebenfalls angesehen

Themen ansehen