Nachrichten-SEO und generative KI: In einer „parasitären Beziehung“
Veröffentlicht: 2023-03-21Während Berichte kursieren, dass das KI-Forschungslabor OpenAI Nachrichten von Medien wie dem Wall Street Journal und CNN verwendet, um seinen ChatGPT-Chatbot zu trainieren, taucht eine noch größere Herausforderung auf: Wie behalten Medien im Zeitalter der generativen KI den Verkehr, die Einnahmen und die Relevanz?
KI-generierte Nachrichten haben Journalisten schon lange Angst gemacht. 2016 signalisierte beispielsweise die britische Press Association ihre Absicht, KI für einige Sport- und Wahlberichte einzusetzen.
Wir haben neuere Beispiele in den USA gesehen, wie diese NHL-Zusammenfassung von Associated Press, die mit der Technologie des Automatisierungsunternehmens für Sportinhalte Data Skrive zusammengestellt wurde.
Der CEO des Medienunternehmens Axel Springer, dem Titel wie Business Insider und Politico gehören, sagte kürzlich, KI habe das Potenzial, Journalisten vollständig zu ersetzen. „Nur diejenigen, die die besten Originalinhalte erstellen, werden überleben“, schrieb Springer Berichten zufolge in einem Brief an die Mitarbeiter.
„Unbekannte Urheberrechtsprobleme“
Das Problem des Urheberrechts – und möglicher rechtlicher Probleme – ist bereits in Frankreich und Spanien aufgetaucht.
„Wenn OpenAI sein Modell mit aktuellen Inhalten erweitert, ohne Datenverkehr [an die ursprüngliche Quelle] zu senden, wird es eine Debatte darüber auslösen, wer die Rechte an den Inhalten besitzt“, sagte Marcus Tober, Senior Vice President of Enterprise Solutions bei der Marketingplattform Semrush.
OpenAI hat bereits einige Urheberrechtsklagen gesehen, und Dan Smullen, Head of SEO bei der Sportwettenplattform Betsperts Media and Technology Group, sagte, wir könnten in Kürze mehr erwarten.
„Obwohl zu hören ist, dass einige Verlage begonnen haben, KI-unterstützte Inhalte in der Redaktion einzuführen, fühlen sich die Redaktionsteams, mit denen ich gesprochen habe, aufgrund der unbekannten Urheberrechtsprobleme unwohl bei der Verwendung der Ergebnisse von OpenAI“, fügte Smullen hinzu.
OpenAI habe Schritte unternommen, um diese Bedenken auszuräumen, beispielsweise indem es Publishern ermögliche, die Verwendung ihrer Inhalte abzulehnen, stellte er fest. Das KI-Forschungslabor hat auch zugestimmt, eine Zuordnung bereitzustellen, wenn seine Algorithmen Informationen von Nachrichtenseiten kratzen.
„Trotzdem befürchten SEOs in der Medienbranche, dass dieses System möglicherweise nicht ausreichend vor Urheberrechts- und Urheberrechtsproblemen schützt“, fügte Smullen hinzu. „Daher sollten Nachrichtenorganisationen die Verwendung von Nachrichtendaten durch OpenAI weiterhin überwachen und sicherstellen, dass ihre Inhalte verantwortungsbewusst verwendet werden.“
Eine einfache Lösung wäre das Hinzufügen von Fußnoten mit Links zu Quellen, ähnlich wie ChatGPT in Bing.
„Wir erwarten etwas Ähnliches mit [dem KI-Dienst von Google] Bard“, fügte Smullen hinzu.
Holen Sie sich den täglichen Newsletter, auf den sich Suchmaschinenvermarkter verlassen.
Siehe Bedingungen.
„Wahrheitszerfall“
Letztendlich droht der Vorstoß der KI in die Nachrichten den Medienkonsum erneut auf den Kopf zu stellen.
Laut Ben Poulton, SEO-Berater und Gründer der SEO-Agentur Intellar, bedrohen KI-Unternehmen, die geschabte Daten verwenden, „die kuratierte Kontrolle, die Nachrichtenorganisationen seit Jahrzehnten haben“.
Das Ergebnis könnte sein weitere Verschlechterung der journalistischen Integrität.
Smullen wies darauf hin, dass ein Mangel an Publisher-Vergütung für Trainingsdaten dazu führen könnte, dass Publisher OpenAI und seine Pendants in Zukunft blockieren, sodass Nachrichtenseiten mit hoher Autorität nicht gecrawlt werden. Dies wiederum könnte zu einer noch größeren Herausforderung bei gefälschten Nachrichten führen, einschließlich einer größeren Verbreitung ungenauer und/oder voreingenommener Informationen, die sich als Tatsachen tarnen.
Daher forderte Smullen, dass Verlage für die entscheidende Rolle, die sie spielen, entschädigt werden – und Cameron Conaway, ein ehemaliger investigativer Journalist, der ein Wachstumsmarketing-Team beim Technologieriesen Cisco leitet und digitales Marketing an der Universität von San Francisco lehrt, stimmte zu.
„Könnte dies den Wahrheitsverfall und das Misstrauen der Gesellschaft gegenüber legitimen neuen Quellen vertiefen?“ er hat gefragt. "Welche Auswirkungen könnte es auf die Demokratie haben, wenn die meisten Informationen quellenlos sind, und wer (oder was) wird dann die Macht haben?"
"Katastrophale Auswirkungen"
Es gibt sogar Bedenken, dass OpenAI die Nachrichtenproduktion letztendlich vollständig automatisieren könnte. Barry Adams, ein spezialisierter SEO-Berater bei der SEO-Firma Polemic Digital, stellte jedoch fest, dass generative KI-Systeme die Nachrichten nicht vorhersagen können, sodass er keine unmittelbaren Probleme vorhersieht.
„KI wird den Journalismus nicht ersetzen, wenn es darum geht, über Neuigkeiten zu berichten, Geschichten zu untersuchen und Macht zur Rechenschaft zu ziehen“, fügte er hinzu.
Andererseits könnte die KI lokale Nachrichten ohne Zitierung neu formulieren, während sie ihre eigenen Versionen ausspuckt. Dies wiederum würde den Datenverkehr und die damit verbundenen Einnahmen von Nachrichtenseiten abziehen, was besonders schädlich für lokale Nachrichtenseiten ist, die besonders auf Display-Anzeigenverkehr angewiesen sind, sagte Conaway.
Und eine Umformulierung hat das Potenzial, die ursprüngliche Bedeutung der Berichterstattung zu verändern.
„Die Kombination aus rauflustigen und finanziell anfälligen lokalen Nachrichtenredaktionen, allgemeiner Medienvermeidung und Misstrauen und dem Aufstieg von KI als Hauptquelle könnte katastrophale Auswirkungen haben“, fügte er hinzu.
Aber es ist noch nicht alles – warte darauf – schlechte Nachrichten.
„Auf der positiven Seite für Nachrichtenorganisationen ist, dass die Leute immer Nachrichten konsumieren werden. Es ist nur das Medium, das sich ändert“, sagte Poulton. „Wenn ChatGPT fünf Geschichten zum selben Thema aus fünf verschiedenen Quellen in fünf Sekunden zusammenfassen kann, ist das dann nicht ein gutes Produkt? Vielleicht könnte ChatGPT auf Nachrichtenseiten verwendet werden, um Benutzern zu helfen, die gewünschten Informationen schnell aufzuschlüsseln und zu finden.“
„Eine parasitäre Beziehung“
Zunächst müssen sich die Parteien jedoch mit der Frage des Verkehrs und der Einnahmen befassen.
Adams sagte, der Mangel an Zuschreibung bei frühen Iterationen von Bing ChatGPT und Googles Sprachmodell für Dialoganwendungen (LaMDA) beunruhige ihn hier am meisten.
„Dies untergräbt einen grundlegenden Vertrag des Internets, in dem Suchmaschinen und Content-Websites in einem symbiotischen Zustand existieren“, sagte er. „Generative KI verwandelt diese Symbiose in eine parasitäre Beziehung, bei der die Suchmaschinen den Inhaltserstellern alles nehmen (dh die Inhalte, die zum Trainieren von [Large Language Models (LLMs)] benötigt werden) und nichts zurückgeben.“
Das Google-eigene YouTube verwendet jedoch bereits ein eher symbiotisches Modell, bei dem die Ersteller von Inhalten an den von der Plattform generierten Einnahmen teilhaben.
„Es gibt keinen Grund, warum ein ähnliches Modell nicht auch für Suchmaschinen und das Internet übernommen werden könnte, außer dass es Google weniger zu einer Gelddruckmaschine machen und etwas Shareholder Value verlieren würde“, fügte Adams hinzu.
Smullen stimmte zu, dass die Lösung darin besteht, Publisher für Trainingsdaten zu bezahlen.
„Ähnlich wie Google wird es seine Dominanz missbrauchen, bis Regierungen eingreifen und die Rechtmäßigkeit seines Geschäftsmodells aus urheberrechtlicher Sicht in Frage stellen“, sagte Smullen. „Es ist nur fair, dass Verlage für ihre Rolle bei der Ermöglichung der nächsten Generation von KI entschädigt werden.“
Adams stimmte zu, dass es unwahrscheinlich sei, dass Google seine eigenen Gewinne freiwillig reduzieren werde.
„Es wird ihnen egal sein, dass sie das kombinierte Wissen der Menschheit, das im Internet geteilt wird, verwendet haben, um diese generativen KI-Systeme zu bauen, und diese Schöpfer jetzt ohne Zuschreibung verwerfen“, fügte er hinzu. "Wenn sie damit durchkommen, werden sie es tun."
'Wachsam bleiben'
Laut Julian Scott, Content-Stratege beim Social-Media-Management- und Automatisierungstool Socialbu, haben einige Nachrichtenorganisationen bereits mit strengeren Lizenzvereinbarungen, strengeren Datenerfassungs- und -nutzungsregeln und der Verwendung von Urheberrechtsschutzsoftware reagiert.
„Allerdings reichen diese Maßnahmen möglicherweise nicht aus, um ihre Inhalte vollständig vor der Nutzung ohne Namensnennung zu schützen“, fügte er hinzu.
SEOs der Medienbranche fordern bessere Tools innerhalb des OpenAI-Modells, die eine angemessene Anerkennung gewährleisten würden, bemerkte Daniel Chabert, CEO und Gründer der Web- und Softwareentwicklungsagentur PurpleFire.
„Sie hoffen, dass OpenAI seine Transparenz in Bezug auf die Verwendung von Nachrichtendaten erhöht und Autoren und Herausgeber proaktiver benachrichtigt, wenn ihre Inhalte verwendet werden“, fügte er hinzu.
In der Zwischenzeit täten Nachrichtenorganisationen gut daran, in bessere Überwachungssysteme zu investieren, um Fehler oder Verzerrungen in den von OpenAI-Modellen generierten Daten zu erkennen.
„Nachrichtenorganisationen müssen wachsam bleiben, was die Nutzung von Nachrichtendaten durch OpenAI betrifft, und die notwendigen Schritte unternehmen, um ihre Inhalte zu schützen und Genauigkeit und Qualität sicherzustellen“, fügte Chabert hinzu.
„Ein Ziel erster Wahl“
Es gibt auch eine bewährte Online-Marketing-Taktik, die hier besonders relevant ist.
Adams merkte an, dass Websites anfangen müssen, über eine „Post-Google-Zukunft“ nachzudenken und starke Marken aufzubauen, die ihr Publikum direkt an sie binden.
„Einige Verlage sind damit ziemlich erfolgreich und haben Marken aufgebaut, die fast immun gegen die Launen der Suchmaschinen sind“, fügte er hinzu. „Das Ziel ist es, eine erste Anlaufstelle für Ihr Publikum zu werden, wobei die Leser Ihre Website direkt ohne die Vermittlung von Google oder Facebook besuchen.“
Da der Anreiz, sich durch die Originalquellen zu klicken, nachlässt, sollten Websites laut Matt Greenwood, SEO-Manager bei der Suchagentur Reflect Digital, „daran interessiert sein, Informationen und Erfahrungen bereitzustellen, die wertvoller sind, als sie in ein paar Zeilen automatisch generierten Textes komprimiert werden können , um den Verbrauchern einen Grund zu geben, unsere Websites weiterhin zu besuchen und unsere ursprünglichen Inhalte zu lesen."
Die in diesem Artikel geäußerten Meinungen sind die des Gastautors und nicht unbedingt Search Engine Land. Mitarbeiter Autoren sind hier aufgelistet.