Notizie SEO e IA generativa: all'interno di una "relazione parassitaria"

Pubblicato: 2023-03-21

Mentre circolano rapporti secondo cui il laboratorio di ricerca sull'intelligenza artificiale OpenAI utilizza notizie di media come il Wall Street Journal e la CNN per addestrare il suo chatbot ChatGPT, emerge una sfida ancora più grande: in che modo i media mantengono il traffico, le entrate e la pertinenza nell'era dell'IA generativa?

Le notizie generate dall'intelligenza artificiale hanno a lungo ispirato la paura tra i giornalisti. Nel 2016, ad esempio, la Press Association del Regno Unito ha segnalato la sua intenzione di utilizzare l'intelligenza artificiale per alcune notizie sportive ed elettorali.

Abbiamo visto esempi più recenti negli Stati Uniti, come questo riepilogo NHL dell'Associated Press compilato con la tecnologia della società di automazione dei contenuti sportivi Data Skrive.

Il CEO della società di media Axel Springer, che possiede titoli come Business Insider e Politico, ha recentemente affermato che l'IA ha il potenziale per sostituire del tutto i giornalisti. "Solo coloro che creano i migliori contenuti originali sopravvivranno", ha riferito Springer in una lettera ai dipendenti.

"Problemi di copyright sconosciuti"

La questione dei diritti d'autore - e potenziali problemi legali - è già emersa in Francia e Spagna.

"Se OpenAI migliorerà il suo modello con contenuti aggiornati senza inviare alcun traffico [alla fonte originale, scatenerà] un dibattito [su] chi possiede i diritti per il contenuto", ha affermato Marcus Tober, vice senior presidente delle soluzioni aziendali presso la piattaforma di marketing Semrush.

OpenAI ha già visto alcune cause legali sul copyright e Dan Smullen, capo del SEO presso la piattaforma di gioco d'azzardo sportivo Betsperts Media and Technology Group, ha affermato che potremmo aspettarci di più a breve.

"In effetti, nonostante abbia sentito che alcuni editori hanno iniziato ad adottare contenuti assistiti dall'intelligenza artificiale nella redazione, i team editoriali con cui ho parlato sono a disagio nell'usare i risultati di OpenAI a causa di problemi di copyright sconosciuti", ha aggiunto Smullen.

OpenAI ha adottato misure per affrontare queste preoccupazioni, come consentire agli editori di rinunciare all'utilizzo dei loro contenuti, ha osservato. Il laboratorio di ricerca sull'intelligenza artificiale ha anche accettato di fornire l'attribuzione quando i suoi algoritmi estraggono informazioni dai siti di notizie.

"Tuttavia, i SEO nel settore dei media temono che questo sistema potrebbe non proteggere adeguatamente dai problemi di copyright e proprietà intellettuale", ha aggiunto Smullen. "In quanto tali, le testate giornalistiche dovrebbero continuare a monitorare l'uso dei dati delle notizie da parte di OpenAI e garantire che il loro contenuto venga utilizzato in modo responsabile".

Una soluzione semplice sarebbe aggiungere note a piè di pagina che si collegano alle fonti, in modo simile a ciò che fa ChatGPT in Bing.

"Ci aspettiamo qualcosa di simile con [il servizio AI conversazionale di Google] Bard", ha aggiunto Smullen.

Ottieni la newsletter quotidiana su cui si affidano i marketer di ricerca.

Vedi termini.

"Decadimento della verità"

In definitiva, la spinta dell'intelligenza artificiale alle notizie minaccia di ribaltare nuovamente il consumo dei media.

Secondo Ben Poulton, consulente SEO e fondatore dell'agenzia SEO Intellar, le aziende di intelligenza artificiale che utilizzano dati raschiati "minacciano il controllo curato che le testate giornalistiche hanno avuto per decenni".

Il risultato potrebbe essere ulteriore degrado dell'integrità giornalistica.

Smullen ha notato che la mancanza di compensi da parte degli editori per i dati di addestramento potrebbe portare a un futuro in cui gli editori bloccano OpenAI e le sue controparti, quindi i siti di notizie di alta autorità non vengono sottoposti a scansione. Ciò, a sua volta, potrebbe comportare una sfida ancora più grande con le notizie false, inclusa una più ampia circolazione di informazioni imprecise e/o distorte mascherate da fatti.

Pertanto, Smullen ha chiesto che gli editori vengano ricompensati per il ruolo fondamentale che svolgono e Cameron Conaway, un ex giornalista investigativo che guida un team di marketing per la crescita presso il gigante tecnologico Cisco e insegna marketing digitale all'Università di San Francisco, ha concordato.

"Questo approfondimento della verità potrebbe decadere e la sfiducia della società nei confronti di nuove fonti legittime?" chiese. "Quale impatto potrebbe avere sulla democrazia se la maggior parte delle informazioni fosse priva di fonti, e chi (o cosa) deterrebbe il potere?"

"Implicazioni disastrose"

C'è persino preoccupazione per OpenAI che alla fine automatizzerà del tutto la produzione di notizie. Tuttavia, Barry Adams, un consulente SEO specializzato presso la società SEO Polemic Digital, ha notato che i sistemi di intelligenza artificiale generativa non possono prevedere le notizie, quindi non prevede problemi immediati.

"L'intelligenza artificiale non sostituirà il giornalismo quando si tratta di riportare notizie, indagare su storie e tenere conto del potere", ha aggiunto.

Inoltre, l'intelligenza artificiale potrebbe riformulare le notizie locali senza citazione mentre sputa le proprie versioni. Ciò, a sua volta, sottrarrebbe il traffico e le relative entrate dai siti di notizie, il che è particolarmente dannoso per i siti di notizie locali che dipendono in modo particolare dal traffico degli annunci display, ha affermato Conaway.

E la riformulazione ha il potenziale per cambiare il significato originale della segnalazione.

"La combinazione di redazioni locali frammentarie e finanziariamente vulnerabili, l'evitamento e la sfiducia generale dei media e l'ascesa dell'intelligenza artificiale come fonte primaria potrebbe avere implicazioni disastrose", ha aggiunto.

Ma non è tutto - aspettalo - cattive notizie.

"Tra i lati positivi per le testate giornalistiche, le persone consumeranno sempre le notizie. È solo il mezzo che cambia", ha affermato Poulton. "Se ChatGPT può riassumere cinque storie sullo stesso argomento da cinque diversi punti vendita in cinque secondi, non è un buon prodotto? Forse ChatGPT potrebbe essere utilizzato su siti di notizie per aiutare gli utenti a scomporre e trovare rapidamente le informazioni che desiderano."

"Un rapporto parassitario"

Prima, però, le parti devono affrontare la questione del traffico e delle entrate.

Adams ha affermato che la mancanza di attribuzione con le prime iterazioni di Bing ChatGPT e del modello linguistico per le applicazioni di dialogo di Google, o LaMDA, lo preoccupa maggiormente qui.

"Ciò mina un contratto fondamentale del web, in cui i motori di ricerca e i siti web di contenuti esistono in uno stato simbiotico", ha affermato. "L'intelligenza artificiale generativa trasforma questa simbiosi in una relazione parassitaria, in cui i motori di ricerca prendono tutto dai creatori di contenuti (vale a dire, il contenuto necessario per addestrare [modelli di linguaggi di grandi dimensioni (LLM)]) e non danno nulla in cambio".

YouTube di proprietà di Google, tuttavia, utilizza già un modello più simbiotico in cui i creatori di contenuti condividono le entrate generate dalla piattaforma.

"Non c'è motivo per cui un modello simile non possa essere adottato per i motori di ricerca e il web, tranne che renderebbe Google meno una macchina per stampare soldi e perderebbe un po' di valore per gli azionisti", ha aggiunto Adams.

Smullen ha concordato che la soluzione è pagare gli editori per i dati di addestramento.

"Simile a Google, abuserà del suo dominio fino a quando i governi non si faranno avanti e metteranno in discussione la legalità del suo modello di business dal punto di vista del copyright", ha affermato Smullen. "È giusto che gli editori vengano ricompensati per il loro ruolo nel rendere possibile la prossima generazione di IA".

Adams ha convenuto che è improbabile che Google riduca volontariamente i propri profitti.

"A loro non importa di aver usato la conoscenza combinata dell'umanità condivisa sul web per costruire questi sistemi di intelligenza artificiale generativa e ora stanno scartando questi creatori senza attribuzione", ha aggiunto. "Se possono farla franca, lo faranno."

'Rimani vigile'

Alcune organizzazioni giornalistiche hanno già risposto con accordi di licenza più severi, norme rafforzate sulla raccolta e l'utilizzo dei dati e l'uso di software di protezione del copyright, secondo Julian Scott, content strategist presso la gestione dei social media e lo strumento di automazione Socialbu.

"Tuttavia, queste misure potrebbero non essere sufficienti per proteggere completamente il loro contenuto dall'uso senza attribuzione", ha aggiunto.

I SEO del settore dei media chiedono strumenti migliori all'interno del modello di OpenAI, che garantirebbero un credito adeguato, ha osservato Daniel Chabert, CEO e fondatore dell'agenzia di sviluppo web e software PurpleFire.

"Sperano che OpenAI aumenti la sua trasparenza riguardo all'uso dei dati delle notizie e sia più proattivo nell'avvisare autori ed editori quando il loro contenuto viene utilizzato", ha aggiunto.

Nel frattempo, le testate giornalistiche farebbero bene a investire in migliori sistemi di monitoraggio per rilevare errori o distorsioni nei dati generati dai modelli di OpenAI.

"Le organizzazioni giornalistiche devono rimanere vigili sull'uso dei dati delle notizie da parte di OpenAI e adottare le misure necessarie per proteggere i loro contenuti e garantire accuratezza e qualità", ha aggiunto Chabert.

'Una destinazione di prima tappa'

C'è anche una tattica di marketing online collaudata, che è particolarmente rilevante qui.

Adams ha notato che i siti Web devono iniziare a pensare a un "futuro post-Google" e costruire marchi forti che leghino il loro pubblico direttamente a loro.

"Alcuni editori hanno abbastanza successo in questo e hanno costruito marchi che sono quasi immuni ai capricci dei motori di ricerca", ha aggiunto. "L'obiettivo è diventare una destinazione di prima tappa per il tuo pubblico, con i lettori che visitano direttamente il tuo sito Web senza l'intermediazione di Google o Facebook".

Man mano che l'impulso a fare clic sulle fonti originali diminuisce, Matt Greenwood, responsabile SEO presso l'agenzia di ricerca Reflect Digital, ha concordato che i siti Web dovrebbero "cercare di fornire informazioni ed esperienze che sono più preziose di quelle che possono essere condensate in poche righe di testo generato automaticamente , per dare ai consumatori un motivo per visitare ancora i nostri siti e leggere i nostri contenuti originali."

Le opinioni espresse in questo articolo sono quelle dell'autore ospite e non necessariamente Search Engine Land. Gli autori dello staff sono elencati qui.

Aggiungi Search Engine Land al tuo feed di Google News.