Știri SEO și inteligență artificială generativă: în interiorul unei „relații parazitare”
Publicat: 2023-03-21Pe măsură ce circulă rapoarte că laboratorul de cercetare AI OpenAI folosește știri de la instituții media precum Wall Street Journal și CNN pentru a-și antrena chatbot-ul ChatGPT, apare o provocare și mai mare: cum rețin instituțiile media traficul, veniturile și relevanța în era AI generativă?
Știrile generate de inteligența artificială au inspirat de mult timp frică în rândul jurnaliștilor. În 2016, de exemplu, Asociația Presei din Marea Britanie și-a semnalat intenția de a folosi AI pentru unele articole despre sport și despre alegeri.
Am văzut exemple mai recente în SUA, cum ar fi această rezumare a NHL de la Associated Press, compilată cu tehnologie de la firma de automatizare a conținutului sportiv Data Skrive.
CEO-ul companiei media Axel Springer, care deține titluri precum Business Insider și Politico, a declarat recent că AI are potențialul de a înlocui cu totul jurnaliştii. „Numai cei care creează cel mai bun conținut original vor supraviețui”, a scris Springer într-o scrisoare către angajați.
„Probleme de drepturi de autor necunoscute”
Problema drepturilor de autor – și potențialele probleme legale, a apărut deja în Franța și Spania.
„Dacă OpenAI își va îmbunătăți modelul cu conținut actualizat fără a trimite trafic [la sursa inițială, va] declanșa o dezbatere [pentru] cine deține drepturile pentru conținut”, a spus Marcus Tober, vice-director. președinte al soluțiilor pentru întreprinderi la platforma de marketing Semrush.
OpenAI a văzut deja câteva procese pentru drepturile de autor, iar Dan Smullen, șeful SEO la platforma de jocuri de noroc sportive Betsperts Media and Technology Group, a spus că ne putem aștepta la mai multe în curând.
„De fapt, deși au auzit că unii editori au început să adopte conținut asistat de inteligență artificială în redacție, echipele editoriale cu care am vorbit sunt incomode să folosească rezultatele de la OpenAI din cauza problemelor necunoscute de drepturi de autor”, a adăugat Smullen.
OpenAI a luat măsuri pentru a aborda aceste preocupări, cum ar fi să permită editorilor să renunțe la utilizarea conținutului lor, a menționat el. Laboratorul de cercetare AI a fost, de asemenea, de acord să ofere atribuire atunci când algoritmii săi scot informații de pe site-urile de știri.
„Totuși, SEO din industria media se îngrijorează că acest sistem ar putea să nu protejeze în mod adecvat împotriva problemelor legate de drepturile de autor și de proprietate intelectuală”, a adăugat Smullen. „Ca atare, organizațiile de știri ar trebui să continue să monitorizeze utilizarea de către OpenAI a datelor de știri și să se asigure că conținutul lor este utilizat în mod responsabil.”
O soluție ușoară ar fi să adăugați note de subsol care leagă la surse, similar cu ceea ce face ChatGPT în Bing.
„Ne așteptăm la ceva similar cu [serviciul IA conversațional al Google] Bard”, a adăugat Smullen.
Obțineți buletinele informative zilnice pe care se bazează marketerii.
Vezi termenii.
„Decăderea adevărului”
În cele din urmă, impulsul AI către știri amenință să răstoarne consumul media din nou.
Potrivit lui Ben Poulton, consultant SEO și fondator al agenției SEO Intellar, companiile de inteligență artificială care folosesc date răzuite „amenință controlul organizat pe care organizațiile de știri l-au avut de zeci de ani”.
Rezultatul ar putea fi degradarea în continuare a integrității jurnalistice.
Smullen a remarcat că lipsa de compensare a editorilor pentru datele de instruire ar putea duce la un viitor în care editorii blochează OpenAI și omologii săi, astfel încât site-urile de știri de înaltă autoritate nu sunt accesate cu crawlere. Aceasta, la rândul său, ar putea genera o provocare și mai mare cu știrile false, inclusiv o circulație mai largă a informațiilor inexacte și/sau părtinitoare mascalate drept fapte.
Ca atare, Smullen a cerut ca editorii să fie compensați pentru rolul critic pe care îl joacă – iar Cameron Conaway, un fost jurnalist de investigație care conduce o echipă de marketing de creștere la gigantul tehnologic Cisco și predă marketing digital la Universitatea din San Francisco, a fost de acord.
„Ar putea acest adevăr adânc să se degradeze și neîncrederea societății în noile surse legitime?” el a intrebat. „Ce impact ar putea avea asupra democrației dacă majoritatea informațiilor sunt fără surse și cine (sau ce) va deține atunci puterea?”
„Implicații dezastruoase”
Există chiar și îngrijorarea că OpenAI va automatiza în cele din urmă producția de știri. Totuși, Barry Adams, un consultant SEO specializat la firma SEO Polemic Digital, a remarcat că sistemele AI generative nu pot prezice știrile, așa că nu prevede probleme imediate.

„AI nu va înlocui jurnalismul atunci când vine vorba de raportarea știrilor, investigarea poveștilor și tragerea la răspundere”, a adăugat el.
Apoi, din nou, AI ar putea reformula știrile locale fără citare, deoarece își scuipă propriile versiuni. Acest lucru, la rândul său, ar sifona traficul și veniturile aferente de pe site-urile de știri, ceea ce este deosebit de dăunător pentru site-urile de știri locale care depind în special de traficul de anunțuri grafice, a spus Conaway.
Și reformularea are potențialul de a schimba sensul inițial al raportării.
„Combinația dintre redacțiile locale dezastruoase și vulnerabile din punct de vedere financiar, evitarea generală a mass-media și neîncrederea și creșterea AI ca sursă primară ar putea avea implicații dezastruoase”, a adăugat el.
Dar nu sunt toate – așteptați – vești proaste.
„În avantajul organizațiilor de știri, oamenii vor consuma întotdeauna știri. Este doar mediul care se schimbă”, a spus Poulton. „Dacă ChatGPT poate rezuma cinci povești pe același subiect de la cinci puncte de vânzare diferite în cinci secunde, nu este acesta un produs bun? Poate că pe site-uri de știri ar putea fi folosite pe site-uri de știri pentru a ajuta utilizatorii să găsească rapid informațiile pe care le doresc.”
„O relație parazitară”
În primul rând, însă, părțile trebuie să abordeze problema traficului și a veniturilor.
Adams a spus că lipsa atribuirii cu iterațiile timpurii ale Bing ChatGPT și modelul de limbă Google pentru aplicații de dialog, sau LaMDA, îl preocupă cel mai mult aici.
„Acest lucru subminează un contract fundamental al web-ului, în care motoarele de căutare și site-urile web de conținut există într-o stare simbiotică”, a spus el. „IA generativă transformă această simbioză într-o relație parazită, în care motoarele de căutare preiau totul de la creatorii de conținut (adică conținutul necesar pentru a antrena [modele mari de limbaj (LLM)]) și nu dau nimic înapoi.”
YouTube, deținut de Google, folosește deja un model mai simbiotic în care creatorii de conținut împart veniturile generate de platformă.
„Nu există niciun motiv pentru care un model similar nu ar putea fi adoptat pentru motoarele de căutare și web, cu excepția faptului că ar face Google mai puțin o mașină de tipărire a banilor și ar pierde ceva valoare pentru acționari”, a adăugat Adams.
Smullen a fost de acord că soluția este să plătească editorii pentru datele de instruire.
„Ca și Google, va abuza de dominația sa până când guvernele își vor intensifica și vor pune la îndoială legalitatea modelului său de afaceri din punct de vedere al dreptului de autor”, a spus Smullen. „Este corect ca editorii să fie compensați pentru rolul lor în a face posibilă următoarea generație de inteligență artificială”.
Adams a fost de acord că este puțin probabil ca Google să își reducă în mod voluntar propriile profituri.
„Nu le va păsa că au folosit cunoștințele combinate despre umanitate împărtășite pe web pentru a construi aceste sisteme AI generative și acum renunță la acești creatori fără atribuire”, a adăugat el. „Dacă pot scăpa, o vor face”.
„Rămâneți vigilenți”
Unele organizații de știri au răspuns deja prin acorduri de licență mai stricte, reguli consolidate de colectare și utilizare a datelor și utilizarea software-ului de protecție a drepturilor de autor, potrivit lui Julian Scott, strateg de conținut la instrumentul de automatizare și management al rețelelor sociale Socialbu.
„Cu toate acestea, este posibil ca aceste măsuri să nu fie suficiente pentru a proteja pe deplin conținutul lor împotriva utilizării fără atribuire”, a adăugat el.
SEO din industria media solicită instrumente mai bune în cadrul modelului OpenAI, care ar asigura un credit adecvat, a remarcat Daniel Chabert, CEO și fondator al agenției de dezvoltare web și software PurpleFire.
„Ei speră că OpenAI își va spori transparența în ceea ce privește utilizarea datelor de știri și va fi mai proactiv în alertarea autorilor și editorilor atunci când conținutul lor este utilizat”, a adăugat el.
Între timp, organizațiile de știri ar fi înțelept să investească în sisteme de monitorizare mai bune pentru a detecta erori sau părtiniri în datele generate de modelele OpenAI.
„Organizațiile de știri trebuie să rămână vigilente cu privire la utilizarea de către OpenAI a datelor de știri și să ia măsurile necesare pentru a-și proteja conținutul și pentru a asigura acuratețea și calitatea”, a adăugat Chabert.
„O destinație de primă oprire”
Există, de asemenea, o tactică de marketing online încercată și adevărată, care este deosebit de relevantă aici.
Adams a remarcat că site-urile web trebuie să înceapă să se gândească la un „viitor post-Google” și să construiască mărci puternice care își leagă publicul direct de ele.
„Unii editori au destul de mult succes în acest sens și au construit mărci care sunt aproape imune la capriciile motoarelor de căutare”, a adăugat el. „Scopul este să deveniți o destinație de primă oprire pentru publicul dvs., cititorii care vă vizitează direct site-ul web fără intermediarul unui Google sau Facebook”.
Pe măsură ce impulsul de a accesa sursele originale scade, Matt Greenwood, manager SEO la agenția de căutare Reflect Digital, a convenit că site-urile web ar trebui să „căuteze să ofere informații și experiențe care sunt mai valoroase decât pot fi condensate în câteva rânduri de text generat automat. , pentru a oferi consumatorilor un motiv să ne viziteze în continuare site-urile și să citească conținutul nostru original.”
Opiniile exprimate în acest articol sunt cele ale autorului invitat și nu neapărat Search Engine Land. Autorii personalului sunt enumerați aici.
