Notícias SEO e IA generativa: Por dentro de uma 'relação parasitária'
Publicados: 2023-03-21À medida que circulam relatos de que o laboratório de pesquisa de IA OpenAI usa notícias de meios de comunicação como o Wall Street Journal e a CNN para treinar seu chatbot ChatGPT, surge um desafio ainda maior: como os meios de comunicação retêm tráfego, receita e relevância na era da IA generativa?
As notícias geradas por IA há muito inspiram medo entre os jornalistas. Em 2016, por exemplo, a Press Association do Reino Unido sinalizou sua intenção de usar a IA para alguns esportes e matérias eleitorais.
Vimos exemplos mais recentes nos EUA, como este resumo da NHL da Associated Press compilado com tecnologia da empresa de automação de conteúdo esportivo Data Skrive.
O CEO da empresa de mídia Axel Springer, proprietária de títulos como Business Insider e Politico, disse recentemente que a IA tem o potencial de substituir completamente os jornalistas. “Apenas aqueles que criam o melhor conteúdo original sobreviverão”, escreveu Springer em uma carta aos funcionários.
'Problemas de direitos autorais desconhecidos'
A questão dos direitos autorais – e possíveis problemas legais – já surgiu na França e na Espanha.
“Se a OpenAI for aprimorar seu modelo com conteúdo atualizado sem enviar nenhum tráfego [para a fonte original, isso] provocará um debate [sobre] quem detém os direitos do conteúdo”, disse Marcus Tober, vice-presidente sênior presidente de soluções empresariais da plataforma de marketing Semrush.
A OpenAI já viu alguns processos de direitos autorais, e Dan Smullen, chefe de SEO da plataforma de apostas esportivas Betsperts Media and Technology Group, disse que poderíamos esperar mais em breve.
“Na verdade, apesar de ouvir que alguns editores começaram a adotar conteúdo assistido por IA na redação, as equipes editoriais com quem falei se sentem desconfortáveis em usar os resultados do OpenAI devido a questões desconhecidas de direitos autorais”, acrescentou Smullen.
A OpenAI tomou medidas para lidar com essas preocupações, como permitir que os editores optem por não ter seu conteúdo usado, observou ele. O laboratório de pesquisa de IA também concordou em fornecer atribuição quando seus algoritmos coletam informações de sites de notícias.
“Ainda assim, os SEOs da indústria de mídia temem que este sistema não proteja adequadamente contra questões de direitos autorais e propriedade intelectual”, acrescentou Smullen. “Assim, as organizações de notícias devem continuar monitorando o uso de dados de notícias pela OpenAI e garantir que seu conteúdo seja usado com responsabilidade”.
Uma solução fácil seria adicionar notas de rodapé com links para fontes, semelhante ao que o ChatGPT faz no Bing.
“Esperamos algo semelhante com o [serviço de IA conversacional do Google] Bard”, acrescentou Smullen.
Obtenha a newsletter diária em que os profissionais de marketing de busca confiam.
Consulte os termos.
'Decadência da verdade'
Em última análise, o impulso da IA para as notícias ameaça derrubar o consumo de mídia novamente.
De acordo com Ben Poulton, consultor de SEO e fundador da agência de SEO Intellar, as empresas de IA que usam dados copiados "ameaçam o controle curado que as organizações de notícias têm há décadas".
O resultado pode ser degradação da integridade jornalística.
Smullen observou que a falta de remuneração do editor por dados de treinamento pode levar a um futuro em que os editores bloqueiam o OpenAI e seus equivalentes, de modo que sites de notícias de alta autoridade não sejam rastreados. Isso, por sua vez, pode gerar um desafio ainda maior com notícias falsas, incluindo uma circulação mais ampla de informações imprecisas e/ou tendenciosas disfarçadas de fatos.
Como tal, Smullen pediu que os editores fossem compensados pelo papel crítico que desempenham – e Cameron Conaway, ex-jornalista investigativo que lidera uma equipe de marketing de crescimento na gigante de tecnologia Cisco e ensina marketing digital na Universidade de San Francisco, concordou.
"Isso poderia aprofundar a decadência da verdade e a desconfiança da sociedade em relação a novas fontes legítimas?" ele perguntou. "Que impacto isso pode ter na democracia se a maioria das informações não tiver fontes, e quem (ou o quê) manterá o poder?"
'Implicações desastrosas'
Existe até preocupação com a OpenAI eventualmente automatizando completamente a produção de notícias. Ainda assim, Barry Adams, consultor especializado em SEO da empresa de SEO Polemic Digital, observou que os sistemas generativos de IA não podem prever as notícias, então ele não prevê nenhum problema imediato.
“A IA não substituirá o jornalismo quando se trata de relatar as notícias, investigar histórias e responsabilizar o poder”, acrescentou.
Então, novamente, a IA poderia reformular as notícias locais sem citação, pois cuspiu suas próprias versões. Isso, por sua vez, desviaria o tráfego e a receita relacionada dos sites de notícias, o que é particularmente prejudicial aos sites de notícias locais que dependem especialmente do tráfego de anúncios gráficos, disse Conaway.
E a reformulação tem o potencial de alterar o significado original do relatório.
“A combinação de redações locais desconexas e financeiramente vulneráveis, evitação e desconfiança da mídia em geral e a ascensão da IA como fonte primária podem ter implicações desastrosas”, acrescentou.
Mas nem tudo – espere – más notícias.
"O lado positivo para as organizações de notícias é que as pessoas sempre consumirão notícias. É apenas o meio que muda", disse Poulton. "Se o ChatGPT pode resumir cinco histórias sobre o mesmo tópico de cinco veículos diferentes em cinco segundos, não é um bom produto? Talvez o ChatGPT possa ser usado em sites de notícias para ajudar os usuários a encontrar rapidamente as informações que desejam."
'Uma relação parasitária'
Primeiro, porém, as partes devem abordar a questão do tráfego e das receitas.
Adams disse que a falta de atribuição com as primeiras iterações do Bing ChatGPT e do Modelo de linguagem para aplicativos de diálogo do Google, ou LaMDA, o preocupa mais aqui.
"Isso mina um contrato fundamental da web, onde mecanismos de busca e sites de conteúdo existem em um estado simbiótico", disse ele. “A IA generativa transforma essa simbiose em um relacionamento parasitário, em que os mecanismos de pesquisa pegam tudo dos criadores de conteúdo (ou seja, o conteúdo necessário para treinar [modelos de linguagem grande (LLMs)]) e não dão nada em troca”.
O YouTube, de propriedade do Google, no entanto, já usa um modelo mais simbiótico, no qual os criadores de conteúdo compartilham a receita gerada pela plataforma.
"Não há razão para que um modelo semelhante não possa ser adotado para os mecanismos de busca e a web, exceto que tornaria o Google menos uma máquina de imprimir dinheiro e perderia algum valor para os acionistas", acrescentou Adams.
Smullen concordou que a solução é pagar aos editores pelos dados de treinamento.
“Semelhante ao Google, ele abusará de seu domínio até que os governos intensifiquem e questionem a legalidade de seu modelo de negócios do ponto de vista dos direitos autorais”, disse Smullen. “É justo que os editores sejam compensados por seu papel em tornar possível a próxima geração de IA”.
Adams concordou que é improvável que o Google reduza voluntariamente seus próprios lucros.
“Eles não vão se importar que usaram o conhecimento combinado da humanidade compartilhado na web para construir esses sistemas generativos de IA e agora estão descartando esses criadores sem atribuição”, acrescentou. "Se eles puderem se safar, eles o farão."
'Mantenha-se vigilante'
Algumas organizações de notícias já responderam com acordos de licenciamento mais rígidos, coleta de dados reforçada e regras de uso e uso de software de proteção de direitos autorais, de acordo com Julian Scott, estrategista de conteúdo da ferramenta de automação e gerenciamento de mídia social Socialbu.
"No entanto, essas medidas podem não ser suficientes para proteger totalmente seu conteúdo de ser usado sem atribuição", acrescentou.
Os SEOs da indústria de mídia estão pedindo melhores ferramentas dentro do modelo da OpenAI, o que garantiria o crédito adequado, observou Daniel Chabert, CEO e fundador da agência de desenvolvimento de software e web PurpleFire.
“Eles esperam que a OpenAI aumente sua transparência em relação ao uso de dados de notícias e seja mais proativa em alertar autores e editores quando seu conteúdo estiver sendo usado”, acrescentou.
Enquanto isso, as organizações de notícias deveriam investir em melhores sistemas de monitoramento para detectar erros ou vieses nos dados gerados pelos modelos da OpenAI.
“As organizações de notícias devem permanecer vigilantes sobre o uso de dados de notícias pela OpenAI e tomar as medidas necessárias para proteger seu conteúdo e garantir precisão e qualidade”, acrescentou Chabert.
'Um destino de primeira paragem'
Há também uma tática de marketing online testada e comprovada, que é particularmente relevante aqui.
Adams observou que os sites precisam começar a pensar em um "futuro pós-Google" e construir marcas fortes que liguem seu público diretamente a eles.
"Alguns editores são bem-sucedidos nisso e construíram marcas quase imunes aos caprichos dos mecanismos de busca", acrescentou. "O objetivo é se tornar um destino de primeira parada para o seu público, com os leitores visitando diretamente o seu site sem a intermediação do Google ou do Facebook."
À medida que diminui o ímpeto de clicar nas fontes originais, Matt Greenwood, gerente de SEO da agência de pesquisa Reflect Digital, concorda que os sites devem "procurar fornecer informações e experiências que sejam mais valiosas do que podem ser condensadas em algumas linhas de texto gerado automaticamente , para dar aos consumidores um motivo para ainda visitar nossos sites e ler nosso conteúdo original."
As opiniões expressas neste artigo são do autor convidado e não necessariamente do Search Engine Land. Os autores da equipe estão listados aqui.