Noticias SEO e IA generativa: dentro de una 'relación parasitaria'

Publicado: 2023-03-21

A medida que circulan informes de que el laboratorio de investigación de IA OpenAI utiliza noticias de medios de comunicación como el Wall Street Journal y CNN para entrenar su chatbot ChatGPT, surge un desafío aún mayor: ¿Cómo los medios de comunicación retienen el tráfico, los ingresos y la relevancia en la era de la IA generativa?

Las noticias generadas por IA han inspirado temor entre los periodistas durante mucho tiempo. En 2016, por ejemplo, la Asociación de la Prensa del Reino Unido señaló su intención de utilizar IA para algunas historias deportivas y electorales.

Hemos visto ejemplos más recientes en los EE. UU., como este resumen de la NHL de Associated Press compilado con tecnología de la firma de automatización de contenido deportivo Data Skrive.

El CEO de la empresa de medios Axel Springer, propietaria de títulos como Business Insider y Politico, dijo recientemente que la IA tiene el potencial de reemplazar a los periodistas por completo. “Solo sobrevivirán aquellos que creen el mejor contenido original”, escribió Springer en una carta a los empleados.

'Problemas de derechos de autor desconocidos'

El tema de los derechos de autor, y los posibles problemas legales, ya han surgido en Francia y España.

“Si OpenAI va a mejorar su modelo con contenido actualizado sin enviar ningún tráfico [a la fuente original,] provocará un debate [sobre] quién posee los derechos del contenido”, dijo Marcus Tober, vicepresidente senior. presidente de soluciones empresariales en la plataforma de marketing Semrush.

OpenAI ya ha visto algunas demandas por derechos de autor, y Dan Smullen, jefe de SEO en la plataforma de apuestas deportivas Betsperts Media and Technology Group, dijo que podríamos esperar más en breve.

“De hecho, a pesar de escuchar que algunos editores han comenzado a adoptar contenido asistido por IA en la sala de redacción, los equipos editoriales con los que he hablado se sienten incómodos al usar los resultados de OpenAI debido a problemas de derechos de autor desconocidos”, agregó Smullen.

OpenAI ha tomado medidas para abordar estas preocupaciones, como permitir que los editores opten por que no se utilice su contenido, señaló. El laboratorio de investigación de IA también acordó proporcionar atribución cuando sus algoritmos extraen información de sitios de noticias.

“Aún así, a los SEO en la industria de los medios les preocupa que este sistema no proteja adecuadamente contra los derechos de autor y los problemas de propiedad intelectual”, agregó Smullen. “Como tal, las organizaciones de noticias deben continuar monitoreando el uso de datos de noticias por parte de OpenAI y asegurarse de que su contenido se use de manera responsable”.

Una solución fácil sería agregar notas al pie que vinculen a las fuentes, similar a lo que hace ChatGPT en Bing.

“Esperamos algo similar con [el servicio de inteligencia artificial conversacional de Google] Bard”, agregó Smullen.

Obtenga el boletín informativo diario en el que confían los especialistas en marketing.

Ver términos.

'Decadencia de la verdad'

En última instancia, el impulso de la IA hacia las noticias amenaza con volcar nuevamente el consumo de medios.

Según Ben Poulton, consultor de SEO y fundador de la agencia de SEO Intellar, las empresas de IA que utilizan datos extraídos "amenazan el control curado que las organizaciones de noticias han tenido durante décadas".

El resultado podría ser mayor degradación de la integridad periodística.

Smullen señaló que la falta de compensación de los editores por los datos de capacitación podría conducir a un futuro en el que los editores bloqueen OpenAI y sus contrapartes, por lo que los sitios de noticias de alta autoridad no se rastrean. Eso, a su vez, podría generar un desafío aún mayor con las noticias falsas, incluida una circulación más amplia de información inexacta y/o sesgada que se hace pasar por un hecho.

Como tal, Smullen pidió que se compense a los editores por el papel fundamental que desempeñan, y Cameron Conaway, un experiodista de investigación que dirige un equipo de marketing de crecimiento en el gigante tecnológico Cisco y enseña marketing digital en la Universidad de San Francisco, estuvo de acuerdo.

"¿Podría esto profundizar la decadencia de la verdad y la desconfianza de la sociedad hacia las nuevas fuentes legítimas?" preguntó. "¿Qué impacto podría tener en la democracia si la mayor parte de la información no tiene fuentes y quién (o qué) tendrá el poder?"

'Implicaciones desastrosas'

Incluso existe la preocupación de que OpenAI eventualmente automatice la producción de noticias por completo. Aún así, Barry Adams, un consultor especializado en SEO de la firma de SEO Polemic Digital, señaló que los sistemas generativos de IA no pueden predecir las noticias, por lo que no prevé ningún problema inmediato.

“La IA no reemplazará al periodismo cuando se trata de reportar noticias, investigar historias y hacer que el poder rinda cuentas”, agregó.

Por otra parte, AI podría reformular las noticias locales sin citarlas, ya que escupe sus propias versiones. Esto, a su vez, desviaría el tráfico y los ingresos relacionados de los sitios de noticias, lo que es particularmente dañino para los sitios de noticias locales que dependen especialmente del tráfico de anuncios gráficos, dijo Conaway.

Y la reformulación tiene el potencial de cambiar el significado original del informe.

"La combinación de salas de redacción locales inestables y financieramente vulnerables, la evasión y desconfianza general de los medios y el surgimiento de la IA como fuente principal podría tener implicaciones desastrosas", agregó.

Pero no es todo, espéralo, malas noticias.

"En el lado positivo para las organizaciones de noticias, la gente siempre consumirá noticias. Es solo el medio el que cambia", dijo Poulton. "Si ChatGPT puede resumir cinco historias sobre el mismo tema de cinco medios diferentes en cinco segundos, ¿no es un buen producto? Tal vez ChatGPT podría usarse en sitios de noticias para ayudar a los usuarios a desglosar y encontrar la información que buscan rápidamente".

'Una relación parasitaria'

Primero, sin embargo, las partes deben abordar la cuestión del tráfico y los ingresos.

Adams dijo que la falta de atribución con las primeras iteraciones de Bing ChatGPT y el Modelo de lenguaje para aplicaciones de diálogo de Google, o LaMDA, es lo que más le preocupa aquí.

"Esto socava un contrato fundamental de la web, donde los motores de búsqueda y los sitios web de contenido existen en un estado simbiótico", dijo. "La IA generativa convierte esta simbiosis en una relación parasitaria, donde los motores de búsqueda toman todo de los creadores de contenido (es decir, el contenido necesario para entrenar [modelos de lenguaje grande (LLM)]) y no devuelven nada a cambio".

Sin embargo, YouTube, propiedad de Google, ya utiliza un modelo más simbiótico en el que los creadores de contenido comparten los ingresos generados por la plataforma.

"No hay ninguna razón por la que no se pueda adoptar un modelo similar para los motores de búsqueda y la web, excepto que haría que Google fuera menos una máquina de imprimir dinero y perdería algo de valor para los accionistas", agregó Adams.

Smullen estuvo de acuerdo en que la solución es pagar a los editores por los datos de capacitación.

"Al igual que Google, abusará de su dominio hasta que los gobiernos den un paso adelante y cuestionen la legalidad de su modelo comercial desde el punto de vista de los derechos de autor", dijo Smullen. "Es justo que los editores sean compensados por su papel en hacer posible la próxima generación de IA".

Adams estuvo de acuerdo en que es poco probable que Google reduzca voluntariamente sus propias ganancias.

"No les importará que usaron el conocimiento combinado de la humanidad compartido en la web para construir estos sistemas generativos de inteligencia artificial y ahora están descartando a estos creadores sin atribución", agregó. "Si pueden salirse con la suya, lo harán".

'No bajar la guardia'

Algunas organizaciones de noticias ya han respondido con acuerdos de licencia más estrictos, reglas de uso y recopilación de datos fortalecidas y el uso de software de protección de derechos de autor, según Julian Scott, estratega de contenido en la herramienta de automatización y administración de redes sociales Socialbu.

"Sin embargo, estas medidas pueden no ser suficientes para proteger completamente su contenido de ser utilizado sin atribución", agregó.

Los SEO de la industria de los medios piden mejores herramientas dentro del modelo de OpenAI, lo que garantizaría el crédito adecuado, señaló Daniel Chabert, director ejecutivo y fundador de la agencia de desarrollo de software y web PurpleFire.

"Esperan que OpenAI aumente su transparencia con respecto al uso de datos de noticias y sea más proactivo en alertar a los autores y editores cuando se usa su contenido", agregó.

Mientras tanto, las organizaciones de noticias deberían invertir en mejores sistemas de monitoreo para detectar errores o sesgos en los datos generados por los modelos de OpenAI.

"Las organizaciones de noticias deben permanecer atentas al uso de datos de noticias por parte de OpenAI y tomar las medidas necesarias para proteger su contenido y garantizar la precisión y la calidad", agregó Chabert.

'Un destino de primera parada'

También hay una táctica de marketing en línea probada y verdadera, que es particularmente relevante aquí.

Adams señaló que los sitios web deben comenzar a pensar en un "futuro posterior a Google" y crear marcas sólidas que vinculen a sus audiencias directamente con ellos.

"Algunos editores tienen bastante éxito en esto y han creado marcas que son casi inmunes a los caprichos de los motores de búsqueda", agregó. "El objetivo es convertirse en un destino de primera parada para su audiencia, con lectores que visiten directamente su sitio web sin la intermediación de Google o Facebook".

A medida que disminuye el ímpetu por hacer clic en las fuentes originales, Matt Greenwood, gerente de SEO de la agencia de búsqueda Reflect Digital, estuvo de acuerdo en que los sitios web deberían "buscar brindar información y experiencias que sean más valiosas que las que se pueden condensar en unas pocas líneas de texto generado automáticamente". , para dar a los consumidores una razón para seguir visitando nuestros sitios y leer nuestro contenido original".

Las opiniones expresadas en este artículo pertenecen al autor invitado y no necesariamente a Search Engine Land. Los autores del personal se enumeran aquí.

Agregue Search Engine Land a su fuente de noticias de Google.