Cómo escalar el uso de grandes modelos de lenguaje en marketing

Publicado: 2023-05-18

La IA generativa y los grandes modelos de lenguaje están configurados para cambiar la industria del marketing tal como la conocemos.

Para mantenerse competitivo, deberá comprender la tecnología y cómo afectará nuestros esfuerzos de marketing, dijo Christopher Penn, científico jefe de datos en TrustInsights.ai, quien habló en la Conferencia MarTech.

Aprenda formas de escalar el uso de modelos de lenguaje grandes, el valor de la ingeniería rápida y cómo los especialistas en marketing pueden prepararse para lo que se avecina.

La premisa detrás de los grandes modelos de lenguaje

Desde su lanzamiento, ChatGPT ha sido un tema de moda en la mayoría de las industrias. No puedes conectarte a Internet sin ver la opinión de todos. Sin embargo, no mucha gente entiende la tecnología detrás de esto, dijo Penn.

ChatGPT es un chatbot de IA basado en los modelos de lenguaje grande (LLM) GPT-3.5 y GPT-4 de OpenAI.

Los LLM se basan en una premisa de 1957 del lingüista inglés John Rupert Firth:

"Conocerás una palabra por la compañía que mantiene".

Esto significa que el significado de una palabra se puede entender en función de las palabras que normalmente aparecen junto a ella. En pocas palabras, las palabras se definen no solo por su definición de diccionario, sino también por el contexto en el que se usan.

Esta premisa es clave para comprender el procesamiento del lenguaje natural.

Por ejemplo, mira las siguientes oraciones:

"Estoy preparando el té".
"Estoy derramando el té".

El primero se refiere a una bebida caliente, mientras que el segundo es una jerga para chismear. “Té” en estos casos tiene significados muy diferentes.

El orden de las palabras también importa.

"Estoy preparando el té".
"El té que estoy preparando".

Las oraciones anteriores tienen diferentes sujetos de enfoque, aunque usan el mismo verbo, "preparar".

Cómo funcionan los modelos de lenguaje grande

A continuación se muestra un diagrama de sistema de transformadores, el modelo de arquitectura en el que se construyen grandes modelos de lenguaje.

The Transformer - Modelo de arquitectura — *Dos características importantes aquí son **las incrustaciones** y **la codificación posicional** .* *(Fuente: La atención es todo lo que necesita, Vaswani et al, 2017)*

En pocas palabras, un transformador toma una entrada y la convierte (es decir, la “transforma”) en otra cosa.

Los LLM se pueden usar para crear, pero son mejores para convertir una cosa en otra.

OpenAI y otras compañías de software comienzan con la ingesta de un enorme corpus de datos, incluidos millones de documentos, trabajos académicos, artículos de noticias, reseñas de productos, comentarios en foros y mucho más.

Reseñas de productos de té y comentarios en foros.

Considere la frecuencia con la que puede aparecer la frase "Estoy preparando el té" en todos estos textos ingeridos.

Las revisiones de productos de Amazon y los comentarios de Reddit anteriores son algunos ejemplos.

Fíjate en "la compañía" que guarda esta frase, es decir, todas las palabras que aparecen cerca de "Estoy preparando el té".

"Sabor", "olor", "café", "aroma" y más, todos prestan contexto a estos LLM.

Las máquinas no pueden leer. Entonces, para procesar todo este texto, usan incrustaciones, el primer paso en la arquitectura del transformador.

La incrustación permite que los modelos asignen a cada palabra un valor numérico, y ese valor numérico aparece repetidamente en el corpus de texto.

La posición de la palabra también es importante para estos modelos.

En el ejemplo anterior, los valores numéricos siguen siendo los mismos pero están en una secuencia diferente. Esta es la codificación posicional.

En términos simples, los modelos de lenguaje grande funcionan así:

Las máquinas toman datos de texto.
Asigne valores numéricos a todas las palabras.
Mira las frecuencias estadísticas y las distribuciones entre las diferentes palabras.
Trate de averiguar cuál será la siguiente palabra en la secuencia.

Todo esto requiere un poder de cómputo, tiempo y recursos significativos.

Obtenga el boletín informativo diario en el que confían los especialistas en marketing.

Ver términos.

Ingeniería rápida: una habilidad imprescindible

Cuanto más contexto e instrucciones proporcionemos a los LLM, es más probable que arrojen mejores resultados. Este es el valor de la ingeniería rápida.

Penn piensa en las indicaciones como barandillas para lo que producirán las máquinas. Las máquinas captarán las palabras en nuestra entrada y se aferrarán a ellas para obtener contexto a medida que desarrollan la salida.

Por ejemplo, al escribir avisos de ChatGPT, notará que las instrucciones detalladas tienden a generar respuestas más satisfactorias.

De alguna manera, las indicaciones son como resúmenes creativos para los escritores. Si desea que su proyecto se realice correctamente, no le dará a su escritor una instrucción de una línea.

En su lugar, enviará un resumen de tamaño decente que cubra todo lo que quiere que escriban y cómo quiere que lo escriban.

Escalar el uso de LLM

Cuando piensa en chatbots de IA, puede pensar inmediatamente en una interfaz web donde los usuarios pueden ingresar indicaciones y luego esperar la respuesta de la herramienta. Esto es lo que todo el mundo está acostumbrado a ver.

“Este no es el juego final para estas herramientas de ninguna manera. Este es el patio de recreo. Aquí es donde los humanos pueden jugar con la herramienta”, dijo Penn. “Así no es como las empresas van a llevar esto al mercado”.

Piense en la escritura rápida como programación. Eres un desarrollador que escribe instrucciones a una computadora para que haga algo.

Una vez que haya ajustado sus mensajes para casos de uso específicos, puede aprovechar las API y hacer que los desarrolladores reales envuelvan esos mensajes en código adicional para que pueda enviar y recibir datos a escala mediante programación.

Así es como los LLM escalarán y cambiarán los negocios para mejor.

Debido a que estas herramientas se implementan en todas partes, es fundamental recordar que todos son desarrolladores.

Esta tecnología estará en Microsoft Office (Word, Excel y PowerPoint) y muchas otras herramientas y servicios que usamos a diario.

“Debido a que está programando en lenguaje natural, no son necesariamente los programadores tradicionales los que tendrán las mejores ideas”, agregó Penn.

Dado que los LLM son impulsados por profesionales de la escritura, el marketing o las relaciones públicas, no los programadores, pueden desarrollar formas innovadoras de usar las herramientas.

Cómo afectarán los LLM al marketing de búsqueda y qué puede hacer al respecto

Estamos empezando a ver el impacto de los grandes modelos de lenguaje en el marketing, específicamente en la búsqueda.

En febrero, Microsoft presentó el nuevo Bing, impulsado por ChatGPT. Los usuarios pueden conversar con el motor de búsqueda y obtener respuestas directas a sus consultas sin hacer clic en ningún enlace.

“Debe esperar que estas herramientas aprovechen su búsqueda sin marca porque están respondiendo preguntas de maneras que no necesitan clics”, dijo Penn.

"Ya nos hemos enfrentado a esto como profesionales de SEO, con fragmentos destacados y resultados de búsqueda sin clic... pero va a empeorar para nosotros".

Recomienda ir a Bing Webmaster Tools o Google Search Console y observar el porcentaje de tráfico que obtiene su sitio de búsquedas informativas sin marca, ya que es el área de mayor riesgo para el SEO.

Construye tu marca

“Si la creación de marca no es una de sus principales prioridades estratégicas para 2023 y más allá, debe serlo”, enfatizó Penn.

Necesita construir su marca y hacer que la gente pregunte por usted por su nombre en la búsqueda.

Cuando los usuarios solicitan ideas o recomendaciones sobre un tema, es probable que los LLM los dirijan a información sintetizada, no a usted.

Pero si las personas solicitan específicamente su marca por su nombre, igual llegarán a donde quieren ir.

Haga que la presencia en línea de su marca sea lo más fuerte posible.

Usa una plataforma de publicación 'inmune' a la IA

Penn también destacó la importancia de usar una plataforma en la que tenga acceso directo y sin intermediarios a su audiencia.

Los canales como el correo electrónico o los SMS (incluso el correo directo) le permiten llegar a los clientes directamente y asegurarse de llegar a ellos sin la mediación de la IA.

La búsqueda orgánica y las redes sociales ya están fuertemente mediadas por IA. Por lo tanto, la probabilidad de llegar de manera confiable incluso a una fracción de su audiencia es escasa.

Incluso las marcas más grandes solo pueden obtener suficientes vistas si gastan en campañas pagas.

Centrarse en la comunidad

Servicios como Slack, Telegram y Discord le permiten reunirse con personas de ideas afines y desarrollar conexiones significativas.

Cuando brinda valor a sus usuarios, puede llegar a ellos de manera confiable, ganar su lealtad y generar valor de marca.

Ver: La singularidad del marketing: Modelos de lenguaje extenso y el fin del marketing tal como lo conocías

Penn compartió más información sobre el impacto de los LLM en los trabajos de marketing en The MarTech Conference. Mira su presentación completa aquí:

Agregue Search Engine Land a su fuente de noticias de Google.