Cómo ChatGPT puede ayudarlo a optimizar su contenido para las entidades
Publicado: 2023-08-07Cuando se utiliza estratégicamente, ChatGPT puede superar el esfuerzo humano manual en calidad de salida.
No, las herramientas no escribirán mejor contenido.
En cambio, creo que un escritor armado con esta tecnología puede crear contenido optimizado que esté mejor alineado con los criterios de clasificación de Google.
Al explorar varios métodos de puntuación de contenido y extracción de entidades, mi objetivo es guiarlo para maximizar los beneficios de las herramientas.
"Más allá de las palabras clave: cómo las entidades impactan en las estrategias modernas de SEO" discutió cómo y por qué incluir entidades relevantes en su sitio web (es decir, mapa temático).
Este artículo se centrará en por qué y cómo usar entidades para crear contenido SEO de mejor clasificación.
¿Cómo se relacionan el SEO de entidad y OpenAI?
Antes de analizar cómo el software optimiza el uso de entidades para los resultados de búsqueda, comprendamos las similitudes entre el SEO de entidades y el ChatGPT de OpenAI.
Bloques de construcción del lenguaje
En su nivel más básico, el lenguaje se construye alrededor de:
- Sujetos: De qué (o de quién) trata la oración.
- Predicados: Dice algo sobre el sujeto.
Por ejemplo, en la oración "El gato se sentó en el tapete", "El gato" es el sujeto y "se sentó en el tapete" es el predicado.
Tanto el motor de búsqueda de Google como el ChatGPT de OpenAI están diseñados para comprender la estructura fundamental del lenguaje.
Los motores de búsqueda semánticos se enfocan en comprender el contenido de una manera computacionalmente eficiente.
ChatGPT va un paso más allá y utiliza muchos más cálculos para generar contenido.
Motores de búsqueda semánticos
El motor de búsqueda de Google identifica entidades, que son esencialmente los sujetos de las oraciones en una página web.
Luego usa el contexto alrededor de esas entidades para comprender los predicados, o lo que se dice sobre esas entidades.
Esto le permite a Google comprender el contenido de la página y cómo podría ser relevante para la consulta de búsqueda de un usuario.
Las relaciones bajo consideración se representan en el gráfico de conocimiento de Google.
Cuando Google analiza un artículo, utiliza su Knowledge Graph para obtener información más detallada.
Identifica entidades y predicados relevantes en el contenido, lo que le permite discernir qué palabra clave busca la pieza más pertinente.
ChatGPT de OpenAI
Por otro lado, ChatGPT usa su modelo transformador e incrustaciones para comprender tanto los sujetos como los predicados.
Específicamente, el mecanismo de atención del modelo le permite comprender las relaciones entre diferentes palabras en una oración, entendiendo efectivamente el predicado.
Mientras tanto, las incrustaciones ayudan al modelo a comprender las relaciones y los significados de las palabras mismas, lo que incluye la comprensión de los sujetos.
A pesar de sus grandes diferencias, ChatGPT y el SEO de entidades comparten una capacidad común:
Reconocer entidades y predicados relevantes para un tema. Esta similitud subraya cuán vitales son las entidades para nuestra comprensión del lenguaje.
A pesar de las complejidades, los profesionales de SEO deben centrar sus esfuerzos en las entidades, los sujetos y sus predicados.
Entonces, ¿cómo usamos esta nueva comprensión para optimizar nuestro contenido?
Optimización de contenido nuevo para entidades
Google identifica entidades y sus predicados en una página web. También los compara en páginas potencialmente relevantes.
En esencia, es como un emparejador, tratando de encontrar la mejor coincidencia entre la consulta de búsqueda de un usuario y el contenido disponible en la web.
Dado que el algoritmo de Google está optimizado para obtener resultados de alta calidad, comience su proceso de optimización examinando los 10 mejores resultados de Google.
Esto le dará información sobre los atributos que Google favorece para un término de búsqueda determinado.
En nuestra agencia, aplicamos un marco para identificar mejoras potenciales que pueden mejorar nuestros artículos entre un 10 y un 20 %, que compartiré a continuación.
Un marco que prioriza los aspectos correctos puede ilustrar la diferencia entre su contenido y el material de mayor rango.
Al crear contenido, seguimos este marco y cumplimos con estos elementos prioritarios.
Nos preparamos para el éxito inmediato si cumplimos con todos estos criterios.
Sumergirse en la parte de la entidad de la lista de verificación
Piensa en esto, de esta manera:
Imagine que Google realiza un seguimiento de la frecuencia con la que ciertas entidades y sus predicados aparecen juntos.
Se ha descubierto qué combinaciones son las más importantes para los usuarios que buscan temas específicos.
Como experto en SEO, su objetivo debe ser incluir estas entidades clave en su contenido, que puede identificar mediante ingeniería inversa de los principales resultados que Google le muestra que ya le gustan.
Si su página web incluye las entidades y los predicados que Google espera para una búsqueda de usuario determinada, su contenido obtendrá una puntuación más alta.
Nos referiremos a la excepción de las nuevas relaciones de entidad en una discusión futura.
Aquí es donde entran en juego las herramientas que utilizan estratégicamente las técnicas ChatGPT y NLP para ayudar a analizar los 10 mejores resultados.
Intentar esto manualmente puede llevar mucho tiempo y ser difícil debido a la escala de datos que tendría que consumir.
Paso 1: Extracción de entidades
Para hacer este análisis, deberá imitar la entidad nativa de Google y los procesos de extracción de predicados y luego convertir sus hallazgos en un plan de acción/guía del escritor viable.
En la jerga técnica, este ejercicio se conoce como reconocimiento de entidades nombradas, y varias bibliotecas de NLP tienen sus propios enfoques únicos.
Afortunadamente, hay muchas herramientas de redacción de contenido disponibles en el mercado que automatizan estos pasos.
Sin embargo, antes de seguir ciegamente las recomendaciones de una herramienta de SEO, es útil comprender qué hará bien y qué no.
Reconocimiento de entidad nombrada (NER)
Piense en NER como un proceso de dos pasos: detección y categorización.
Punteo
- El primer paso es como un juego de “Veo, veo”. El algoritmo lee el texto palabra por palabra, buscando palabras o frases que puedan ser entidades. Es como alguien que lee un libro y resalta los nombres de personas, lugares o fechas.
categorizar
- Una vez que el algoritmo ha detectado entidades potenciales, el siguiente paso es averiguar qué tipo de entidad es cada una. Esto es como clasificar las palabras resaltadas en diferentes cubos: uno para Personas , uno para Ubicaciones , uno para Fechas , etc.
Consideremos un ejemplo. Si tenemos la frase: “Elon Musk nació en Pretoria en 1971”.
En el paso de detección, el algoritmo podría identificar a "Elon Musk", "Pretoria" y "1971" como entidades potenciales.
En el paso de categorización, clasificaría a "Elon Musk" como Persona , "Pretoria" como Ubicación y "1971" como Fecha .
El algoritmo utiliza una combinación de reglas y modelos de aprendizaje automático entrenados en grandes cantidades de texto.
Estos modelos han aprendido de los ejemplos cómo se ven los diferentes tipos de entidades, por lo que pueden hacer conjeturas informadas cuando encuentran texto nuevo.
Extracción de relación (RE)
Después de que NER identifica las entidades en un texto, el siguiente paso es comprender las relaciones entre estas entidades.
Esto se hace a través de un proceso llamado extracción de relaciones (RE). Estas relaciones actúan esencialmente como los predicados que conectan las entidades.
En el contexto de la PNL, estas conexiones a menudo se representan como triples, que son conjuntos de tres elementos:
- Un sujeto.
- un predicado
- Un objeto.
El sujeto y el objeto suelen ser las entidades identificadas a través de NER, y el predicado es la relación entre ellos, identificada a través de RE.
El concepto de usar triples para descifrar y comprender las relaciones es maravillosamente simplista. Podemos captar las ideas centrales presentadas con un mínimo de computación, tiempo o memoria.
Es un testimonio de la naturaleza del lenguaje que obtenemos una buena idea de lo que se dice concentrándonos solo en las entidades y sus predicados.
Elimine todas las palabras adicionales y lo que queda son los componentes clave: una instantánea, por así decirlo, de las relaciones que el autor está tejiendo.
Extraer relaciones y representarlas como triples es un paso crucial en la PNL.
Permite que las computadoras comprendan la narrativa del texto y el contexto en torno a las entidades identificadas, lo que permite una comprensión más matizada y la generación de lenguaje humano.
Recuerde que Google sigue siendo una máquina y su comprensión del lenguaje es diferente a la comprensión humana.
Además, Google no tiene que escribir contenido, sino que debe equilibrar las demandas informáticas. En cambio, puede extraer la cantidad mínima de información que logra el objetivo de vincular el contenido a la consulta de búsqueda.
Paso 2: Creación de una guía del escritor
Debemos imitar el proceso de extracción de entidades de Google y sus relaciones para generar un análisis y una hoja de ruta útiles.
Debemos comprender y emplear estas dos ideas clave en los 10 primeros resultados de búsqueda. Afortunadamente, hay varias formas de abordar la construcción de la hoja de ruta.
- Podemos confiar en la extracción de entidades
- Podemos extraer frases de palabras clave.
La ruta de la entidad
Una ruta que se puede probar es una metodología similar a herramientas como InLinks.
Estas plataformas emplean la extracción de entidades en los 10 mejores resultados, probablemente utilizando la API NER de Google Cloud.
A continuación, determinan las frecuencias mínima y máxima de las entidades extraídas dentro del contenido.
Según su uso de estas entidades, califican su contenido.
Para determinar el uso exitoso de entidades dentro de su material, estas plataformas a menudo diseñan sus propios algoritmos de reconocimiento de entidades.
Pros y contras
Este método es efectivo y puede ayudarlo a crear contenido más autorizado. Sin embargo, pasa por alto un aspecto clave: la extracción de relaciones.
Si bien podemos hacer coincidir el uso de entidades con los artículos de mayor rango, es un desafío verificar si nuestro contenido incluye todos los predicados o relaciones relevantes entre estas entidades. (Nota: Google Cloud no comparte públicamente su API de extracción de relaciones).
Otro peligro potencial de esta estrategia es que promueve la inclusión de todas las entidades que se encuentran en los 10 artículos principales.
Idealmente, querrías abarcar todo, pero la realidad es que algunas entidades tienen más peso que otras.
Para complicar aún más las cosas, los resultados de búsqueda a menudo contienen intenciones mixtas, lo que significa que algunas entidades solo son pertinentes para artículos que satisfacen intenciones de búsqueda específicas.
Por ejemplo, la composición de la entidad de una página de listado de productos diferirá significativamente de una publicación de blog.
También puede ser un desafío para un escritor convertir entidades de una sola palabra en temas relevantes para su contenido. Activar y desactivar ciertos competidores puede ayudar a solucionar estos problemas.
No me malinterpreten, soy fanático de estas herramientas y las uso como parte de mi análisis.
Cada enfoque que compartiré aquí tiene sus propias ventajas y desventajas, las cuales pueden mejorar su contenido hasta cierto punto.
Sin embargo, mi objetivo es presentar las diversas formas en que puede usar la tecnología y ChatGPT para optimizar entidades.
La ruta de la frase clave
Otra estrategia que hemos adoptado en nuestras herramientas consiste en extraer las frases de palabras clave más cruciales de los 10 principales competidores.
La belleza de las frases de palabras clave radica en su transparencia, lo que facilita que el usuario final comprenda lo que representan.
Además, normalmente capturan el sujeto y el predicado de temas clave en lugar de solo los sujetos o entidades.
Sin embargo, una desventaja es que los usuarios a menudo luchan por incorporar sin problemas estas palabras clave en su contenido.
En cambio, tienden a calzar las palabras clave, perdiendo la esencia de lo que representa la frase de palabras clave.
Desafortunadamente, desde el punto de vista de un desarrollador, es difícil medir y calificar a un escritor en función de su capacidad para capturar la esencia de una frase clave.
Por lo tanto, los desarrolladores deben puntuar en función del uso exacto de una frase de palabra clave, lo que desalienta el verdadero comportamiento previsto.
Otra ventaja significativa del enfoque de frase de palabras clave es que las palabras clave a menudo sirven como señales para herramientas de IA como ChatGPT, lo que garantiza que el modelo de texto generativo capture las entidades clave y sus predicados (es decir, triples).
Por último, considere la diferencia entre recibir una larga lista de sustantivos y una lista de frases de palabras clave.
Puede resultarle desconcertante tejer una narrativa coherente a partir de una lista desconectada de sustantivos como escritor.
Pero cuando se le presentan frases de palabras clave, es mucho más fácil discernir cómo podrían interconectarse naturalmente dentro de un párrafo, contribuyendo a una narrativa más coherente y significativa.
¿Cuáles son los diferentes enfoques para extraer frases de palabras clave?
Hemos establecido que las frases de palabras clave pueden guiar de manera efectiva los temas sobre los que debe escribir.
Aún así, es importante tener en cuenta que las diferentes herramientas en el mercado tienen diferentes enfoques para extraer estas frases cruciales.
La extracción de palabras clave es una tarea fundamental en la PNL que consiste en identificar palabras o frases importantes que puedan resumir el contenido de un texto.
Hay varios algoritmos populares de extracción de palabras clave, cada uno con sus propias fortalezas y debilidades al capturar las entidades en una página.
TF-IDF (Término frecuencia-frecuencia inversa del documento)
Aunque TF-IDF ha sido un punto de discusión popular entre los SEO, a menudo se malinterpreta y sus conocimientos no siempre se aplican correctamente.
Adherirse ciegamente a su puntuación puede, sorprendentemente, restar valor a la calidad del contenido.
TF-IDF pondera cada palabra en un documento en función de su frecuencia dentro del documento y su rareza en todos los documentos.
Si bien es un método simple y rápido, no considera el contexto de las palabras ni el significado semántico.
¿Qué valor puede proporcionar
Las palabras de puntuación alta representan términos que son frecuentes en páginas individuales e infrecuentes en toda la colección de páginas de clasificación superior.
Por un lado, estos términos pueden verse como marcadores de contenido único y distintivo.
Pueden revelar aspectos o subtemas específicos dentro de su tema de palabra clave objetivo que no están completamente cubiertos por los competidores, lo que le permite brindar un valor único.
Sin embargo, los términos de puntuación alta también pueden ser engañosos.
TF-IDF puede revelar una puntuación alta en términos de importancia única para artículos de clasificación específicos, pero no representa términos o temas generalmente importantes para la clasificación.
Un ejemplo básico de esto podría ser la marca de una empresa. Podría usarse repetidamente en un solo documento o artículo, pero nunca en otros artículos de clasificación.
Incluirlo en tu contenido no tendría ningún sentido.
Por otro lado, si encuentra términos con puntajes TF-IDF más bajos que aparecen consistentemente en páginas de alto rango, esto podría indicar un contenido de "línea de base" crucial que su página debería contener.
Es posible que no sean únicos, pero podrían ser necesarios para la relevancia de la palabra clave o el tema dado.
Nota: TF-IDF representa muchas estrategias, pero se pueden aplicar matemáticas adicionales en variaciones. Estos incluyen algoritmos como BM25 para introducir puntos de saturación o cálculos de rendimientos decrecientes.
Además, TF-IDF se puede mejorar enormemente, y a menudo lo es, mostrando retroactivamente para cada término el porcentaje de las 10 páginas principales que incluyen la palabra. Aquí, el algoritmo lo ayuda a identificar términos notables, pero luego lo ayuda a comprender mejor los términos de "línea de base" al mostrar hasta qué punto los 10 términos principales del ranking comparten los términos.
RAKE (extracción automática rápida de palabras clave)
RAKE considera todas las frases como palabras clave potenciales, lo que puede ser útil para capturar entidades de varias palabras.
Sin embargo, no tiene en cuenta el orden de las palabras, lo que puede dar lugar a frases sin sentido.
La aplicación del algoritmo RAKE a cada una de las 10 páginas principales por separado generará una lista de frases clave para cada página.
El siguiente paso es buscar la superposición: frases clave que aparecen en varias páginas de alto rango.
Estas frases comunes pueden indicar temas de particular importancia que los motores de búsqueda esperan ver en relación con su palabra clave objetivo.
Al integrar estas frases en su propio contenido (de una manera significativa y natural), podría aumentar potencialmente la relevancia de su página y, por lo tanto, su clasificación para la palabra clave objetivo.
Sin embargo, es importante tener en cuenta que no todas las frases compartidas son necesariamente beneficiosas. Algunos pueden ser comunes porque son genéricos o están ampliamente asociados con el tema.
El objetivo es encontrar esas frases compartidas que tengan un significado significativo y un contexto relacionado con su palabra clave específica.
Todas las técnicas de extracción de palabras clave se pueden mejorar al permitirle usar su cerebro para activar o desactivar competidores o palabras clave.
La capacidad de activar y desactivar competidores y palabras clave específicas ayudará a solucionar los problemas antes mencionados.
Competidores
Palabras clave
Este enfoque esencialmente proporciona una forma de combinar las fortalezas de RAKE (identificar frases clave dentro de documentos individuales) y una estrategia más similar a TF-IDF (considerar la importancia de los términos en una colección de documentos).
Al hacerlo, puede aprovechar una comprensión más holística del panorama de contenido para su palabra clave objetivo, lo que lo guiará para crear contenido único y relevante.
YAKE (otro extractor de palabras clave más)
Por último, YAKE considera la frecuencia de las palabras y su posición en el texto.
Esto puede ayudar a identificar entidades importantes que aparecen al principio o al final de un documento.
Sin embargo, puede pasar por alto entidades importantes que aparecen en el medio.
Cada algoritmo escanea el texto e identifica palabras clave potenciales en función de varios criterios (p. ej., frecuencia, posición, similitud semántica).
Luego asignan una puntuación a cada palabra clave potencial; las palabras clave con la puntuación más alta se seleccionan como finales.
Estos algoritmos pueden capturar entidades de manera efectiva, pero existen limitaciones.
Por ejemplo, pueden pasar por alto entidades raras o no aparecer como palabras clave en el texto. También pueden tener problemas con entidades con múltiples nombres o a las que se hace referencia de diferentes maneras.
En resumen, las palabras clave proporcionan un par de mejoras sobre el NER directo.
- Son más fáciles de entender para un escritor.
- Captan tanto los predicados como las entidades.
- Como veremos en la siguiente sección, funcionan como mejores guías para que la IA escriba contenido optimizado para entidades.
IA abierta
ChatGPT y OpenAI son realmente innovadores en SEO.
Para desbloquear todo su potencial, necesita un experto en SEO bien informado que lo guíe por el camino correcto y un mapa de entidades construido meticulosamente para guiarlo sobre temas relevantes sobre los que escribir.
Considere un escenario:
Es posible que se haya dado cuenta de que puede dirigirse a ChatGPT y pedirle que escriba un artículo sobre casi cualquier tema, y lo cumplirá fácilmente.
Sin embargo, la pregunta es, ¿se optimizará el artículo resultante para posicionar una palabra clave?
Debemos establecer una distinción clara entre el contenido general y el contenido optimizado para búsquedas.
Cuando la IA se deja a su suerte para escribir su contenido, tiende a generar un artículo que atrae a un lector habitual.
Sin embargo, el contenido optimizado para SEO baila con una melodía diferente.
Google tiende a favorecer el contenido que se puede escanear, incluye definiciones y el conocimiento previo necesario, y fundamentalmente ofrece muchos ganchos para que los lectores encuentren respuestas a sus consultas de búsqueda.
ChatGPT, que funciona con una arquitectura de transformador, tiende a producir contenido en función de la frecuencia y los patrones observados en los datos con los que se entrenó. Una pequeña fracción de estos datos consiste en artículos de Google de alto rango.
Por el contrario, a medida que pasa el tiempo, Google adapta sus resultados de búsqueda a su eficacia para un usuario, esencialmente la supervivencia de las piezas de contenido más aptas.
Las entidades que se encuentran en estos artículos perdurables son vitales para emular como contenido fundamental, que tiende a diferir significativamente de lo que ChatGPT produce desde el primer momento.
La conclusión clave es que existe una diferencia entre el contenido que es ganador desde el punto de vista de la legibilidad y el contenido que es ganador en un entorno de Google. En el mundo del contenido web, la utilidad triunfa sobre todo.
Como lo demostró Nielsen hace mucho tiempo, la capacidad de escaneado es suprema.
Los usuarios prefieren escanear el contenido web en lugar de leer de arriba a abajo. Este comportamiento suele seguir un patrón en forma de F. Escribir contenido que funcione bien en la búsqueda debe centrarse en ser fácilmente escaneable frente a estar escrito puramente para ser leído de arriba a abajo.
ChatGPT fuera de la caja
Observemos cómo funciona ChatGPT desde el primer momento, utilizando Noble e Inlinks para la puntuación.
Incluso con un aviso elaborado meticulosamente, sin el contexto de lo que funciona en la primera página de Google, ChatGPT a menudo no da en el blanco y produce contenido que probablemente no compita.
Le pedí a ChatGPT que escribiera un artículo sobre "¿Cuánto ganan las enfermeras itinerantes por hora?".
Cuando se combina con el análisis SEO
Sin embargo, ChatGPT puede exhibir su verdadero poder cuando se combina con análisis SERP y palabras clave cruciales para la clasificación.
Al pedirle a ChatGPT que incluya estos términos, la IA se guía hacia la generación de contenido relevante por tema.
Aquí hay algunos puntos importantes para recordar
Si bien ChatGPT incorporará muchas entidades clave relevantes para un tema, el uso de herramientas que analizan los resultados de SERP puede mejorar significativamente la combinación de entidades en su contenido.
Además, estas diferencias pueden ser más pronunciadas según el tema, pero si ejecuta este experimento más veces, encontrará que esta es una tendencia constante.
Los enfoques basados en palabras clave cumplen dos requisitos simultáneamente:
- Asegurar la inclusión de las entidades más críticas.
- Proporcionar un sistema de calificación más riguroso, ya que abarca tanto predicados como entidades.
Información adicional
ChatGPT podría tener dificultades para lograr la longitud de contenido necesaria por sí solo.
Cuanto más se desvía la intención de la página de las publicaciones estilo blog, más notable se vuelve la brecha de rendimiento entre ChatGPT y las herramientas de SEO que usan ChatGPT por separado.
A pesar de las capacidades de la IA, es esencial recordar el factor humano. No todas las páginas deben analizarse debido a resultados de búsqueda mixtos.
Además, las técnicas de extracción de palabras clave no son infalibles, y los casos extremos pueden generar nombres propios irrelevantes que aún podrían pasar por el sistema de puntuación.
Por lo tanto, el equilibrio óptimo entre la intervención humana y la IA implica deshabilitar manualmente cualquier sitio de la competencia con una intención diferente y combinar su lista de palabras clave para eliminar las palabras clave claramente incorrectas.
Últimos pasos: ir un paso más allá
Los métodos que hemos discutido son un punto de partida, lo que le permite crear contenido que cubre una gama más amplia de entidades y sus predicados que cualquiera de sus competidores.
Al seguir este enfoque, está escribiendo contenido que refleja las características de las páginas que Google ya favorece.
Pero recuerda, esto es solo un punto de partida. Es probable que estas páginas de la competencia hayan existido durante algún tiempo y pueden haber acumulado más vínculos de retroceso y métricas de usuario.
Si su objetivo es superarlos, deberá hacer que su contenido se destaque aún más.
A medida que la web se satura cada vez más con contenido generado por IA, es razonable especular que Google podría comenzar a favorecer los sitios web en los que confía para establecer nuevas relaciones de entidad. Es probable que esto cambie la forma en que se evalúa el contenido, enfatizando más el pensamiento original y la innovación.
Como escritor, esto significa ir más allá de simplemente incorporar los temas cubiertos por los 10 mejores resultados. En cambio, pregúntese: ¿qué perspectiva única puede ofrecer que falta en el top 10 actual?
No se trata sólo de las herramientas. Se trata de nosotros, los estrategas, los pensadores, los creadores.
Se trata de cómo manejamos estas herramientas y cómo equilibramos la destreza computacional del software con la chispa creativa de la mente humana.
Al igual que en el mundo del ajedrez, es la combinación de la precisión de la máquina y el ingenio humano lo que realmente marca la diferencia.
Entonces, abracemos esta nueva era de SEO, en la que creamos contenido y creamos experiencias que resuenan con nuestra audiencia y se destacan en el vasto panorama digital.
Las opiniones expresadas en este artículo pertenecen al autor invitado y no necesariamente a Search Engine Land. Los autores del personal se enumeran aquí.