Ganancia de información en SEO: qué es y por qué es importante

Publicado: 2023-07-25

En junio de 2022 se otorgó una patente de Google sobre "puntuación de ganancia de información". Creo que no es una coincidencia que siguieron varias actualizaciones de algoritmos, incluida la actualización de contenido útil.

¿Es el puntaje de ganancia de información una forma clave para que Google priorice el contenido valioso que es "contenido original, de alta calidad y centrado en las personas que demuestra cualidades EEAT"?

Mi hipótesis: sí. Este es el por qué.

¿Qué es una puntuación de ganancia de información?

Una puntuación de ganancia de información es esencialmente una medida de qué tan único es su contenido del resto del corpus. Aquí, el corpus serían todos los documentos potenciales que Google analiza en la clasificación para la consulta particular buscada.

De la Figura 5 en la Patente US20200349181A1
De la Figura 5 en la Patente US20200349181A1

En la patente, la mayoría de los escenarios proporcionados para calcular las puntuaciones de ganancia de información se realizan después de consultas posteriores o vistas de documentos y vistas de resultados de búsqueda. Es un proceso de aprendizaje específico para el individuo y/o para el tema que está buscando.

El difunto Bill Slawski escribió un desglose técnico de este proceso cuando la patente aún estaba en revisión en 2020.

Una de las cosas interesantes que veo en el lenguaje de las patentes es esta:

Google está dando margen para que las puntuaciones de ganancia de información se calculen algorítmicamente y se apliquen como datos de entrenamiento en los modelos de aprendizaje automático.

La necesidad de un primer conjunto de documentos para calcular la puntuación de ganancia de información puede quedar obsoleta en el futuro:

“[e]n algunas implementaciones, los datos de cada uno de los documentos del segundo conjunto de documentos pueden aplicarse a través de un modelo de aprendizaje automático como entrada”.

¿Cómo afecta la obtención de información a los rankings de búsqueda?

Desde una perspectiva del mundo real, esto significa que Google:

  • Tiene una forma de calcular qué tan único es su contenido del resto del contenido en esa área temática.
  • Tiene una métrica para promocionar o degradar contenido de forma activa en función de ese nivel de diferencia o uniformidad.

El puntaje de ganancia de información sugiere un nuevo elemento de algoritmo dirigido al contenido generado por IA y nuevas granjas de contenido.

En consecuencia, el contenido puede ser degradado si carece de singularidad, incluso si consta de diferentes palabras dispuestas de manera diferente.

El contenido de rascacielos podría ser parte de esta degradación dirigida.

La puntuación de ganancia de información y el sistema de contenido útil están forzando la innovación donde actualmente hay un mar de contenido "perfectamente optimizado".


Obtenga el boletín informativo diario en el que confían los especialistas en marketing.

Procesando .. por favor espere.

Ver términos.


¿Puede la ganancia de información mejorar la visibilidad de su sitio web?

El uso de la información obtenida para crear o actualizar contenido es un proceso doble.

  • Analice la fuente de sus datos.
  • Identificar oportunidades de mercado.

En un escenario ideal, sería fascinante ver lo que un experto o gerente de ventas podría producir si se le pidiera que escribiera sobre la solución del problema X de un cliente sin ningún "requisito de SEO" o usando Google. El resultado podría ser una respuesta sorprendentemente innovadora y apropiada.

La mayoría de nosotros no tenemos el lujo de un tiro en la oscuridad como ese y necesitamos un poco más de estructura para cambiar, actualizar y adaptar la forma en que creamos contenido.

Así que analicemos cómo podemos cambiar ese enfoque.

¿De dónde obtienes tu información?

El tuit del Dr. Pete

Si bien puede parecer un paso atrás, prepárese para pasar más tiempo investigando el contenido que nunca.

Si obtiene su información únicamente de la web y el SERP para el que desea clasificar, puede ser parte del problema. Todos lo hacemos, pero es un poco perezoso, ¿verdad?

El contenido excelente y de calidad lleva tiempo.

El contenido que publicamos que estamos ampliando y utilizando como una forma de promocionar nuestras empresas, nuestras marcas y a nosotros mismos debería poder cumplir con la marca de "liderazgo intelectual".

¿Qué lleva eso? La base del liderazgo intelectual es esencialmente una opinión informada.

Esto requiere que tomes una postura, tengas una opinión específica o llegues a una conclusión particular.

Y para hacer eso, necesita la información para fundamentar esa opinión, o debería hacerlo.

En cualquier empresa, tendrá datos únicos que solo están esperando que los use en un artículo o herramienta para sus clientes y clientes, como:

  • Comentarios y registros de su equipo de atención al cliente.
  • Tus reseñas.
  • Comentarios y llamadas de ventas de su equipo de ventas.
  • Los datos de uso de su producto, si se pueden agregar y publicar.

Todas estas son fuentes de contenido que un competidor no puede duplicar fácilmente.

También se pueden convertir en experiencias multimedia enriquecidas que Google no puede crear.

También está informado por sus clientes reales y sus experiencias reales.

Es posible que gran parte del contenido que los resultados de la búsqueda le “digan” que cree no sea apropiado para sus clientes.

Comenzar con sus propios datos filtrará naturalmente una gran cantidad de contenido que está escrito exclusivamente para los motores de búsqueda.

¿Qué oportunidades hay en el mercado?

Si bien es tentador ir a Google o Bing y seguir el formato del artículo mejor posicionado en los resultados de búsqueda, recuerde que Google solo lo clasifica en lo más alto porque es lo mejor a lo que tiene acceso.

No pueden crear su propio contenido (todavía) para responder exactamente lo que una persona está buscando si aún no existe.

Por lo tanto, la clasificación de contenido podría ser una basura absoluta para conocer la experiencia real y proporcionar una respuesta sólida, pero debido a que es lo mejor de lo peor, es lo que clasifica.

Por lo tanto, al crear contenido nuevo, también debemos analizar la relevancia del tema y las áreas relacionadas con el tema sobre el que está escribiendo que quizás otros competidores no estén aprovechando.

Las herramientas que pueden ayudarlo a ver las relaciones tópicas existentes de sus competidores incluyen:

  • Demostración de API de lenguaje natural
  • Demostración de Diffbot
  • En órbita

Las herramientas que puede usar para ayudar a comprender las relaciones semánticas de su tema principal (que pueden no ser cubiertas por sus competidores) incluyen:

  • MercadoMuse
  • TF-IDF a través de Ryte
  • Agrupación de palabras clave con Semrush (pago)
  • Cree su propia herramienta de modelado de temas utilizando Latent Dirichlet Allocation y Python (no probado)

Cada una de estas herramientas tiene sus propias compensaciones y consideraciones, y cada una debe sopesarse con los compromisos de datos que su organización está haciendo.

Como todo lo demás, también son una aproximación de cómo funciona el sistema de clasificación del motor de búsqueda de Google.

También es bueno recordar que la avalancha de contenido recientemente publicado de AI tiene implicaciones de costos reales para Google.

Más contenido significa facturas de electricidad cada vez más caras, por lo que tienen un interés personal en eliminar la mayor cantidad de contenido posible antes de que pase por los tres rastreadores.

Por lo tanto, encuentre formas de crear contenido que sea adecuado tanto para sus clientes como para Google.


Las opiniones expresadas en este artículo pertenecen al autor invitado y no necesariamente a Search Engine Land. Los autores del personal se enumeran aquí.