Estudio: el 31% de los sitios web internacionales contienen errores hreflang

Publicado: 2023-04-04

Implementar hreflang puede ser una tarea desafiante para muchos SEO. Las innumerables variaciones de sintaxis en varios idiomas pueden ser difíciles para aquellos con poca comprensión de más de un idioma.

También existe la complejidad añadida de comprender los matices específicos del idioma y la orientación regional que normalmente solo entendería un hablante nativo o alguien que haya estudiado a fondo el idioma.

La implementación incorrecta de hreflang puede causar muchas complicaciones (es decir, contenido duplicado, indexación errónea y poca visibilidad de SERP) perjudiciales para el rendimiento de SEO.

Es imperativo implementar hreflang con cuidado. Afortunadamente, hreflang está bien documentado y los problemas relacionados se pueden identificar a través de varias herramientas de SEO.

Estudio de errores Hreflang

Para determinar qué tan extendidos están los problemas de hreflang y cuáles son más comunes, me asocié con NerdyData, que me dio acceso a su base de datos de sitios web que contienen código hreflang.

NerdyData proporcionó una lista de 18 786 sitios web que contienen al menos una instancia de hreflang que declara una alternativa dentro del código fuente. Por lo tanto, este estudio solo tiene en cuenta hreflang implementado en <head>, no a través de mapas de sitio XML o el encabezado HTTP.

Realicé el estudio por:

  • Ejecución de rastreos en Screaming Frog para validar la presencia de hreflang en las páginas de inicio.
  • Eliminar los redireccionamientos de GEO-IP para que la lista completa de URL se resuelva en 200.
  • Utilizando HreflangChecker.com y Visual SEO Studio para procesar las URL en lotes para identificar problemas comunes identificados por las herramientas.

El 31,02% de los sitios web contienen directivas hreflang en conflicto

Mis hallazgos muestran que el 31,02 % de los sitios web que ofrecen varios idiomas tienen directivas hreflang en conflicto. El conflicto de hreflang puede ocurrir cuando una página web tiene varias etiquetas hreflang para diferentes idiomas y orientación geográfica.

En pocas palabras, se ha asignado más de una URL a un idioma o región individual, lo que envía señales confusas a los motores de búsqueda. Por ejemplo:

  • <enlace rel=”alternate” href=”https://example.com/” hreflang=”en” />
  • <enlace rel=”alternate” href=”https://example.com/en-uk/” hreflang=”en-gb” />
  • <enlace rel=”alternate” href=”https://example.com/en-us/” hreflang=”en-gb” />
  • <enlace rel=”alternate” href=”https://example.com/en-au/” hreflang=”en-au” />

Tal confusión conduce potencialmente a complicaciones en torno al contenido duplicado y la clasificación e indexación incorrectas, lo que dificulta una buena ubicación en el SERP.

Incluso si los usuarios encuentran su página web entre las que funcionan bien, sufrirán una mala experiencia de usuario si reciben la versión incorrecta de la página.

Al 16,04 % de los clústeres de hreflang les faltan etiquetas autorreferenciales

El hreflang autorreferenciado ocurre cuando una página incluye una etiqueta hreflang que apunta a su URL.

En esencia, la página indica que está disponible en varios idiomas, incluido el idioma original de la página.

A pesar de parecer inicialmente una táctica redundante, es una buena práctica para el SEO internacional. Desafortunadamente, el 16,04 % de los sitios con varios idiomas no tienen etiquetas hreflang autorreferenciadas.

Los motores de búsqueda pueden comprender mejor la relación entre las diferentes versiones de la misma página cuando se utilizan etiquetas hreflang autorreferenciadas, incluidas las páginas disponibles en diferentes idiomas.

Dado que hreflang contribuye como una de aproximadamente 20 señales de canonicalización, es una señal importante para incluir.

El 47,95% de los sitios web no utilizan x-default

El atributo x-default indica a los motores de búsqueda que una página no está orientada a un idioma o ubicación específicos, definiéndola como una versión de idioma predeterminada de la página.

Es especialmente útil cuando una página está disponible en varios idiomas pero no ofrece contenido en el idioma preferido del usuario.

El atributo x-default no es necesariamente necesario en hreflang. Actualmente, hasta el 47,95% de los sitios multilingües no lo utilizan.

Sin embargo, puede ser beneficioso usarlo en casos en los que un usuario busca una página en un idioma específico que no está disponible, ya que ayuda a los motores de búsqueda a encontrar la versión más adecuada de la página para mostrar.

Es importante tener en cuenta que el atributo x-default solo debe usarse si no hay otro idioma disponible. Cuando existan otros idiomas disponibles, cada uno debe especificarse con una etiqueta hreflang.

Además, x-default no debe usarse en páginas específicas de un idioma o ubicación en particular.

El 8,91% de los grupos de hreflang contienen al menos una instancia de códigos de idioma no válidos

Es fundamental utilizar el formato de dos letras ISO-639-1 dentro de los atributos hreflang.

Desafortunadamente, es común que los códigos de idioma sean incorrectos, lo que genera múltiples problemas que pueden afectar la orientación internacional de un sitio web.

Mi investigación encontró que el 8,91 % de los sitios orientados a más de un idioma actualmente contienen códigos de idioma desconocidos.

Podría ser simplemente un enfoque confuso para combinar el idioma y los códigos de ubicación, pero muchos problemas comunes podrían ser la causa.

Algunos códigos de idioma no coinciden exactamente con la ortografía de un país.

Por ejemplo, puede esperar que el código de idioma para el croata sea "cr", pero en realidad es "hr". Debido a que el código no es obvio, es fácil cometer errores al implementar códigos de idioma.

El 1,6 % de los clústeres de hreflang contienen al menos una instancia de códigos de región no válidos

Al contrario de la estadística anterior, relativamente pocos grupos de hreflang contienen códigos de región no válidos.

Si bien no se requiere el uso de los códigos de región ISO-3166-1 de dos letras, es útil cuando se orienta al mismo idioma entre dos o más países con diferentes reglas ortográficas. Hacerlo proporciona más contexto a los motores de búsqueda, analizando la ubicación y el idioma del usuario.

Para volver a mi ejemplo anterior, debe usar el código "en-US" para dirigirse a los usuarios en los Estados Unidos. Si está configurado en "en-GB", solo se orientará a los usuarios británicos, y perderá por completo a su público objetivo.

Los errores comunes aquí incluyen:

  • <enlace rel=”alternate” href=”https://example.com/en-gb/” hreflang=”en-uk” />
  • <enlace rel=”alternate” href=”https://example.com/en-eu/” hreflang=”en-eu” />

Aquí, todas las entradas tienen como objetivo el inglés, pero también tienen la intención de dirigirse al Reino Unido y Europa. Tanto el Reino Unido como la UE son códigos no válidos, ya que es GB (Gran Bretaña) y no puede orientar a Europa como continente.

La orientación al español también puede ser problemática en América Latina, ya que el clúster intenta orientarse a es-la, es-lx y es-419 en un intento de orientar la región en su conjunto cuando debería orientarse a países individuales, o dejar el español como general. idioma.

El 22,46 % de los grupos de hreflang contienen combinaciones de región e idioma irregulares/inusuales

Hay una variedad de beneficios al dirigirse a países sin idiomas nativos con hreflang, uno de los cuales es mejorar la experiencia del usuario para hablantes no nativos.

Por ejemplo, el holandés es el idioma nativo de los Países Bajos, pero se estima que el 95 % de la población también habla inglés. También hay alrededor de 97.8000 ciudadanos británicos que viven en los Países Bajos.

Con un número tan alto de hablantes de inglés, tiene sentido dirigirse a los usuarios de los Países Bajos con las páginas de su sitio web en inglés.

Sin embargo, no todas las combinaciones tienen sentido. Por ejemplo:

  • <enlace rel=”alternate” href=”https://example.com/en-vn/” hreflang=”en-vn” />
  • <enlace rel=”alternate” href=”https://example.com/es-ie/” hreflang=”es-ie” />
  • <enlace rel=”alternativo” href=”https://example.com/zh-zm/” hreflang=”zh-zm” />

Si bien los tres ejemplos anteriores pasarán una prueba de hreflang y son técnicamente precisos, la cantidad de hablantes de chino de Zambia probablemente arrojará pocos o ningún resultado al tener esta versión alternativa.

La creación de versiones alternativas que tienen poco sentido crea una demanda de rastreo adicional e innecesaria y versiones que Google probablemente considere duplicadas, anulando las canónicas.


Las opiniones expresadas en este artículo pertenecen al autor invitado y no necesariamente a Search Engine Land. Los autores del personal se enumeran aquí.