Estudo: 31% dos sites internacionais contêm erros hreflang

Publicados: 2023-04-04

A implementação do hreflang pode ser uma tarefa desafiadora para muitos SEOs. As inúmeras variações de sintaxe em vários idiomas podem ser difíceis para aqueles com pouco entendimento de mais de um idioma.

Há também a complexidade adicional de entender as nuances específicas do idioma e a segmentação regional, que normalmente só seriam compreendidas por um falante nativo ou por alguém que estudou minuciosamente o idioma.

A implementação incorreta do hreflang pode causar muitas complicações (ou seja, conteúdo duplicado, indexação incorreta e baixa visibilidade da SERP) prejudiciais ao desempenho do SEO.

É imperativo implementar o hreflang com cuidado. Felizmente, o hreflang está bem documentado e os problemas relacionados podem ser identificados por meio de várias ferramentas de SEO.

Estudo de erros de Hreflang

Para determinar o quão difundidos são os problemas do hreflang e quais são os mais comuns, fiz uma parceria com a NerdyData, que me deu acesso ao banco de dados de sites que contêm o código hreflang.

NerdyData forneceu uma lista de 18.786 sites que contêm pelo menos uma instância de hreflang declarando uma alternativa no código-fonte. Portanto, este estudo considera apenas o hreflang implementado no <head>, não por meio de sitemaps XML ou do cabeçalho HTTP.

Eu realizei o estudo por:

  • Executar rastreamentos no Screaming Frog para validar a presença de hreflang nas páginas iniciais.
  • Removendo redirecionamentos GEO-IP para que a lista completa de URLs resolva em 200s.
  • Utilizando HreflangChecker.com e Visual SEO Studio para processar os URLs em lotes para identificar problemas comuns identificados pelas ferramentas.

31,02% dos sites contêm diretivas hreflang conflitantes

Minhas descobertas mostram que 31,02% dos sites que atendem a vários idiomas têm diretivas hreflang conflitantes. O conflito de hreflang pode ocorrer quando uma página da Web possui várias tags hreflang para diferentes idiomas e segmentação geográfica.

Simplificando, mais de um URL foi atribuído a um idioma ou região individual, enviando sinais confusos aos mecanismos de pesquisa. Por exemplo:

  • <link rel=”alternate” href=”https://example.com/” hreflang=”en” />
  • <link rel=”alternate” href=”https://example.com/en-uk/” hreflang=”en-gb” />
  • <link rel=”alternate” href=”https://example.com/en-us/” hreflang=”en-gb” />
  • <link rel=”alternate” href=”https://example.com/en-au/” hreflang=”en-au” />

Essa confusão potencialmente leva a complicações em torno de conteúdo duplicado e classificação e indexação incorretas, dificultando uma boa colocação no SERP.

Mesmo que os usuários encontrem sua página da Web entre as que apresentam bom desempenho, eles sofrerão uma experiência de usuário ruim se receberem a versão incorreta da página.

16,04% dos clusters hreflang não possuem tags de autorreferência

A autorreferência de hreflang ocorre quando uma página inclui uma tag hreflang apontando para seu URL.

Em essência, a página indica que está disponível em vários idiomas, incluindo o idioma original da página.

Apesar de inicialmente parecer uma tática redundante, é uma boa prática para SEO internacional. Infelizmente, 16,04% dos sites com vários idiomas não possuem tags hreflang auto-referenciadas.

Os mecanismos de pesquisa podem entender melhor a relação entre diferentes versões da mesma página quando tags hreflang auto-referenciadas são usadas, incluindo páginas disponíveis em diferentes idiomas.

Dado que hreflang contribui como um dos aproximadamente 20 sinais de canonização, é um sinal importante a ser incluído.

47,95% dos sites não utilizam x-default

O atributo x-default sinaliza para os mecanismos de pesquisa que uma página não tem como alvo um idioma ou local específico, definindo-a como uma versão de idioma padrão da página.

É especialmente útil quando uma página está disponível em vários idiomas, mas não fornece conteúdo no idioma preferencial do usuário.

O atributo x-default não é necessariamente necessário em hreflang. Até 47,95% dos sites multilíngues não o estão usando atualmente.

No entanto, pode ser útil usar nos casos em que um usuário pesquisa uma página em um idioma específico que não está disponível, pois ajuda os mecanismos de pesquisa a encontrar a versão mais apropriada da página a ser exibida.

É importante observar que o atributo x-default só deve ser usado se outro idioma não estiver disponível. Onde existem outros idiomas disponíveis, cada um deve ser especificado com uma tag hreflang.

Além disso, x-default não deve ser usado em páginas específicas de um determinado idioma ou local.

8,91% dos clusters hreflang contêm pelo menos uma instância de códigos de idioma inválidos

É essencial usar o formato ISO-639-1 de duas letras nos atributos hreflang.

Infelizmente, é comum que os códigos de idioma dêem errado, causando vários problemas que podem afetar a segmentação internacional de um site.

Minha pesquisa descobriu que 8,91% dos sites segmentados para mais de um idioma atualmente contêm códigos de idiomas desconhecidos.

Pode ser simplesmente uma abordagem confusa para combinar códigos de idioma e localização, mas muitos problemas comuns podem ser a causa.

Alguns códigos de idioma não correspondem exatamente à ortografia de um país.

Por exemplo, você pode esperar que o código do idioma croata seja “cr”, mas na verdade é “hr”. Como o código não é óbvio, é fácil cometer erros ao implementar códigos de idioma.

1,6% dos clusters hreflang contêm pelo menos uma instância de códigos de região inválidos

Ao contrário da estatística anterior, relativamente poucos clusters hreflang contêm códigos de região inválidos.

Embora o uso de códigos de região ISO-3166-1 de duas letras não seja obrigatório, ele ajuda ao direcionar o mesmo idioma entre dois ou mais países com regras de ortografia diferentes. Isso fornece mais contexto aos mecanismos de pesquisa, analisando a localização e o idioma do usuário.

Voltando ao meu exemplo anterior, você deve usar o código “en-US” para segmentar usuários nos Estados Unidos. Se estiver definido como “en-GB”, você segmentará apenas usuários baseados na Grã-Bretanha, perdendo totalmente o público-alvo.

Erros comuns aqui incluem:

  • <link rel=”alternate” href=”https://example.com/en-gb/” hreflang=”en-uk” />
  • <link rel=”alternate” href=”https://example.com/en-eu/” hreflang=”en-eu” />

Aqui, todas as entradas são voltadas para o inglês, mas também visam o Reino Unido e a Europa. Tanto o Reino Unido quanto a UE são códigos inválidos, pois é GB (Grã-Bretanha), e você não pode segmentar a Europa como um continente.

A segmentação em espanhol também pode ser problemática na América Latina, com o cluster tentando segmentar es-la, es-lx e es-419 em uma tentativa de segmentar a região como um todo, quando você deveria segmentar países individuais – ou deixar o espanhol como um todo linguagem.

22,46% dos clusters hreflang contêm combinações de região de idioma irregulares/incomuns

Há uma série de benefícios em segmentar países sem idiomas nativos com hreflang, sendo o principal deles melhorar a experiência do usuário para falantes não nativos.

Por exemplo, o holandês é a língua nativa da Holanda, mas cerca de 95% da população também fala inglês. Há também cerca de 97.8000 cidadãos britânicos que vivem na Holanda.

Com um número tão alto de falantes de inglês, segmentar usuários na Holanda com as páginas do seu site em inglês faz sentido.

No entanto, nem todas as combinações fazem sentido. Por exemplo:

  • <link rel=”alternate” href=”https://example.com/en-vn/” hreflang=”en-vn” />
  • <link rel=”alternate” href=”https://example.com/es-ie/” hreflang=”es-ie” />
  • <link rel=”alternate” href=”https://example.com/zh-zm/” hreflang=”zh-zm” />

Embora os três exemplos acima passem no teste hreflang e sejam tecnicamente precisos, o número de falantes de chinês na Zâmbia provavelmente produzirá pouco ou nenhum resultado com essa versão alternativa.

A criação de versões alternativas que fazem pouco sentido cria uma demanda de rastreamento adicional e desnecessária e versões que o Google provavelmente pode considerar duplicadas, substituindo as canônicas.


As opiniões expressas neste artigo são do autor convidado e não necessariamente do Search Engine Land. Os autores da equipe estão listados aqui.