Quatro problemas comuns encontrados em sitemaps XML e como corrigi-los

Publicados: 2022-10-26


Quais são os problemas comuns encontrados em sitemaps XML? Que impacto eles têm e como você os corrige?

É isso que vamos discutir hoje com uma senhora que, quando não está trabalhando em projetos ou escrevendo sobre SEO, passa seu tempo cultivando tomates, pimentas e ervas. Ela foi recentemente orientada por Aleyda Solis e pela Freelance Coalition for Developing Countries Tech SEO mentoria. E como contratante freelance e fundador do Tech SEO Journal. Uma calorosa recepção ao podcast In Search SEO, Katherine Nwanorue.

Neste episódio, Katherine compartilha quatro problemas comuns de mapa de site XML e como corrigi-los, incluindo:
  • Como listar URLs não qualificados
  • Erro de formato HTML não suportado
  • Não declarar uma página e sua versão alternativa corretamente
  • Ter um mapa do site maior para seções separadas de um site

Catarina: Oi, David. Obrigado por me receber.

D: Oi, Catarina. Ótimo ter você aqui. Você pode encontrar Katherine em techseojournal.com. Então, Katherine, por que os sitemaps XML são tão importantes?

K: Essa é uma boa pergunta. Para mim, há dois benefícios principais em ter um sitemap XML. Por um lado, ajuda os mecanismos de pesquisa a encontrar suas páginas importantes. Se você estiver lidando com um site menor com 500 páginas ou menos, uma boa estrutura de links internos e páginas que não mudam com frequência, ter um sitemap XML não é sua prioridade neste caso. Mas se você estiver lidando com sites maiores, onde você tem conteúdo que muda com frequência, estruturas de links internos ruins e páginas órfãs, ter um mapa do site faz sentido porque pode ajudar os mecanismos de pesquisa a encontrar suas páginas importantes.

Mas também gostaria de mencionar que ter um sitemap XML não garante a indexação. É mais como uma dica, uma pista, para os motores de busca. É como dizer ao Google: "Ei, eu tenho essas páginas muito legais que acho que deveriam ser indexadas. Você se importaria de dar uma olhada nelas?"

O segundo benefício de ter um sitemap XML é que ele ajuda a solucionar problemas de SEO, particularmente problemas de indexação. Mas vou voltar a este.

D: Ótimo, agora você disse para sites maiores. Você tem um certo número de páginas em mente onde, se um site tiver mais de um certo número de páginas, é uma boa ideia usar um sitemap XML?

K: A documentação do Google recomenda 500 páginas ou mais, o oposto de um site menor. Mas na maioria dos casos, 1000 páginas ou mais podem ser boas.

D: É ótimo ter números definitivos para focar lá. Então, hoje, você está compartilhando os quatro problemas comuns com sitemaps XML. Começando com o número um, listando URLs inelegíveis.



1. Como listar URLs não qualificados



K: Sim, e por URLs inelegíveis, quero dizer URLs que geraram um código de erro 404. Talvez eles estejam bloqueados pelo robots.txt, ou tenham uma tag noindex, ou estejam sendo redirecionados. Isso geralmente ocorre no caso em que você provavelmente criou um sitemap manualmente e, de alguma forma, essas páginas de erro chegaram ao arquivo. Outra razão pela qual isso ocorre é que talvez você tenha criado um sitemap XML que não é atualizado automaticamente, é estático. Portanto, quando você cria novas páginas em seu site, isso não reflete no mapa do site. Isso é um problema porque, em vez de rastrear suas páginas válidas, os mecanismos de pesquisa estão perdendo tempo tentando acessar seu conteúdo fortemente redirecionado ou páginas que não deveriam. E o Google mencionou que, se eles não conseguirem rastrear o mapa do site após várias tentativas, acabarão parando de tentar. Isso anula o propósito de ter um sitemap XML em primeiro lugar.

D: Então, se você mantiver URLs inelegíveis incorporados em seu sitemap XML, eventualmente o Google simplesmente ignorará seu sitemap XML, ou talvez nem confie em todo o seu site como tendo autoridade. Isso nos leva ao número dois quando um sitemap XML gera um erro de formato HTML não suportado.



2. Erro de formato HTML não suportado



K: Em primeiro lugar, gostaria de descrever o que é um Sitemap HTML. Um Sitemap HTML é seu conteúdo, links para suas páginas e seções em seu site. Geralmente é destinado a usuários humanos navegarem em seu site. Ele está localizado na seção de rodapé do seu site. E sim, na maioria dos casos, os mecanismos de pesquisa também podem seguir esses links para encontrar suas páginas. Mas é aí que a semelhança termina com um mapa do site XML. Um Sitemap HTML não tem uma data de modificação. Se você tiver vídeos, talvez nem consiga vinculá-los ao mapa do site HTML.

Se você realmente deseja informar aos mecanismos de pesquisa sobre seu conteúdo existente e atualizado, deve seguir um mapa do site XML. Mas em um caso em que você está tentando enviar um sitemap XML e está recebendo este erro que está no formato HTML, é provável que você esteja realmente enviando um arquivo no formato HTML ou seu sitemap tenha erros que são dificultando a leitura.

Outro motivo comum pelo qual isso ocorre é que há uma funcionalidade de cache em seu site, onde um plug-in, servidor ou configuração está atrapalhando e, em vez disso, está servindo um arquivo no formato HTML.

D: Ótimas dicas também. Há algum benefício em ter um mapa do site HTML e um mapa do site XML ao mesmo tempo ou um mapa do site XML por si só seria suficiente?

K: Há benefícios em ter ambos. Se você pode obter valor adicional em algo, por que não? Se suas páginas têm uma profundidade de rastreamento muito longa, onde algumas páginas são difíceis de alcançar, talvez um sitemap HTML possa ajudá-lo a levar os usuários às páginas em que eles devem acessar e pode ajudá-los a navegar em seu site. Por outro lado, um sitemap XML destina-se aos motores de busca. Portanto, neste caso, você está considerando os usuários e os rastreadores. Então, sim, é definitivamente uma boa ideia ter os dois.

D: E você obviamente falou sobre a importância de codificar um sitemap XML corretamente. Existe algum lugar que você recomende verificar se seus Sitemaps XML estão codificados corretamente?

K: Sim, se você está preocupado que seu sitemap XML possa ser um arquivo HTML, você deve tentar enviá-lo no Google Search Console. Você provavelmente receberá uma resposta de que este é um Sitemap HTML. E quando isso acontecer, para descobrir o que realmente está causando isso, abra o mapa do site XML em seu navegador e inspecione a página com as ferramentas de desenvolvimento do Chrome. Se houver um plug-in ou se for um cache de servidor, você provavelmente verá uma lista de coisas que estão atrapalhando. Depois de descobrir que existe uma funcionalidade de cache, você pode ir em frente e alterar suas configurações, limpar seu cache e tudo deve voltar ao que está. Mas se você não estiver vendo nenhuma funcionalidade de cache atrapalhando, provavelmente terá erros. E, neste caso, você precisaria usar um validador de sitemap XML para verificar se há erros ou atributos codificados incorretamente em seu sitemap.

D: Brilhante. E se o seu sitemap XML estiver codificado corretamente, se for XML adequado, existe algum perigo de ter um plug-in de cache congelando seu sitemap XML para que ele não seja atualizado corretamente? Ou isso não é um perigo com um arquivo XML?

K: Isso é um perigo. É por isso que recomendo que você verifique se não há armazenamento em cache no plug-in. Há uma configuração em muitos plugins onde você pode armazenar em cache seus sitemaps, mas não deveria, pois isso pode causar problemas, como mencionei. Isso pode fazer com que o mapa do site XML apareça como um arquivo HTML. Isso pode criar muitos erros, então é melhor não armazenar em cache o seu sitemap XML. Por favor, não. É melhor não.

D: E o número três não está declarando uma página e sua versão alternativa corretamente.



3. Não declarar uma página e sua versão alternativa corretamente



K: Isso se aplica a um caso em que você está implementando sua tag hreflang em seu sitemap XML. E neste caso, você precisa especificar a URL que deseja indexar e suas versões alternativas, incluindo ela mesma. Por exemplo, digamos que eu tenha uma página para falantes de inglês no meu site e gostaria que ela fosse indexada. Mas, ao mesmo tempo, tenho duas versões alternativas. Eu tenho uma versão em alemão para falantes na Suíça e uma versão em chinês para usuários chineses. Então, para fazer isso, eu especificaria o URL da página em inglês e listaria essas três versões. Há a versão alemã para a Suíça, a versão chinesa para a China e a própria versão em inglês.

E essas tags são recíprocas. Portanto, se cada versão alternativa referenciada não apontar para a outra, há um problema. Seu sitemap XML pode apresentar problemas em que suas tags hreflang são interpretadas incorretamente ou são completamente ignoradas.

D: E isso nos leva ao número quatro, que é ter um sitemap maior para seções separadas de um site.



4. Ter um Sitemap maior para seções separadas de um site



K: Certo. Atualmente, o Google suporta 50.000 URLs em um único sitemap ou um tamanho de sitemap de 50 MB no máximo sem compactação, o que você acertar primeiro. Isso não significa que, se você tiver 50.000 URLs, deva listar todos eles em uma página. Essa não é uma boa prática, pois pode dificultar a solução de problemas. Você não teria ideia de quais seções do seu site estão tendo problemas de indexação ou rastreamento, seções em que os mecanismos de pesquisa e os rastreadores não estão entrando.

Idealmente, você deve segmentar seus sitemaps por seções. Por exemplo, se você tiver um site de comércio eletrônico, poderá criar um único mapa do site para suas páginas estáticas (Sobre nós, termos e condições etc.) e, em seguida, diferentes mapas do site para suas páginas de categoria. Dessa forma, você pode identificar facilmente problemas e filtrar nos relatórios do setor no Google Search Console as seções do seu site que não estão sendo rastreadas e indexadas como deveriam.

D: Existe um número máximo de sitemaps que você pode ter para o seu site?

K: Atualmente, eu realmente não posso colocar um número para isso agora.

D: Que tal verificar e diagnosticar seus sitemaps XML regularmente? Existe algo que você deve verificar para ver se há erros uma vez por mês?

K: Eu não recomendaria uma vez por mês. Se você realmente quer saber o que está acontecendo em seu site, você deve verificar seu Google Search Console, porque é onde você pode ver esses erros para o mapa do site. Você deve verificá-lo periodicamente, diariamente, se puder, ou semanalmente, dependendo do número de páginas que publicar. Se você publica conteúdo todos os dias, faz sentido verificar muito. Mas se suas páginas raramente mudam, semanalmente seria bom. Mas, por favor, você precisa verificar.

D: As pessoas que estão lendo, ouvindo ou assistindo isso estão pensando que eu preciso entender mais sobre mapas de site XML. Há algum recurso que você possa recomendar para que as pessoas saibam mais sobre os mapas de site XML?

K: Sim. Você deve verificar a documentação do Google. Eles têm uma extensa documentação sobre o que é o mapa do site XML, como criar um, as melhores práticas e como gerenciá-lo para sites multilíngues. Quase todas as informações que você pode encontrar estão lá.





Pareto Pickle - Ter uma boa estrutura de ligação interna



D: Excelente. Vamos terminar com o Picles de Pareto. Pareto diz que você pode obter 80% de seus resultados com 20% de seus esforços. Qual é uma atividade de SEO que você recomendaria que fornece resultados incríveis para níveis modestos de esforço?

K: Eu diria uma boa estrutura de links internos. Isso ocorre porque é a principal fonte de descoberta de URL para mecanismos de pesquisa. Eles podem seguir links em seu site para acessar páginas importantes em seu site. E além disso, você também pode usar links para passar o valor de SEO para outras páginas também. Ou você também pode usá-lo para indicar a importância relativa de uma página sobre outras e a relação entre suas páginas. Então, sim, uma boa estrutura de links internos é a melhor.

D: Então, ter uma boa estrutura de links internos não significa que os sitemaps XML não sejam necessários?

K: Não realmente. Como mencionei, se você tem uma boa estrutura de links internos e um site menor, não é uma prioridade ter um sitemap XML. Mas alguns sites podem ver mais valor de um sitemap XML do que outros. Se você tem páginas muito grandes, você pode ter uma boa estrutura de links internos, mas quem não quer mais valor? Quem não quer que os motores de busca cheguem às suas páginas a tempo? Portanto, um sitemap XML é como uma precaução secundária que você toma, enquanto uma boa estrutura de links internos é o primeiro passo a ser dado.

D: Um Sitemap HTML é necessário se você tiver bons links internos?

K: Se os usuários ainda estão tendo problemas para navegar para seu site, um Sitemap HTML faz sentido.

D: Entendido. Portanto, se você está tendo problemas com a classificação de URLs, ou talvez navegação, como você diz, um Sitemap HTML pode ser bom para usuários e mecanismos de pesquisa. Mas se todas as páginas que você deseja indexar estiverem indexadas, não é necessário ter um Sitemap HTML.

K: Sim, não é necessário. É bom ter nesse caso, mas não é obrigatório.

D: Bem, eu fui seu anfitrião, David Bain. Você pode encontrar Katherine em techseojournal.com. Katherine, muito obrigado por estar no podcast In Search SEO.

K: Obrigado por me receber. Foi um prazer.

D: E obrigado por ouvir. Confira todos os episódios anteriores e inscreva-se para uma avaliação gratuita da plataforma Rank Ranger em rankranger.com.