Sitemaps XML e SEO: o que você precisa saber

Publicados: 2023-08-16

Os sitemaps XML acabaram de completar 18 anos em junho e, em homenagem à sua introdução completa na idade adulta, estou detalhando como os sitemaps XML funcionam, como criar um e por que os sitemaps XML oferecem um monte de benefícios de SEO.

O que é um mapa do site XML?

Em poucas palavras, um sitemap XML é um protocolo em formato XML que informa aos mecanismos de pesquisa sobre as URLs em um site disponíveis para rastreamento.

Os sitemaps XML foram feitos para compartilhar informações sobre cada URL, como:

  • Quando foi atualizado pela última vez.
  • Quantas vezes ele muda.
  • Quão importante é em relação a outros URLs em seu site.

Os sitemaps XML permitem que os mecanismos de pesquisa rastreiem seu site com mais eficiência se determinados URLs estiverem isolados.

Se você é um profissional de SEO, provavelmente já usa mapas de site XML integrados ao plug-in Yoast WordPress. Mas há muitos extras que você pode estar perdendo.

Como construir um sitemap XML dinâmico

Se você estiver usando o WordPress, aproveite plug-ins de SEO como Yoast e RankMath para gerar um sitemap XML dinâmico.

Se você não estiver usando o WordPress, siga estas etapas para criar um sitemap XML dinâmico.

Entenda sua estrutura de navegação

Reúna uma lista de todos os nossos URLs no site e agrupe-os para alinhá-los à estrutura de navegação e agrupamentos de conteúdo.

Faça parceria com sua equipe de desenvolvedores

Compartilhe a lista de URLs agrupados com sua equipe de desenvolvimento para obter ajuda na criação de um sitemap XML dinâmico usando Python, PHP ou JavaScript.

Aqui está um exemplo de como codificar um sitemap XML dinâmico usando Python:

 import xml.etree.ElementTree as ET import datetime # List of URLs (replace these with your actual URLs) urls = [    "https://www.example.com/page1",    "https://www.example.com/page2",    "https://www.example.com/page3",    # Add more URLs here ] # Create the root element urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") # Loop through URLs and create URL entries for url in urls:    url_elem = ET.SubElement(urlset, "url")    loc_elem = ET.SubElement(url_elem, "loc")    loc_elem.text = url    lastmod_elem = ET.SubElement(url_elem, "lastmod")    lastmod_elem.text = datetime.datetime.now().isoformat()    changefreq_elem = ET.SubElement(url_elem, "changefreq")    changefreq_elem.text = "daily"  # You can set this to the desired frequency    priority_elem = ET.SubElement(url_elem, "priority")    priority_elem.text = "0.5"  # You can set this to a value between 0 and 1 # Create the XML tree tree = ET.ElementTree(urlset) # Save the XML to a file tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)

Ao trabalhar com desenvolvedores, aproveitei Flask e Python juntos para criar um mapa do site XML verdadeiramente dinâmico que muda sempre que o conteúdo do site muda.

Se pudermos definir a rota do sitemap dinâmico com base no conteúdo do site usando uma função como get_dynamic_urls() , poderemos recuperar todos os URLs.

 @app.route('/sitemap.xml', methods=['GET']) def sitemap():    urls = get_dynamic_urls()  # Replace with your dynamic URL retrieval logic    urlset = ET.Element("urlset")    urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9")    for url in urls:        url_elem = ET.SubElement(urlset, "url")        loc_elem = ET.SubElement(url_elem, "loc")        loc_elem.text = url        lastmod_elem = ET.SubElement(url_elem, "lastmod")        lastmod_elem.text = datetime.datetime.now().isoformat()        changefreq_elem = ET.SubElement(url_elem, "changefreq")        changefreq_elem.text = "daily"        priority_elem = ET.SubElement(url_elem, "priority")        priority_elem.text = "0.5"    xml_content = ET.tostring(urlset, encoding="utf-8")    return xml_content, {'Content-Type': 'application/xml'}

Se você estiver compartilhando código entre várias propriedades de domínio, verifique se os arquivos estão codificados corretamente em suas páginas HTML.

Por exemplo, seus arquivos CSS e JavaScript devem ser vinculados usando as tags <link> e <script> .

Antes de compartilhar o código entre diferentes domínios, você precisará criar um servidor centralizado para hospedar as regras de mapa do site XML compartilhadas.

Você terá várias fases de seu sitemap XML dinâmico com seus desenvolvedores até que todas as regras sejam confirmadas.

Não se esqueça de verificar se os URLs dinâmicos estão realmente sendo recuperados e integrados à lógica do mapa do site.

Carregar para o seu servidor

Assim que seu sitemap XML estiver compactado, carregue seu sitemap XML dinâmico no diretório raiz do seu site.

Envie para os mecanismos de pesquisa  

Informe os mecanismos de pesquisa sobre seus sitemaps XML enviando-os por meio do Google Search Console e do Bing Webmaster Tools.

Em manutenção

Um sitemap XML não é apenas uma tática de SEO do tipo “configure e esqueça”. É essencial atualizar seu sitemap XML à medida que seu site muda.

15 dicas para ter em mente ao criar um sitemap XML

1. Sitemaps XML não são um fator de classificação

Quando perguntado no X (anteriormente Twitter) se há uma vantagem de classificação em usar sitemaps XML, Gary Illyes do Google respondeu:

  • "Não, não direto de qualquer maneira."
Gary Illyes em mapas de site XML

2. O Google pode encontrar suas páginas sem um mapa do site

Os sites não precisam de um mapa do site se forem pequenos e vinculados corretamente, Daniel Waisberg, advogado de pesquisa do Google, compartilhou em um vídeo de treinamento do Google Search Console.

No entanto, ele continuou dizendo que um mapa do site pode ser especialmente útil se:

  • O site é muito grande.
  • As páginas do site estão isoladas.
  • O site é novo ou muda rapidamente.
Daniel Waisberg - Quando os sitemaps são úteis

Além disso, é importante observar que John Muller, do Google, afirmou no X (anteriormente Twitter) que ter um sitemap XML é uma “linha de base mínima para qualquer site sério”.

3. O Google verifica se seu sitemap XML foi alterado antes do reprocessamento

O Google verifica se o mapa do site XML foi alterado antes de desperdiçar recursos analisando e processando o arquivo novamente, confirmou Illyes.

Ele afirmou em um SEO Office Hours.

  • “Assim que você alterar algo em seu mapa do site, seja o elemento URL ou o último mod, o mapa do site será analisado novamente e geralmente reprocessado. Isso não significa que os URLs serão rastreados com certeza, é claro que eles ainda estão sujeitos às avaliações de qualidade como qualquer outro URL. Também vale a pena mencionar que, se você remover uma URL do mapa do site porque talvez ela não exista mais, isso não significa que ela será automaticamente removida do índice ou mesmo priorizada para rastreamento, para que possa ser descartada mais cedo.”

4. Sitemaps XML podem fazer com que seu novo conteúdo seja indexado mais rapidamente

Mueller confirmou que informar ao Google que seu sitemap XML está atualizado pode ajudar a indexar seu novo conteúdo mais rapidamente.

Ele compartilhou:

  • “Fazer ping em um mapa do site é um pouco diferente de apenas fornecê-lo no robots.txt — ao fazer o ping, você sinaliza ativamente uma alteração no arquivo do mapa do site. Se você deseja que o novo conteúdo seja indexado rapidamente, essa é uma boa prática.”

5. Sitemaps XML devem ser codificados em UTF-8

Se o seu sitemap XML não estiver usando UTF-8, os mecanismos de pesquisa não poderão lê-lo.

6. Mantenha o tamanho do arquivo abaixo de 50 MB (descompactado) ou 50.000 URLs

Há limites de tamanho para seus sitemaps XML. Mantenha-o abaixo de 50.000 URLs por sitemap ou 50 MB (descompactado).

Se você tiver um tamanho de arquivo maior ou mais URLs, use vários sitemaps XML.

7. Você pode ter vários sitemaps XML

O Google permite que você envie vários sitemaps. Dividir seus sitemaps em diferentes seções de seu site para medir o desempenho pode ser útil.

Por exemplo, se você for um grande site de comércio eletrônico, poderá segmentar seus sitemaps XML por tipo de produto (ou seja, sapatos femininos x sapatos masculinos).

Ou, se você tiver vários idiomas, talvez queira um hreflang relacionado ao seu <loc> XML sitemap.

Se você tiver idiomas alternativos, isso não contará para o máximo de 50.000 URLs.

Ou, se você tiver muitos vídeos ou imagens, poderá separar seus sitemaps XML em um sitemap XML de vídeo e um sitemap XML de imagem.

Não há nenhum benefício de classificação em ter vários sitemaps XML.

8. Se você tiver vários sitemaps XML, lembre-se de usar um arquivo de índice de sitemap

Se você tiver vários sitemaps XML para um site grande, convém enviar um arquivo de índice de sitemap para enviar vários sitemaps de uma só vez.

9. A tag lastmod deve ser impecável

A tag <lastmod> é uma das partes mais essenciais do seu sitemap XML.

Por exemplo, meus dados estruturados aproveitam a data <lastmod> do meu sitemap XML.

A tag <lastmod> também sinaliza para os mecanismos de pesquisa se você atualizou o conteúdo antigo ou lançou um novo conteúdo.

Mueller confirmou isso afirmando:

  • “…Se você está apenas alterando o rodapé do carimbo de data/hora, claro, a página também mudou tecnicamente, mas isso deve ser priorizado – provavelmente não.”

O Bing até fez uma posição oficial sobre a tag lastmod no mapa do site XML, afirmando:

  • “Para sitemaps XML, uma das tags mais críticas que você pode incluir em seu sitemap é a tag “lastmod”.

10. Sitemaps XML devem incluir apenas 200 URLs de status que são todos autocanonizados

Lembre-se de manter apenas URLs ativos, com status 200, indexáveis ​​e autocanonizados.

Se você continuar exibindo páginas redirecionadas 404 ou 301, os mecanismos de pesquisa podem parar de rastrear seu sitemap XML completamente.

Mueller respondeu a um comentário no X (anteriormente conhecido como Twitter):

  • “Pararíamos de buscar arquivos de sitemap se as URLs fossem inválidas, mas se você estiver retornando conteúdo ou redirecionando (o que é meio recomendado), continuaremos tentando. Isso não deve causar problemas, já que os arquivos gerais do mapa do site são apenas uma pequena parte de todos os URLs obtidos de um site.”

11. Os mecanismos de pesquisa podem verificar seu sitemap XML diariamente

Fabrice Canel, da Microsoft, compartilhou que a Microsoft verifica seu sitemap XML diariamente.

Enquanto Mueller compartilhou que o Google verifica seu sitemap XML com base na frequência (também conhecida como sua tag <lastmod> ).

12. A velocidade da página afeta indiretamente seu mapa do site XML

Todos nós sabemos como a velocidade da página é vital para nossos esforços de SEO. Mas como um site de desempenho lento afeta seu sitemap XML?

Mueller confirmou que a velocidade da página não deve afetar seu sitemap XML afirmando:

  • “Contanto que não demore, você deve ficar bem. Talvez armazenar em cache a versão mais recente para evitar carregamento desnecessário do servidor?”

A verdade é que trabalhei em sites de desempenho lento, nos quais o mapa do site XML não carregava quando os mecanismos de pesquisa rastreiam o site, causando grandes flutuações de classificação.

Há um impacto indireto no mapa do site XML se o site não carregar corretamente.

É por isso que é importante usar a compactação Gzip para reduzir o tamanho do arquivo e acelerar o tempo de carregamento.

13. Remova a tag <priority> dos seus sitemaps XML

Illyes comparou a tag <priority> em sitemaps XML a “um saco de barulho”.

Então, se você está dependendo de motores de busca para rastrear seus URLs em seu sitemap XML com base na prioridade, você vai esperar muito tempo.

Recomendo remover essa tag de seus sitemaps XML.

14. Se você tiver problemas de estrutura de navegação, emparelhe seu sitemap XML com um sitemap HTML

Sempre houve sentimentos contraditórios sobre sitemaps HTML.

Mueller compartilhou que os sitemaps HTML “nunca deveriam ser necessários”.

Ele continuou:

  • “Mudei de ideia sobre sitemaps HTML ao longo dos anos, eles nunca deveriam ser necessários. Sites pequenos e grandes sempre devem ter uma estrutura de navegação clara. Se você sentir a necessidade de um sitemap HTML, gaste tempo melhorando a arquitetura do seu site. Sitemaps HTML se encaixam na mesma lixeira com spinners de carregamento HTML.”
 <iframe src="https://mastodon.social/@johnmu/109477617298107922/embed" class="mastodon-embed" width="400" allowfullscreen="allowfullscreen"></iframe><script src="https://mastodon.social/embed.js" async="async"></script>

Ao trabalhar em grandes sites em nível empresarial, muitas vezes há várias camadas de tomadores de decisão em uma estrutura de navegação do site. E muitas vezes, as melhores práticas de SEO são levadas em consideração.

Eu emparelho meu sitemap XML com um sitemap HTML até estar confiante em nossa navegação no site e na hierarquia de links internos.

15. Não se esqueça de incluir todos os seus sitemaps XML em seu arquivo robots.txt

Não se esqueça de incluir seus sitemaps XML (todos eles) como links em seu arquivo robots.txt.

Aqui está um exemplo:

Inclua todos os seus sitemaps XML em seu arquivo robots.txt

Não se preocupe sobre onde eles devem ir no arquivo robots.txt. Não há impacto na localização de seu sitemap XML em seu arquivo robots.txt.

Mueller confirmou isso:

Sitemaps XML são o modelo do seu site para os mecanismos de pesquisa

Esteja você lançando uma nova página da Web ou apenas adicionando uma tag canônica a uma página duplicada, seu sitemap XML é algo que você deve atualizar 24 horas por dia, 7 dias por semana.

Mas faça isso com cautela.

Embora você não deva ser paranóico, seu sitemap XML é a planta de sua casa para os mecanismos de busca.

Portanto, não se esqueça de enviar seus sitemaps XML para o Google Search Console e Bing Webmaster Tools.


As opiniões expressas neste artigo são do autor convidado e não necessariamente do Search Engine Land. Os autores da equipe estão listados aqui.