Sitemaps XML et SEO : ce que vous devez savoir
Publié: 2023-08-16Les sitemaps XML viennent d'avoir 18 ans en juin, et en l'honneur de leur introduction à part entière à l'âge adulte, je décompose le fonctionnement des sitemaps XML, comment en créer un et pourquoi les sitemaps XML offrent une multitude d'avantages SEO.
Qu'est-ce qu'un sitemap XML ?
En un mot, un sitemap XML est un protocole au format XML qui indique aux moteurs de recherche les URL d'un site Web disponibles pour l'exploration.
Les sitemaps XML étaient destinés à partager des informations sur chaque URL, telles que :
- Quand il a été mis à jour pour la dernière fois.
- Combien de fois ça change.
- Quelle est son importance par rapport aux autres URL de votre site Web.
Les sitemaps XML permettent aux moteurs de recherche d'explorer votre site Web plus efficacement si certaines URL sont isolées.
Si vous êtes un professionnel du référencement, vous utilisez probablement déjà des sitemaps XML intégrés à votre plugin Yoast WordPress. Mais il y a beaucoup d'extras qui pourraient vous manquer.
Comment créer un plan de site XML dynamique
Si vous utilisez WordPress, utilisez des plugins SEO comme Yoast et RankMath pour générer un sitemap XML dynamique.
Si vous n'utilisez pas WordPress, suivez ces étapes pour créer un sitemap XML dynamique.
Comprendre votre structure de navigation
Rassemblez une liste de toutes nos URL sur le site Web et regroupez-les pour les aligner sur la structure de navigation et les groupements de contenu.
Associez-vous à votre équipe de développeurs
Partagez la liste des URL regroupées avec votre équipe de développement pour obtenir leur aide dans la création d'un sitemap XML dynamique à l'aide de Python, PHP ou JavaScript.
Voici un exemple de codage d'un plan de site XML dynamique à l'aide de Python :
import xml.etree.ElementTree as ET import datetime # List of URLs (replace these with your actual URLs) urls = [ "https://www.example.com/page1", "https://www.example.com/page2", "https://www.example.com/page3", # Add more URLs here ] # Create the root element urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") # Loop through URLs and create URL entries for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" # You can set this to the desired frequency priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" # You can set this to a value between 0 and 1 # Create the XML tree tree = ET.ElementTree(urlset) # Save the XML to a file tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)
Lorsque je travaille avec des développeurs, j'ai utilisé Flask et Python ensemble pour créer un sitemap XML vraiment dynamique qui change chaque fois que le contenu du site Web change.
Si nous pouvons définir la route du sitemap dynamique en fonction du contenu du site Web à l'aide d'une fonction telle que get_dynamic_urls()
, nous devrions être en mesure de récupérer toutes les URL.
@app.route('/sitemap.xml', methods=['GET']) def sitemap(): urls = get_dynamic_urls() # Replace with your dynamic URL retrieval logic urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" xml_content = ET.tostring(urlset, encoding="utf-8") return xml_content, {'Content-Type': 'application/xml'}
Si vous partagez du code sur plusieurs propriétés de domaine, assurez-vous que les fichiers sont correctement codés sur vos pages HTML.
Par exemple, vos fichiers CSS et JavaScript doivent être liés à l'aide des balises <link>
et <script>
.
Avant de partager le code sur différents domaines, vous devez créer un serveur centralisé pour héberger les règles de sitemap XML partagées.
Vous aurez plusieurs phases de votre sitemap XML dynamique avec vos développeurs jusqu'à ce que toutes les règles soient confirmées.
N'oubliez pas de vérifier que les URL dynamiques sont bien récupérées et intégrées dans la logique de votre sitemap.
Télécharger sur votre serveur
Une fois votre sitemap XML compressé, téléchargez votre sitemap XML dynamique dans le répertoire racine de votre site Web.
Soumettre aux moteurs de recherche
Informez les moteurs de recherche de vos plans de site XML en les soumettant via Google Search Console et Bing Webmaster Tools.
Maintenance en cours
Un plan de site XML n'est pas seulement une tactique de référencement "créez-le et oubliez-le". Il est essentiel de mettre à jour votre sitemap XML à mesure que votre site Web change.
15 conseils à garder à l'esprit lors de la création d'un sitemap XML
1. Les sitemaps XML ne sont pas un facteur de classement
Lorsqu'on lui a demandé sur X (anciennement Twitter) s'il y avait un avantage de classement à utiliser des sitemaps XML, Gary Illyes de Google a répondu :
- "Non, pas direct en tout cas."
2. Google peut trouver vos pages sans plan du site
Les sites Web n'ont pas besoin d'un sitemap s'ils sont petits et correctement liés, Daniel Waisberg, Search Advocate chez Google, partagé dans une vidéo de formation Google Search Console.
Cependant, il a poursuivi en disant qu'un sitemap pourrait être particulièrement utile si :
- Le site est vraiment grand.
- Les pages du site sont isolées.
- Le site est nouveau ou évolue rapidement.
En outre, il est important de noter que John Muller de Google a déclaré sur X (anciennement Twitter) qu'avoir un plan de site XML est une "base de référence minimale pour tout site Web sérieux".
3. Google vérifie si votre sitemap XML a changé avant de retraiter
Google vérifie si votre sitemap XML a changé avant de gaspiller des ressources en analysant et en traitant à nouveau le fichier, a confirmé Illyes.
Il a déclaré dans un SEO Office Hours.
- "Dès que vous modifiez quelque chose dans votre sitemap, que ce soit l'élément d'URL ou le dernier mod, le sitemap sera à nouveau analysé et généralement retraité. Cela ne signifie pas que les URL seront sûrement explorées, bien sûr, elles sont toujours soumises aux évaluations de qualité comme toute autre URL. Il convient également de mentionner que si vous supprimez une URL du sitemap parce qu'elle n'existe peut-être plus, cela ne signifie pas qu'elle sera automatiquement supprimée de l'index ou même prioritaire pour l'exploration afin qu'elle puisse être supprimée plus tôt.
4. Les sitemaps XML peuvent indexer plus rapidement votre nouveau contenu
Mueller a confirmé que dire à Google que votre sitemap XML est mis à jour peut aider à indexer plus rapidement votre nouveau contenu.
Il a partagé:
- "Pinger un sitemap est un peu différent que de simplement le fournir dans le fichier robots.txt - en faisant un ping, vous signalez activement un changement dans le fichier sitemap. Si vous souhaitez que le nouveau contenu soit indexé rapidement, c'est une bonne pratique. »
5. Les sitemaps XML doivent être encodés en UTF-8
Si votre sitemap XML n'utilise pas UTF-8, les moteurs de recherche ne peuvent pas le lire.
6. Gardez la taille du fichier sous 50 Mo (non compressé) ou 50 000 URL
Il existe des limites de taille pour vos sitemaps XML. Gardez-le sous 50 000 URL par sitemap ou 50 Mo (non compressé).
Si vous avez une taille de fichier plus importante ou plusieurs URL, utilisez plusieurs sitemaps XML.
7. Vous pouvez avoir plusieurs sitemaps XML
Google vous permet de soumettre plusieurs sitemaps. Il peut être utile de diviser vos sitemaps en différentes sections de votre site Web pour mesurer les performances.
Par exemple, si vous êtes un grand site Web de commerce électronique, vous pouvez segmenter vos sitemaps XML par type de produit (c'est-à-dire, chaussures pour femmes ou chaussures pour hommes).
Ou, si vous avez plusieurs langues, vous voudrez peut-être un hreflang lié à votre sitemap XML <loc>.
Si vous avez d'autres langues, cela ne compte pas dans le maximum de 50 000 URL.
Ou, si vous avez beaucoup de vidéos ou d'images, vous pouvez séparer vos plans de site XML en un plan de site XML vidéo et un plan de site XML image.
Il n'y a aucun avantage de classement à avoir plusieurs sitemaps XML.
8. Si vous avez plusieurs sitemaps XML, n'oubliez pas d'utiliser un fichier d'index de sitemap
Si vous avez plusieurs sitemaps XML pour un grand site, vous souhaiterez soumettre un fichier d'index de sitemap pour soumettre plusieurs sitemaps à la fois.
9. La balise lastmod doit être parfaite
La balise <lastmod>
est l'une des parties les plus essentielles de votre sitemap XML.
Par exemple, mes données structurées exploitent la date <lastmod> de mon sitemap XML.
La balise <lastmod>
signale également aux moteurs de recherche si vous avez actualisé l'ancien contenu ou lancé un nouveau contenu.
Mueller l'a confirmé en déclarant :
- "... Si vous modifiez simplement le pied de page de l'horodatage, bien sûr, la page a également techniquement changé, mais cela devrait-il être prioritaire - probablement pas."
Bing a même pris une position officielle sur la balise lastmod
dans le sitemap XML, déclarant :
- "Pour les sitemaps XML, l'une des balises les plus importantes que vous pouvez inclure dans votre sitemap est la balise" lastmod "."
10. Les sitemaps XML ne doivent inclure que 200 URL de statut qui sont toutes auto-canonicalisées
N'oubliez pas de ne conserver que les URL en direct, de statut 200, indexables et auto-canonicalisées.
Si vous continuez à présenter des pages redirigées 404 ou 301, les moteurs de recherche pourraient cesser complètement d'explorer votre sitemap XML.
Mueller a répondu à un commentaire sur X (anciennement connu sous le nom de Twitter) :
- "Nous arrêterons de récupérer les fichiers de plan de site si les URL ne sont pas valides, mais si vous renvoyez du contenu ou redirigez (ce qui est plutôt recommandé), nous continuerons à les essayer. Cela ne devrait pas poser de problèmes, car les fichiers de sitemap globaux ne représentent qu'une infime partie de toutes les URL extraites d'un site.
11. Les moteurs de recherche peuvent vérifier quotidiennement votre sitemap XML
Fabrice Canel de Microsoft a partagé que Microsoft vérifie quotidiennement votre sitemap XML.
Alors que Mueller a partagé que Google vérifie votre plan de site XML en fonction de la fréquence (c'est-à-dire votre balise <lastmod>
).
12. La vitesse de la page a un impact indirect sur votre sitemap XML
Nous savons tous à quel point la vitesse des pages est vitale pour nos efforts de référencement. Mais quel est l'impact d'un site Web lent sur votre plan de site XML ?
Mueller a confirmé que la vitesse de la page ne devrait pas avoir d'incidence sur votre sitemap XML en déclarant :
- « Tant qu'il n'expire pas, ça devrait aller. Peut-être mettre en cache la dernière version pour éviter une charge inutile du serveur ? »
La vérité est que j'ai travaillé sur des sites Web peu performants où le sitemap XML ne se charge pas lorsque les moteurs de recherche explorent le site Web, ce qui provoque des fluctuations de classement importantes.
Il y a un impact indirect sur votre plan de site XML si votre site Web ne se charge pas correctement.
C'est pourquoi il est important d'utiliser la compression Gzip pour réduire la taille des fichiers et accélérer les temps de chargement.
13. Supprimez la balise <priority> de vos sitemaps XML
Illyes a comparé la balise <priority>
dans les sitemaps XML à « un sac de bruit ».
Donc, si vous comptez sur les moteurs de recherche pour explorer vos URL dans votre sitemap XML en fonction de la priorité, vous attendrez longtemps.
Je vous recommande de supprimer cette balise de vos sitemaps XML.
14. Si vous rencontrez des problèmes de structure de navigation, associez votre sitemap XML à un sitemap HTML
Il y a toujours eu des sentiments mitigés à propos des sitemaps HTML.
Mueller a partagé que les sitemaps HTML "ne devraient jamais être nécessaires".
Il a continué:
- "J'ai changé d'avis sur les sitemaps HTML au fil des ans, ils ne devraient jamais être nécessaires. Les sites petits et grands doivent toujours avoir une structure de navigation claire. Si vous ressentez le besoin d'un sitemap HTML, passez plutôt du temps à améliorer l'architecture de votre site. Les sitemaps HTML s'intègrent dans le même bac avec les spinners de chargement HTML.
<iframe src="https://mastodon.social/@johnmu/109477617298107922/embed" class="mastodon-embed" width="400" allowfullscreen="allowfullscreen"></iframe><script src="https://mastodon.social/embed.js" async="async"></script>
Lorsque vous travaillez sur de grands sites Web au niveau de l'entreprise, il existe souvent plusieurs couches de décideurs sur une structure de navigation de site Web. Et souvent, les meilleures pratiques de référencement sont prises en considération.
J'associe mon plan de site XML à un plan de site HTML jusqu'à ce que je sois confiant dans la navigation de notre site Web et la hiérarchie des liens internes.
15. N'oubliez pas d'inclure tous vos sitemaps XML dans votre fichier robots.txt
N'oubliez pas d'inclure vos sitemaps XML (tous) sous forme de liens dans votre fichier robots.txt.
Voici un exemple:
Ne vous inquiétez pas de l'endroit où ils doivent aller dans le fichier robots.txt. Il n'y a aucun impact sur l'emplacement de votre sitemap XML dans votre fichier robots.txt.
Mueller l'a confirmé :
Les sitemaps XML sont le modèle de votre site Web pour les moteurs de recherche
Que vous lanciez une nouvelle page Web ou que vous ajoutiez simplement une balise canonique à une page en double, votre sitemap XML est quelque chose que vous devez mettre à jour 24h/24 et 7j/7.
Mais faites-le avec prudence.
Bien que vous ne devriez pas être paranoïaque, votre sitemap XML est le plan de votre maison pour les moteurs de recherche.
N'oubliez donc pas de soumettre vos sitemaps XML à Google Search Console et Bing Webmaster Tools.
Les opinions exprimées dans cet article sont celles de l'auteur invité et pas nécessairement Search Engine Land. Les auteurs du personnel sont répertoriés ici.