Ce que vous devez savoir sur le référencement des balises canoniques

Publié: 2022-02-22

Si vous n'êtes pas féru de technologie, le référencement des balises canoniques peut vous sembler compliqué et bizarre. Cependant, il s'agit d'un outil important dans votre arsenal d'optimisation pour les moteurs de recherche et irremplaçable lors de la gestion du contenu dupliqué. En comprenant à quoi servent les canoniques et comment les utiliser correctement, vous pouvez mieux optimiser vos pages et maintenir l'équité des liens.

Comme pour tout autre aspect du référencement, il existe de nombreuses spéculations sur ce que les canoniques peuvent et ne peuvent pas faire, et sur la manière dont ils doivent être utilisés. Étant donné que ces types de balises existent depuis plus d'une décennie maintenant, de nombreuses informations obsolètes et trompeuses circulent sur Internet.

Donc, dans cet article, nous parlons de tout ce que vous devez savoir sur le référencement des balises canoniques en 2022. Lisez la suite et prenez des notes !

Que sont les balises canoniques ?

Les balises canoniques sont des morceaux de code qui peuvent être placés dans la section d'en-tête du code HTML d'une page. Ils sont utilisés lorsqu'un site Web a des URL avec un contenu identique, similaire ou étroitement lié, et servent à indiquer aux moteurs de recherche laquelle est la plus importante.

Les balises de liens canoniques se présentent comme suit :

<link rel="canonical" href="https://example.com/text/text-text" />

Le lien à l'intérieur de la balise est l'URL de la page principale et, conformément aux réglementations de Google, doit être une URL absolue et non relative. Cela signifie que vous devez utiliser l'adresse complète de la page, y compris le protocole, le domaine et l'emplacement du contenu de votre site Web :

<link rel="canonical" href="https://example.com/text/text-text" />

au lieu de

<link rel="canonical" href="text/text-text" />

canonique 2

La source

Quels types de pages ont besoin de balises canoniques ?

Même si vous n'avez pas de contenu manifestement dupliqué, comme des pages répétitives, vous pouvez toujours avoir des URL en double qui peuvent confondre les bots et, potentiellement, entraîner des revers d'indexation. Ceux-ci peuvent être créés par votre système de gestion de contenu (CMS), causés par une incohérence dans la façon dont vous utilisez les chemins, des problèmes de protocole, etc.

Voyons donc quels types de pages peuvent bénéficier du référencement par balise canonique, et comment procéder dans chaque cas :

Quels types de pages ont besoin de balises canoniques

HTTP / HTTPS

Google donne la priorité au protocole HTTPS, donc, par défaut, si vous avez une page avec à la fois la version HTTP et HTTPS, et aucune redirection de la première vers la seconde, le bot affichera la version HTTPS comme canonique. Si vous ne souhaitez pas utiliser une redirection 301 et supprimer complètement la version HTTP, vous devez ajouter une balise canonique au HTTPS.

Cependant, si, pour une raison quelconque, vous souhaitez marquer la version HTTP comme la plus importante, vous pouvez y ajouter la balise canonique. Gardez à l'esprit, cependant, que Google peut toujours choisir d'afficher la version sécurisée, malgré vos recommandations.

www / non-www

Pour les bots, https://www.example.com/text et https://example.com/text ne sont pas une seule et même chose. Idéalement, vous devriez être cohérent dans l'utilisation d'une version www ou non-www de vos liens.

Cependant, vous ne pouvez pas être sûr de ce que vos visiteurs peuvent saisir dans les moteurs de recherche et les navigateurs, et de ce qu'ils peuvent mettre en signet. Canonicaliser l'une des versions garantira que les bots savent laquelle vous préférez et peuvent se concentrer dessus.

Copies de contenu inter-domaines

Si vous syndiquez le contenu, comme le font souvent les éditeurs numériques, ou si vous souhaitez publier un article sur plusieurs domaines, vous devez canoniser la page d'origine (celle de votre propre site Web).

Cela peut être fait en ajoutant la balise rel="canonical" à votre page et en demandant aux éditeurs de l'ajouter au code de leur page avec un lien vers l'original. De cette façon, tout le jus et l'équité des liens seront acheminés vers votre site Web.

De plus, les bots rencontrent le même contenu sur plusieurs emplacements, ils ne seront pas confus quant au lien à classer plus haut.

Pages mobiles

Si votre site Web n'est pas réactif et que vous disposez d'une version mobile autonome, Google considère les URL pour ordinateur et mobile comme des pages distinctes :

https://m.exemple.com/texte ≠ https://exemple.com/texte

Pour éviter toute confusion et empêcher la répartition de l'autorité entre les deux, vous devez définir un seul d'entre eux comme canonique. Avec l'indexation mobile d'abord en place, il est préférable de canoniser la page mobile.

Cependant, ne vous inquiétez pas - si l'utilisateur saisit une requête sur le bureau, les bots afficheront la version appropriée malgré la balise.

Pages AMP

Lorsque vous avez une version AMP du contenu, la meilleure pratique consiste à héberger la page AMP sur une adresse similaire à celle d'origine.

https://example.com/news
https://amp.example.com/news

Dans ce cas, vous devez canoniser la page principale et ajouter la balise canonique avec le lien d'origine dans le code de la version AMP. De cette façon, les bots identifieront plus facilement quelle est la page principale.

Liens avec les paramètres de recherche et les identifiants de session

Les identifiants de session et les paramètres d'URL confondent souvent les bots et peuvent les empêcher de réussir à indexer correctement vos pages. Si vous ne pouvez pas éviter de les utiliser, vous devez canoniser la page principale, afin que les bots sachent que les extensions dans l'adresse du lien sont simplement cela et non une nouvelle page.

Les paramètres sont le plus souvent utilisés pour mieux organiser le contenu sur les sites Web de commerce électronique. Ils ajoutent des valeurs à l'URL pour indiquer les variations du produit telles que la couleur, la taille et le type, et peuvent être utilisés pour appliquer divers filtres de recherche, des informations de suivi de campagne, etc.

Voici à quoi peut ressembler une page avec des paramètres :

https//www.example.com/page?key1=value1&key2=value2

au lieu de

https//www.exemple.com/page

Les ID de session peuvent être utilisés pour suivre le comportement d'un utilisateur individuel sur un site Web. Par exemple, dans une boutique de commerce électronique, l'ID peut être un remplacement de cookie qui montre au site Web quelles pages la personne visite. Les informations peuvent être utilisées pour que le panier de la personne et les derniers articles visités soient conservés jusqu'à ce qu'elle quitte le site Web.

Voici à quoi peut ressembler une page avec un ID de session :

https://example.com/index.jsp;jsessionid=07D3CCD4D9A6A9F3CF9CAD4F9A728F44

au lieu de

https//www.exemple.com/page

Idéalement, les robots doivent être suffisamment intelligents pour reconnaître à la fois les paramètres et les identifiants de session. Cependant, parfois, ils peuvent devenir confus et c'est pourquoi la définition de balises canoniques les aidera à consolider les classements des pages, au lieu de les distribuer.

Même contenu sous différentes catégories

Lorsque vous avez le même élément de contenu dans plus d'une catégorie sur votre site Web, vous avez plusieurs URL avec presque le même contenu menant à la même page :

https://example.com/category1/text-text/
https://example.com/category2/text-text/

Si vous ne marquez pas l'une des pages comme canonique et que vous ne l'y reliez pas de manière cohérente dans votre stratégie de création de liens internes, le bot les considérera comme des doublons. Cela ne fera pas seulement perdre du temps (et du budget d'exploration) à décider lequel montrer à l'utilisateur, mais peut même classer les deux séparément.

Pages d'auto-référence

Bien que cela puisse sembler redondant, l'auto-référencement est une chose et a été confirmé par John Mueller de Google comme ayant une valeur SEO dans une réponse à la question d'un utilisateur sur Reddit :

différence entre canonique et canonique auto-référencé

<link rel="canonical" href="b.html" /> Si c'est sur a.html, alors c'est juste un canonique normal (élément de lien techniquement canonique), si c'est sur b.html, alors c'est un auto-référentiel une.

Puisque vous ne savez pas comment les gens se lient à vos pages, une page auto-référentielle aide à nettoyer les petites erreurs. Par exemple, si un lien va vers b.html?utm=cheese, alors généralement le serveur affiche simplement b.html, et un élément de lien canonique auto-référentiel encouragerait alors les moteurs de recherche à utiliser simplement "b.html" au lieu de "b.html?utm=fromage".

En un mot, la page d'origine peut et doit également être étiquetée avec un rel=canonical, afin qu'il soit plus clair pour les bots qu'il s'agit bien de l'original.

Versions linguistiques du site Web

Si vous avez différentes versions linguistiques de votre site Web, vous souhaiterez peut-être définir comme canonique une seule d'entre elles. Dans ce cas, vous pouvez ajouter la balise auto-référençante rel=canonical au code de celle que vous considérez comme principale, et faire pointer les autres vers elle.

Pour permettre à Google de comprendre plus facilement pourquoi les deux pages ont un contenu similaire ou identique mais pas dupliqué, vous devez utiliser les attributs de balise hreflang. Par exemple, si votre site Web a des versions en anglais britannique, anglais américain et espagnol, vous pouvez ajouter les extraits suivants à chaque version respective :

lien rel = "alternate" href = "http://example.com" hreflang = "en-us" />
lien rel = "alternate" href = "http://example.com" hreflang = "en-uk" />
lien rel=”alternate” href=”http://example.com” hreflang=”en-es” />

et marquez la version anglaise des États-Unis comme version canonique.

Cependant, gardez à l'esprit qu'en fonction de l'emplacement de l'utilisateur, Google aura le dernier mot sur la page à afficher et peut ignorer votre suggestion.

À quoi sert le référencement des balises canoniques ?

rel canonique

En un mot, l'objectif principal du référencement des balises canoniques est de gérer la duplication et de préserver l'équité des liens. Lorsque, pour une raison ou une autre, vous avez plusieurs URL qui mènent à la même page, les bots peuvent devenir confus quant à l'URL à classer.

En tant qu'être humain, vous voyez les liens comme, pratiquement, la même chose. Cependant, pour le bot, chaque URL a sa signification. Si vous ne précisez pas celui que vous considérez comme le plus important, Google fera ce choix pour vous. Cependant, vous et Google pouvez avoir des priorités différentes et une compréhension différente de l'importance d'un lien.

De plus, si vous ne spécifiez pas quel est le chemin canonique, chaque lien séparé sera proposé aux utilisateurs dans les résultats de recherche sous une forme différente. Cela signifie que toute l'autorité et le jus de lien s'écouleront entre les pages, au lieu de s'accumuler dans une seule d'entre elles.

Encore une fois, Google décidera d'accepter l'une des pages comme canonique, mais s'il n'a pas d'instructions auxquelles se référer, théoriquement, il pourrait prendre une décision différente à chaque fois.

Pourquoi vous ne devriez pas abuser des balises canoniques ?

Les gens doivent être prudents avec le référencement des balises canoniques. Si vous essayez de manipuler les robots ou d'utiliser les balises à mauvais escient pour une autre raison (nous fournirons des exemples), vous risquez de confondre les robots d'indexation et ils peuvent renoncer à indexer vos liens.

De plus, les canoniques mal placées sur les grands sites Web peuvent épuiser votre budget de crawl. Si les robots ne sont pas sûrs de ce qui se passe avec vos pages, ils continueront d'essayer de le comprendre, au lieu d'explorer le nouveau contenu que vous avez publié. Cela retardera leur travail et affectera les performances de votre site Web dans les classements de recherche de Google.

En bref, si vous utilisez les canoniques de la mauvaise manière, vous risquez de créer des problèmes là où il n'y en avait pas.

Idées fausses courantes sur les balises canoniques SEO

Voici les idées fausses les plus courantes sur les balises canoniques en SEO. Nous l'avons résumé ici pour plus de clarté :

  • Google est obligé de les respecter. Faux. Les canoniques sont des recommandations et non des règles. Ils servent à suggérer à Google les pages en double que vous considérez comme les plus importantes. Cependant, même avec ces balises, les bots peuvent toujours décider qu'une autre page est plus appropriée et la choisir plutôt que celle que vous voulez
  • Ils sont utilisés pour regrouper le contenu par sujet. Le seul but des canoniques est d'aider les bots à trier les URL en double. Cela signifie que si vous avez des pages sur des sujets similaires, mais ciblez des mots-clés différents et avez un contenu différent, les balises canoniques ne sont pas le bon outil pour unir leur équité de lien. Si deux pages sont très différentes, mais sont connectées avec un rel=canonical, les bots continueront à les explorer, essayant de comprendre pourquoi la balise est là, et cela gaspillera inutilement le budget de crawl.
  • Les balises canoniques peuvent remplacer les redirections. La canonisation n'a pas le même poids que les redirections, car, comme indiqué ci-dessus, ce n'est pas une directive, mais une suggestion. Donc, si vous ne voulez pas qu'une page soit accessible ou priorisée, la balise n'aidera pas
  • Vous devriez toujours utiliser des canoniques. Pas nécessairement. Le but ici est de contourner les problèmes techniques qui ne devraient pas exister en premier lieu. Si vos URL sont cohérentes sur l'ensemble de votre site Web et que vous ne rencontrez pas les problèmes dont nous avons parlé précédemment, vous n'aurez peut-être pas besoin de balises canoniques. Cela dit, si vous n'êtes pas sûr, vous pouvez utiliser la balise rel=canonical pour référencer uniquement les pages qui sont les plus importantes pour vous, juste au cas où.

Comment consolider une page en tant que canonique

Bien que Google ait toujours le dernier mot sur la page qu'il considère comme canonique, il existe des moyens de recommander fortement celle que vous préférez.

Comme le savent les personnes qui se sont occupées du référencement, Google utilise divers signaux pour décider comment explorer, comprendre et indexer le Web. Si vous utilisez les bons, il est plus susceptible de vous écouter.

Dans le cas des canoniques, John Mueller de Google dit que les bots, en effet, essaient de lire ce que le site Web veut qu'ils fassent.

Alors, comment dire à Google ce que vous voulez, à part ajouter la balise de lien rel="canonical" à votre en-tête HTML ?

Comment consolider une page en tant que canonique

Canonicaliser les URL HTTPS

Google préfère fortement les chemins HTTPS aux chemins HTTP, car ils disposent des certificats SSL (ou TLS) et offrent un transfert d'informations plus sécurisé. Donc si vos liens utilisent les deux types, Google sera attiré par le HTTPS.

Pour éviter de confondre les bots et de les obliger à choisir entre ce qu'ils savent être la bonne chose à faire et ce que vous semblez les forcer à faire, il est préférable de toujours canoniser les liens HTTPS.

Ajoutez uniquement les URL canonisées à votre sitemap

Le sitemap XML est un outil important dans votre stratégie de référencement et vous permet d'aider les bots à hiérarchiser et indexer votre contenu. Google considère toutes les URL de la carte comme canoniques par défaut, car elles sont censées être vos pages les plus importantes - celles que vous lui demandez d'indexer.

Ainsi, lorsque vous créez votre carte, assurez-vous de n'ajouter que les pages que vous considérez comme des copies maîtresses.

Optimisez vos URL

Les robots se soucient également de l'apparence de vos URL. Cela signifie que l'utilisateur peut ou non facilement leur donner un sens. Les liens avec des paramètres qui prêtent à confusion sont plus susceptibles d'être évités car Google a tendance à choisir ce qui est affiché dans les SERP. Bien qu'il soit possible qu'un tel lien soit classé s'il correspond parfaitement à la requête de l'utilisateur, il vaut mieux prévenir que guérir.

Ajouter des liens internes uniquement aux URL canoniques

Les liens internes sont un excellent moyen de montrer à Google quels liens ont plus de poids que d'autres. Lorsque vous ajoutez des liens vers vos articles, assurez-vous qu'ils sont toujours canonisés et pointent vers l'URL principale. De cette façon, les robots sauront quelles pages sont les plus importantes et les considéreront comme plus pertinentes.

Utiliser les redirections

Lorsque l'une des pages en double ne vous est plus utile, la meilleure façon de dire à Google que vous ne voulez pas qu'elle soit explorée et indexée est de créer une redirection de serveur 301. De cette façon, au lieu de visiter les deux pages et d'avoir à choisir, les bots ignoreront complètement l'ancienne au profit de la nouvelle.

Ceci est particulièrement recommandé lorsque vous installez SSL ou TLS sur votre site Web et que tous vos liens HTTP deviennent HTTPS. La création de redirections garantira que toute personne ayant l'ancien lien mis en signet ou en backlink sera automatiquement redirigée vers la nouvelle adresse sécurisée. Cela évitera aux bots d'avoir à prendre une décision eux-mêmes.

Cependant, gardez à l'esprit qu'avec les redirections, l'ancienne page devient complètement inaccessible à la fois à Google et aux utilisateurs. Il s'agit d'une mesure drastique et ne devrait être utilisée que si vous n'avez vraiment plus besoin de la page, mais que vous souhaitez conserver son équité. De plus, trop de redirections peuvent potentiellement ralentir votre site Web.

Conclusion

Le référencement des balises canoniques n'est pas compliqué lorsque vous le comprenez et savez utiliser les bonnes balises.

Ce qu'il est important de retenir, c'est que l'objectif principal des attributs rel=canonical est de gérer la duplication d'URL et d'aider les bots à comprendre pourquoi différentes URL pointent vers un contenu similaire.

Si vous n'êtes pas féru de technologie et avez besoin d'aide pour gérer le référencement canonique de votre site Web, n'hésitez pas à nous appeler !