Utiliser des URL canoniques

Publié: 2015-06-30

Vous avez peut-être entendu parler des URL canoniques, mais vous ne savez pas ce que c'est ? Et comment l'utiliser ?

Détendez-vous, cet article posera des bases claires sur les URL canoniques

Le balisage canonique n'est rien d'autre que l'ajout d'un élément HTML au section d'une page html. Cela aide Google à identifier le contenu en double en spécifiant le mot "Canonical", Google identifiera quelle est la version préférée (URL) de la page. Il est également pris en charge par Yahoo et Bing

Pour Google, afficher des pages pertinentes est le plus important et l'un des principaux défis pour Google est d'éviter d'afficher des pages en double dans les résultats de recherche dans Analytics. Le balisage canonique aide Google à identifier les pages en double et à n'afficher que les pages pertinentes. L'objectif fondamental du balisage canonique est simplement de garder le contenu en double hors de l'index du moteur de recherche tout en consolidant la force de la page préférée.

Avant d'aller plus loin, il faut connaître les conditions dans lesquelles surgit la duplicité des contenus.

Sur Internet, des problèmes de contenu dupliqué peuvent survenir dans les conditions suivantes.

1) Le même contenu est accessible à partir de différentes URL

peuvent être considérées comme des pages différentes par les moteurs de recherche même si elles représentent le même contenu et la même page.

2) Un autre exemple classique est qu'il existe différentes URL pour la même page, mais que le contenu est affiché sous forme de tableau et que les résultats sont triés différemment.

3) Lorsqu'un site est configuré pour afficher les résultats en version https, http ou non www.
Les moteurs de recherche considèrent ci-dessus trois URL différentes comme des URL différentes, bien que toutes aient le même contenu.

4) Le contenu que l'on pourrait avoir créé pour un blog est syndiqué sur d'autres sites ou reproduit en totalité ou en partie.

Exemple : Disons que blog.edupristine.com/first-post.html est également syndiqué sur son site sœur www.edpri.com/blog/first-post.html bien que le contenu soit le même, le moteur de recherche pourrait considérer comme des URL complètement différentes.

Alors, comment cela est-il mis en œuvre?

Prenons un exemple de cas réel sur Flipkart.com

Généralement, dans les sites de commerce électronique, une page de produit unique peut être une URL dynamique basée sur la session de l'utilisateur, les préférences de recherche, le tri, etc.

Par exemple : toutes les pages suivantes montrent que le produit Moto E principalement sur Flipkart a des URL différentes

• http://www.flipkart.com/mobiles-accessories/pr?p%5B%5D=sort%3Drelevance&sid=tyy&filterNone=true&q=moto

• http://www.flipkart.com/mobiles-accessories/pr?p%5B%5D=sort%3Dpopularity&sid=tyy&filterNone=true&q=moto

• http://www.flipkart.com/moto-e-1st-gen/p/itme7zd2zsjgbhxg?pid=MOBDVHC6XKKPZ3GZ

• http://www.flipkart.com/moto-e-1st-gen/p/itme7zd2zsjgbhxg

Mais toutes ces pages pointent vers un seul produit, c'est-à-dire Moto E.

Il est important pour Google & Flipkart d'identifier que toutes ces pages appartiennent au même produit/service et il appartient aux webmasters d'aider Google à identifier de toutes ces pages quelle est la page préférée. Cette page préférée serait affichée dans la page de recherche.

Ici http://www.flipkart.com/moto-e-1st-gen/p/itme7zd2zsjgbhxgURL est la page préférée et donc dans toutes les pages mentionnées ci-dessus, la balise html suivante est ajoutée

Avec cela, Google identifie et donne le résultat de recherche de préférence à la page ci-dessus.
Voir l'image ci-dessous pour référence.

marquage canonique par flipkart

On voit le code source du produit moto-e, toutes les pages ont la même balise canonique

Voir l'image ci-dessous pour référence.

marquage canonique par flipkart

Avantages des balises canoniques

1. L'utilisation de balises canoniques aide Google à lier les pages de contenu en double et similaires afin que Google puisse regrouper les informations sous différentes pages sous une seule page préférée.

2. Les balises canoniques nous aident également à obtenir de meilleures mesures de suivi, car il est difficile de suivre plusieurs URL pour le même contenu.

3. Les balises canoniques aident à déterminer l'URL que les utilisateurs souhaitent voir.

4. Les balises canoniques aident à traiter la syndication de contenu d'URL qui sont publiées sur divers domaines vers l'URL préférée

En plus de l'exemple montré avec l'étude de cas Flipkart, on peut/doit faire l'action suivante pour améliorer la visibilité de la recherche comme suggéré par Google

1. Définir votre domaine préféré dans la section des webmasters

Dans Google webmasters pour un site Web, on peut définir sa configuration préférée
c'est-à-dire qu'une fois ces ensembles terminés, Google préférera la version sélectionnée pour les résultats de recherche

2. Utilisation de la balise html de l'URL préférée avec l'élément de lien HTML rel="canonical"

Voir comme mentionné ci-dessus dans l'exemple flipkart Moto E

3. Utilisez les redirections 301 pour les URL

Par exemple; Dans une page telle que

On peut choisir une page comme canonique et le reste peut être redirigé vers cette URL de page canonique sélectionnée.

4. Comme mentionné par Google lui-même, pour les liens canoniques, Google préfère HTTPS à HTTP, sauf lorsqu'il existe des signaux contradictoires tels que les suivants :

• La page HTTPS a un certificat SSL non valide/contient des dépendances non sécurisées

• La page HTTPS est robotisée (et la page HTTP ne l'est pas).

• La page HTTPS redirige les utilisateurs vers ou via une page HTTP.

• La page HTTPS a un lien rel=”canonical” vers la page HTTP.

• La page HTTPS contient une balise meta noindex robots

On peut garantir ce comportement en prenant l'une des actions suivantes :

o Ajoutez des redirections 301 ou 302 de la page HTTP vers la page HTTPS.

o Ajoutez un lien rel="canonical" de la page HTTP vers la page HTTPS.

5. Gestion des paramètres dynamiques dans les URL

On peut informer Google d'ignorer certains paramètres dans une URL

c'est-à-dire la fourchette de prix ("De à" dans la chaîne d'URL ou l'identifiant de session dans une URL)

6. Utilisation du lien canonique dans l'en-tête http pour les pages non HTML (PDF, etc.)

Une configuration dans le serveur Web où en utilisant rel="canonical" dans l'en-tête http pour

Indiquez l'URL canonique pour les documents HTML, PDF, etc.

Dans ce cas, on peut utiliser un en-tête HTTP rel="canonical" pour spécifier à Google l'URL canonique du fichier PDF, comme suit :

rel="canonique"

Le balisage canonique est très important pour le référencement car il aide directement Google dans son algorithme de recherche. Le balisage canonique a donc une grande importance dans les algorithmes de Google.

Les URL canoniques sont extrêmement importantes pour les entreprises de commerce électronique, les sites à fort contenu et les sites où le trafic de recherche est important

J'espère que cet article répond à toutes vos questions. Sinon, laissez un commentaire et je ferai de mon mieux pour dissiper tous vos doutes.