Votre guide complet pour éviter le contenu dupliqué

Publié: 2021-05-25

Le contenu dupliqué est interprété comme un texte ou un bloc de texte qui est une copie exacte du contenu original qui a été trouvé sur un autre site Web. Les copies qui sont paraphrasées, même partiellement, ou détournées sont également considérées comme du contenu en double. Les sites Web qui volent le contenu d'autres pages ne sont généralement pas bien classés sur les moteurs de recherche.

Cependant, vous pouvez accidentellement produire du contenu en double sur votre propre site Web. Les pages qui utilisent les mêmes formulations et ont la même idée peuvent être considérées comme du contenu en double. Bien que Google ne pénalise pas nécessairement les sites Web pour avoir du contenu en double, cela peut affecter négativement votre classement dans les moteurs de recherche. Cela peut également avoir un effet négatif sur le trafic de votre site Web.

Pourquoi les spécialistes du marketing devraient-ils éviter le contenu dupliqué ?

Comme nous l'avons mentionné ci-dessus, le contenu dupliqué peut entraîner des problèmes avec le classement de votre moteur de recherche. Parmi les autres problèmes que vous pourriez rencontrer, citons les suivants :

  • Vos pages clés peuvent ne pas apparaître sur les SERP.
  • Des problèmes d'indexation peuvent survenir.
  • Les mesures de base du site telles que le trafic et les positions de classement seront affectées.
  • L'équité du lien sera diluée.
  • Votre autorité de domaine peut être compromise.

Les moteurs de recherche récompensent les sites Web avec un contenu unique en les plaçant plus haut dans le classement. Par conséquent, les spécialistes du marketing doivent toujours vérifier si leurs pages Web contiennent du contenu en double afin d'éviter que Google ne se trompe sur les pages qu'ils doivent classer.

Comment le contenu dupliqué peut affecter votre site Web

Les deux types de contenu dupliqué

Le contenu dupliqué peut être divisé en deux : le contenu dupliqué interne et le contenu dupliqué externe.

Le contenu dupliqué interne se produit au sein de votre propre site Web, ce qui peut être dû à la présence d'un contenu similaire sur différentes pages Web. Les autres causes de problèmes internes de contenu dupliqué sont les suivantes :

  • Les éléments sur la page tels que les titres de page similaires, les méta-descriptions et les en-têtes sont également classés comme contenu dupliqué. Pour éviter cela, créez des variantes uniques que vous pouvez utiliser pour chaque page.
  • Avoir la même description de produit pour les articles que vous proposez compte également comme contenu dupliqué. Si vous distribuez vos produits à d'autres revendeurs et sites Web tiers, envisagez de proposer différentes descriptions de produits pour chacun. Alternativement, vous pouvez simplement inclure un résumé et le lier à votre page principale lorsque vous fournissez tous les détails.

Le contenu dupliqué externe se produit lorsque d'autres webmasters copient votre contenu et le publient sur leurs propres sites Web. Voici les deux principaux exemples de contenu dupliqué externe :

  • Le contenu scrapé fait référence au contenu volé copié par un webmaster à partir d'un site Web qui n'est pas le sien. Ils ont généralement des outils qu'ils utilisent pour reformuler et transformer le contenu qu'ils ont volé et publié sur leur site. La plupart du temps, ces « grattoirs » ne prennent même pas la peine de remplacer le texte de marque dans le contenu. Vous pouvez rechercher du contenu scrapé et si vous en trouvez, vous pouvez le signaler à Google pour qu'il soit supprimé.
  • Le contenu syndiqué diffère du contenu scrapé en ce sens que vous autorisez la publication de votre contenu sur un autre site. Différents types de contenu, y compris des infographies, des vidéos et des articles de blog, peuvent être syndiqués. Pour éviter la duplication de contenu, demandez au propriétaire du site Web tiers s'il peut simplement syndiquer le titre, puis mettre un lien vers votre site Web pour afficher l'intégralité du contenu. Ajustez le titre et assurez-vous qu'il ne ressemble pas à celui que vous utilisez sur votre page. Cependant, la syndication de contenu présente un avantage, dans lequel le créateur de contenu original a la possibilité d'avoir de la publicité gratuite et des backlinks vers son site Web.

Comment puis-je parcourir Internet à la recherche de contenu dupliqué ?

Tout d'abord, vérifiez si vous avez des pages Web spécifiques qui sont mal classées sur les moteurs de recherche. Ensuite, suivez les étapes ci-dessous pour voir si votre contenu a été copié ailleurs :

  • Prenez des parties de votre contenu et placez-les dans la barre de recherche. Placez des guillemets au début et à la fin de la requête de recherche. De cette façon, vous dites à Google que vous recherchez des résultats avec exactement le même libellé. Si quelque chose en dehors de votre propre page Web apparaît, cela signifie que quelqu'un d'autre a copié votre contenu.
  • Allez sur Copyscape et voyez si vous pouvez trouver du contenu en double sur un autre domaine. Cet outil peut déterminer si votre contenu a été pris ailleurs.
  • Un autre outil que vous pouvez utiliser est Siteliner. Il vérifie automatiquement votre site Web une fois par mois pour s'assurer qu'il n'y a pas de contenu en double.
  • Plagiarismcheck.org est un outil payant qui détecte le texte paraphrasé et le contenu copié.

La vérification du contenu en double ne devrait pas prendre trop de temps et doit être pratiquée régulièrement pour vous assurer que vous tirez le meilleur parti de vos efforts de référencement.

Comment rechercher du contenu en double

Nous avons répertorié quelques mesures que vous pouvez prendre pour vous débarrasser du contenu et des pages en double :

1. Implémenter des balises canoniques

Les balises canoniques sont un moyen simple de faire savoir à Google les pages pour lesquelles vous essayez de vous classer avec certains mots-clés sur leur moteur de recherche. Par exemple, vous avez les pages A, B et C, et vous utilisez des mots-clés et des idées similaires pour toutes ces pages. Cependant, Google peut être confus quant aux pages à classer, car les pages contiennent essentiellement la même chose.

Pour éviter ce problème, il est essentiel de choisir une seule page pour laquelle vous souhaitez vous classer. Disons que la page A est la page que vous avez choisie. Vous pouvez mettre des balises canoniques sur chaque page, mais les pages B et C pointeront vers la page A. Les pages B et C sont toujours indexées, mais Google sait maintenant que la page A est l'autorité.

Les pages avec le même objectif de mots clés et le même contenu peuvent se concurrencer, c'est pourquoi la mise en œuvre de balises canoniques est indispensable. Sans cela, vos pages ne seraient pas classées sur la première page de Google.

Les plugins WordPress tels que Yoast offrent des fonctionnalités de balises canoniques qui sont utiles si vous avez plusieurs pages qui utilisent le même mot-clé et que vous essayez d'éviter d'être tagué avec du contenu et des pages en double.

2. Utilisez des balises méta

Les balises Meta robots peuvent être utilisées si vous souhaitez interdire l'indexation de certaines pages par Google. La balise meta robots "no index" empêchera Google et les autres moteurs de recherche d'afficher ces pages dans les résultats de recherche.

Cependant, vous devez être averti que l'utilisation des balises meta robots empêchera complètement les pages en double d'apparaître sur les moteurs de recherche. Si vous souhaitez que la ou les pages soient indexées, envisagez plutôt de suivre les conseils numéro un et trois.

L'importance d'utiliser des balises méta

3. Utilisez les redirections 301

La mise en œuvre des redirections 301 est l'un des moyens les plus simples de se débarrasser des pages en double sur votre site. L'ajouter aidera Google à rediriger l'audience vers la page d'origine. Cette étape est indispensable si vous reconstruisez votre site Web.

Les redirections 301 peuvent être effectuées sur les logiciels du serveur Web tels que IIS et Apache. Cela peut également être fait sur la programmation côté serveur, y compris JSP, PHP, ColdFusion, Perl et ASP/.net. Pour en savoir plus sur la mise en œuvre des redirections 301, cliquez ici.

4. Consolidez vos pages

Si vous ne voulez pas faire les trois choses que nous avons mentionnées ci-dessus, envisagez de compiler tout votre contenu similaire sur une seule page. Ici, vous pouvez envisager de réécrire certains de vos articles de blog similaires qui ont essentiellement la même idée et de les transformer en un article long. Cela aidera Google à reconnaître ces pages et à les classer en fonction des mots-clés que vous avez utilisés.

5. Soyez conscient du contenu scrapé

Le scraping de contenu se produit lorsque des sites Web tiers copient votre contenu textuellement, puis le publient eux-mêmes. Demandez toujours à ces sites de lier le contenu à votre site afin que Google sache que le vôtre est l'original. Vous pouvez également demander que le contenu ou la page copiés soient marqués avec la "balise noindex" pour éviter d'obtenir du contenu en double.

Outils pour trouver du contenu scrapé en ligne

6. Soyez cohérent avec les liens internes

Assurez-vous que vous utilisez la même URL lorsqu'il s'agit de liens internes. Vérifiez quelle est la version canonique du domaine et soyez cohérent avec vos liens internes tout au long de votre contenu.

7. Faites attention à la répétition standard

Évitez de placer le même texte protégé par des droits d'auteur au bas de chaque page Web, car même cela peut être marqué comme contenu en double.

Vous pouvez, à la place, mettre un résumé du texte et le lier à une page séparée. Cette page doit contenir toutes les informations importantes sur votre texte protégé par le droit d'auteur. Consolider votre contenu sur une seule page peut aider à éviter le contenu en double.

Conclusion

Planifier à l'avance et maintenir régulièrement votre site Web est une bonne pratique pour éviter le contenu dupliqué. Marquez toujours la source d'origine du contenu et indiquez à Google quelle page vous essayez de classer. Assurer l'unicité de votre contenu est également un bon moyen d'éviter le contenu dupliqué.

Comment se débarrasser du contenu dupliqué

Prendre les bonnes mesures pour éliminer le contenu dupliqué doit être basé sur la façon dont il a été mis en œuvre. Vous devrez peut-être exécuter une ou plusieurs tactiques pour faire savoir aux moteurs de recherche que votre contenu est celui à classer. N'hésitez pas à suivre les étapes décrites ci-dessus et à les appliquer sur votre site Web pour obtenir un meilleur classement sur les moteurs de recherche.