Estimations de trafic tierces par rapport à Google Analytics : pourquoi l'analyse de Rand Fishkin n'est pas fiable
Publié: 2023-01-24Rand Fishkin est l'un des noms les plus respectés de l'industrie du référencement et pour une bonne raison. Après avoir lancé et dirigé Moz, l'une des principales sociétés dans le domaine des logiciels de référencement, il a fondé pendant plus d'une décennie la société d'analyse de contenu SparkToro.
Je suis un admirateur du travail de Fishkin depuis longtemps. En 2015, lorsque j'ai lancé ma propre agence de marketing numérique, je me souviens d'avoir regardé ses vidéos Whiteboard Friday pour améliorer mon jeu de référencement. Et son compte Twitter a été ma source incontournable pour trouver des pépites de sagesse commerciale.
Voici mon tweet préféré de tous les temps de Fishkin :
La meilleure façon de vendre quelque chose – ne vendez rien. Gagnez la prise de conscience, le respect et la confiance de ceux qui pourraient acheter.
— Rand Fishkin (@randfish) 4 février 2015
Ses mémoires Lost and Founder mettent en lumière son expérience en affaires et en référencement. C'est l'un de mes livres d'affaires préférés - une lecture incontournable pour quiconque cherche à démarrer ou à développer une entreprise et à naviguer dans les hauts et les bas qui l'accompagnent.
Récemment, Fishkin a publié une étude approfondie comparant les estimations de trafic de tiers avec les données de trafic de Google Analytics sur le blog SparkToro. Cette étude a généré beaucoup de buzz dans la communauté SEO et la réponse a été mitigée.
Bien que l'analyse elle-même soit louable, les résultats semblent prédisposés et ne parviennent pas à éliminer complètement les biais.
Il est essentiel que lors de l'évaluation de toute analyse, les gens jettent un regard critique sur la méthodologie, les sources de données et tout biais potentiel.
Dans cet article, nous décomposerons l'analyse de Fishkin et examinerons pourquoi les données pourraient ne pas être fiables pour les utilisateurs SEO.
Collaboration avec Similarweb
Aux fins de cette étude, SparkToro a acquis des mesures auprès de quatre fournisseurs de données d'estimation de trafic - Semrush, Datos, SimilarWeb et Ahrefs - et les a comparées aux chiffres rapportés par Google Analytics.
Mais quelque chose qui n'est pas mentionné dans l'article est le fait que Fishkin et SparkToro ont travaillé en étroite collaboration avec Similarweb sur ce projet. En tant que tel, il n'est pas complètement impartial.
Voici le tweet de Fishkin qui le prouve :
Compte tenu de ces biais et limites potentiels, il est important de prendre les résultats de cette analyse avec un grain de sel.
Défaut dans la méthodologie
Dans l'article, Fishkin affirme que plus de 1 000 participants ont partagé les données de trafic Google Analytics de leurs sites Web avec SparkToro.
Selon Fishkin :
"1 053 sites Web ont partagé du trafic avec nous, mais nous avons considérablement nettoyé cet ensemble de données avant d'exécuter nos analyses. Nous avons exclu les sites pour lesquels les tiers n'avaient pas de données.
La raison pour laquelle ils ont nettoyé leur ensemble de données de manière significative n'est pas très claire. Ont-ils supprimé tous les sites pour lesquels l'un des outils n'avait aucune donnée ? Si c'est le cas, cela pourrait affecter le résultat.
Si tous les sites Web avaient été inclus dans la recherche, les chiffres auraient pu être différents.
Il est important de noter que Similarweb n'a pas de données pour les petits sites Web (> 5 000 visites). Cela montre que l'échantillon est biaisé et qu'il ne s'agit certainement pas d'un ensemble aléatoire de domaines.
Un autre point de discorde dans l'étude est le manque de clarté sur le type d'estimations de trafic fournies par les outils de référencement tiers.
Voici comment Fishkin explique cette situation difficile :
"Il est difficile de dire à partir de leurs sites Web si Ahrefs et Semrush essaient d'estimer le trafic global ou simplement le trafic de recherche. Si c'est ce dernier cas, Semrush en particulier pourrait envisager de se lancer dans le jeu de l'analyse concurrentielle.
Contrairement aux affirmations de Fishkin, il n'est pas si difficile de trouver le type de trafic estimé par Semrush et Ahrefs.
Ahrefs estime uniquement le trafic organique. Voici un tweet de Tim Soulo, CTO d'Ahrefs, qui valide cela :
Ahrefs estime exclusivement le trafic de recherche.
Et autant que je sache, Similarweb et Semrush donnent tous deux des estimations du trafic global. pic.twitter.com/GnXhd0o4ch
– Tim Soulo (@timsoulo) 22 novembre 2022
Semrush, en revanche, dispose de deux types de données disponibles. Le premier est le trafic organique dans les outils de référencement, et le second dans les outils .Trends.
Alors que Domain Analytics de Semrush effectue des estimations basées uniquement sur les positions des mots-clés et leur trafic estimé, Traffic Analytics effectue des estimations en analysant les données de flux de clics sur toutes les sources de trafic, y compris la recherche.
Étant donné que SparkToro a comparé des concurrents complètement différents, et peut-être différents ensembles de données, la méthodologie de recherche et les analyses manquent de rigueur et de transparence.
De plus, Fishkin ne fournit aucune information sur les pays utilisés pour cette étude spécifique.
On ne peut que supposer que SparkToro analysait les données de trafic aux États-Unis. Mais il y a aussi le fait que les données mondiales sont les seules données disponibles par défaut dans Similarweb. Les données individuelles pour chaque pays sont achetées séparément. En conséquence, il n'est pas clair quelles données ont été utilisées pour la comparaison dans cette étude.
Il n'y a aucune mention des catégories/niches des sites Web non plus.
Vous trouverez également plusieurs graphiques dans l'étude. Fishkin considère le graphique ci-dessous comme son préféré :
Ce graphique montre chacun des quatre fournisseurs de données ainsi que le pourcentage de fois où leur métrique de trafic était à moins de 30 % des utilisateurs signalés par Google Analytics pour le mois. Les sites Web ont également été segmentés en fonction du trafic qu'ils reçoivent.
Maintenant ma question est : pourquoi Fishkin a-t-il choisi 30 % ? Pourquoi n'est-ce pas 20 % ou 40 %? Quelle est l'idée derrière le nombre?
Le raisonnement derrière le pourcentage choisi de 30% pour cette étude semble être subjectif, sans explication claire quant à la raison pour laquelle ce chiffre exact a été sélectionné. C'est juste un pourcentage aléatoire spécialement choisi pour cette étude.
Bien qu'un écart de 30 % soit permis, on ne sait pas quel serait le résultat si le pourcentage était réduit ou augmenté. En fin de compte, la réponse à cette question reste un mystère.
Ensuite, il y a ce graphique qui montre la plage d'estimation du trafic tiers pour 46 sites avec plus de 250 000 utilisateurs GA mensuels :
Ce tableau est honnêtement inutile et ne fournit aucune valeur aux utilisateurs. Il est destiné à comparer les données de deux sites Web particuliers, montrant les écarts les plus grands et les plus petits en fonction de leurs données Google Analytics. Cette méthode de tirer des conclusions est très peu fiable, car elle est basée sur seulement 46 sites Web - une très petite taille d'échantillon.
Commentaires de la communauté SEO
Rand Fishkin a utilisé quatre des outils de référencement SaaS les plus populaires du marché pour cette étude. En tant que tel, il était inévitable que les résultats reçoivent une abondance de commentaires.
Et la communauté SEO n'a pas déçu.
Alors que certains experts ont trouvé les informations de l'étude utiles, une grande partie de la communauté a remis en question la faiblesse de la méthodologie et le biais inhérent à l'étude.
Le spécialiste du marketing numérique Kris Roadruck a noté que l'étude utilisait les utilisateurs comme métrique préférée et non les sessions ou les pages vues pour comparer Google Analytics aux outils qui signalent les visites organiques.
Pourquoi les utilisateurs (et non les sessions ou les pages vues) ? Cela semble un choix étrange lors de l'analyse comparative avec des outils signalant des recherches/visites organiques ?
– Kris Roadruck (@KrisRoadruck) 22 novembre 2022
Et puis il y a les commentaires sur l'article lui-même. Un utilisateur a commenté la méthodologie bizarre consistant à comparer les données de trafic d'Ahrefs, qui ne sont pas substantielles, à celles de Semrush et Similarweb.
Dernières pensées
Bien que l'étude de Fishkin fournisse quelques informations et informations précieuses, il est essentiel de prendre en compte d'autres perspectives et sources lors du test de l'exactitude des estimations de trafic tierces.
Il est toujours recommandé de croiser les résultats avec d'autres outils et méthodologies et de ne pas se fier uniquement à une seule source, qui dans ce cas, semble être biaisée en faveur de Similarweb.
Articles Liés
- 11 meilleures chaînes YouTube SEO pour améliorer votre jeu SEO
- BuzzSumo : Le guide ultime (18 façons avancées d'utiliser BuzzSumo)
- 50 meilleures citations navales Ravikant pour vous inspirer