Comment la fuite Yandex changera à jamais votre plan de jeu SEO

Publié: 2023-01-31

Récemment, une partie du code source de Yandex a été divulguée.

Qu'est-ce que cela signifie pour votre référencement ?

Penses-y…

Comprendre leur code source vous donnera un aperçu du fonctionnement interne du moteur de recherche. Cela vous donne la possibilité d'analyser les facteurs de classement Yandex et de les comparer à ceux utilisés par Google.

Alors que Google est connu pour ses données complexes et riches, il convient de noter que Yandex détient toujours une part de marché importante dans certaines régions, notamment en Russie. La fuite de code source Yandex est une opportunité précieuse pour la communauté SEO de comprendre comment Yandex note et classe les pages.

Dans cet article, je décomposerai certains des thèmes de haut niveau que nous voyons et vous montrerons certains éléments uniques des algorithmes qui pourraient changer votre façon de faire du référencement à l'avenir.

Mais d'abord, explorons pourquoi l'analyse des algorithmes Yandex est si importante.

Pourquoi regarder Yandex ?

La fuite Yandex nous a donné la toute première opportunité de voir le code source réel d'un moteur de recherche majeur. Comme vous le savez, Google a toujours donné des conseils généraux qui ne révèlent pas les spécificités du moteur de recherche.

Cela signifie que nous nous sommes toujours appuyés sur les tests utilisateurs pour comprendre comment rendre notre contenu plus visible dans les résultats de recherche.

Maintenant, pour la première fois, nous pouvons voir certains des rouages de l'algorithme de recherche de Yandex, y compris des détails sur les facteurs de classement utilisés pour déterminer la pertinence et l'autorité d'une page Web. Cela a fourni des informations précieuses sur la manière dont Yandex examine le classement de recherche.

Le code source de Yandex a mis en lumière certains systèmes de notation importants utilisés par le moteur de recherche Yandex. Cela soulève la question. Pouvons-nous supposer que Google utilise des facteurs de classement similaires ?

Après analyse, il est clair que la liste des facteurs de classement de Yandex est nettement plus petite que ce que nous attendons de Google. Cependant, cela ne signifie pas que les facteurs utilisés par Yandex sont moins importants.

En fait, jusqu'à présent, la communauté SEO n'était peut-être pas au courant de nombreux facteurs que nous observons chez Yandex. Cela signifie que comprendre ces facteurs pourrait vous donner un avantage SEO à l'avenir.

Vous pourriez avoir une occasion en or de réévaluer vos stratégies d'optimisation et éventuellement de découvrir de nouvelles façons d'améliorer le classement des pages.

Maintenant, avant que je sois accusé de diffuser des informations erronées, je ne dis pas que Google utilise l'un de ces facteurs de classement. Je pose juste la question.

En outre, il convient de noter que cette fuite peut également offrir de nouvelles opportunités aux spammeurs pour exploiter ces systèmes. En tant que professionnels du référencement, il est important de rester vigilant et de continuer à se concentrer sur les techniques d'optimisation éthiques.

Comportement de l'utilisateur

Il est très intéressant de voir l'accent mis par Yandex sur le comportement des utilisateurs. Selon le code source divulgué, Yandex prend en compte des mesures telles que le taux de clics (CTR) et le temps d'attente pour déterminer la pertinence et l'autorité d'une page Web. Il y a 150 facteurs de classement autour de cela (environ 8% de tous les facteurs).

En outre, de nombreux facteurs ressemblent étonnamment à ce que Google préconise depuis des années. Ce à quoi je fais référence, c'est de mettre l'accent sur les facteurs de référencement traditionnels tels que les backlinks et l'utilisation des mots clés.

Il existe des centaines de facteurs qui utilisent directement ou indirectement le PageRank, un système qui classe les pages Web en fonction du nombre et de la qualité des liens pointant vers elles (Google, qui a inventé le PageRank, a été le premier moteur de recherche à mesurer et à noter les pages en fonction de celui-ci. )

Les implications de cette fuite sont importantes pour les professionnels du référencement qui cherchent à optimiser leur contenu pour Yandex.

Dans l'ensemble, la fuite du code source de Yandex fournit des informations précieuses sur le fonctionnement interne d'un moteur de recherche majeur et offre de nouvelles opportunités pour améliorer vos stratégies d'optimisation.

Analyse et statistiques

Parlons des chiffres et abandonnons quelques mesures. Nous devons en tant que commerçants. ;)

Il existe 1922 facteurs de classement, vous pouvez tous les trouver ici.

Les facteurs de classement sont regroupés. Vous trouverez ci-dessous un tableau montrant les principaux groupes.

D'accord, entrons dans certains des facteurs de classement.

Facteurs de classement Yandex

En fouillant dans les informations, je peux identifier deux thèmes évidents qui méritent d'être notés :

Annotation
Facteurs de requête

Annotation

D'après ce que je vois, de nombreux facteurs sont regroupés. L'un des principaux groupes s'appelle Annotation. Ce groupe comprend des éléments tels que UX, CTR, taux de rebond et temps de séjour.

D'après ce que je vois, l'annotation est un facteur majeur qui inclut l'analyse sémantique du score de la page et les prédictions du CTR. De plus, il semble qu'il pourrait y avoir un index d'annotation. Nous pouvons voir qu'ils utilisent plus qu'un seul facteur pondéré sémantique. Vous pouvez trouver le classique Weighted BM15, parmi les schémas pondérés propriétaires qu'ils semblent utiliser.

En termes simples, BM25 est un algorithme qui mesure les documents dans l'index du moteur de recherche et mesure leur pertinence par rapport à la requête de recherche d'un utilisateur. C'est un modèle de sac de mots qui mesure les mots dans un document mais ne tient pas compte de la grammaire et de l'ordre des mots, et se concentre sur la fréquence à laquelle les mots apparaissent dans le document.

Facteurs de requête

Viennent ensuite les facteurs de requête. Ces facteurs semblent être les facteurs les plus courants et les plus simples tels que :

Wordcount (Factor #59) où vous pouvez voir la formule réelle utilisée : Min (nombre de mots de requête/10, 1.f) - Veuillez ne pas commencer à spammer les pages en conséquence. ;)
Nombre de mots inversé (Facteur #60) : affiche une formule simple de "1 / number_of_words_in_query".
IDF (Inverse Document Frequency) : Il s'agit d'une mesure utilisée dans le traitement du langage naturel et la recherche d'informations pour refléter l'importance d'un terme dans une collection ou un corpus de documents. La plupart des référenceurs devraient le connaître car certains outils l'utilisent dans des rapports tels que le rapport Rank Ranger TF-IDF.
Quelque chose de très intéressant ici est de voir qu'ils catégorisent et prennent en compte si la requête est une NightQuery ou une MorningQuery, et aussi à des heures précises.

Maintenant, il y a beaucoup plus à voir ici. Je regarde simplement les facteurs d'annotation et de requête afin de garder ce message aussi court que possible.

Voici un bref résumé des principaux facteurs de classement.

Résumé des facteurs de classement

Le PageRank reste un facteur de référencement
Les backlinks sont cruciaux
Le CTR (taux de clics) et le taux de rebond sont des facteurs majeurs
Des audits de site fréquents pour corriger les erreurs 404/5xx sont cruciaux pour optimiser le référencement
Les facteurs sur la page continuent de jouer un rôle dans le référencement, allant de l'analyse de base à une analyse plus avancée et sémantique
Le classement des pages sur le moteur de recherche Yandex peut être affecté par le comportement de l'utilisateur, y compris le nombre de fois qu'une URL est ajoutée aux signets de l'utilisateur et le temps actif passé sur une page après avoir cliqué sur une requête du moteur de recherche, tel que mesuré par le Outils de barre et de navigateur Yandex.
La position moyenne du domaine dans toutes les requêtes est un facteur de classement.
La profondeur de crawl est un facteur de classement.
Si une URL est la dernière visitée dans une session de recherche, cela signifie que l'utilisateur a trouvé ce qu'il cherchait.
Avoir Google Analytics sur le site est un facteur de classement. Imagine ça…
UX (expérience utilisateur) englobe divers facteurs qui évaluent la qualité de l'expérience utilisateur sur une page, tels que les vidéos cassées, les liens, le nombre d'annonces, les interactions de la page et les visites répétées, qui sont tous mesurés.

Maintenant que nous avons examiné certains des facteurs de classement à un niveau élevé, examinons maintenant certains des facteurs les plus inattendus.

L'examen de ces facteurs vous donnera une nouvelle perspective et, espérons-le, vous donnera de nouvelles opportunités de tester

Nouvelles opportunités : facteurs de classement inattendus

L'algorithme de recherche de Yandex présente de multiples éléments à étudier, dont beaucoup seront probablement exploités par des spammeurs, d'autres offrant des opportunités d'optimisation pour la recherche de Google. Voici quelques observations qui ont retenu mon attention.

Facteur #63 | Nom : HasNoQueryURLShows

La description traduite : "Il n'y a pas d'informations sur la cliquabilité pour cette URL pour cette requête 1 - la requête ou l'url de la requête n'est pas dans la base de clics, 0 - l'url de la requête est dans la base de données des clics"

Prenez celui-ci, et si le fait que l'URL de votre page de destination ait été consultée ou non lors de recherches précédentes était un facteur de classement ? Si tel est le cas, vous pouvez envisager de pousser les clics initiaux pour influencer ce facteur.

Facteur #850 | Nom : BrowserBookmarksUrl

La description de ce facteur est "Plus les utilisateurs ajoutent aux signets une URL, plus elle a de valeur de facteur".

Vraiment?

Au début, cela semble old school, mais en y réfléchissant plus loin, le seul moyen pour eux de mesurer la façon dont les utilisateurs marquent les URL est sur le navigateur ou la barre Yandex. Je me demande si Google fait la même chose avec Chrome. Nous verrons probablement de nouvelles listes de contrôle SEO qui incluent l'ajout de pages aux favoris .

Facteur #243 suivi d'une série de facteurs basés sur les données Clickstream de la barre Yandex

Voici une traduction de la description de l'un des facteurs : "temps moyen d'un utilisateur continu actif (en secondes) sur la page après avoir cliqué sur une requête d'un moteur de recherche. (Le facteur dépend du couple (requête, url)). Selon au compteur interne de Yandex.Bar / Elements / Browser »

Il semble que les utilisateurs qui utilisent Yandex.bar pour rechercher sur le Web et cliquer sur les résultats affecteront le classement de la page.

Quelques plats à emporter

Comme vous l'avez vu, selon ce que nous voyons, Yandex présente des facteurs de classement intéressants et inattendus.

Par exemple, Google affirme depuis des années que le taux de rebond est un signal bruyant et qu'il n'utilise pas les taux de clics pour classer le contenu.

Pourtant, il semble que Yandex utilise ces signaux pour classer le contenu. Maintenant, comme je l'ai mentionné ci-dessus, je ne fais aucune réclamation ici. Mais je pose la question. Certains de ces facteurs affectent-ils la façon dont Google classe les pages ?

Étant donné que Google ne partagera probablement pas son code source de si tôt, la seule façon de le savoir est de faire un petit test utilisateur.