Como o vazamento do Yandex mudará para sempre seu plano de jogo de SEO

Publicados: 2023-01-31

Recentemente, uma parte do código-fonte do Yandex vazou.

O que isso significa para o seu SEO daqui para frente?

Pense sobre isso…

Compreender o código-fonte deles lhe dará uma ideia do funcionamento interno do mecanismo de pesquisa. Isso lhe dá a oportunidade de analisar os fatores de classificação do Yandex e compará-los com os usados pelo Google.

Embora o Google seja conhecido por seus dados complexos e ricos, vale a pena notar que o Yandex ainda detém uma participação de mercado significativa em certas regiões, principalmente na Rússia. O vazamento do código-fonte do Yandex é uma oportunidade valiosa para a comunidade de SEO entender como o Yandex pontua e classifica as páginas.

Nesta postagem, detalharei alguns dos temas de alto nível que vemos, além de mostrar alguns elementos exclusivos dos algoritmos que podem mudar a forma como você faz SEO no futuro.

Mas primeiro, vamos explorar por que analisar os algoritmos do Yandex é tão importante.

Por que olhar para Yandex?

O vazamento do Yandex nos deu a primeira oportunidade de ver o código fonte real de um grande mecanismo de busca. Como você sabe, o Google sempre deu conselhos gerais que não revelam as especificidades do mecanismo de busca.

Isso significa que sempre contamos com testes de usuários para entender como tornar nosso conteúdo mais visível nos resultados de pesquisa.

Agora, pela primeira vez, podemos ver alguns dos trabalhos internos do algoritmo de busca do Yandex, incluindo detalhes sobre os fatores de classificação usados para determinar a relevância e a autoridade de uma página da web. Isso forneceu informações valiosas sobre as maneiras pelas quais o Yandex analisa a classificação de pesquisa.

O código-fonte do Yandex trouxe à tona alguns sistemas de pontuação significativos usados pelo mecanismo de busca Yandex. Isso levanta a questão. Podemos presumir que o Google usa fatores de classificação semelhantes?

Após a análise, fica claro que a lista de fatores de classificação do Yandex é significativamente menor do que esperaríamos do Google. No entanto, isso não significa que os fatores usados pelo Yandex sejam menos importantes.

Na verdade, até agora, a comunidade de SEO pode não estar ciente de muitos dos fatores que estamos vendo no Yandex. Isso significa que entender esses fatores pode lhe dar uma vantagem de SEO no futuro.

Você pode ter uma oportunidade de ouro para reavaliar suas estratégias de otimização e potencialmente descobrir novas maneiras de melhorar a classificação da página.

Agora, antes de ser acusado de espalhar desinformação, não estou dizendo que o Google usa nenhum desses fatores de classificação. Só estou fazendo a pergunta.

Além disso, vale a pena notar que esse vazamento também pode fornecer novas oportunidades para os spammers explorarem esses sistemas. Como profissionais de SEO, é importante ficar atento e continuar a focar em técnicas de otimização ética.

Comportamento do usuário

É muito interessante ver a ênfase que o Yandex coloca no comportamento do usuário. De acordo com o código-fonte vazado, o Yandex considera fortemente métricas como taxa de cliques (CTR) e tempo de permanência ao determinar a relevância e a autoridade de uma página da web. Existem 150 fatores de classificação em torno disso (aproximadamente 8% de todos os fatores).

Além disso, existem muitos fatores que soam surpreendentemente semelhantes ao que o Google vem defendendo há anos. O que estou me referindo é enfatizar os fatores tradicionais de SEO, como backlinks e uso de palavras-chave.

Existem centenas de fatores que direta ou indiretamente usam o PageRank que é um sistema que classifica as páginas da web com base no número e na qualidade dos links que apontam para elas (o Google que inventou o PageRank, foi o primeiro mecanismo de busca a medir e pontuar as páginas com base nele. )

As implicações desse vazamento são significativas para profissionais de SEO que buscam otimizar seu conteúdo para o Yandex.

No geral, o vazamento do código-fonte do Yandex fornece informações valiosas sobre o funcionamento interno de um importante mecanismo de pesquisa e oferece novas oportunidades para melhorar suas estratégias de otimização.

Análise e estatísticas

Vamos falar sobre números e deixar cair algumas métricas. Nós temos que, como profissionais de marketing. ;)

Existem 1922 fatores de classificação, você pode encontrá-los todos aqui.

Os fatores de classificação são agrupados. Abaixo está um gráfico mostrando os principais grupos.

Ok, vamos entrar em alguns dos fatores de classificação.

Fatores de classificação do Yandex

Analisando as informações, posso identificar dois temas óbvios dignos de nota:

Anotação
fatores de consulta

Anotação

Pelo que vejo, muitos dos fatores estão agrupados. Um dos principais grupos é chamado de anotação. Este grupo inclui coisas como UX, CTR, taxa de rejeição e tempo de permanência.

Pelo que vejo, a anotação é um fator importante que inclui a análise semântica da pontuação da página e as previsões de CTR. Além do mais, parece que pode haver um índice de anotação. Podemos ver que eles estão usando mais do que apenas um fator ponderado semântico. Você pode encontrar o clássico BM15 ponderado, entre os esquemas ponderados proprietários que eles parecem usar.

Simplificando, o BM25 é um algoritmo que mede os documentos no índice do mecanismo de pesquisa e mede a relevância deles para a consulta de pesquisa de um usuário. É um modelo de saco de palavras que mede as palavras em um documento, mas desconsidera a gramática e a ordem das palavras e se concentra na frequência com que as palavras aparecem no documento.

Fatores de consulta

Em segundo lugar estão os fatores de consulta. Esses fatores parecem ser os fatores mais comuns e simples, como:

Contagem de palavras (fator #59) onde você pode ver a fórmula real usada: Min(número de palavras de consulta/10, 1.f) - Por favor, não comece a enviar páginas de spam de acordo. ;)
Contagem de palavras invertida (Fator #60): mostra uma fórmula simples de "1 / number_of_words_in_query”.
IDF (Frequência Inversa de Documentos): Esta é uma medida usada no processamento de linguagem natural e na recuperação de informações para refletir a importância de um termo em uma coleção ou corpus de documentos. A maioria dos SEOs deve estar familiarizada com ele, pois algumas ferramentas o utilizam em relatórios, como o relatório Rank Ranger TF-IDF.
Algo muito interessante aqui é ver que eles categorizam e levam em consideração se a consulta é NightQuery ou MorningQuery, e também em horários específicos.

Agora, há muito mais para ver aqui. Estou apenas analisando os fatores de anotação e consulta para manter esta postagem o mais curta possível.

Aqui está um breve resumo dos principais fatores de classificação.

Resumo do fator de classificação

PageRank continua sendo um fator em SEO
Backlinks são cruciais
CTR (taxa de cliques) e taxa de rejeição são fatores importantes
Auditorias frequentes do site para corrigir erros 404/5xx são cruciais para otimizar o SEO
Os fatores on-page continuam a desempenhar um papel importante no SEO, desde análises básicas até análises mais avançadas e semânticas
A classificação das páginas no mecanismo de pesquisa Yandex pode ser afetada pelo comportamento do usuário, incluindo o número de vezes que um URL é adicionado aos favoritos do usuário e o tempo ativo gasto em uma página depois de clicar em uma consulta do mecanismo de pesquisa, conforme medido pelo Barra Yandex e ferramentas do navegador.
A posição média do domínio em todas as consultas é um fator de classificação.
A profundidade do rastreamento é um fator de classificação.
Se uma URL for a última visitada em uma sessão de pesquisa, significa que o usuário encontrou o que procurava.
Ter o Google Analytics no site é um fator de ranqueamento. Imagine isso…
UX (experiência do usuário) engloba vários fatores que avaliam a qualidade da experiência do usuário em uma página, como vídeos quebrados, links, número de anúncios, interações na página e visitas repetidas, todos medidos.

Agora que vimos alguns dos fatores de classificação de alto nível, vamos agora ver alguns dos fatores mais inesperados.

Analisar esses fatores lhe dará uma nova perspectiva e, com sorte, algumas novas oportunidades para testar

Novas oportunidades: fatores de classificação inesperados

O algoritmo de busca do Yandex apresenta vários elementos para estudar, muitos dos quais provavelmente serão explorados por spammers, outros oferecendo oportunidades de otimização para a busca do Google. Aqui estão algumas observações que me chamaram a atenção.

Fator #63 | Nome: HasNoQueryURLShows

A descrição traduzida: "Não há informações de clicabilidade para este URL para esta solicitação 1 - solicitação ou URL de solicitação não está na base de cliques, 0 - url de solicitação está no banco de dados de cliques"

Pegue este, e se o URL da sua página de destino tivesse ou não acessos em pesquisas anteriores ou não fosse um fator de classificação? Nesse caso, você pode querer considerar pressionar por cliques iniciais para influenciar esse fator.

Fator #850 | Nome: BrowserBookmarksUrl

A descrição desse fator é "Quanto mais usuários adicionarem aos favoritos uma url, mais valor de fator ela terá".

Sério?

A princípio, parece antiquado, mas pensando melhor, a única maneira de medir como os usuários marcam URLs é no navegador ou na barra Yandex. Eu me pergunto se o Google faz o mesmo com o Chrome. Provavelmente veremos novas listas de verificação de SEO que incluem a adição de páginas aos favoritos .

Fator nº 243 seguido por uma série de fatores baseados nos dados Clickstream da barra Yandex

Aqui está uma tradução da descrição de um dos fatores: "tempo médio ativo contínuo do usuário (em segundos) na página após clicar em uma consulta de um mecanismo de pesquisa. (O fator depende do par (consulta, url)). De acordo para o contador interno do Yandex.Bar / Elements / Browser”

Parece que os usuários que usam o Yandex.bar para pesquisar na web e clicar nos resultados afetarão a classificação da página.

Algumas conclusões importantes

Como você viu, de acordo com o que estamos vendo, o Yandex apresenta alguns fatores de classificação interessantes e inesperados.

Por exemplo, o Google diz há anos que a taxa de rejeição é um sinal ruidoso e que eles não usam taxas de cliques para classificar o conteúdo.

No entanto, parece que o Yandex pode estar usando esses sinais para classificar o conteúdo. Agora, como mencionei acima, não estou fazendo nenhuma reclamação aqui. Mas eu estou fazendo a pergunta. Alguns desses fatores afetam como o Google classifica as páginas?

Como o Google provavelmente não compartilhará seu código-fonte tão cedo, a única maneira de descobrir é fazer um pequeno teste com o usuário.