Yandex 유출이 SEO 게임 계획을 영원히 바꾸는 방법

게시 됨: 2023-01-31
Yandex 유출이 SEO 게임 계획을 영원히 바꾸는 방법


최근 Yandex의 소스 코드 일부가 유출되었습니다.

이것이 귀하의 SEO에 어떤 의미가 있습니까?

이것에 대해 생각하다…

소스 코드를 이해하면 검색 엔진의 내부 작업을 엿볼 수 있습니다. 이를 통해 Yandex 순위 요소를 분석하고 Google에서 사용하는 요소와 비교할 수 있습니다.

Google은 복잡하고 풍부한 데이터로 유명하지만 Yandex가 특정 지역, 특히 러시아에서 여전히 상당한 시장 점유율을 차지하고 있다는 점은 주목할 가치가 있습니다. Yandex 소스 코드 유출은 SEO 커뮤니티가 Yandex가 페이지의 점수를 매기고 순위를 매기는 방법을 이해할 수 있는 귀중한 기회입니다.

이 게시물에서는 우리가 보는 높은 수준의 테마 중 일부를 분석하고 앞으로 SEO를 수행하는 방법을 변경할 수 있는 알고리즘의 고유한 요소를 보여줍니다.

하지만 먼저 Yandex 알고리즘 분석이 왜 그렇게 중요한지 살펴보겠습니다.



Yandex를 살펴보는 이유는 무엇입니까?



Yandex 유출은 우리에게 주요 검색 엔진의 실제 소스 코드를 볼 수 있는 최초의 기회를 제공했습니다. 아시다시피 Google은 항상 검색 엔진의 세부 사항을 밝히지 않는 일반적인 조언을 제공했습니다.

이것은 우리가 검색 결과에서 콘텐츠를 더 잘 보이게 만드는 방법을 이해하기 위해 항상 사용자 테스트에 의존해 왔다는 것을 의미합니다.

이제 처음으로 웹 페이지의 관련성과 권한을 결정하는 데 사용되는 순위 요소에 대한 세부 정보를 포함하여 Yandex 검색 알고리즘의 일부 내부 작업을 볼 수 있습니다. 이것은 Yandex가 검색 순위를 보는 방식에 대한 귀중한 통찰력을 제공했습니다.

Yandex의 소스 코드는 Yandex 검색 엔진에서 사용하는 몇 가지 중요한 점수 시스템을 밝혀냈습니다. 이것은 질문을 구걸합니다. Google이 유사한 순위 요소를 사용한다고 가정할 수 있습니까?

분석 결과 Yandex의 순위 요소 목록이 Google에서 기대하는 것보다 훨씬 적다는 것이 분명합니다. 그러나 이것이 Yandex에서 사용하는 요소가 덜 중요하다는 의미는 아닙니다.

사실 지금까지 SEO 커뮤니티는 Yandex에서 보고 있는 많은 요소를 인식하지 못했을 수 있습니다. 즉, 이러한 요소를 이해하면 앞으로 나아가는 SEO 이점을 얻을 수 있습니다.

최적화 전략을 재평가하고 잠재적으로 페이지 순위를 향상시키는 새로운 방법을 발견할 절호의 기회를 가질 수 있습니다.

제가 잘못된 정보를 퍼뜨렸다는 비난을 받기 전에 저는 Google이 이러한 순위 요소를 사용한다고 말하는 것이 아닙니다. 나는 단지 질문을하고 있습니다.

또한 이 유출이 스패머에게 이러한 시스템을 악용할 수 있는 새로운 기회를 제공할 수도 있다는 점은 주목할 가치가 있습니다. SEO 전문가로서 경계를 유지하고 윤리적 최적화 기술에 지속적으로 집중하는 것이 중요합니다.


사용자 행동



Yandex가 사용자 행동에 중점을 두는 것을 보는 것은 매우 흥미로운 일입니다. 유출된 소스 코드에 따르면 Yandex는 웹 페이지의 관련성과 권한을 결정할 때 클릭률(CTR) 및 체류 시간과 같은 지표를 많이 고려합니다. 이 주변에는 150개의 순위 요소가 있습니다(모든 요소의 약 8%).

또한 Google이 수년 동안 옹호해 온 것과 매우 유사하게 들리는 많은 요소가 있습니다. 내가 말하는 것은 백링크 및 키워드 사용과 같은 전통적인 SEO 요소에 중점을 두는 것입니다.

페이지를 가리키는 링크의 수와 품질을 기반으로 웹 페이지의 순위를 매기는 시스템인 PageRank를 직간접적으로 사용하는 수백 가지 요인이 있습니다(PageRank를 발명한 Google은 이를 기반으로 페이지를 측정하고 점수를 매긴 최초의 검색 엔진이었습니다. )

이 유출의 의미는 Yandex에 대한 콘텐츠를 최적화하려는 SEO 전문가에게 중요합니다.

전반적으로 Yandex의 소스 코드 유출은 주요 검색 엔진의 내부 작동에 대한 귀중한 통찰력을 제공하고 최적화 전략을 개선할 수 있는 새로운 기회를 제공합니다.



분석 및 통계



숫자에 대해 이야기하고 몇 가지 측정항목을 삭제해 보겠습니다. 우리는 마케터로서 해야 합니다. ;)

1922개의 순위 요소가 있으며 여기에서 모두 찾을 수 있습니다.

순위 요소는 함께 그룹화됩니다. 아래는 상위 그룹을 보여주는 차트입니다.





자, 몇 가지 순위 요인에 대해 알아보겠습니다.



Yandex 순위 요인



정보를 파헤치면서 주목할 가치가 있는 두 가지 분명한 주제를 식별할 수 있습니다.
  • 주석
  • 쿼리 요소


주석



내가 본 바로는 많은 요인들이 함께 그룹화되어 있습니다. 주요 그룹 중 하나는 Annotation입니다. 이 그룹에는 UX, CTR, 이탈률, 체류 시간 등이 포함됩니다.

내가 본 바로는 주석은 페이지 점수 및 CTR 예측의 의미 분석을 포함하는 주요 요소입니다. 또한 Annotation 인덱스가 있는 것 같습니다. 우리는 그들이 하나 이상의 의미론적 가중 요소를 사용하고 있음을 알 수 있습니다. 그들이 사용하는 것으로 보이는 독점 가중 스키마 중에서 고전적인 가중 BM15를 찾을 수 있습니다.

간단히 말해서 BM25는 검색 엔진의 색인에 있는 문서를 측정하고 사용자의 검색어와 얼마나 관련이 있는지 측정하는 알고리즘입니다. 문서의 단어를 측정하지만 문법과 어순을 무시하고 문서에 단어가 나타나는 빈도에 초점을 맞추는 단어 모음 모델입니다.


쿼리 요소



두 번째는 검색어 요인입니다. 이러한 요소는 다음과 같이 보다 일반적이고 단순한 요소인 것 같습니다.

  1. 실제 사용된 수식을 볼 수 있는 단어 수(인자 #59): 최소(검색어 수/10, 1.f) - 그에 따라 스팸 페이지를 시작하지 마십시오. ;)
  2. 거꾸로 된 단어 수(요인 #60): "1 / number_of_words_in_query"의 간단한 공식을 보여줍니다.
  3. IDF(Inverse Document Frequency): 이것은 자연어 처리 및 정보 검색에서 사용되는 척도로서 문서 모음 또는 코퍼스에서 용어의 중요성을 반영합니다. 일부 도구가 Rank Ranger TF-IDF 보고서와 같은 보고서에서 이를 활용하므로 대부분의 SEO는 이에 익숙해야 합니다.
  4. 여기서 매우 흥미로운 점은 쿼리가 NightQuery인지 MorningQuery인지, 그리고 특정 시간에 분류하고 고려한다는 것입니다.
이제 여기에서 더 많은 것을 볼 수 있습니다. 이 게시물을 가능한 한 짧게 유지하기 위해 주석과 쿼리 요인만 살펴보고 있습니다.

다음은 주요 순위 요인에 대한 간략한 요약입니다.


순위 요소 요약



  • PageRank는 여전히 SEO의 요소입니다.
  • 백링크가 중요합니다
  • CTR(클릭률)과 이탈률이 주요 요인
  • 404/5xx 오류를 해결하기 위한 빈번한 사이트 감사는 SEO 최적화에 매우 중요합니다.
  • 온페이지 요소는 기본 분석에서 고급 및 의미 분석에 이르기까지 SEO에서 지속적으로 중요한 역할을 합니다.
  • Yandex 검색 엔진의 페이지 순위는 사용자 북마크에 URL이 추가된 횟수와 검색 엔진에서 쿼리를 클릭한 후 페이지에서 보낸 활성 시간을 포함하여 사용자 행동의 영향을 받을 수 있습니다. Yandex 바 및 브라우저 도구.
  • 모든 쿼리에서 평균 도메인 위치는 순위 요소입니다.
  • 크롤링 깊이는 순위 요소입니다.
  • URL이 검색 세션에서 마지막으로 방문한 경우 사용자가 찾고 있던 것을 찾았다는 의미입니다.
  • 사이트에 Google Analytics가 있는 것은 순위 요소입니다. 상상 해봐…
  • UX(사용자 경험)는 깨진 비디오, 링크, 광고 수, 페이지 상호 작용 및 반복 방문과 같이 페이지에서 사용자 경험의 품질을 평가하는 다양한 요소를 포함하며 모두 측정됩니다.

상위 수준에서 몇 가지 순위 요소를 살펴보았으므로 이제 좀 더 예상치 못한 몇 가지 요소를 살펴보겠습니다.

이러한 요소를 살펴보면 새로운 관점을 얻을 수 있고 테스트할 수 있는 새로운 기회를 얻을 수 있습니다.



새로운 기회: 예상치 못한 순위 요인



Yandex의 검색 알고리즘은 연구할 여러 요소를 제공하며, 그 중 다수는 스패머가 악용할 가능성이 높으며 다른 요소는 Google 검색에 최적화할 수 있는 기회를 제공합니다. 다음은 내 눈을 사로 잡은 몇 가지 관찰입니다.


요인 #63 | 이름: HasNoQueryURLShows



번역된 설명: "이 요청에 대한 이 URL에 대한 클릭 가능성 정보가 없습니다. 1 - 요청 또는 요청 URL이 클릭 기반에 없고, 0 - 요청 URL이 클릭 데이터베이스에 있습니다.”

랜딩 페이지 URL이 이전 검색에서 적중했는지 여부가 순위 요인이라면 어떨까요? 그렇다면 이 요소에 영향을 미치기 위해 초기 클릭을 유도하는 것을 고려할 수 있습니다.


요인 #850 | 이름: BrowserBookmarksUrl



이 요인에 대한 설명은 "사용자가 더 많은 URL을 북마크에 추가할수록 더 많은 요인 값을 갖게 됩니다."입니다.

진짜?

처음에는 구식처럼 들리지만 자세히 생각해 보면 사용자가 URL을 북마크하는 방법을 측정하는 유일한 방법은 Yandex 브라우저 또는 바에 있습니다. Google이 Chrome에서 동일한 작업을 수행하는지 궁금합니다. 즐겨찾기에 페이지 추가를 포함하는 새로운 SEO 체크리스트를 보게 될 것입니다.


요인 #243 다음에 Yandex 막대의 클릭스트림 데이터를 기반으로 하는 일련의 요인



다음은 요인 중 하나에 대한 설명을 번역한 것입니다. Yandex.Bar / Elements / Browser의 내부 카운터로”

Yandex.bar를 사용하여 웹을 검색하고 결과를 클릭하는 사용자는 페이지 순위에 영향을 미치는 것으로 보입니다.



몇 가지 주요 사항



보시다시피 Yandex는 흥미롭고 예상치 못한 몇 가지 순위 요소를 제공합니다.

예를 들어 Google은 Bounce Rate가 시끄러운 신호이며 콘텐츠 순위 지정에 클릭률을 사용하지 않는다고 수년 동안 말했습니다.

그러나 Yandex가 콘텐츠 순위 지정에 이러한 신호를 사용하고 있는 것으로 보입니다. 이제 위에서 언급했듯이 여기서는 어떠한 주장도 하지 않습니다. 그러나 나는 질문을 하고 있다. 이러한 요인 중 일부는 Google이 페이지 순위를 매기는 방식에 영향을 줍니까?

Google은 곧 소스 코드를 공유할 가능성이 없으므로 알아낼 수 있는 유일한 방법은 약간의 사용자 테스트를 수행하는 것입니다.