Google이 EEAT를 통해 저자를 식별하고 평가하는 방법

게시 됨: 2023-04-17

Google은 검색 결과의 순위를 매길 때 콘텐츠 소스, 특히 작성자를 더 중요하게 생각합니다. SERP에서 Perspectives, About this result 및 About this author를 소개하면 이를 명확하게 알 수 있습니다.

이 기사에서는 Google이 작성자의 경험, 전문성, 권위 및 신뢰도(EEAT)를 통해 잠재적으로 콘텐츠를 평가할 수 있는 방법을 살펴봅니다.

EEAT: Google의 품질 공세

Google은 검색 결과 및 on-SERP 사용자 경험의 품질을 개선하기 위한 EEAT 개념의 중요성을 강조했습니다.

콘텐츠의 일반적인 품질, 링크 신호(예: PageRank 및 앵커 텍스트) 및 엔터티 수준 신호와 같은 온페이지 요소는 모두 중요한 역할을 합니다.

문서 채점과 달리 개별 콘텐츠 평가는 EEAT의 초점이 아닙니다.

개념에는 도메인 및 발신자 엔터티와 관련된 주제별 참조가 있습니다. 검색 의도 및 개별 콘텐츠 자체와는 별개입니다.

궁극적으로 EEAT는 검색 쿼리와 독립적인 영향 요인입니다.

EEAT는 주로 주제 영역을 말하며 회사, 조직, 사람 및 해당 도메인과 같은 엔터티와 관련하여 콘텐츠 컬렉션 및 오프 페이지 신호를 평가하는 평가 계층으로 이해됩니다.

콘텐츠의 출처로서의 저자의 중요성

(E-)EAT 이전에 Google은 검색 순위에 콘텐츠 소스의 등급을 포함하려고 했습니다. 예를 들어, 2009년 Vince 업데이트는 브랜드 제작 콘텐츠에 순위 우위를 부여했습니다.

오래 전에 종료된 Knol 또는 Google+와 같은 프로젝트를 통해 Google은 작성자 등급(즉, 소셜 그래프 및 사용자 등급을 통해)에 대한 신호를 수집하려고 시도했습니다.

지난 20년 동안 여러 Google 특허는 Knol과 같은 콘텐츠 플랫폼과 Google+와 같은 소셜 네트워크를 직간접적으로 언급했습니다.

EEAT 기준에 따라 콘텐츠의 출처 또는 작성자를 평가하는 것은 검색 결과의 품질을 더욱 발전시키는 데 중요한 단계입니다.

AI로 생성된 콘텐츠와 전형적인 스팸이 많기 때문에 Google이 검색 색인에 열등한 콘텐츠를 포함시키는 것은 말이 되지 않습니다.

색인을 생성하고 정보 검색 중에 처리해야 하는 콘텐츠가 많을수록 더 많은 컴퓨팅 성능이 필요합니다.

EEAT는 모든 콘텐츠를 크롤링하지 않고도 더 넓은 범위에 적용되는 항목, 도메인 및 작성자 수준을 기반으로 Google 순위를 매길 수 있습니다.

이 거시적 수준에서 콘텐츠는 작성자 엔터티에 따라 분류되고 어느 정도 크롤링 예산으로 할당될 수 있습니다. Google은 이 방법을 사용하여 전체 콘텐츠 그룹을 인덱싱에서 제외할 수도 있습니다.

Google은 어떻게 작성자를 식별하고 콘텐츠에 속성을 부여할 수 있나요?

작성자는 개인 항목 유형에 속합니다. Knowledge Graph에 기록된 이미 알려진 엔터티와 Knowledge Vault와 같은 지식 저장소에 기록된 이전에 알려지지 않았거나 검증되지 않은 엔터티를 구분해야 합니다.

항목이 Knowledge Graph에 아직 캡처되지 않은 경우에도 Google은 기계 학습 및 언어 모델을 사용하여 구조화되지 않은 콘텐츠에서 항목을 인식하고 추출할 수 있습니다. 이 솔루션은 자연어 처리의 하위 작업인 NER(엔터티 인식)로 명명됩니다.

NER는 언어 패턴을 기반으로 엔터티를 인식하고 엔터티 유형이 할당됩니다. 일반적으로 명사는 (명명된) 엔티티입니다.

최신 정보 검색 시스템은 이를 위해 워드 임베딩(Word2Vec)을 사용합니다.

숫자 벡터는 텍스트의 각 단어 또는 텍스트 단락을 나타내며 엔터티는 노드 벡터 또는 엔터티 임베딩(Node2Vec/Entity2Vec)으로 나타낼 수 있습니다.

단어는 품사(POS) 태깅을 통해 문법 클래스(명사, 동사, 전치사 등)에 할당됩니다.

명사는 일반적으로 엔티티입니다. 주제는 기본 엔터티이고 객체는 보조 엔터티입니다. 동사와 전치사는 엔터티를 서로 연관시킬 수 있습니다.

아래 예에서 "olaf kopp", "head of seo", "cofounder" 및 "aufgesang"은 명명된 엔터티입니다. (NN = 명사).

자연어 처리는 엔터티를 식별 하고 엔터티 간의 관계를 결정할 수 있습니다.

이는 엔터티의 개념을 더 잘 포착하고 이해하는 시맨틱 공간을 생성합니다.

이에 대한 자세한 내용은 "Google이 NLP를 사용하여 검색어, 콘텐츠를 더 잘 이해하는 방법"에서 확인할 수 있습니다.

저자 임베딩에 대응하는 것은 문서 임베딩입니다. 문서 임베딩은 벡터 공간 분석을 통해 작성자 벡터와 비교됩니다. (자세한 내용은 Google 특허 "문서의 벡터 표현 생성"에서 확인할 수 있습니다.)

모든 유형의 콘텐츠는 다음을 허용하는 벡터로 표현될 수 있습니다.

벡터 공간에서 비교할 콘텐츠 벡터와 작성자 벡터입니다.
유사성에 따라 클러스터링할 문서.
할당할 저자.

문서 벡터와 해당 작성자 벡터 사이의 거리는 작성자가 문서를 생성한 확률을 나타냅니다.

거리가 다른 벡터보다 작고 특정 임계값에 도달하면 문서가 작성자에게 귀속됩니다.

이렇게 하면 잘못된 플래그로 문서가 생성되는 것을 방지할 수도 있습니다. 그런 다음 작성자 벡터는 콘텐츠에 지정된 작성자 이름을 사용하여 이미 설명한 대로 작성자 엔터티에 할당할 수 있습니다.

저자에 대한 중요한 정보 출처는 다음과 같습니다.

그 사람에 대한 Wikipedia 기사.
저자 프로필.
스피커 프로필.
소셜 미디어 프로필.

엔티티 유형 사람의 이름을 Google에 검색하면 처음 20개의 검색 결과에서 Wikipedia 항목, 작성자의 프로필 및 작성자와 직접 연결된 도메인의 URL을 찾을 수 있습니다.

모바일 SERP에서 Google이 개인 엔티티와 직접적인 관계를 설정하는 소스를 확인할 수 있습니다.

Google은 소셜 미디어 프로필 아이콘 위의 모든 결과를 엔티티에 대한 직접적인 참조가 있는 소스로 인식했습니다.

"olaf kopp"에 대한 검색 쿼리의 이 스크린샷은 엔터티가 소스에 연결되어 있음을 보여줍니다.

또한 지식 패널의 새로운 변형을 표시합니다. 여기 베타 테스트의 일부가 된 것 같습니다.

이 스크린샷에서 이미지와 속성(연령) 외에도 Google에서 내 도메인과 소셜 미디어 프로필을 내 엔터티에 직접 연결하여 지식 패널에 전달하는 것을 볼 수 있습니다.

저에 대한 Wikipedia 기사가 없기 때문에 About 설명은 미국 검색 엔진 랜드의 작성자 프로필과 독일 에이전시 웹 사이트의 작성자 프로필에서 전달됩니다.

웹상의 개인 프로필은 Google이 작성자를 맥락화하고 작성자와 관련된 소셜 미디어 프로필 및 도메인을 식별하는 데 도움이 됩니다.

저자 프로필의 저자 상자 또는 저자 컬렉션은 Google에서 저자에게 콘텐츠를 할당하는 데 도움이 됩니다. 모호성이 발생할 수 있으므로 저자의 이름은 식별자로 충분하지 않습니다.

일관성을 유지하려면 모든 저자의 설명에 주의를 기울여야 합니다. Google은 이를 사용하여 항목의 유효성을 서로 비교하여 확인할 수 있습니다.

엔티티로서의 저자 800x476 — *EEAT의 맥락에서 디지털 대표자로서의 도메인 및 프로필과 엔티티 자산으로서의 콘텐츠.*

검색 마케터가 의존하는 일일 뉴스레터를 받으세요.

용어를 참조하십시오.

저자의 EEAT 등급에 대한 흥미로운 Google 특허

다음 특허는 Google이 작성자를 식별하고 콘텐츠를 할당하고 EEAT 측면에서 평가하는 방법에 대한 가능한 방법론을 엿볼 수 있습니다.

콘텐츠 작성자 배지

이 특허는 배지를 통해 콘텐츠가 작성자에게 할당되는 방식을 설명합니다.

콘텐츠는 이메일 주소 또는 작성자 이름과 같은 ID를 사용하여 작성자 배지에 할당됩니다. 확인은 작성자 브라우저의 애드온을 통해 수행됩니다.

작성자 벡터 생성

구글은 2016년에 이 특허에 2036년까지 서명했다. 하지만 미국에만 특허 출원이 있어 아직 전 세계 구글 검색에는 사용되지 않고 있다.

이 특허는 작성자가 교육 데이터를 기반으로 벡터로 표현되는 방식을 설명합니다.

벡터는 작성자의 일반적인 쓰기 스타일과 단어 선택을 기반으로 식별되는 고유한 매개변수가 됩니다.

이러한 방식으로 이전에 저자에게 귀속되지 않은 콘텐츠를 저자에게 할당하거나 유사한 저자를 클러스터로 그룹화할 수 있습니다.

그런 다음 과거에 검색(예: Discover)에서 사용자의 사용자 행동을 기반으로 한 명 이상의 작성자에 대한 콘텐츠 순위를 조정할 수 있습니다.

따라서 이미 발견된 저자의 콘텐츠와 유사한 저자의 콘텐츠가 더 높은 순위를 차지합니다.

이 특허는 작성자 및 단어 임베딩과 같은 소위 임베딩을 기반으로 합니다.

오늘날 임베딩은 딥 러닝 및 자연어 처리의 기술 표준입니다.

따라서 Google의 이러한 방법이 저자 인식 및 귀속에도 사용될 것임은 자명합니다.

저자의 평판 점수

이 특허는 2008년 Google에서 처음 서명했으며 최소 기간은 2029년입니다. 이 특허는 원래 오랫동안 폐쇄된 Google Knol 프로젝트를 나타냅니다.

따라서 Google이 2017년에 온라인 콘텐츠의 수익 창출이라는 새 제목으로 다시 그렸던 이유가 더욱 흥미진진합니다. Knol은 2012년 Google에 의해 폐쇄되었습니다.

특허는 평판 점수를 결정하는 것입니다. 이를 위해 다음 요소를 고려할 수 있습니다.

작성자의 프레임 수준입니다.
저명한 매체의 간행물.
간행물의 수.
최근 릴리스의 나이.
작가가 공식적으로 작가로 활동한 기간.
작성자의 콘텐츠에 의해 생성된 링크의 수입니다.

작성자는 주제당 여러 평판 점수를 가질 수 있으며 주제 영역당 여러 별칭을 가질 수 있습니다.

특허의 많은 부분이 Knol과 같은 폐쇄형 플랫폼과 관련이 있습니다. 따라서 이 특허는 이 시점에서 충분해야 합니다.

에이전트 등급

이 Google 특허는 2005년에 처음 서명되었으며 최소 기간은 2026년까지입니다.

미국 외에 스페인, 캐나다 등 전 세계에도 등록돼 구글 검색에 활용될 가능성이 높다.

이 특허는 디지털 콘텐츠가 에이전트(출판사 및/또는 저자)에게 할당되는 방법을 설명합니다. 이 콘텐츠는 무엇보다도 상담원 순위를 기준으로 순위가 매겨집니다.

에이전트 순위는 검색 쿼리의 검색 의도와 무관하며 에이전트에 할당된 문서 및 해당 백링크를 기반으로 결정됩니다.

에이전트 순위는 하나의 검색 쿼리, 검색 쿼리 클러스터 또는 전체 주제 영역을 독점적으로 나타냅니다.

“에이전트 순위는 선택적으로 검색어 또는 검색어 범주와 관련하여 계산될 수도 있습니다. 예를 들어, 검색어(또는 검색어의 구조화된 모음, 즉 쿼리)는 주제(예: 스포츠 또는 의료 전문 분야)로 분류될 수 있으며 에이전트는 각 주제와 관련하여 다른 순위를 가질 수 있습니다."

온라인 콘텐츠 작성자의 신뢰성

이 Google 특허는 2008년에 처음 서명되었으며 최소 기간은 2029년이며 지금까지 미국에서만 등록되었습니다.

Justin Lawyer는 저자의 Patent Reputation Score와 같은 방식으로 개발했으며 검색에서의 사용과 직접적으로 관련됩니다.

특허에서 위에서 언급한 특허와 유사한 점을 발견할 수 있습니다.

저에게는 신뢰와 권위 측면에서 저자를 평가하는 가장 흥미로운 특허입니다.

이 특허는 저자의 신뢰성을 알고리즘적으로 결정하는 데 사용할 수 있는 다양한 요소를 참조합니다.

검색 엔진이 작성자의 신용 요소 및 평판 점수의 영향을 받아 문서의 순위를 매기는 방법을 설명합니다.

작성자는 콘텐츠를 게시하는 다양한 주제의 수에 따라 여러 평판 점수를 가질 수 있습니다.

저자의 평판 점수는 출판사와 무관합니다.

다시 이 특허에는 EEAT 등급에서 가능한 요소로 링크에 대한 참조가 있습니다. 게시된 콘텐츠에 대한 링크 수는 작성자의 평판 점수에 영향을 줄 수 있습니다.

평판 점수에 대해 다음과 같은 가능한 신호가 언급됩니다.

작성자가 주제 영역에서 콘텐츠를 제작한 기간입니다.
저자의 인식.
게시된 콘텐츠에 대한 사용자의 평가.
다른 게시자가 평균 이상의 등급으로 작성자의 콘텐츠를 게시하는 경우.
작성자가 게시한 콘텐츠의 양입니다.
저자가 마지막으로 출판한 지 얼마나 되었는지.
저자가 유사한 주제에 대한 이전 간행물의 평가.

특허의 평판 점수에 대한 다른 흥미로운 정보:

작성자는 콘텐츠를 게시하는 다양한 주제의 수에 따라 여러 평판 점수를 가질 수 있습니다.
저자의 평판 점수는 출판사와 무관합니다.
중복된 내용이나 발췌문이 여러 번 게시될 경우 평판 점수가 하락할 수 있습니다.
게시된 콘텐츠에 대한 링크 수는 평판 점수에 영향을 줄 수 있습니다.

또한, 이 특허는 저자에 대한 신뢰성 요소를 다룹니다. 다음과 같은 영향 요인이 언급됩니다.

회사에서 저자의 직업 또는 역할에 대한 확인된 정보입니다. 회사의 신뢰성도 고려합니다.
게시된 콘텐츠의 주제에 대한 직업의 관련성.
저자의 교육 및 훈련 수준.
시간에 따른 저자의 경험. 저자가 주제에 대해 더 오래 출판할수록 더 신뢰할 수 있습니다. 저자/발행자의 경험은 주제 영역의 첫 출판 날짜를 통해 Google에 대해 알고리즘적으로 결정될 수 있습니다.
주제에 게시된 콘텐츠 수입니다. 저자가 한 주제에 대해 많은 논문을 발표하면 그가 전문가이고 어느 정도 신빙성이 있다고 가정할 수 있습니다.
마지막 릴리스까지 경과된 시간입니다. 저자가 주제에 대해 마지막으로 게시한 이후 시간이 길수록 해당 주제에 대한 가능한 평판 점수가 더 낮아집니다. 콘텐츠가 최신일수록 더 높습니다.
수상작 및 최우수작 목록에서 저자/출판사를 언급합니다.

순위가 매겨진 검색 결과의 순위를 재지정하는 시스템 및 방법

이 구글 특허는 2013년에 처음 서명됐으며 최소 존속 기간은 2033년까지다.

특허 발명가 중에는 여러 EEAT 관련 Google 특허에 관여한 Chung Tin Kwok이 있습니다.

이 특허는 저자의 콘텐츠에 대한 참조 외에도 검색 엔진이 저자 점수 매기기에서 주제별 문서 코퍼스에 기여할 수 있는 비율을 고려할 수 있는 방법을 설명합니다.

"일부 실시예에서, 각각의 엔티티에 대한 원저자 점수를 결정하는 단계는 각각의 엔티티와 연관되는 것으로 식별된 알려진 콘텐츠의 인덱스에서 콘텐츠의 복수 부분을 식별하는 단계를 포함하며, 복수의 부분의 각 부분은 사전 결정된 양을 나타냅니다. 및 기지 콘텐츠 색인 내의 콘텐츠 부분의 제1 인스턴스인 복수의 부분의 백분율을 계산하는 단계를 포함한다.

인용 점수를 포함하여 저자 점수를 기준으로 검색 결과의 순위를 다시 매기는 것을 설명합니다. 인용 점수는 저자의 문서에 대한 참조 수를 기반으로 합니다.

저자 채점의 또 다른 기준은 저자가 주제 관련 문서 모음에 기여한 콘텐츠의 비율입니다.

"[W]각 엔티티에 대한 저자 점수를 결정하는 것은: 각각의 엔티티에 대한 인용 점수를 결정하는 것을 포함하며, 여기서 인용 점수는 각각의 엔티티와 관련된 콘텐츠가 인용되는 빈도에 해당합니다. 각각의 엔터티, 여기서 원저자 점수는 알려진 콘텐츠의 인덱스에서 콘텐츠의 첫 번째 인스턴스인 각 엔터티와 관련된 콘텐츠의 백분율에 해당하며, 미리 정해진 함수를 사용하여 인용 점수와 원저자 점수를 결합하여 생성 저자 점수."

특허의 목적은 "모방"을 식별하고 순위에서 해당 내용을 낮추는 것이지만 저자에 대한 일반적인 평가에도 사용할 수 있습니다.

저자를 평가하는 주요 요소

위의 특허에 나열된 저자 평가에 대한 가능한 요소 외에도 고려해야 할 몇 가지 사항이 더 있습니다(이 중 일부는 내 기사 "Google이 EAT를 평가할 수 있는 14가지 방법"에서 이미 언급했습니다).

주제에 대한 콘텐츠의 전반적인 품질: 저자가 도메인 및 형식과 관계없이 전체 주제에 대한 콘텐츠에 대해 전달하는 품질은 EEAT의 요인이 될 수 있습니다. 이에 대한 신호는 콘텐츠 수준에서 사용자 신호, 링크 및 기타 품질 신호가 될 수 있습니다.
PageRank 또는 작성자 콘텐츠에 대한 참조.
콘텐츠(팟캐스트, 비디오, 웹사이트, PDF, 책)에서 관련 주제 또는 용어와 함께 저자가 동시에 등장합니다.
관련 주제 또는 용어와 함께 검색 쿼리에서 작성자의 동시 출현.

작성자 엔터티에 EEAT 적용

기계 학습 방법을 사용하면 구조화되지 않은 콘텐츠에서 의미 구조를 대규모로 인식하고 매핑할 수 있습니다.

이를 통해 Google은 이전에 Knowledge Graph에 표시된 것보다 더 많은 항목을 인식하고 이해할 수 있습니다.

결과적으로 콘텐츠의 출처는 점점 더 중요한 역할을 합니다. EEAT는 문서, 콘텐츠 및 도메인을 넘어 알고리즘적으로 적용될 수 있습니다.

이 개념은 콘텐츠의 작성자 엔터티(즉, 콘텐츠를 담당하는 작성자 및 조직)도 포함할 수 있습니다.

앞으로 몇 년 동안 Google 검색에서 EEAT의 훨씬 더 중요한 영향을 보게 될 것이라고 생각합니다. 이 요소는 개별 콘텐츠의 관련성 최적화만큼 순위에 중요할 수도 있습니다.

이 기사에 표현된 의견은 게스트 작성자의 의견이며 반드시 검색 엔진 랜드가 아닙니다. 교직원 저자는 여기에 나열됩니다.

Google 뉴스 피드에 Search Engine Land를 추가하세요.