엔티티 SEO: 결정적인 가이드

게시 됨: 2023-04-06

이 기사는 Andrew Ansley 가 공동 작성했습니다 .

문자열이 아닌 사물. 전에 들어본 적이 없다면 Knowledge Graph를 발표한 유명한 Google 블로그 게시물에서 가져온 것입니다.

발표 11주년이 한 달 밖에 남지 않았지만 많은 사람들이 여전히 "문자열이 아닌 것"이 SEO에 실제로 의미하는 바를 이해하기 위해 고군분투하고 있습니다.

이 인용문은 Google이 사물을 이해하고 더 이상 단순한 키워드 감지 알고리즘이 아님을 전달하려는 시도입니다.

2012년 5월에 엔티티 SEO가 탄생했다고 주장할 수 있습니다. 반구조화 및 구조화 지식 기반의 도움을 받는 Google의 머신 러닝은 키워드의 의미를 이해할 수 있습니다.

언어의 모호한 특성은 마침내 장기적인 해결책을 찾았습니다.

그렇다면 지난 10년 동안 엔티티가 Google에 중요했다면 SEO가 여전히 엔티티에 대해 혼동하는 이유는 무엇입니까?

좋은 질문. 네 가지 이유가 있습니다.

  • 용어로서의 엔티티 SEO는 SEO가 그 정의에 익숙해져 어휘에 통합할 만큼 널리 사용되지 않았습니다.
  • 엔티티에 대한 최적화는 기존의 키워드 중심 최적화 방법과 크게 겹칩니다. 결과적으로 엔티티는 키워드와 통합됩니다. 게다가 엔티티가 SEO에서 어떤 역할을 하는지 명확하지 않았으며 Google이 주제에 대해 말할 때 "엔티티"라는 단어는 때때로 "주제"와 상호 교환 가능합니다.
  • 엔터티를 이해하는 것은 지루한 작업입니다. 엔터티에 대한 깊은 지식을 원한다면 Google 특허를 읽고 기계 학습의 기본 사항을 알아야 합니다. Entity SEO는 SEO에 대한 훨씬 더 과학적인 접근 방식이며 과학은 모든 사람을 위한 것이 아닙니다.
  • YouTube는 지식 배포에 막대한 영향을 미쳤지만 많은 과목에 대한 학습 경험을 평평하게 만들었습니다. 플랫폼에서 가장 큰 성공을 거둔 제작자는 역사적으로 청중을 교육할 때 쉬운 길을 택했습니다. 결과적으로 콘텐츠 제작자는 최근까지 엔터티에 많은 시간을 할애하지 않았습니다. 그렇기 때문에 NLP 연구원들에게 엔터티에 대해 배우고 그 지식을 SEO에 적용해야 합니다. 특허와 연구 논문이 핵심입니다. 다시 한 번 이것은 위의 첫 번째 요점을 강화합니다.

이 문서는 SEO가 SEO에 대한 엔터티 기반 접근 방식을 완전히 마스터하지 못하게 하는 네 가지 문제에 대한 솔루션입니다.

이것을 읽으면 다음을 배우게 됩니다.

  • 엔터티가 무엇이고 왜 중요한지.
  • 시맨틱 검색의 역사.
  • SERP에서 엔터티를 식별하고 사용하는 방법.
  • 엔터티를 사용하여 웹 콘텐츠 순위를 매기는 방법.

엔터티가 중요한 이유는 무엇입니까?

엔티티 SEO는 순위를 매길 콘텐츠를 선택하고 그 의미를 결정하는 것과 관련하여 검색 엔진이 향하는 미래입니다.

이것을 지식 기반 신뢰와 결합하면 엔티티 SEO가 향후 2년 동안 SEO가 수행되는 방식의 미래가 될 것이라고 믿습니다.

엔터티의 예

그렇다면 엔터티를 어떻게 인식합니까?

SERP에는 당신이 본 적이 있는 엔터티의 몇 가지 예가 있습니다.

가장 일반적인 엔터티 유형은 위치, 사람 또는 비즈니스와 관련이 있습니다.

Google 프로필 페이지
Google 비즈니스 프로필
구글 이미지 검색
구글 이미지 검색
지식 패널
지식 패널
의도 클러스터
의도 클러스터

아마도 SERP에서 엔터티의 가장 좋은 예는 의도 클러스터일 것입니다. 주제를 더 많이 이해할수록 이러한 검색 기능이 더 많이 나타납니다.

흥미롭게도 단일 SEO 캠페인은 엔티티 중심의 SEO 캠페인을 실행하는 방법을 알고 있을 때 SERP의 얼굴을 바꿀 수 있습니다.

Wikipedia 항목은 엔터티의 또 다른 예입니다. Wikipedia는 엔터티와 관련된 정보의 좋은 예를 제공합니다.

왼쪽 상단에서 볼 수 있듯이 엔티티는 해부학에서 인간에 대한 중요성에 이르기까지 "물고기"와 관련된 모든 종류의 속성을 가지고 있습니다.

물고기 - Wikipedia 항목

Wikipedia에는 ​​주제에 대한 많은 데이터 포인트가 포함되어 있지만, 모든 것을 포함하지는 않습니다.

엔터티란 무엇입니까?

엔터티는 이름, 유형, 특성 및 다른 엔터티와의 관계로 특징지어지는 고유하게 식별 가능한 개체 또는 사물입니다. 엔터티는 엔터티 카탈로그에 존재할 때만 존재하는 것으로 간주됩니다.

엔터티 카탈로그는 각 엔터티에 고유한 ID를 할당합니다. 내 대행사에는 각 엔터티(서비스, 제품 및 브랜드가 모두 포함됨)와 연결된 고유 ID를 사용하는 프로그래밍 방식 솔루션이 있습니다.

단어나 구가 기존 카탈로그에 없는 경우 해당 단어나 구가 엔터티가 아니라는 의미는 아니지만 일반적으로 카탈로그에 존재하는 것으로 엔터티인지 여부를 알 수 있습니다.

Wikipedia는 항목이 엔터티인지 여부를 결정하는 요소가 아니지만 회사는 엔터티 데이터베이스로 가장 잘 알려져 있습니다.

엔터티에 대해 이야기할 때 모든 카탈로그를 사용할 수 있습니다. 일반적으로 엔터티는 사람, 장소 또는 사물이지만 아이디어와 개념도 포함될 수 있습니다.

엔터티 카탈로그의 몇 가지 예는 다음과 같습니다.

  • 위키백과
  • 위키데이터
  • DBpedia
  • 프리베이스
  • 야고
야고 지식 그래프

엔터티는 구조화되지 않은 데이터와 구조화된 데이터 사이의 간극을 연결하는 데 도움이 됩니다.

구조화되지 않은 텍스트를 의미론적으로 보강하는 데 사용할 수 있는 반면 텍스트 소스는 구조화된 지식 기반을 채우는 데 사용할 수 있습니다.

텍스트에서 엔터티에 대한 언급을 인식하고 이러한 언급을 지식 기반의 해당 항목과 연결하는 것을 엔터티 연결 작업이라고 합니다.

엔터티를 사용하면 인간과 기계 모두에게 텍스트의 의미를 더 잘 이해할 수 있습니다.

인간은 엔터티가 언급된 컨텍스트를 기반으로 엔터티의 모호성을 비교적 쉽게 해결할 수 있지만 이는 기계에 많은 어려움과 과제를 제시합니다.

엔터티의 기술 자료 항목은 해당 엔터티에 대해 알고 있는 내용을 요약합니다.

세상이 끊임없이 변화함에 따라 새로운 사실도 표면화되고 있습니다. 이러한 변화를 따라잡으려면 편집자와 콘텐츠 관리자의 지속적인 노력이 필요합니다. 이것은 대규모로 까다로운 작업입니다.

엔티티가 언급된 문서의 내용을 분석하여 새로운 사실 ​​또는 업데이트가 필요한 사실을 찾는 프로세스를 지원하거나 완전히 자동화할 수 있습니다.

과학자들은 이것을 지식 기반 인구의 문제라고 부르며, 이것이 엔터티 연결이 중요한 이유입니다.

엔터티는 키워드 쿼리 및 문서 콘텐츠로 표현되는 사용자의 정보 요구에 대한 의미론적 이해를 용이하게 합니다. 따라서 엔터티는 쿼리 및/또는 문서 표현을 개선하는 데 사용될 수 있습니다.

Extended Named Entity 연구 논문에서 저자는 약 160개의 엔티티 유형을 식별합니다. 다음은 목록에 있는 7개의 스크린샷 중 2개입니다.

확장된 명명된 엔터티 - 1
1/7 엔티티 유형
확장된 명명된 엔터티 - 2
3/7 엔티티 유형

엔터티의 특정 범주는 더 쉽게 정의되지만 개념과 아이디어가 엔터티임을 기억하는 것이 중요합니다. 이 두 범주는 Google이 자체적으로 확장하기가 매우 어렵습니다.

모호한 개념으로 작업할 때 한 페이지만으로 Google을 가르칠 수는 없습니다. 엔터티를 이해하려면 시간이 지남에 따라 유지되는 많은 기사와 참조가 필요합니다.

법인과 관련된 Google의 역사

2010년 7월 16일에 Google은 Freebase를 인수했습니다. 이 구매는 현재의 엔티티 검색 시스템으로 이어진 첫 번째 주요 단계였습니다.

구글과 프리베이스

Freebase에 투자한 후 Google은 Wikidata에 더 나은 솔루션이 있음을 깨달았습니다. 그런 다음 Google은 Freebase를 Wikidata로 병합하는 작업을 수행했는데 이는 예상보다 훨씬 어려운 작업이었습니다.

5명의 Google 과학자가 "Freebase에서 Wikidata로: 위대한 마이그레이션"이라는 제목의 논문을 작성했습니다. 주요 내용은 다음과 같습니다.

“Freebase는 개체, 팩트, 유형 및 속성의 개념을 기반으로 합니다. 각 Freebase 개체에는 "mid"(머신 ID용)라는 안정적인 식별자가 있습니다."

“Wikidata의 데이터 모델은 항목과 진술의 개념에 의존합니다. 항목은 엔터티를 나타내고 "qid"라는 안정적인 식별자를 가지며 여러 언어로 된 레이블, 설명 및 별칭을 가질 수 있습니다. 다른 Wikimedia 프로젝트(가장 눈에 띄는 Wikipedia)의 항목에 대한 추가 진술 및 페이지 링크. Freebase와 달리 Wikidata 진술은 실제 사실을 인코딩하는 것이 아니라 서로 모순될 수 있는 다양한 출처의 주장을 인코딩하는 것을 목표로 합니다…

엔터티는 이러한 지식 기반에서 정의되지만 Google은 여전히 ​​구조화되지 않은 데이터(예: 블로그)에 대한 엔터티 지식을 구축해야 했습니다.

Google은 Bing 및 Yahoo와 협력하여 이 작업을 수행하기 위해 Schema.org를 만들었습니다.

Google은 웹사이트 관리자가 Google이 콘텐츠를 이해하는 데 도움이 되는 도구를 사용할 수 있도록 스키마 지침을 제공합니다. Google은 문자열이 아닌 사물에 집중하기를 원합니다.

구글의 말:

“페이지에 구조화된 데이터를 포함하여 페이지의 의미에 대한 명확한 단서를 Google에 제공함으로써 우리를 도울 수 있습니다. 구조화된 데이터는 페이지에 대한 정보를 제공하고 페이지 콘텐츠를 분류하기 위한 표준화된 형식입니다. 예를 들어 레시피 페이지에서 재료, 요리 시간과 온도, 칼로리 등이 무엇인지.”

Google은 계속해서 다음과 같이 말합니다.

"고급 디스플레이로 Google 검색에 표시될 수 있는 개체에 필요한 모든 속성을 포함해야 합니다. 일반적으로 더 많은 추천 기능을 정의하면 귀하의 정보가 향상된 디스플레이로 검색 결과에 나타날 가능성이 높아집니다. 그러나 완전하지 않거나 형식이 잘못되었거나 부정확한 데이터로 가능한 모든 권장 속성을 제공하려고 시도하는 것보다 더 적지만 완전하고 정확한 권장 속성을 제공하는 것이 더 중요합니다.”

스키마에 대해 더 많은 것을 말할 수 있지만 스키마는 페이지 콘텐츠를 검색 엔진에 명확하게 표시하려는 SEO를 위한 놀라운 도구라고 말하는 것으로 충분합니다.

퍼즐의 마지막 조각은 "향후 20년을 위한 검색 개선"이라는 제목의 Google 블로그 발표에서 나옵니다.

문서 관련성과 품질은 이 발표의 주요 아이디어입니다. 페이지의 콘텐츠를 결정하기 위해 Google이 사용한 첫 번째 방법은 전적으로 키워드에 초점을 맞추었습니다.

그런 다음 Google은 검색할 주제 레이어를 추가했습니다. 이 레이어는 지식 그래프와 웹 전반에 걸쳐 데이터를 체계적으로 스크랩하고 구조화함으로써 가능해졌습니다.

그것은 우리를 현재 검색 시스템으로 인도합니다. Google은 10년 이내에 5억 7천만 개의 항목과 180억 개의 팩트에서 8천억 개의 팩트와 80억 개의 항목으로 성장했습니다. 이 숫자가 증가함에 따라 엔터티 검색이 향상됩니다.

엔터티 모델이 이전 검색 모델보다 어떻게 개선되었습니까?

기존의 키워드 기반 정보 검색(IR) 모델에는 쿼리와 명시적으로 일치하는 용어가 없는 (관련) 문서를 검색할 수 없다는 고유한 제한이 있습니다.

ctrl + f를 사용하여 페이지에서 텍스트를 찾으면 기존의 키워드 기반 정보 검색 모델과 유사한 것을 사용합니다.

엄청난 양의 데이터가 매일 웹에 게시됩니다.

Google이 모든 단어, 모든 단락, 모든 기사 및 모든 웹사이트의 의미를 이해하는 것은 불가능합니다.

대신 엔터티는 Google이 이해도를 높이면서 계산 부하를 최소화할 수 있는 구조를 제공합니다.

“개념 기반 검색 방법은 더 높은 수준의 개념 공간에서 쿼리 및 문서의 의미론적 표현을 얻기 위해 보조 구조에 의존하여 이 문제를 해결하려고 시도합니다. 이러한 구조에는 제어 어휘(사전 및 시소러스), 온톨로지 및 지식 저장소의 엔터티가 포함됩니다.”

개체 지향 검색 , 8.3장

엔터티에 대한 결정적인 책을 쓴 Krisztian Balog는 전통적인 정보 검색 모델에 대한 세 가지 가능한 솔루션을 식별합니다.

  • 확장 기반 : 다른 용어로 쿼리를 확장하기 위해 엔터티를 소스로 사용합니다.
  • 프로젝션 기반 : 쿼리와 문서 간의 관련성은 엔터티의 잠재 공간에 프로젝션하여 이해합니다.
  • 엔터티 기반 : 용어 기반 표현을 보강하기 위해 엔터티 공간에서 쿼리 및 문서의 명시적 의미론적 표현을 얻습니다.

이 세 가지 접근 방식의 목표는 쿼리와 밀접하게 관련된 엔터티를 식별하여 필요한 사용자 정보를 보다 풍부하게 표현하는 것입니다.

그런 다음 Balog는 투영 기반 엔터티 매핑 방법과 관련된 6개의 알고리즘을 식별합니다(투영 방법은 엔터티를 3차원 공간으로 변환하고 기하학을 사용하여 벡터를 측정하는 것과 관련됨).

  • 명시적 의미론적 분석(ESA) : 주어진 단어의 의미론은 Wikipedia에서 파생된 개념에 대한 단어의 연관 강도를 저장하는 벡터로 설명됩니다.
  • LES(Latent entity space model) : 생성 확률론적 프레임워크를 기반으로 합니다. 문서의 검색 점수는 잠재 엔터티 공간 점수와 원래 쿼리 우도 점수의 선형 조합으로 간주됩니다.
  • EsdRank: EsdRank는 쿼리-엔티티 및 엔터티-문서 기능의 조합을 사용하여 문서 순위를 지정하기 위한 것입니다. 이들은 이전부터 각각 LES의 쿼리 프로젝션 및 문서 프로젝션 구성 요소의 개념에 해당합니다. 차별적 학습 프레임워크를 사용하여 엔터티 인기도 또는 문서 품질과 같은 추가 신호도 쉽게 통합할 수 있습니다.
  • 명시적 시맨틱 순위(ESR): 명시적 시맨틱 순위 모델은 지식 그래프의 관계 정보를 통합하여 엔터티 공간에서 "소프트 매칭"을 가능하게 합니다.
  • 단어-엔티티 듀엣 프레임워크: 이것은 용어 기반 표현과 엔티티 기반 표현 간의 교차 공간 상호 작용을 통합하여 쿼리 용어와 문서 용어, 쿼리 엔터티와 문서 용어, 쿼리 용어와 문서 엔터티 및 쿼리 엔터티의 네 가지 일치 유형으로 이어집니다. 엔터티를 문서화합니다.
  • 관심 기반 순위 모델 : 이것은 설명하기 가장 복잡한 것입니다.

Balog가 쓴 내용은 다음과 같습니다.

“질의 엔터티별로 추출되는 총 4개의 어텐션 피처가 설계되었습니다. 개체 모호성 기능은 개체 주석과 관련된 위험을 특성화하기 위한 것입니다. 이들은 다음과 같습니다: (1) 표면 형태가 다른 엔티티(예: Wikipedia)에 연결될 확률의 엔트로피, (2) 주석이 달린 엔티티가 표면 형태의 가장 인기 있는 의미인지 여부(즉, 가장 높은 공통성을 가짐) 점수 및 (3) 주어진 표면 형태에 대해 가장 유력한 후보와 두 번째로 유력한 후보 간의 공통성 점수의 차이 네 번째 특징은 임베딩 공간에서 쿼리 엔터티와 쿼리 간의 코사인 유사성으로 정의되는 근접성입니다. . 구체적으로, 공동 엔터티-용어 임베딩은 엔터티 멘션이 해당 엔터티 식별자로 대체되는 말뭉치의 스킵그램 모델을 사용하여 훈련됩니다. 쿼리의 임베딩은 쿼리 용어 임베딩의 중심으로 간주됩니다."

지금은 이러한 6가지 엔터티 중심 알고리즘에 대해 표면적으로 친숙해지는 것이 중요합니다.

주요 테이크 아웃은 두 가지 접근 방식이 존재한다는 것입니다. 잠재적 엔티티 계층에 문서를 프로젝션하는 것과 문서의 명시적 엔티티 주석입니다.

세 가지 유형의 데이터 구조

세 가지 유형의 데이터 구조

위의 이미지는 벡터 공간에 존재하는 복잡한 관계를 보여줍니다. 예제에서는 지식 그래프 연결을 보여 주지만 이와 동일한 패턴을 페이지별 스키마 수준에서 복제할 수 있습니다.

엔터티를 이해하려면 알고리즘이 사용하는 세 가지 유형의 데이터 구조를 아는 것이 중요합니다.

  • 구조화되지 않은 엔터티 설명을 사용하여 다른 엔터티에 대한 참조를 인식하고 명확하게 해야 합니다. 지시된 에지(하이퍼링크)는 각 엔터티에서 해당 설명에 언급된 다른 모든 엔터티로 추가됩니다.
  • 반구조화된 설정(예: Wikipedia)에서는 다른 엔터티에 대한 링크가 명시적으로 제공될 수 있습니다.
  • 구조화된 데이터 로 작업할 때 RDF 트리플은 그래프(즉, 지식 그래프)를 정의합니다. 특히 주체 및 개체 리소스(URI)는 노드이고 술어는 에지입니다.

IR 점수에 대한 반구조화되고 혼란스러운 컨텍스트의 문제는 문서가 단일 주제에 대해 구성되지 않은 경우 IR 점수가 두 가지 다른 컨텍스트에 의해 희석되어 다른 텍스트 문서에 대한 상대적 순위가 손실될 수 있다는 것입니다.

IR 점수 희석에는 잘못 구조화된 어휘 관계와 나쁜 단어 근접성이 포함됩니다.

서로를 완성하는 관련 단어는 문서의 단락 또는 섹션 내에서 밀접하게 사용되어 IR 점수를 높이기 위해 컨텍스트를 보다 명확하게 표시해야 합니다.

엔터티 특성 및 관계를 활용하면 5~20% 범위의 상대적 개선이 이루어집니다. 엔터티 유형 정보를 활용하면 25%에서 100% 이상에 이르는 상대적인 개선으로 훨씬 더 많은 보상을 얻을 수 있습니다.

엔터티로 문서에 주석을 추가하면 구조화되지 않은 문서에 구조를 가져올 수 있으므로 엔터티에 대한 새로운 정보로 지식 기반을 채우는 데 도움이 될 수 있습니다.

콘텐츠 스트림

Wikipedia를 엔터티 SEO 프레임워크로 사용

Wikipedia 페이지의 구조

  • 제목(I.)
  • 리드 섹션(II.)
    • 명확성 링크(II.a)
    • 정보 상자(II.b)
    • 소개 텍스트(II.c)
  • 목차 (III.)
  • 본문 내용(IV.)
  • 부록 및 하단 사항(V.)
    • 참조 및 참고 사항(Va)
    • 외부 링크(Vb)
    • 카테고리(VC)

대부분의 Wikipedia 기사에는 기사의 간략한 요약인 소개 텍스트인 "리드"가 포함되며 일반적으로 4개 단락을 넘지 않습니다. 기사의 흥미를 유발하는 방식으로 작성해야 합니다.

첫 번째 문장과 시작 단락은 특히 중요합니다. 첫 번째 문장은 "기사에 설명된 엔터티의 정의로 생각할 수 있습니다." 첫 번째 단락은 너무 많은 세부 사항 없이 보다 정교한 정의를 제공합니다.

링크의 가치는 탐색 목적을 넘어 확장됩니다. 기사 사이의 의미론적 관계를 포착합니다. 또한 앵커 텍스트는 엔터티 이름 변형의 풍부한 소스입니다. Wikipedia 링크는 무엇보다도 텍스트에서 엔티티 언급을 식별하고 명확하게 하는 데 도움이 될 수 있습니다.

  • 개체에 대한 주요 사실을 요약합니다(정보 상자).
  • 간략한 소개.
  • 내부 링크. 편집자에게 주어진 핵심 규칙은 엔티티 또는 개념의 첫 번째 항목에만 연결하는 것입니다.
  • 엔터티에 대해 널리 사용되는 모든 동의어를 포함합니다.
  • 카테고리 페이지 지정.
  • 탐색 템플릿.
  • 참조.
  • Wiki 페이지를 이해하기 위한 특수 구문 분석 도구입니다.
  • 여러 미디어 유형.

항목을 최적화하는 방법

다음은 검색을 위해 엔터티를 최적화할 때 주요 고려 사항입니다.

  • 페이지에 의미론적으로 관련된 단어를 포함합니다.
  • 페이지의 단어 및 구문 빈도.
  • 페이지의 개념 구성입니다.
  • 구조화되지 않은 데이터, 반구조화된 데이터 및 구조화된 데이터를 페이지에 포함합니다.
  • 주어-술어-객체 쌍(SPO).
  • 책의 페이지 역할을 하는 사이트의 웹 문서입니다.
  • 웹 사이트에서 웹 문서 구성.
  • 엔터티의 알려진 기능인 웹 문서에 개념을 포함합니다.

중요 사항: 엔터티 간의 관계를 강조하는 경우 지식 기반을 종종 지식 그래프라고 합니다.

의도는 사용자 검색 로그 및 기타 컨텍스트와 함께 분석되기 때문에 사람 1의 동일한 검색 문구가 사람 2와 다른 결과를 생성할 수 있습니다. 사람은 완전히 동일한 쿼리에 대해 다른 의도를 가질 수 있습니다.

귀하의 페이지가 두 가지 유형의 의도를 모두 포함하는 경우 귀하의 페이지는 웹 순위에 더 적합합니다. 기술 자료 구조를 사용하여 쿼리 의도 템플릿을 안내할 수 있습니다(이전 섹션에서 언급함).

People Also Ask, People Search For 및 Autocomplete는 제출된 쿼리와 의미적으로 관련되어 있으며 현재 검색 방향으로 더 깊이 들어가거나 검색 작업의 다른 측면으로 이동합니다.

우리는 이것을 알고 있으므로 어떻게 최적화할 수 있습니까?

문서에는 가능한 한 많은 검색 의도 변형이 포함되어야 합니다. 웹 사이트에는 클러스터에 대한 모든 검색 의도 변형이 포함되어야 합니다. 클러스터링은 세 가지 유형의 유사성에 의존합니다.

  • 어휘 유사성.
  • 의미론적 유사성.
  • 유사성을 클릭합니다.

주제 범위

그것은 무엇입니까 –> 속성 목록 –> 각 속성에 대한 섹션 –> 각 섹션은 해당 주제에 대한 전체 기사에 대한 링크 –> 청중을 지정해야 하고 하위 섹션에 대한 정의를 지정해야 합니다 –> 고려해야 할 사항 ? –> 어떤 이점이 있습니까? –> 수정자 혜택 –> ___이란 무엇입니까 –> 무엇을 합니까? –> 그것을 얻는 방법 –> 그것을 하는 방법 –> 그것을 할 수 있는 사람 –> 모든 범주로 다시 연결

사람들은 또한 묻습니다.

Google은 Google이 콘텐츠를 보는 방식을 알려주는 현저성 점수("강점" 또는 "자신감"이라는 단어를 사용하는 방식과 유사)를 제공하는 도구를 제공합니다.

구글 API 도구

위의 예는 2018년 엔티티에 대한 Search Engine Land 기사에서 가져온 것입니다.

SEL 기사의 항목

예에서 사람, 기타 및 조직을 볼 수 있습니다. 이 도구는 Google Cloud의 Natural Language API입니다.

엔티티에 대해 이야기할 때 모든 단어, 문장 및 단락이 중요합니다. 생각을 정리하는 방법에 따라 콘텐츠에 대한 Google의 이해가 바뀔 수 있습니다.

SEO에 대한 키워드를 포함할 수 있지만 Google은 귀하가 원하는 방식으로 해당 키워드를 이해합니까?

도구에 한두 개의 단락을 배치하고 예제를 재구성하고 수정하여 현저성을 높이거나 낮추는 방법을 확인하십시오.

"명확성"이라고 하는 이 연습은 엔터티에 매우 중요합니다. 언어는 모호하므로 우리는 Google에 우리의 말을 덜 모호하게 만들어야 합니다.

최신 명확성 접근법은 세 가지 유형의 증거를 고려합니다.

엔터티 및 멘션의 우선 순위.

언급을 둘러싼 텍스트와 후보 엔터티 간의 컨텍스트 유사성 및 문서의 모든 엔터티 연결 결정 간의 일관성.

엔티티 연결 결정

스키마는 내가 가장 좋아하는 콘텐츠 모호성 제거 방법 중 하나입니다. 블로그의 엔터티를 지식 저장소에 연결하고 있습니다. 발로그 말한다 :

"구조화되지 않은 텍스트의 엔터티를 구조화된 지식 저장소에 연결하면 사용자의 정보 소비 활동에 큰 힘을 실어줄 수 있습니다."

예를 들어 문서를 읽는 사람은 한 번의 클릭으로 컨텍스트 또는 배경 정보를 얻을 수 있으며 관련 엔터티에 쉽게 액세스할 수 있습니다.

엔터티 주석은 검색 성능을 개선하거나 검색 결과와 더 나은 사용자 상호 작용을 촉진하기 위해 다운스트림 처리에서 사용할 수도 있습니다.

엔티티 주석

여기에서 FAQ 콘텐츠가 FAQ 스키마를 사용하여 Google용으로 구성되었음을 확인할 수 있습니다.

항목 주석 - 2

이 예에서는 텍스트 설명, ID 및 페이지의 기본 엔터티 선언을 제공하는 스키마를 볼 수 있습니다.

(Google은 콘텐츠의 계층 구조를 이해하기를 원하므로 H1–H6이 중요한 이유입니다.)

대체 이름과 선언과 동일함을 볼 수 있습니다. 이제 Google은 콘텐츠를 읽을 때 텍스트와 연결할 구조화된 데이터베이스를 알게 되며 엔티티에 연결된 단어의 동의어 및 대체 버전을 갖게 됩니다.

스키마를 사용하여 최적화하면 엔터티 식별, 엔터티 추출 및 엔터티 청킹이라고도 하는 NER(명명된 엔터티 인식)에 맞게 최적화됩니다.

아이디어는 Named Entity Disambiguation > Wikification > Entity Linking에 참여하는 것입니다.

엔티티

"Wikipedia의 출현은 다른 귀중한 리소스(특히, 하이퍼링크, 카테고리, 리디렉션 및 명확화 페이지)와 함께 포괄적인 엔티티 카탈로그를 제공함으로써 대규모 엔티티 인식 및 명확화를 용이하게 했습니다."

– 개체 지향 검색

어떻게 SEO 도구 제안 그 이상

대부분의 SEO는 콘텐츠를 최적화하기 위해 일부 온페이지 도구를 사용합니다. 모든 도구는 고유한 콘텐츠 기회 및 콘텐츠 깊이 제안을 식별하는 기능이 제한되어 있습니다.

대부분의 경우 온페이지 도구는 상위 SERP 결과를 집계하고 에뮬레이션할 평균을 생성합니다.

SEO는 Google이 동일한 재해싱된 정보를 찾고 있지 않다는 점을 기억해야 합니다. 다른 사람들이 하는 것을 따라할 수 있지만 고유한 정보가 시드 사이트/권한 사이트가 되는 열쇠입니다.

다음은 Google에서 새 콘텐츠를 처리하는 방법에 대한 간략한 설명입니다.

주어진 엔터티를 언급하는 문서가 발견되면 해당 엔터티의 지식 기반 항목이 업데이트될 수 있는 새로운 사실을 발견하기 위해 해당 문서를 확인할 수 있습니다.

Balog는 다음과 같이 씁니다.

"우리는 편집자가 관심 있는 특정 엔터티 집합(즉, 특정 편집자가 담당).”

지식 기반, 엔티티 인식 및 정보 크롤링 가능성을 개선하는 사람은 누구나 Google의 사랑을 받을 것입니다.

지식 리포지토리에서 변경한 내용은 문서를 원래 소스로 역추적할 수 있습니다.

주제를 다루는 콘텐츠를 제공하고 드물거나 새로운 수준의 깊이를 추가하면 Google은 문서에 고유한 정보가 추가되었는지 식별할 수 있습니다.

결국 이 새로운 정보가 일정 기간 동안 유지되면 귀하의 웹사이트가 권위를 갖게 될 수 있습니다.

이것은 도메인 등급에 기반한 권위가 아니라 훨씬 더 가치 있다고 생각하는 주제 범위입니다.

SEO에 대한 엔터티 접근 방식을 사용하면 검색량으로 키워드를 타겟팅하는 데 제한을 받지 않습니다.

머리 용어(예: "플라이 낚싯대")를 확인하기만 하면 인간의 좋은 사고 방식에 따라 검색 의도 변형을 타겟팅하는 데 집중할 수 있습니다.

우리는 Wikipedia에서 시작합니다. 제물 낚시의 예에서 우리는 낚시 웹사이트에서 최소한 다음 개념을 다루어야 한다는 것을 알 수 있습니다.

  • 어종, 역사, 기원, 개발, 기술 개선, 확장, 플라이 낚시 방법, 캐스팅, 스페이 캐스팅, 송어 플라이 낚시, 플라이 낚시 기술, 냉수 낚시, 드라이 플라이 송어 낚시, 송어 님핑, 정수 송어 낚시, 송어 놀이, 송어 방류, 바닷물 플라이 낚시, 태클, 인공 파리 및 매듭.

위의 주제는 플라이 낚시 Wikipedia 페이지에서 가져왔습니다. 이 페이지는 주제에 대한 훌륭한 개요를 제공하지만 의미론적으로 관련된 주제에서 나오는 추가 주제 아이디어를 추가하는 것을 좋아합니다.

"물고기"라는 주제에 대해 어원, 진화, 해부학 및 생리학, 어류 의사 소통, 어류 질병, 보존 및 인간에 대한 중요성을 포함한 몇 가지 추가 주제를 추가할 수 있습니다.

송어의 해부학적 구조를 특정 낚시 기술의 효율성과 연관시킨 사람이 있습니까?

하나의 낚시 웹사이트에서 모든 물고기 종류를 다루면서 낚시 기술, 낚싯대, 미끼의 유형을 각 물고기에 연결했습니까?

지금쯤이면 주제 확장이 어떻게 커질 수 있는지 알 수 있을 것입니다. 콘텐츠 캠페인을 계획할 때 이 점을 염두에 두십시오.

그냥 다시 해시하지 마십시오. 값을 추가. 고유해야 합니다. 이 기사에서 언급한 알고리즘을 가이드로 사용하십시오.

결론

이 문서는 엔터티에 중점을 둔 문서 시리즈의 일부입니다. 다음 기사에서는 엔터티에 대한 최적화 노력과 시장에 나와 있는 일부 엔터티 중심 도구에 대해 자세히 살펴보겠습니다.

나는 이러한 개념들 중 많은 것을 나에게 설명해 준 두 사람에게 고함을 치면서 이 글을 끝내고 싶다.

SEO by the Sea의 Bill Slawski와 Holistic SEO의 Koray Tugbert. Slawski는 더 이상 우리와 함께하지 않지만 그의 기여는 SEO 업계에 계속해서 파급 효과를 미치고 있습니다.

나는 기사 내용에 대해 다음 출처에 크게 의존합니다. 이러한 출처는 해당 주제에 대해 존재하는 최고의 리소스이기 때문입니다.

  • Satoshi Ketine, Kiyoshi Sudo 및 Chikashi Nobata의 확장된 명명된 엔터티 계층 구조
  • Krisztian Balog의 Entity-Oriented Search , Information Retrieval Series(INRE, 39권)
  • 엔터티 감지를 사용한 쿼리 재작성 , Google 특허
  • 검색 쿼리 개선 , Google 특허
  • 엔터티를 검색 쿼리와 연결 , Google 특허

이 기사에 표현된 의견은 게스트 작성자의 의견이며 반드시 검색 엔진 랜드가 아닙니다. 교직원 저자는 여기에 나열됩니다.