'검색됨 - 현재 인덱싱되지 않음' 이해 및 해결

게시 됨: 2023-02-07

Google Search Console에 '발견됨 – 현재 인덱싱되지 않음' 이 표시되면 Google이 URL을 알고 있지만 아직 크롤링 및 인덱싱하지 않았음을 의미합니다.

반드시 페이지가 처리되지 않는다는 의미는 아닙니다. 그들의 문서에서 알 수 있듯이 그들은 귀하의 추가 노력 없이 나중에 다시 돌아올 수 있습니다.

그러나 다음과 같은 다른 요인으로 인해 Google이 페이지를 크롤링하고 색인을 생성하지 못할 수 있습니다.

Google의 크롤링 기능을 제한하거나 방해하는 서버 문제 및 현장 기술 문제.
품질과 같은 페이지 자체와 관련된 문제.

또한 Google Search Console Inspection API를 사용하여 coverageState 상태(및 기타 유용한 데이터 포인트)에 대한 URL을 한꺼번에 대기열에 추가할 수 있습니다.

Google Search Console을 통해 인덱싱 요청

이것은 명백한 해결책이며 대부분의 경우 문제를 해결할 것입니다.

때때로 Google은 새 URL을 크롤링하는 속도가 느립니다. 그런 일이 발생합니다. 그러나 다른 경우에는 근본적인 문제가 범인입니다.

인덱싱을 요청하면 다음 두 가지 중 하나가 발생할 수 있습니다.

URL이 "크롤링됨 - 현재 인덱싱되지 않음"이 됩니다.
임시 인덱싱

둘 다 근본적인 문제의 증상입니다.

두 번째는 인덱싱을 요청하면 때때로 URL에 일시적인 "신선도 향상"이 제공되어 URL이 필수 품질 임계값을 초과할 수 있고 결과적으로 임시 인덱싱으로 이어질 수 있기 때문입니다.

검색 마케터가 의존하는 일일 뉴스레터를 받으세요.

용어를 참조하십시오.

페이지 품질 문제

이것은 어휘가 혼란스러워 질 수있는 곳입니다. "아직 크롤링되지 않은 경우 Google에서 페이지 품질을 어떻게 확인할 수 있습니까?"라는 질문을 받았습니다.

이것은 좋은 질문이며 대답은 할 수 없다는 것입니다.

Google은 도메인의 다른 페이지를 기반으로 페이지의 품질을 가정합니다. 그들의 분류는 마찬가지로 URL 패턴과 웹사이트 아키텍처를 기반으로 합니다.

결과적으로 이러한 페이지를 "인식"에서 크롤링 대기열로 이동하는 것은 유사한 페이지에서 발견한 품질 부족에 따라 우선 순위가 낮아질 수 있습니다.

유사한 URL 패턴에 있는 페이지 또는 사이트 아키텍처의 유사한 영역에 있는 페이지는 동일한 사용자 의도 및 키워드를 대상으로 하는 다른 콘텐츠에 비해 제안 가치가 낮을 수 있습니다.

가능한 원인은 다음과 같습니다.

기본 콘텐츠 깊이입니다.
프레젠테이션.
지원 콘텐츠 수준.
제공되는 콘텐츠 및 관점의 고유성.
또는 훨씬 더 조작적인 문제(즉, 콘텐츠의 품질이 낮고 자동 생성, 회전 또는 이미 설정된 콘텐츠를 직접 복제함)입니다.

사이트 클러스터 및 특정 페이지 내에서 콘텐츠 품질을 개선하기 위해 노력하면 더 큰 목적으로 콘텐츠를 크롤링하려는 Google의 관심을 다시 불러일으키는 데 긍정적인 영향을 미칠 수 있습니다.

또한 사이트에서 좋은 품질 페이지와 나쁜 품질 페이지의 비율을 개선하기 위해 최고 품질이 아니라고 인정하는 웹 사이트의 다른 페이지를 색인 생성하지 않을 수 있습니다.

크롤링 예산 및 효율성

크롤링 예산은 SEO에서 종종 오해되는 메커니즘입니다.

대부분의 웹사이트는 이에 대해 걱정할 필요가 없습니다. 실제로 Google의 Gary Illyes는 웹사이트의 90%가 크롤링 예산에 대해 생각할 필요가 없다고 주장했습니다. 종종 기업 웹 사이트의 문제로 간주됩니다.

반면 크롤링 효율성은 모든 규모의 웹사이트에 영향을 미칠 수 있습니다. 간과하면 Google이 웹사이트를 크롤링하고 처리하는 방식에 문제가 발생할 수 있습니다.

예를 들어 귀하의 웹사이트가 다음과 같은 경우:

매개변수가 있는 URL을 복제합니다.
후행 슬래시를 사용하거나 사용하지 않고 해결합니다.
HTTP 및 HTTPS에서 사용할 수 있습니다.
여러 하위 도메인(예: https://website.com 및 https://www.website.com)의 콘텐츠를 제공합니다.

...더 넓은 사이트 가정을 기반으로 크롤링 우선 순위에 대한 Google의 가정에 영향을 미치는 중복 문제가 있을 수 있습니다.

불필요한 URL과 요청으로 Google의 크롤링 예산을 낭비하고 있을 수 있습니다. Googlebot이 웹사이트를 부분적으로 크롤링한다는 점을 감안할 때 Google 리소스가 새로 게시된 모든 URL을 원하는 만큼 빨리 검색할 수 있을 만큼 확장되지 않을 수 있습니다.

웹 사이트를 정기적으로 크롤링하고 다음을 확인하려고 합니다.

페이지는 원하는 대로 단일 하위 도메인으로 확인됩니다.
페이지는 단일 HTTP 프로토콜로 확인됩니다.
매개변수가 있는 URL은 원하는 대로 루트로 정규화됩니다.
내부 링크는 불필요하게 리디렉션을 사용하지 않습니다.

웹사이트에서 전자상거래 제품 필터와 같은 매개변수를 사용하는 경우 robots.txt 파일에서 이러한 URI 경로를 허용하지 않음으로써 이러한 URI 경로의 크롤링을 억제할 수 있습니다.

서버는 Google이 웹사이트를 크롤링하기 위해 예산을 할당하는 방식에도 중요할 수 있습니다.

서버가 과부하 상태이고 응답 속도가 너무 느리면 크롤링 문제가 발생할 수 있습니다. 이 경우 Googlebot이 페이지에 액세스할 수 없어 일부 콘텐츠가 크롤링되지 않습니다.

결과적으로 Google은 나중에 웹 사이트 색인을 생성하기 위해 다시 시도하지만 전체 프로세스가 지연될 것입니다.

내부 연결

웹사이트가 있는 경우 한 페이지에서 다른 페이지로의 내부 링크를 갖는 것이 중요합니다.

Google은 일반적으로 내부 링크가 없거나 충분하지 않은 URL에 관심을 기울이지 않으며 색인에서 제외할 수도 있습니다.

Screaming Frog 및 Sitebulb와 같은 크롤러를 통해 페이지에 대한 내부 링크 수를 확인할 수 있습니다.

내부 링크가 있는 체계적이고 논리적인 웹사이트 구조를 갖는 것이 웹사이트를 최적화하는 가장 좋은 방법입니다.

그러나 이것에 문제가 있는 경우 모든 내부 페이지가 연결되었는지 확인하는 한 가지 방법은 HTML 사이트맵을 사용하여 크롤링 깊이를 "해킹"하는 것입니다.

이들은 기계가 아닌 사용자를 위해 설계되었습니다. 지금은 유물로 보일지 모르지만 여전히 유용할 수 있습니다.

또한 웹사이트에 많은 URL이 있는 경우 URL을 여러 페이지로 분할하는 것이 좋습니다. 단일 페이지에서 모두 연결되는 것을 원하지 않습니다.

또한 내부 링크는 onClick() 과 같은 JavaScript 함수에 의존하는 대신 내부 링크에 <a> 태그를 사용해야 합니다.

Jamstack 또는 JavaScript 프레임워크를 사용하는 경우 해당 프레임워크 또는 관련 라이브러리가 내부 링크를 처리하는 방법을 조사하십시오. 이들은 <a> 태그로 표시되어야 합니다.

이 기사에 표현된 의견은 게스트 작성자의 의견이며 반드시 검색 엔진 랜드가 아닙니다. 교직원 저자는 여기에 나열됩니다.

Google 뉴스 피드에 Search Engine Land를 추가하세요.