Zrozumienie i rozwiązanie problemu „Odkryte – obecnie nieindeksowane”

Opublikowany: 2023-02-07

Jeśli w Google Search Console zobaczysz komunikat „Odnalezione – obecnie nieindeksowane” , oznacza to, że Google zna adres URL, ale jeszcze go nie przeszukał i nie zindeksował.

Nie musi to oznaczać, że strona nigdy nie zostanie przetworzona. Jak mówi ich dokumentacja, mogą wrócić do tego później bez dodatkowego wysiłku z Twojej strony.

Jednak inne czynniki mogą uniemożliwiać Google przeszukiwanie i indeksowanie strony, w tym:

Problemy z serwerem i problemy techniczne w witrynie ograniczające lub uniemożliwiające indeksowanie przez Google.
Kwestie związane z samą stroną, takie jak jakość.

Możesz także użyć interfejsu Google Search Console Inspection API do masowego kolejkowania adresów URL pod kątem ich stanu coverageState (a także innych przydatnych punktów danych).

Poproś o indeksowanie przez Google Search Console

Jest to oczywiste rozwiązanie iw większości przypadków rozwiąże problem.

Czasami Google po prostu wolno indeksuje nowe adresy URL – to się zdarza. Ale innym razem winowajcą są podstawowe problemy.

Gdy poprosisz o indeksowanie, może się zdarzyć jedna z dwóch rzeczy:

Adres URL zmienia się na „Zindeksowano – obecnie nie jest indeksowany”
Tymczasowe indeksowanie

Oba są objawami leżących u podstaw problemów.

Druga sytuacja ma miejsce, ponieważ prośba o zindeksowanie czasami powoduje tymczasowy „wzrost świeżości” adresu URL, co może sprawić, że adres URL przekroczy wymagany próg jakości, co z kolei doprowadzi do tymczasowego indeksowania.

Otrzymuj codzienny biuletyn wyszukiwania, na którym polegają marketerzy.

Zobacz warunki.

Problemy z jakością strony

W tym miejscu słownictwo może być mylące. Zapytano mnie: „Jak Google może określić jakość strony, jeśli nie została ona jeszcze zindeksowana?”

To dobre pytanie, a odpowiedź brzmi, że nie może.

Google przyjmuje założenia dotyczące jakości strony na podstawie innych stron w domenie. Ich klasyfikacje są również oparte na wzorcach adresów URL i architekturze witryny.

W rezultacie przeniesienie tych stron z „świadomości” do kolejki indeksowania może zostać pozbawione priorytetu na podstawie niskiej jakości, którą wykryto na podobnych stronach.

Możliwe, że strony o podobnych wzorcach adresów URL lub znajdujące się w podobnych obszarach architektury witryny mają niską wartość w porównaniu z innymi fragmentami treści kierowanymi na te same intencje użytkowników i słowa kluczowe.

Możliwe przyczyny to:

Główna głębia treści.
Prezentacja.
Poziom treści pomocniczych.
Wyjątkowość oferowanych treści i perspektyw.
Lub nawet bardziej manipulacyjne kwestie (tj. treść jest niskiej jakości i automatycznie generowana, wirowana lub bezpośrednio powiela już ustaloną treść).

Praca nad poprawą jakości treści w klastrze witryn i na poszczególnych stronach może mieć pozytywny wpływ na ponowne zainteresowanie Google indeksowaniem Twoich treści w większym celu.

Możesz także nieindeksować innych stron w witrynie, co do których uznajesz, że nie są najwyższej jakości, aby poprawić stosunek stron o dobrej jakości do stron o złej jakości w witrynie.

Indeksuj budżet i wydajność

Budżet indeksowania jest często źle rozumianym mechanizmem w SEO.

Większość stron internetowych nie musi się o to martwić. W rzeczywistości Gary Illyes z Google stwierdził, że prawdopodobnie 90% stron internetowych nie musi myśleć o budżecie na indeksowanie. Jest to często postrzegane jako problem dla witryn firmowych.

Z drugiej strony wydajność indeksowania może mieć wpływ na witryny dowolnej wielkości. Przeoczony może prowadzić do problemów z indeksowaniem i przetwarzaniem witryny przez Google.

Aby to zilustrować, jeśli Twoja witryna:

Duplikuje adresy URL z parametrami.
Rozpoznaje z końcowymi ukośnikami i bez nich.
Jest dostępny w protokole HTTP i HTTPS.
Obsługuje treści z wielu subdomen (np. https://website.com i https://www.website.com).

…w takim razie możesz mieć problemy z powielaniem, które wpływają na założenia Google dotyczące priorytetu indeksowania na podstawie szerszych założeń dotyczących witryny.

Być może zapychasz budżet indeksowania Google niepotrzebnymi adresami URL i żądaniami. Biorąc pod uwagę, że Googlebot indeksuje witryny fragmentarycznie, może to spowodować, że zasoby Google nie będą wystarczające, aby wykryć wszystkie nowo opublikowane adresy URL tak szybko, jak chcesz.

Chcesz regularnie indeksować swoją witrynę i upewnić się, że:

Strony rozwiązują się do pojedynczej subdomeny (zgodnie z życzeniem).
Strony są tłumaczone na jeden protokół HTTP.
Adresy URL z parametrami są kanonizowane do katalogu głównego (zgodnie z życzeniem).
Linki wewnętrzne nie wykorzystują przekierowań niepotrzebnie.

Jeśli Twoja witryna korzysta z parametrów, takich jak filtry produktów e-commerce, możesz ograniczyć indeksowanie tych ścieżek URI, blokując je w pliku robots.txt.

Twój serwer może również mieć znaczenie dla sposobu, w jaki Google przydziela budżet na indeksowanie Twojej witryny.

Jeśli serwer jest przeciążony i odpowiada zbyt wolno, mogą wystąpić problemy z indeksowaniem. W takim przypadku Googlebot nie będzie mógł uzyskać dostępu do strony, co spowoduje, że niektóre treści nie zostaną zindeksowane.

W związku z tym Google spróbuje wrócić później, aby zaindeksować witrynę, ale bez wątpienia spowoduje to opóźnienie całego procesu.

Linkowanie wewnętrzne

Gdy masz witrynę internetową, ważne jest, aby mieć wewnętrzne linki z jednej strony do drugiej.

Google zwykle przywiązuje mniejszą wagę do adresów URL, które nie mają żadnych lub mają wystarczającą liczbę linków wewnętrznych – i może nawet wykluczyć je ze swojego indeksu.

Możesz sprawdzić liczbę wewnętrznych linków do stron za pomocą robotów indeksujących, takich jak Screaming Frog i Sitebulb.

Posiadanie zorganizowanej i logicznej struktury witryny z wewnętrznymi linkami to najlepszy sposób na optymalizację witryny.

Ale jeśli masz z tym problem, jednym ze sposobów upewnienia się, że wszystkie Twoje strony wewnętrzne są połączone, jest „włamanie się” do głębokości indeksowania za pomocą map witryn HTML.

Są one przeznaczone dla użytkowników, a nie maszyn. Chociaż teraz mogą być postrzegane jako relikwie, nadal mogą być przydatne.

Ponadto, jeśli witryna ma wiele adresów URL, warto podzielić je na wiele stron. Nie chcesz, aby wszystkie były połączone z jednej strony.

Linki wewnętrzne również muszą używać tagu <a> dla linków wewnętrznych zamiast polegać na funkcjach JavaScript, takich jak onClick() .

Jeśli korzystasz ze środowiska Jamstack lub JavaScript, sprawdź, jak on lub inne powiązane biblioteki obsługują linki wewnętrzne. Muszą one być przedstawione jako znaczniki <a>.

Opinie wyrażone w tym artykule są opiniami autora-gościa i niekoniecznie Search Engine Land. Autorzy personelu są wymienieni tutaj.

Dodaj Search Engine Land do swojego kanału Google News.