Compreendendo e resolvendo 'Descoberto - atualmente não indexado'

Publicados: 2023-02-07

Se você vir “Descoberto – atualmente não indexado” no Google Search Console, isso significa que o Google está ciente do URL, mas ainda não o rastreou e indexou.

Isso não significa necessariamente que a página nunca será processada. Como diz a documentação deles, eles podem voltar a ele mais tarde, sem nenhum esforço extra de sua parte.

Mas outros fatores podem estar impedindo o Google de rastrear e indexar a página, incluindo:

Problemas de servidor e problemas técnicos no local que restringem ou impedem a capacidade de rastreamento do Google.
Questões relacionadas à própria página, como qualidade.

Você também pode usar a API de inspeção do Google Search Console para enfileirar URLs para seu status de coverageState (bem como outros pontos de dados úteis) em massa.

Solicitar indexação por meio do Google Search Console

Essa é uma solução óbvia e, na maioria dos casos, resolverá o problema.

Às vezes, o Google é simplesmente lento para rastrear novos URLs – isso acontece. Mas outras vezes, os problemas subjacentes são os culpados.

Quando você solicita a indexação, uma das duas coisas pode acontecer:

URL torna-se “Rastreado – atualmente não indexado”
Indexação temporária

Ambos são sintomas de problemas subjacentes.

A segunda acontece porque a solicitação de indexação às vezes dá ao seu URL um “aumento de atualização” temporário que pode levar o URL acima do limite de qualidade necessário e, por sua vez, levar a uma indexação temporária.

Obtenha a newsletter diária em que os profissionais de marketing de busca confiam.

Consulte os termos.

Problemas de qualidade da página

É aqui que o vocabulário pode ficar confuso. Já me perguntaram: "Como o Google pode determinar a qualidade da página se ela ainda não foi rastreada?"

Esta é uma boa pergunta, e a resposta é que não pode.

O Google está fazendo uma suposição sobre a qualidade da página com base em outras páginas do domínio. Suas classificações também são baseadas em padrões de URL e arquitetura do site.

Como resultado, mover essas páginas de "conscientização" para a fila de rastreamento pode perder a prioridade com base na falta de qualidade que encontraram em páginas semelhantes.

É possível que as páginas com padrões de URL semelhantes ou localizadas em áreas semelhantes da arquitetura do site tenham uma proposta de baixo valor em comparação com outras partes do conteúdo que visam as mesmas intenções de usuário e palavras-chave.

As possíveis causas incluem:

A profundidade do conteúdo principal.
Apresentação.
Nível de conteúdo de apoio.
Singularidade do conteúdo e perspectivas oferecidas.
Ou problemas ainda mais manipulativos (ou seja, o conteúdo é de baixa qualidade e gerado automaticamente, fiado ou duplica diretamente o conteúdo já estabelecido).

Trabalhar para melhorar a qualidade do conteúdo no cluster de sites e nas páginas específicas pode ter um impacto positivo em reacender o interesse do Google em rastrear seu conteúdo com um propósito maior.

Você também pode não indexar outras páginas no site que você reconhece não serem da mais alta qualidade para melhorar a proporção de páginas de boa qualidade para páginas de má qualidade no site.

Orçamento e eficiência do rastreamento

O orçamento de rastreamento é um mecanismo frequentemente incompreendido em SEO.

A maioria dos sites não precisa se preocupar com isso. Na verdade, Gary Illyes, do Google, afirmou publicamente que provavelmente 90% dos sites não precisam pensar no orçamento de rastreamento. Muitas vezes, é considerado um problema para sites corporativos.

A eficiência do rastreamento, por outro lado, pode afetar sites de todos os tamanhos. Ignorado, pode levar a problemas sobre como o Google rastreia e processa o site.

Para ilustrar, se o seu site:

Duplica URLs com parâmetros.
Resolve com e sem barras à direita.
Está disponível em HTTP e HTTPS.
Oferece conteúdo de vários subdomínios (por exemplo, https://website.com e https://www.website.com).

…então você pode estar tendo problemas de duplicação que afetam as suposições do Google sobre a prioridade de rastreamento com base em suposições mais amplas do site.

Você pode estar acabando com o orçamento de rastreamento do Google com URLs e solicitações desnecessárias. Dado que o Googlebot rastreia sites em partes, isso pode fazer com que os recursos do Google não se estendam o suficiente para descobrir todos os URLs recém-publicados tão rápido quanto você gostaria.

Você deseja rastrear seu site regularmente e garantir que:

As páginas são resolvidas em um único subdomínio (conforme desejado).
As páginas resolvem para um único protocolo HTTP.
URLs com parâmetros são canonizados para a raiz (conforme desejado).
Os links internos não usam redirecionamentos desnecessariamente.

Se o seu site utiliza parâmetros, como filtros de produtos de comércio eletrônico, você pode restringir o rastreamento desses caminhos de URI desativando-os no arquivo robots.txt.

Seu servidor também pode ser importante na forma como o Google aloca o orçamento para rastrear seu site.

Se o seu servidor estiver sobrecarregado e respondendo muito lentamente, podem surgir problemas de rastreamento. Nesse caso, o Googlebot não conseguirá acessar a página, fazendo com que parte do seu conteúdo não seja rastreado.

Consequentemente, o Google tentará voltar mais tarde para indexar o site, mas sem dúvida causará um atraso em todo o processo.

Links internos

Quando você tem um site, é importante ter links internos de uma página para outra.

O Google geralmente presta menos atenção a URLs que não possuem links internos suficientes – e pode até mesmo excluí-los de seu índice.

Você pode verificar o número de links internos para páginas por meio de rastreadores como Screaming Frog e Sitebulb.

Ter uma estrutura de site organizada e lógica com links internos é o melhor caminho a seguir quando se trata de otimizar seu site.

Mas se você tiver problemas com isso, uma maneira de garantir que todas as suas páginas internas estejam conectadas é "hackear" a profundidade do rastreamento usando sitemaps HTML.

Estes são projetados para usuários, não para máquinas. Embora possam ser vistos como relíquias agora, eles ainda podem ser úteis.

Além disso, se o seu site tiver muitos URLs, é aconselhável dividi-los em várias páginas. Você não quer todos eles vinculados a partir de uma única página.

Links internos também precisam usar a tag <a> para links internos em vez de depender de funções JavaScript como onClick() .

Se você estiver utilizando um framework Jamstack ou JavaScript, investigue como ele ou quaisquer bibliotecas relacionadas lidam com links internos. Estes devem ser apresentados como tags <a>.

As opiniões expressas neste artigo são do autor convidado e não necessariamente do Search Engine Land. Os autores da equipe estão listados aqui.

Adicione Search Engine Land ao seu feed do Google Notícias.