Entendiendo y resolviendo 'Descubierto – actualmente no indexado'

Publicado: 2023-02-07

Si ve "Descubierto: actualmente no indexado" en Google Search Console, significa que Google conoce la URL, pero aún no la ha rastreado ni indexado.

No significa necesariamente que la página nunca se procesará. Como dice su documentación, pueden volver a ella más tarde sin ningún esfuerzo adicional de su parte.

Pero otros factores podrían estar impidiendo que Google rastree e indexe la página, entre ellos:

Problemas del servidor y problemas técnicos en el sitio que restringen o impiden la capacidad de rastreo de Google.
Cuestiones relativas a la propia página, como la calidad.

También puede usar la API de inspección de Google Search Console para poner en cola las URL para su estado de estado de coverageState (así como otros puntos de datos útiles) en masa.

Solicitar indexación a través de Google Search Console

Esta es una solución obvia y, en la mayoría de los casos, resolverá el problema.

A veces, Google simplemente tarda en rastrear nuevas URL: sucede. Pero otras veces, los problemas subyacentes son los culpables.

Cuando solicita la indexación, puede suceder una de dos cosas:

La URL se convierte en "Rastreada, actualmente no indexada"
Indexación temporal

Ambos son síntomas de problemas subyacentes.

El segundo ocurre porque solicitar la indexación a veces le da a su URL un "impulso de frescura" temporal que puede llevar la URL por encima del umbral de calidad requerido y, a su vez, conducir a una indexación temporal.

Obtenga el boletín informativo diario en el que confían los especialistas en marketing.

Ver términos.

Problemas de calidad de la página

Aquí es donde el vocabulario puede volverse confuso. Me han preguntado: "¿Cómo puede Google determinar la calidad de la página si aún no se ha rastreado?"

Esta es una buena pregunta, y la respuesta es que no puede.

Google hace suposiciones sobre la calidad de la página basándose en otras páginas del dominio. Sus clasificaciones también se basan en patrones de URL y arquitectura del sitio web.

Como resultado, mover estas páginas de "reconocimiento" a la cola de rastreo puede perder prioridad en función de la falta de calidad que han encontrado en páginas similares.

Es posible que las páginas con patrones de URL similares o aquellas ubicadas en áreas similares de la arquitectura del sitio tengan una propuesta de bajo valor en comparación con otras piezas de contenido dirigidas a las mismas intenciones de usuario y palabras clave.

Las posibles causas incluyen:

La profundidad del contenido principal.
Presentación.
Nivel de contenido de apoyo.
Singularidad del contenido y perspectivas ofrecidas.
O incluso problemas más manipulativos (es decir, el contenido es de baja calidad y se genera automáticamente, gira o duplica directamente el contenido ya establecido).

Trabajar para mejorar la calidad del contenido dentro del grupo de sitios y las páginas específicas puede tener un impacto positivo al reavivar el interés de Google en rastrear su contenido con mayor propósito.

También puede no indexar otras páginas del sitio web que reconozca que no son de la más alta calidad para mejorar la proporción de páginas de buena calidad frente a páginas de mala calidad en el sitio.

Presupuesto de rastreo y eficiencia

El presupuesto de rastreo es un mecanismo a menudo mal entendido en SEO.

La mayoría de los sitios web no necesitan preocuparse por esto. De hecho, Gary Illyes de Google ha dejado constancia de que probablemente el 90% de los sitios web no necesitan pensar en el presupuesto de rastreo. A menudo se considera un problema para los sitios web empresariales.

La eficiencia del rastreo, por otro lado, puede afectar a sitios web de todos los tamaños. Si se pasa por alto, puede generar problemas en la forma en que Google rastrea y procesa el sitio web.

Para ilustrar, si su sitio web:

Duplica URLs con parámetros.
Resuelve con y sin barras inclinadas.
Está disponible en HTTP y HTTPS.
Sirve contenido de varios subdominios (p. ej., https://website.com y https://www.website.com).

…entonces es posible que tenga problemas de duplicación que afecten las suposiciones de Google sobre la prioridad de rastreo en función de suposiciones más amplias del sitio.

Es posible que esté agotando el presupuesto de rastreo de Google con URL y solicitudes innecesarias. Dado que Googlebot rastrea sitios web en partes, esto puede hacer que los recursos de Google no se extiendan lo suficiente como para descubrir todas las URL recién publicadas tan rápido como le gustaría.

Desea rastrear su sitio web regularmente y asegurarse de que:

Las páginas se resuelven en un solo subdominio (como se desee).
Las páginas se resuelven en un solo protocolo HTTP.
Las URL con parámetros se canonicalizan hasta la raíz (según se desee).
Los enlaces internos no utilizan redireccionamientos innecesariamente.

Si su sitio web utiliza parámetros, como filtros de productos de comercio electrónico, puede frenar el rastreo de estas rutas URI al no permitirlas en el archivo robots.txt.

Su servidor también puede ser importante en la forma en que Google asigna el presupuesto para rastrear su sitio web.

Si su servidor está sobrecargado y responde con demasiada lentitud, pueden surgir problemas de rastreo. En este caso, Googlebot no podrá acceder a la página, lo que provocará que parte de su contenido no se rastree.

En consecuencia, Google intentará volver más tarde para indexar el sitio web, pero sin duda provocará un retraso en todo el proceso.

Enlace interno

Cuando tienes un sitio web, es importante tener enlaces internos de una página a otra.

Google generalmente presta menos atención a las URL que no tienen suficientes enlaces internos, e incluso puede excluirlos de su índice.

Puede verificar la cantidad de enlaces internos a páginas a través de rastreadores como Screaming Frog y Sitebulb.

Tener una estructura de sitio web organizada y lógica con enlaces internos es la mejor manera de optimizar su sitio web.

Pero si tiene problemas con esto, una forma de asegurarse de que todas sus páginas internas estén conectadas es "hackear" la profundidad de rastreo usando mapas de sitio HTML.

Estos están diseñados para usuarios, no para máquinas. Aunque ahora pueden verse como reliquias, aún pueden ser útiles.

Además, si su sitio web tiene muchas URL, es aconsejable dividirlas en varias páginas. No desea que todos estén vinculados desde una sola página.

Los enlaces internos también necesitan usar la etiqueta <a> para enlaces internos en lugar de depender de funciones de JavaScript como onClick() .

Si está utilizando un marco Jamstack o JavaScript, investigue cómo este o cualquier biblioteca relacionada maneja los enlaces internos. Estos deben presentarse como etiquetas <a>.

Las opiniones expresadas en este artículo pertenecen al autor invitado y no necesariamente a Search Engine Land. Los autores del personal se enumeran aquí.

Agregue Search Engine Land a su fuente de noticias de Google.