5 formas de usar archivos de registro para SEO con Gerry White
Publicado: 2023-02-08¿Cómo estás aprovechando los archivos de registro para mejorar tu SEO?
De eso es de lo que hablaremos hoy con un hombre con más de 20 años de experiencia en la industria de SEO que trabaja en marcas y agencias, incluidas la BBC, Just Eat y Rise at Seven. Una cálida bienvenida al podcast In Search SEO, Gerry White.
En este episodio, Gerry comparte cinco formas de usar archivos de registro para SEO, que incluyen:
- Cómo ve Google su sitio
- Parámetros
- ¿Hay subdominios que consumen su presupuesto de rastreo?
- Archivos JavaScript y CSS
- Códigos de respuesta
Gerry: Hola, me alegro de estar aquí.
D: Es bueno tenerte. Puedes encontrar a Gerry buscando a Gerry White en LinkedIn. Entonces, Gerry, ¿todo SEO debería usar archivos de registro?
G: No, sé que suena controvertido cuando digo que los archivos de registro tenemos una gran cantidad de información. Pero honestamente, muchas veces son rendimientos decrecientes. Y, a menudo, generalmente puede encontrar mucha información antes de ingresar a los archivos de registro. Lo que quiero decir con eso es que, si echa un vistazo a la información de Google Search Console, hay una gran cantidad de información allí. Cuando he estado buscando en los archivos de registro, es cuando primero he agotado muchos otros lugares primero. Siempre recomiendo rastrear un sitio usando algo como Screaming Frog o cualquier rastreador de escritorio que tenga, y luego mirar Google Search Console antes de comenzar a mirar los archivos de registro.
La razón por la que digo eso, y la razón por la que sueno casi en contra de los archivos de registro cuando hablo de lo útiles que son, es el hecho de que en realidad es bastante difícil trabajar con ellos al principio. Y se necesita un poco de habilidad, conocimiento y experiencia para realmente tenerlos en sus manos, e incluso para tener acceso a ellos. Pero una gran cosa de hoy es el hecho de que ahora, en realidad, tenemos más acceso a los archivos de registro que casi nunca antes. Inicialmente, cuando comencé, no teníamos Google Analytics ni ningún software analítico como el que tenemos hoy. El análisis del archivo de registro fue la forma en que observamos cómo las personas visitaban los sitios web. Ahora, rara vez miramos los archivos de registro para ver cómo la gente mira los sitios web, a menos que estemos haciendo algo con InfoSec. O estamos haciendo algo para diagnosticar algo realmente extraño y maravilloso.
Pero en realidad, muchas veces, tenemos un software de análisis mucho mejor. Esto podría cambiar porque, en realidad, una cosa extraña es el hecho de que muchos sitios web no pueden rastrear cuántas personas van a una página 404, porque la mayoría de las veces, nunca haces clic para aceptar cookies en una página 404. . De repente, los archivos de registro regresan para responder algunas preguntas muy extrañas como esa.
Pero la razón principal por la que hoy hablo de los archivos de registro es por motivos de SEO. Así que sí, si tiene problemas con los sitios grandes, si tiene un sitio web grande de comercio electrónico, si tiene un sitio internacional, multilingüe y enorme con navegación por facetas, entonces los archivos de registro son algo que definitivamente debe tener en cuenta. en cuenta y definitivamente debe ser considerado en el futuro tan pronto como sea posible.
D: Entonces, hoy comparte cinco formas en que el SEO debería usar archivos de registro. Comenzando con el número uno, viendo cómo Google ve su sitio.
1. Ver cómo Google ve su sitio
G: Sí, Google es bastante impredecible, casi como un niño rebelde. Es extraño porque aunque digo que podemos mirar sitios y podemos usar herramientas de rastreo para ver cómo Google debería mirar el sitio, a menudo nos sorprende descubrir que Google se obsesionó con un conjunto de páginas o con por alguna ruta extraña en alguna parte. O más recientemente, he estado trabajando durante el último año para un supermercado llamado Odor, y una de las cosas que encontramos fue que el bot de Google ha estado observando mucho la configuración de análisis y creando enlaces artificiales a partir de ella. Google está encontrando enlaces rotos. Y durante mucho tiempo, estuve tratando de averiguar por qué estaba encontrando decenas de miles de 404 que no estaban en la página en absoluto. Pero resulta que ha estado mirando la configuración de análisis y creando un enlace a partir de eso. Así que estamos viendo cuánto impacto ha tenido. Y si estamos viendo el hecho de que Google está encontrando todos estos 404, eso podría no ser un gran problema. Pero ahora queremos saber cuánto tiempo está gastando en esos 404, y si solucionamos este pequeño problema, ¿significará que el rastreo del resto del sitio aumentará en un 20-30 %? ¿Cuál es la oportunidad si lo arreglamos allí? Se trata de ver por qué Google está mirando el sitio de esa manera y qué está encontrando que realmente no debería estar encontrando.
2. Parámetros
La otra cosa que a menudo miramos son los parámetros. No sé si lo sabes, pero la gente de SEO siempre vincula a la versión canónica de la página. Lo que quiero decir es que a menudo hay varias versiones de una página que a veces tienen algún tipo de seguimiento interno o externo. Hay tantas formas en las que podemos vincularnos a una página y, a menudo, un producto, por ejemplo, puede ubicarse en varios lugares de un sitio. Un buen ejemplo de esto es que trabajé en un sitio, que era Magento. Y cada producto parecía ubicarse en cada categoría, por lo que fue increíble cuando descubrimos que había alrededor de 20 versiones de cada producto, y cada producto se podía rastrear. Entonces, a partir de ahí, supimos que Google también estaba pasando una gran cantidad de tiempo rastreando el sitio. Y lo que es interesante es que, si elimina un producto, Google dirá "Oh, pero tengo 19 otras versiones de este producto", por lo que la página real tardará un tiempo en desaparecer si ha usado un 404 o algo así debido a la forma en que funciona Google. Google verá que esta es una versión canónica de esta página. Pero si elimina la versión canónica, comenzará a usar otras diferentes. Y este es el tipo de información que nos brinda el archivo de registro. La capacidad para que veamos el sitio de la misma manera que lo hace Google.
Y también nos permite ver cosas como códigos de estado. Un gran ejemplo de esto es que hay un código de estado que dice que no he sido modificado. Y por mi vida en este momento, no puedo pensar qué es, debería haber escrito esto antes de este podcast. Pero básicamente, el "No he sido modificado" mejora enormemente la tasa de rastreo de un sitio web. Y cuando descubro que esto era algo que Google estaba respetando, lo que puedo hacer es con todas las imágenes, todos los productos. , y todas estas partes y piezas que no se modifican con mucha frecuencia, si podemos usar un no modificado, y podemos mejorar la velocidad a la que Google rastrea, mejorar la efectividad y reducir la carga en el servidor, podemos luego mejore significativamente la forma en que Google encuentra todos los diferentes productos.
La forma en que Google ve las cosas, lo que queremos, los administradores de servidores quieren y todos quieren, es que el servidor sea lo más rápido y eficiente posible. Nuevamente, volviendo al lado de los archivos de registro, hoy en día, no pudimos usar los archivos de registro de manera efectiva durante muchos años. Porque con los CDN, a menudo encontraría que habría varios lugares en los que se accedería a una página. Y la CDN a menudo no tenía un archivo de registro. Así que estaremos mirando todos estos lugares diferentes y veremos cuánta carga hay en este servidor y cuánta carga hay en ese servidor. Y tratamos de juntar todo y los archivos de registro estarán en un formato diferente. Ahora, con las CDN, podemos comenzar a comprender la eficacia de una CDN. De repente, cosas como PageSpeed se ven enormemente afectadas y mejoradas por el hecho de que si usamos archivos de registro, podemos comenzar a comprender el hecho de que la imagen, por ejemplo, mediante la canonicalización de imágenes, por lo que si se usa una imagen en varias páginas, como siempre que las URL sean coherentes, la CDN funciona y Google la rastrea mejor. Sí, hay muchas maneras diferentes en las que los archivos de registro ayudan a mejorar PageSpeed, el almacenamiento en caché y servir a los usuarios y motores de búsqueda de manera mucho más eficiente.
D: Estoy repasando tus cinco puntos que ibas a compartir. Y hay diferentes elementos de ellos que ya has compartido. Me recuerdas a alguien a quien solo puedo hacerle una pregunta y me dan un episodio de podcast de 15 minutos sin hacer más preguntas. Así que hay una persona que probablemente pueda hacer eso, incluso más que tú. Y ese es probablemente Duane Forrester. Duane y yo bromeamos acerca de que él hizo eso, yo solo le hice una pregunta y me fui y lo dejé para que compartiera el contenido por el resto del episodio. Pero hablaste un poco sobre los parámetros. No sé si tocaste el punto número tres, que es descubrir si hay subdominios que están consumiendo el presupuesto de rastreo, ya que no debería ser así.
3. ¿Hay subdominios que consumen su presupuesto de rastreo?
G: Esto en realidad se remonta a Just Eat. En un momento, descubrimos que el sitio web estaba replicado en múltiples subdominios diferentes, y todos estos eran rastreables. Ahora, curiosamente, estos no tenían visibilidad según herramientas como Citrix. Y la razón por la que no lo hicieron fue porque todo estaba canonizado. Entonces, cuando descubrimos que, aunque estos duplicados estaban disponibles, Google estaba gastando algo menos del 60 al 70% de su presupuesto rastreando estos subdominios. Y debido a la forma en que estos no se almacenaban en caché de la misma manera debido a los CDN y otras tecnologías, en realidad esto creaba una gran cantidad de cargas en el servidor. Así que fue algo fascinante para nosotros, porque simplemente estábamos ignorando esto como un problema que debe solucionarse en algún momento en el futuro. Porque sabíamos del problema. Sabíamos que había un tipo de problema, y yo había hablado al respecto. Pero le quité prioridad hasta que empezamos a mirar los archivos de registro.
Vimos que Google está gastando mucha energía, tiempo y recursos aquí. ¿Cuánta carga del servidor está creando? ¿Qué impacto tuvo? Y no podíamos entender la carga de un servidor debido a la forma en que el servidor no podía interpretar las diferentes fuentes. Así que fue fascinante que cuando obtuvimos los archivos de registro, pudimos mejorar la confiabilidad del sitio web en una cantidad considerable. Así que sabíamos acerca de los subdominios, simplemente no sabíamos qué tan problemático era hasta que comenzamos a buscar en los archivos de registro. Y luego, de repente, vimos que esto debe arreglarse lo antes posible. Era una de esas cosas que sabíamos cómo arreglar, era solo priorización. Estaba al final de la cola y fue ascendido al número dos.
4. Archivos JavaScript y CSS
D: Se refirió a la canonicalización, pero también dijo que, específicamente, los archivos JavaScript y CSS pueden ser un problema. ¿Porqué es eso?
G: Una de las cosas que solemos hacer es romper el caché agregando un parámetro al archivo CSS. La razón por la que hacemos esto es lo que sucede si usa un CDN o algo similar, es que cada vez que actualiza el CSS, está creando nuevas páginas, o algo así, entonces el problema es que tiene un archivo CSS que está en caché y las páginas nuevas no podrán usarlo. Y tenemos largos tiempos de caché en todos estos diferentes archivos JavaScript y CSS. Entonces, dentro de la página, tan pronto como agregamos algo que necesita que se actualice JavaScript o CSS, simplemente cambia el parámetro dentro de él ligeramente. A partir de ahí, lo que teníamos que asegurarnos era que todos los diferentes servidores estuvieran usando la misma versión de parámetros en el futuro. Y eso fue algo en lo que si trabajas en varios equipos diferentes, varios sitios web diferentes, el mejor JavaScript que impulsa todo, siempre nos aseguramos de que sea la versión correcta. Y los archivos de registro fueron una forma en que nos aseguramos de que todas las diferentes páginas accedieran constantemente a la versión correcta de JavaScript porque tal vez tuvimos que actualizar una clave API o algo similar. Había tantas maneras diferentes en las que teníamos que hacerlo. Y esto fue algo que fue una tarea enorme para los desarrolladores.
Una de las cosas que estábamos viendo en los archivos de registro era si el anterior estaba siendo atacado, de dónde lo estaba siendo atacado y ¿podríamos arreglarlo? También descubrimos que hay muchas maneras diferentes en las que puede escribir la ruta al archivo JavaScript. Por ejemplo, estaba en un subdominio donde usamos un nombre de host diferente porque, curiosamente, si trabaja en varios sitios web diferentes, a menudo encuentra que hay diferentes URL o diferentes nombres de dominio que en realidad acceden al mismo servidor. Y, a menudo, si está utilizando un CDN o un subdirectorio, a veces puede ser muy inconsistente. Y desde el punto de vista del usuario, si accede al mismo archivo JavaScript de seis o siete formas diferentes dentro de un viaje, entonces lo está cargando de seis o siete formas diferentes. Y si bien eso puede no parecer mucho, acumulativamente, agrega algunos megabytes a su viaje. Y eso, por supuesto, ralentiza toda la experiencia y hace que los servidores sean menos eficientes. Y hay mucho más. Así que asegúrese de que siempre se utilice la versión correcta de JavaScript, CSS y otros fragmentos. Y también asegúrese de que no haya ninguna razón para que el JavaScript se oculte con parámetros o algo así. Hay tantas formas en que se pueden crear trampas de araña, que incluyen los archivos de JavaScript, donde, por ejemplo, se etiqueta algo, donde tal vez no usen la referencia absoluta correcta para JavaScript. Así que está ubicado en un directorio diferente a otras veces. Es sorprendente todas las diferentes formas en que puede detectar cuando JavaScript se carga de forma ligeramente diferente en varias páginas diferentes. Así que sí, es muy simple. Pero es sorprendentemente caro cuando se trata de análisis.
5. Códigos de respuesta
D: También asegurarse de que los códigos de respuesta se entreguen de la manera que usted desearía. Un ejemplo de eso es a través de TOS que a veces Google ve o no ve, lo que debería o no debería ser. Entonces, ¿por qué sucedería eso?
G: Nuevamente, siempre visitamos páginas web usando el mismo navegador, la misma tecnología, la misma experiencia y todo. Trato de asegurarme de usar otras herramientas además de las que uso habitualmente, ya que todos hacen una auditoría de Screaming Frog, así que trato de usar todo tipo de partes y piezas. Pero siempre pretendemos que somos como una computadora. Así que nunca pretendemos que somos Googlebot, nunca pretendemos que somos todas estas cosas diferentes. Entonces, si observa cómo los bots de Google acceden a un archivo en particular desde una dirección IP diferente... mucha tecnología como CloudFlare, si finge que es Googlebot y está tratando de acceder usando Screaming Frog, sabe que está no Googlebot, en realidad eres esto. Y, por lo tanto, lo trata de manera diferente a como trataría a Googlebot. Y muy a menudo, los servidores están configurados para renderizar previamente cosas para hacer todas las partes. Y es solo asegurarse de que todos obtengan el código de respuesta correcto del servidor en ese momento.
Y parece bastante simple, pero cuando estás escalando internacionalmente... Cuando tienes redireccionamientos geográficos, si un usuario o motor de búsqueda no puede acceder a una página en particular porque alguien colocó un redireccionamiento geográfico para decir que si visitas esto sitio web de España, luego vaya y cargue este subdirectorio ... Por lo tanto, no puede ver las versiones raíz o las versiones alternativas. Es por eso que cosas como que los códigos de respuesta sean correctos es absolutamente crítico. Y es sorprendente la frecuencia con la que pasas por estas cosas y asumes que todo está configurado correctamente. Porque una y otra vez, sabemos cómo debe configurarse. Le damos esto a alguien, alguien lo interpreta, otra persona lo implementa y alguien más lo revisa. Y luego alguien más hace clic en un botón en el CDN, que dice: "Oh, podemos geolocalizar a alguien en este lugar en particular". No es tanto el hecho de que una persona haya hecho algo mal, sino que hay algo en la cadena que efectivamente lo ha roto ligeramente.
El encurtido de Pareto - Fruta madura
D: Terminemos con el Pareto Pickle. Pareto dice que puedes obtener el 80% de tus resultados con el 20% de tus esfuerzos. ¿Cuál es una actividad de SEO que recomendaría que proporcione resultados increíbles con niveles modestos de esfuerzo?
G: Lo que más me gusta en este momento es que tengo un tablero muy básico de Google Data Studio, que me permite echar un vistazo a lo que yo llamo la fruta madura. Ahora, todo el mundo odia el bingo de palabras de moda. Pero esto es lo mío cuando veo cosas que no están clasificadas tan bien como deberían. Observo todas las palabras clave en las que se clasifican para un conjunto particular de páginas, recetas, productos o algo así. Un buen ejemplo es que, en este momento, estoy trabajando en decenas de miles de productos, observo todas las páginas que tienen muchas impresiones, pero puede haberlas en la posición seis y puedo subirlas a la posición 3. Y nueve de cada diez veces puede hacer esto simplemente asegurándose de que las etiquetas de título mejoren y que los enlaces internos hayan mejorado. Cosas muy simples para averiguar cuál de las palabras clave con el alto volumen de búsqueda se puede aumentar un poco más para aumentar la tasa de clics.
D: He sido su anfitrión, David Bain. Puedes encontrar a Gerry buscando a Gerry White en LinkedIn. Gerry, muchas gracias por estar en el podcast In Search SEO.
G: Es un placer. Gracias por tu tiempo.
D: Y gracias por escuchar. Echa un vistazo a todos los episodios anteriores y regístrate para una prueba gratuita de la plataforma Rank Ranger.