Mapas de sitio XML y SEO: lo que necesita saber
Publicado: 2023-08-16Los mapas de sitio XML acaban de cumplir 18 años en junio, y en honor a su introducción completa en la edad adulta, estoy analizando cómo funcionan los mapas de sitio XML, cómo crear uno y por qué los mapas de sitio XML ofrecen una gran cantidad de beneficios de SEO.
¿Qué es un mapa del sitio XML?
En pocas palabras, un mapa del sitio XML es un protocolo en formato XML que informa a los motores de búsqueda sobre las URL de un sitio web disponibles para rastrear.
Los mapas de sitio XML estaban destinados a compartir información sobre cada URL, como:
- Cuándo se actualizó por última vez.
- Con qué frecuencia cambia.
- Qué tan importante es en relación con otras URL en su sitio web.
Los mapas de sitio XML permiten que los motores de búsqueda rastreen su sitio web de manera más eficiente si ciertas URL están aisladas.
Si es un profesional de SEO, probablemente ya use mapas de sitio XML integrados en su complemento Yoast WordPress. Pero hay un montón de extras que puede que te estés perdiendo.
Cómo construir un mapa de sitio XML dinámico
Si está utilizando WordPress, aproveche los complementos de SEO como Yoast y RankMath para generar un mapa del sitio XML dinámico.
Si no está utilizando WordPress, siga estos pasos para crear un mapa del sitio XML dinámico.
Comprender su estructura de navegación
Reúna una lista de todas nuestras URL en el sitio web y agrúpelas para alinearlas con la estructura de navegación y las agrupaciones de contenido.
Asóciate con tu equipo de desarrolladores
Comparta la lista de URL agrupadas con su equipo de desarrollo para obtener su ayuda en la creación de un mapa del sitio XML dinámico usando Python, PHP o JavaScript.
Aquí hay un ejemplo de cómo codificar un mapa de sitio XML dinámico usando Python:
import xml.etree.ElementTree as ET import datetime # List of URLs (replace these with your actual URLs) urls = [ "https://www.example.com/page1", "https://www.example.com/page2", "https://www.example.com/page3", # Add more URLs here ] # Create the root element urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") # Loop through URLs and create URL entries for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" # You can set this to the desired frequency priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" # You can set this to a value between 0 and 1 # Create the XML tree tree = ET.ElementTree(urlset) # Save the XML to a file tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)
Cuando trabajo con desarrolladores, he aprovechado Flask y Python juntos para crear un mapa del sitio XML verdaderamente dinámico que cambia cada vez que cambia el contenido del sitio web.
Si podemos definir la ruta del mapa del sitio dinámico en función del contenido del sitio web mediante una función como get_dynamic_urls()
, deberíamos poder recuperar todas las URL.
@app.route('/sitemap.xml', methods=['GET']) def sitemap(): urls = get_dynamic_urls() # Replace with your dynamic URL retrieval logic urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" xml_content = ET.tostring(urlset, encoding="utf-8") return xml_content, {'Content-Type': 'application/xml'}
Si está compartiendo código en varias propiedades de dominio, asegúrese de que los archivos estén codificados correctamente en sus páginas HTML.
Por ejemplo, sus archivos CSS y JavaScript deben vincularse mediante etiquetas <link>
y <script>
.
Antes de compartir el código entre diferentes dominios, deberá crear un servidor centralizado para alojar las reglas del mapa del sitio XML compartido.
Tendrá múltiples fases de su mapa de sitio XML dinámico con sus desarrolladores hasta que se confirmen todas las reglas.
No olvide comprobar que las URL dinámicas se están recuperando e integrando en la lógica de su mapa del sitio.
Sube a tu servidor
Una vez que su mapa de sitio XML esté comprimido, cargue su mapa de sitio XML dinámico en el directorio raíz de su sitio web.
Enviar a los motores de búsqueda
Informe a los motores de búsqueda acerca de sus mapas de sitio XML enviándolos a través de Google Search Console y Bing Webmaster Tools.
Mantenimiento en proceso
Un mapa del sitio XML no es solo una táctica de SEO de "configúrelo y olvídese". Es esencial actualizar su mapa del sitio XML a medida que cambia su sitio web.
15 consejos a tener en cuenta al crear un mapa del sitio XML
1. Los mapas de sitio XML no son un factor de clasificación
Cuando se le preguntó en X (anteriormente Twitter) si hay una ventaja de clasificación en el uso de mapas de sitio XML, Gary Illyes de Google respondió:
- "No, no directo de todos modos".
2. Google puede encontrar tus páginas sin un mapa del sitio
Los sitios web no necesitan un mapa del sitio si son pequeños y están vinculados correctamente, compartió Daniel Waisberg, Search Advocate en Google, en un video de capacitación de Google Search Console.
Sin embargo, siguió diciendo que un mapa del sitio podría ser especialmente útil si:
- El sitio es realmente grande.
- Las páginas del sitio están aisladas.
- El sitio es nuevo o cambia rápidamente.
Además, es importante tener en cuenta que John Muller de Google declaró en X (anteriormente Twitter) que tener un mapa del sitio XML es una "línea de base mínima para cualquier sitio web serio".
3. Google verifica si su mapa del sitio XML ha cambiado antes de reprocesarlo
Google verifica si su mapa de sitio XML ha cambiado antes de desperdiciar recursos analizando y procesando el archivo nuevamente, confirmó Illyes.
Dijo en un horario de oficina de SEO.
- “Tan pronto como cambie algo en su mapa del sitio, ya sea el elemento URL o la última modificación, el mapa del sitio se analizará nuevamente y, en general, se reprocesará. Eso no significa que las URL se rastrearán con seguridad, por supuesto, todavía están sujetas a evaluaciones de calidad como cualquier otra URL. También vale la pena mencionar que si elimina una URL del mapa del sitio porque tal vez ya no exista, eso no significa que se eliminará automáticamente del índice o incluso se priorizará para el rastreo para que pueda eliminarse antes.
4. Los mapas de sitio XML pueden indexar su nuevo contenido más rápido
Mueller confirmó que decirle a Google que su mapa de sitio XML está actualizado puede ayudar a que su nuevo contenido sea indexado más rápido.
El compartió:
- “Hacer ping en un mapa del sitio es un poco diferente a simplemente proporcionarlo en robots.txt: al hacer ping, está marcando activamente un cambio en el archivo del mapa del sitio. Si está interesado en tener contenido nuevo indexado rápidamente, es una buena práctica”.
5. Los mapas de sitio XML deben estar codificados en UTF-8
Si su mapa del sitio XML no usa UTF-8, los motores de búsqueda no pueden leerlo.
6. Mantenga el tamaño del archivo por debajo de 50 MB (sin comprimir) o 50,000 URL
Hay límites de tamaño para sus mapas de sitio XML. Manténgalo por debajo de 50,000 URL por mapa de sitio o 50 MB (sin comprimir).
Si tiene un tamaño de archivo más grande o más URL, use varios mapas de sitio XML.
7. Puedes tener múltiples mapas de sitio XML
Google le permite enviar múltiples mapas de sitio. Puede ser útil dividir sus mapas de sitio en diferentes secciones de su sitio web para medir el rendimiento.
Por ejemplo, si tiene un gran sitio web de comercio electrónico, puede segmentar sus mapas de sitio XML por tipo de producto (es decir, zapatos de mujer frente a zapatos de hombre).
O, si tiene varios idiomas, es posible que desee un hreflang relacionado con su mapa del sitio XML <loc>.
Si tiene idiomas alternativos, no cuenta para el máximo de 50,000 URL.
O, si tiene muchos videos o imágenes, puede separar sus mapas de sitio XML en un mapa de sitio XML de video y un mapa de sitio XML de imagen.
No hay ningún beneficio de clasificación por tener múltiples mapas de sitio XML.
8. Si tiene varios mapas de sitio XML, recuerde usar un archivo de índice de mapa de sitio
Si tiene varios mapas de sitio XML para un sitio grande, querrá enviar un archivo de índice de mapa de sitio para enviar muchos mapas de sitio a la vez.
9. La etiqueta lastmod debe ser impecable
La etiqueta <lastmod>
es una de las partes más esenciales de su mapa de sitio XML.
Por ejemplo, mis datos estructurados aprovechan la fecha <lastmod> de mi mapa del sitio XML.
La etiqueta <lastmod>
también indica a los motores de búsqueda si actualizó contenido antiguo o lanzó contenido nuevo.
Mueller confirmó esto al afirmar:
- "... Si solo está cambiando el pie de página de la marca de tiempo, claro, la página también ha cambiado técnicamente, pero si se le da prioridad, probablemente no".
Bing incluso ha tomado una postura oficial sobre la etiqueta lastmod
en el mapa del sitio XML, declarando:
- “Para los mapas de sitio XML, una de las etiquetas más críticas que puede incluir en su mapa de sitio es la etiqueta “lastmod””.
10. Los mapas de sitio XML solo deben incluir 200 URL de estado que estén autocanonicalizadas
Recuerde mantener solo URL activas, estado 200, indexables y autocanonicalizadas.
Si continúa mostrando páginas redirigidas 404 o 301, los motores de búsqueda podrían dejar de rastrear su mapa del sitio XML por completo.
Mueller respondió a un comentario en X (anteriormente conocido como Twitter):
- “Dejaríamos de buscar archivos de mapas de sitios si las URL no son válidas, pero si devuelve contenido o redirige (que es algo recomendable), seguiremos intentándolo. No debería causar problemas, ya que los archivos generales del mapa del sitio son solo una pequeña parte de todas las URL obtenidas de un sitio".
11. Los motores de búsqueda pueden revisar su mapa de sitio XML diariamente
Fabrice Canel de Microsoft compartió que Microsoft revisa su mapa de sitio XML diariamente.
Mientras que Mueller compartió que Google verifica su mapa de sitio XML en función de la frecuencia (también conocido como su etiqueta <lastmod>
).
12. La velocidad de la página afecta indirectamente a su mapa del sitio XML
Todos sabemos cuán vital es la velocidad de la página para nuestros esfuerzos de SEO. Pero, ¿cómo afecta un sitio web de rendimiento lento a su mapa de sitio XML?
Mueller ha confirmado que la velocidad de la página no debería afectar su mapa del sitio XML al afirmar:
- “Mientras no se agote el tiempo, deberías estar bien. ¿Quizás almacenar en caché la última versión para evitar una carga innecesaria del servidor?
La verdad es que he trabajado en sitios web de rendimiento lento donde el mapa del sitio XML no se carga cuando los motores de búsqueda rastrean el sitio web, lo que provoca grandes fluctuaciones en la clasificación.
Hay un impacto indirecto en su mapa de sitio XML si su sitio web no se carga correctamente.
Por eso es importante usar la compresión Gzip para reducir el tamaño del archivo y acelerar los tiempos de carga.
13. Elimina la etiqueta <priority> de tus mapas de sitio XML
Illyes comparó la etiqueta <priority>
en los mapas de sitio XML con "una bolsa de ruido".
Entonces, si depende de los motores de búsqueda para rastrear sus URL en su mapa del sitio XML en función de la prioridad, esperará mucho tiempo.
Recomiendo eliminar esta etiqueta de sus mapas de sitio XML.
14. Si tiene problemas con la estructura de navegación, combine su mapa del sitio XML con un mapa del sitio HTML
Siempre ha habido sentimientos encontrados acerca de los mapas de sitio HTML.
Mueller compartió que los mapas de sitio HTML "nunca deberían ser necesarios".
Él continuó:
- “Cambié de opinión sobre los sitemaps HTML a lo largo de los años, nunca deberían ser necesarios. Los sitios pequeños y grandes siempre deben tener una estructura de navegación clara. Si siente la necesidad de un mapa del sitio HTML, dedique tiempo a mejorar la arquitectura de su sitio. Los mapas de sitio HTML caben en el mismo contenedor con los giradores de carga de HTML”.
<iframe src="https://mastodon.social/@johnmu/109477617298107922/embed" class="mastodon-embed" width="400" allowfullscreen="allowfullscreen"></iframe><script src="https://mastodon.social/embed.js" async="async"></script>
Cuando se trabaja en grandes sitios web a nivel empresarial, a menudo hay varias capas de tomadores de decisiones en la estructura de navegación de un sitio web. Y, a menudo, se tienen en cuenta las mejores prácticas de SEO.
Combino mi mapa del sitio XML con un mapa del sitio HTML hasta que tenga confianza en la navegación de nuestro sitio web y en la jerarquía de enlaces internos.
15. No olvide incluir todos sus mapas de sitio XML en su archivo robots.txt
No olvide incluir sus mapas de sitio XML (todos ellos) como enlaces en su archivo robots.txt.
Aquí hay un ejemplo:
No te preocupes por dónde deben ir en el archivo robots.txt. No hay impacto en la ubicación de su mapa del sitio XML en su archivo robots.txt.
Mueller lo confirmó:
Los mapas de sitio XML son el modelo de su sitio web para los motores de búsqueda.
Ya sea que esté lanzando una nueva página web o simplemente agregando una etiqueta canónica a una página duplicada, su mapa del sitio XML es algo que debe actualizar las 24 horas del día, los 7 días de la semana.
Pero hazlo con precaución.
Si bien no debe ser paranoico, su mapa del sitio XML es el modelo de su casa para los motores de búsqueda.
Así que no olvide enviar sus mapas de sitio XML a Google Search Console y Bing Webmaster Tools.
Las opiniones expresadas en este artículo pertenecen al autor invitado y no necesariamente a Search Engine Land. Los autores del personal se enumeran aquí.