Sitemap XML e SEO: cosa devi sapere
Pubblicato: 2023-08-16Le sitemap XML hanno appena compiuto 18 anni a giugno e, in onore della sua introduzione a tutti gli effetti nell'età adulta, sto analizzando come funzionano le sitemap XML, come crearne una e perché le sitemap XML offrono una marea di vantaggi SEO.
Che cos'è una mappa del sito XML?
In poche parole, una sitemap XML è un protocollo in formato XML che comunica ai motori di ricerca gli URL su un sito Web disponibili per la scansione.
Le sitemap XML avevano lo scopo di condividere informazioni su ogni URL, come:
- Quando è stato aggiornato l'ultima volta.
- Quante volte cambia.
- Quanto è importante in relazione ad altri URL nel tuo sito web.
Le sitemap XML consentono ai motori di ricerca di eseguire la scansione del tuo sito Web in modo più efficiente se determinati URL sono isolati.
Se sei un professionista SEO, probabilmente utilizzi già le sitemap XML integrate nel tuo plugin Yoast WordPress. Ma ci sono molti extra che potresti perdere.
Come costruire una sitemap XML dinamica
Se utilizzi WordPress, sfrutta i plug-in SEO come Yoast e RankMath per generare una mappa del sito XML dinamica.
Se non utilizzi WordPress, segui questi passaggi per creare una sitemap XML dinamica.
Comprendi la tua struttura di navigazione
Metti insieme un elenco di tutti i nostri URL sul sito Web e raggruppali per allinearli alla struttura di navigazione e ai raggruppamenti di contenuti.
Collabora con il tuo team di sviluppatori
Condividi l'elenco di URL raggruppati insieme al tuo team di sviluppo per ottenere il loro aiuto nella creazione di una mappa del sito XML dinamica utilizzando Python, PHP o JavaScript.
Ecco un esempio di come codificare una sitemap XML dinamica usando Python:
import xml.etree.ElementTree as ET import datetime # List of URLs (replace these with your actual URLs) urls = [ "https://www.example.com/page1", "https://www.example.com/page2", "https://www.example.com/page3", # Add more URLs here ] # Create the root element urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") # Loop through URLs and create URL entries for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" # You can set this to the desired frequency priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" # You can set this to a value between 0 and 1 # Create the XML tree tree = ET.ElementTree(urlset) # Save the XML to a file tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)
Quando lavoro con gli sviluppatori, ho sfruttato insieme Flask e Python per creare una mappa del sito XML veramente dinamica che cambia ogni volta che cambia il contenuto del sito web.
Se siamo in grado di definire il percorso dinamico della mappa del sito in base al contenuto del sito Web utilizzando una funzione come get_dynamic_urls()
, dovremmo essere in grado di recuperare tutti gli URL.
@app.route('/sitemap.xml', methods=['GET']) def sitemap(): urls = get_dynamic_urls() # Replace with your dynamic URL retrieval logic urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" xml_content = ET.tostring(urlset, encoding="utf-8") return xml_content, {'Content-Type': 'application/xml'}
Se condividi il codice tra più proprietà di dominio, assicurati che i file siano codificati correttamente nelle tue pagine HTML.
Ad esempio, i file CSS e JavaScript devono essere collegati utilizzando i tag <link>
e <script>
.
Prima di condividere il codice tra domini diversi, dovrai creare un server centralizzato per ospitare le regole della mappa del sito XML condivise.
Avrai più fasi della tua sitemap XML dinamica con i tuoi sviluppatori fino a quando tutte le regole non saranno confermate.
Non dimenticare di verificare che gli URL dinamici vengano effettivamente recuperati e integrati nella logica della tua mappa del sito.
Carica sul tuo server
Una volta che la tua Sitemap XML è stata compressa, carica la tua Sitemap XML dinamica nella directory principale del tuo sito web.
Invia ai motori di ricerca
Fai conoscere ai motori di ricerca le tue sitemap XML inviandole tramite Google Search Console e Bing Webmaster Tools.
Manutenzione continua
Una sitemap XML non è solo una tattica SEO "impostala e dimenticala". È essenziale aggiornare la tua mappa del sito XML man mano che il tuo sito web cambia.
15 consigli da tenere a mente quando si crea una sitemap XML
1. Le sitemap XML non sono un fattore di ranking
Quando è stato chiesto su X (in precedenza Twitter) se esiste un vantaggio di posizionamento nell'utilizzo delle sitemap XML, Gary Illyes di Google ha risposto:
- "No, non diretto comunque."
2. Google può trovare le tue pagine senza una mappa del sito
I siti web non hanno bisogno di una mappa del sito se sono piccoli e collegati correttamente, Daniel Waisberg, Search Advocate di Google, condiviso in un video di formazione su Google Search Console.
Tuttavia, ha continuato dicendo che una mappa del sito potrebbe essere particolarmente utile se:
- Il sito è davvero grande.
- Le pagine del sito sono isolate.
- Il sito è nuovo o cambia rapidamente.
Inoltre, è importante notare che John Muller di Google ha dichiarato su X (precedentemente Twitter) che avere una sitemap XML è una "linea di base minima per qualsiasi sito web serio".
3. Google verifica se la tua mappa del sito XML è cambiata prima della rielaborazione
Google verifica se la tua mappa del sito XML è cambiata prima di sprecare risorse analizzando ed elaborando nuovamente il file, ha confermato Illyes.
Ha dichiarato in un SEO Office Hours.
- “Non appena modifichi qualcosa nella tua mappa del sito, sia che si tratti dell'elemento URL o dell'ultima modifica, la mappa del sito verrà analizzata di nuovo e generalmente rielaborata. Ciò non significa che gli URL verranno sicuramente sottoposti a scansione, ovviamente sono ancora soggetti a valutazioni di qualità come qualsiasi altro URL. Vale anche la pena ricordare che se rimuovi un URL dalla mappa del sito perché forse non esiste più, ciò non significa che verrà automaticamente eliminato dall'indice o addirittura avrà la priorità per la scansione in modo che possa essere eliminato prima.
4. Le sitemap XML possono far sì che i tuoi nuovi contenuti vengano indicizzati più velocemente
Mueller ha confermato che dire a Google che la tua Sitemap XML è aggiornata può aiutarti a indicizzare i tuoi nuovi contenuti più velocemente.
Ha condiviso:
- “Il ping di una Sitemap è un po' diverso dal semplice fornirla nel file robots.txt: eseguendo il ping, stai attivamente segnalando una modifica nel file della Sitemap. Se desideri che i nuovi contenuti vengano indicizzati rapidamente, questa è una buona pratica".
5. Le sitemap XML devono essere codificate in UTF-8
Se la tua sitemap XML non utilizza UTF-8, i motori di ricerca non possono leggerla.
6. Mantieni la dimensione del file sotto i 50 MB (non compressi) o 50.000 URL
Esistono limiti di dimensione per le tue sitemap XML. Tienilo sotto i 50.000 URL per sitemap o 50 MB (non compresso).
Se disponi di file di dimensioni maggiori o più URL, utilizza più Sitemap XML.
7. Puoi avere più sitemap XML
Google ti consente di inviare più Sitemap. Può essere utile suddividere le tue sitemap in diverse sezioni del tuo sito web per misurare le prestazioni.
Ad esempio, se sei un grande sito di e-commerce, puoi segmentare le tue sitemap XML per tipo di prodotto (ad esempio, scarpe da donna o scarpe da uomo).
Oppure, se hai più lingue, potresti volere un hreflang correlato alla tua sitemap XML <loc>.
Se disponi di lingue alternative, non viene conteggiato per il limite massimo di 50.000 URL.
Oppure, se hai molti video o immagini, puoi separare le tue Sitemap XML in una Sitemap XML video e una Sitemap XML immagine.
Non vi è alcun vantaggio di rango nell'avere più sitemap XML.
8. Se disponi di più sitemap XML, ricorda di utilizzare un file di indice della mappa del sito
Se disponi di più Sitemap XML per un sito di grandi dimensioni, ti consigliamo di inviare un file Indice Sitemap per inviare più Sitemap contemporaneamente.
9. Il tag lastmod dovrebbe essere impeccabile
Il tag <lastmod>
è una delle parti più essenziali della tua sitemap XML.
Ad esempio, i miei dati strutturati sfruttano la data <lastmod> della mia mappa del sito XML.
Il tag <lastmod>
segnala anche ai motori di ricerca se hai aggiornato i vecchi contenuti o ne hai lanciati di nuovi.
Mueller lo ha confermato affermando:
- "...Se stai solo cambiando il piè di pagina del timestamp, certo, anche la pagina è cambiata tecnicamente, ma dovrebbe essere la priorità, probabilmente no."
Bing ha persino preso una posizione ufficiale sul tag lastmod
nella mappa del sito XML, affermando:
- "Per le sitemap XML, uno dei tag più critici che puoi includere nella tua sitemap è il tag" lastmod "."
10. Le sitemap XML dovrebbero includere solo 200 URL di stato che sono tutti auto-canonici
Ricorda di mantenere solo gli URL attivi, lo stato 200, indicizzabili e autocanonicalizzato.
Se continui a mostrare pagine reindirizzate 404 o 301, i motori di ricerca potrebbero interrompere completamente la scansione della tua Sitemap XML.
Mueller ha risposto a un commento su X (precedentemente noto come Twitter):
- “Smetteremo di recuperare i file della mappa del sito se gli URL non sono validi, ma se stai restituendo contenuti o reindirizzando (che è piuttosto consigliato), continueremo a provarli. Non dovrebbe causare problemi, dal momento che i file complessivi della mappa del sito sono solo una minuscola parte di tutti gli URL recuperati da un sito.
11. I motori di ricerca possono controllare quotidianamente la tua sitemap XML
Fabrice Canel di Microsoft ha condiviso che Microsoft controlla quotidianamente la tua mappa del sito XML.
Mentre Mueller ha condiviso che Google controlla la tua sitemap XML in base alla frequenza (ovvero il tuo tag <lastmod>
).
12. La velocità della pagina influisce indirettamente sulla mappa del sito XML
Sappiamo tutti quanto sia vitale la velocità della pagina per i nostri sforzi SEO. Ma in che modo un sito Web con prestazioni lente influisce sulla tua mappa del sito XML?
Mueller ha confermato che la velocità della pagina non dovrebbe influire sulla tua mappa del sito XML affermando:
- “Finché non scade, dovresti stare bene. Forse memorizzare nella cache l'ultima versione per evitare un carico del server non necessario?
La verità è che ho lavorato su siti Web con prestazioni lente in cui la mappa del sito XML non viene caricata quando i motori di ricerca eseguono la scansione del sito Web causando importanti fluttuazioni di posizionamento.
C'è un impatto indiretto sulla tua sitemap XML se il tuo sito web non si carica correttamente.
Ecco perché è importante utilizzare la compressione Gzip per ridurre le dimensioni del file e velocizzare i tempi di caricamento.
13. Rimuovi il tag <priority> dalle tue sitemap XML
Illyes ha paragonato il tag <priority>
nelle sitemap XML a "un sacco di rumore".
Quindi, se dipendi dai motori di ricerca per eseguire la scansione dei tuoi URL nella tua Sitemap XML in base alla priorità, dovrai aspettare molto tempo.
Ti consiglio di rimuovere questo tag dalle tue sitemap XML.
14. Se hai problemi con la struttura di navigazione, abbina la tua mappa del sito XML a una mappa del sito HTML
Ci sono sempre stati sentimenti contrastanti riguardo alle sitemap HTML.
Mueller ha condiviso che le sitemap HTML "non dovrebbero mai essere necessarie".
Lui continuò:
- “Ho cambiato idea sulle sitemap HTML nel corso degli anni, non dovrebbero mai essere necessarie. I siti piccoli e grandi dovrebbero sempre avere una chiara struttura di navigazione. Se senti la necessità di una sitemap HTML, dedica del tempo a migliorare l'architettura del tuo sito. Le sitemap HTML si inseriscono nello stesso cestino con gli spinner di caricamento HTML.
<iframe src="https://mastodon.social/@johnmu/109477617298107922/embed" class="mastodon-embed" width="400" allowfullscreen="allowfullscreen"></iframe><script src="https://mastodon.social/embed.js" async="async"></script>
Quando si lavora su siti Web di grandi dimensioni a livello aziendale, ci sono spesso più livelli di decisori su una struttura di navigazione del sito Web. E spesso, vengono prese in considerazione le migliori pratiche SEO.
Abbino la mia mappa del sito XML con una mappa del sito HTML fino a quando non sono sicuro della navigazione del nostro sito Web e della gerarchia di collegamenti interni.
15. Non dimenticare di includere tutte le tue sitemap XML nel tuo file robots.txt
Non dimenticare di includere le tue sitemap XML (tutte) come link nel tuo file robots.txt.
Ecco un esempio:
Non preoccuparti di dove dovrebbero andare nel file robots.txt. Non vi è alcun impatto sulla posizione della tua Sitemap XML nel tuo file robots.txt.
Mueller ha confermato questo:
Le sitemap XML sono il modello del tuo sito web per i motori di ricerca
Sia che tu stia lanciando una nuova pagina web o semplicemente aggiungendo un tag canonical a una pagina duplicata, la tua sitemap XML è qualcosa che dovresti aggiornare 24 ore su 24, 7 giorni su 7.
Ma fallo con cautela.
Anche se non dovresti essere paranoico, la tua mappa del sito XML è il progetto della tua casa per i motori di ricerca.
Quindi non dimenticare di inviare le tue sitemap XML a Google Search Console e Bing Webmaster Tools.
Le opinioni espresse in questo articolo sono quelle dell'autore ospite e non necessariamente Search Engine Land. Gli autori dello staff sono elencati qui.