Quattro problemi comuni riscontrati nelle mappe dei siti XML e come risolverli
Pubblicato: 2022-10-26Quali sono i problemi comuni riscontrati nelle mappe dei siti XML? Che impatto hanno e come li risolvi?
Questo è ciò di cui parleremo oggi con una signora che quando non lavora a progetti o scrive di SEO, passa il suo tempo a coltivare pomodori, peperoni ed erbe aromatiche. Di recente è stata mentore di Aleyda Solis e della Freelance Coalition for Developing Countries Tech SEO tutorship. E come appaltatore freelance e fondatore di Tech SEO Journal. Un caloroso benvenuto al podcast In Search SEO, Katherine Nwanorue.
In questo episodio, Katherine condivide quattro problemi comuni relativi alla mappa del sito XML e come risolverli, tra cui:
- Elenco di URL non idonei
- Errore di formato HTML non supportato
- Non dichiarare correttamente una pagina e la sua versione alternativa
- Avere una mappa del sito più grande per sezioni separate di un sito web
Caterina: Ciao, David. Grazie per avermi.
D: Ehi, Caterina. Bello averti qui. Puoi trovare Katherine su techseojournal.com. Allora Katherine, perché le mappe dei siti XML sono così importanti?
K: Questa è una buona domanda. Per me, ci sono due vantaggi principali nell'avere una mappa del sito XML. Per uno, aiuta i motori di ricerca a trovare le tue pagine importanti. Se hai a che fare con un sito Web più piccolo che ha 500 pagine o meno, una buona struttura di collegamento interna e pagine che non cambiano frequentemente, in questo caso avere una mappa del sito XML non è la tua priorità. Ma se hai a che fare con siti Web più grandi, in cui hai contenuti che cambiano frequentemente, strutture di collegamento interne scadenti e pagine orfane, avere una mappa del sito ha senso perché può aiutare i motori di ricerca a trovare le tue pagine importanti.
Ma vorrei anche ricordare che avere una mappa del sito XML non garantisce l'indicizzazione. È più come un suggerimento, un indizio, per i motori di ricerca. È come dire a Google: "Ehi, ho queste pagine davvero interessanti che penso dovrebbero essere indicizzate. Ti dispiacerebbe darci un'occhiata?"
Il secondo vantaggio di avere una mappa del sito XML è che aiuta a risolvere i problemi di SEO, in particolare i problemi di indicizzazione. Ma tornerò su questo.
D: Ottimo, ora hai detto per i siti più grandi. Hai in mente un certo numero di pagine in cui se un sito ha più di un certo numero di pagine, è una buona idea utilizzare una mappa del sito XML?
K: La documentazione di Google consiglia 500 pagine o più, l'opposto di un sito web più piccolo. Ma nella maggior parte dei casi, 1000 pagine o più potrebbero andare bene.
D: È fantastico avere numeri definitivi su cui concentrarsi. Quindi oggi condividi i quattro problemi comuni con le mappe dei siti XML. A partire dal numero uno, elencando gli URL non idonei.
1. Elenco di URL non idonei
K: Sì, e per URL non idonei intendo gli URL che hanno generato un codice di errore 404. Forse sono bloccati da robots.txt, o hanno un tag noindex, o vengono reindirizzati. Questo di solito si verifica nel caso in cui probabilmente hai creato una mappa del sito manualmente e in qualche modo queste pagine di errore sono state inserite nel file. Un altro motivo per cui questo viene fuori è che forse hai creato una mappa del sito XML che non si aggiorna automaticamente, è statica. Quindi, quando crei nuove pagine sul tuo sito web, non si riflette sulla mappa del sito. Questo è un problema perché invece di eseguire la scansione delle tue pagine valide, i motori di ricerca stanno perdendo tempo cercando di accedere ai tuoi contenuti fortemente reindirizzati o alle pagine a cui non dovrebbero andare. E Google ha affermato che se non riescono a eseguire la scansione della mappa del sito dopo diversi tentativi, alla fine smetteranno di provare. Questo vanifica lo scopo di avere una mappa del sito XML in primo luogo.
D: Quindi, se mantieni URL non idonei incorporati nella tua mappa del sito XML, alla fine Google ignorerà semplicemente la tua mappa del sito XML, o forse non si fiderà nemmeno dell'intero sito web come autorevole. Questo ci porta al numero due quando una mappa del sito XML genera un errore di formato HTML non supportato.
2. Errore di formato HTML non supportato
K: In primo luogo, vorrei descrivere di cosa tratta una Sitemap HTML. Una Sitemap HTML è il suo contenuto, i collegamenti alle tue pagine e le sezioni del tuo sito web. Di solito è pensato per consentire agli utenti umani di navigare nel tuo sito. Si trova nella sezione footer del tuo sito web. E sì, nella maggior parte dei casi, anche i motori di ricerca possono seguire questi link per trovare le tue pagine. Ma è qui che la somiglianza finisce con una mappa del sito XML. Una Sitemap HTML non ha una data di modifica. Se disponi di video, probabilmente non sarai nemmeno in grado di collegare quei video alla mappa del sito HTML.
Se vuoi davvero informare i motori di ricerca dei tuoi contenuti esistenti e aggiornati, dovresti attenerti a una mappa del sito XML. Ma nel caso in cui stai tentando di inviare una mappa del sito XML e ricevi questo errore che è in formato HTML, è probabile che tu stia effettivamente inviando un file in formato HTML o che la tua mappa del sito abbia degli errori rendendo difficile la lettura.
Un altro motivo comune per cui questo si presenta è che c'è una funzionalità di memorizzazione nella cache sul tuo sito Web in cui un plug-in, un server o una configurazione si intromette e sta invece servendo un file in formato HTML.
D: Anche lì ottimi consigli. Ci sono dei vantaggi nell'avere contemporaneamente una Sitemap HTML e una Sitemap XML o una Sitemap XML da sola sarebbe sufficiente?
K: Ci sono vantaggi nell'avere entrambi. Se puoi ottenere valore aggiuntivo in qualcosa, perché no? Se le tue pagine hanno una profondità di scansione molto lunga, in cui alcune pagine sono difficili da raggiungere, allora forse una mappa del sito HTML può aiutarti a portare gli utenti alle pagine in cui dovrebbero entrare e può aiutarli a navigare nel tuo sito web. D'altra parte, una mappa del sito XML è pensata per i motori di ricerca. Quindi, in questo caso, stai considerando sia gli utenti che i crawler. Quindi sì, è sicuramente una buona idea avere entrambi.
D: E ovviamente hai parlato dell'importanza di codificare correttamente una mappa del sito XML. C'è un posto in cui consigli di controllare che le tue Sitemap XML siano codificate correttamente?
K: Sì, se sei preoccupato che la tua mappa del sito XML possa essere un file HTML, dovresti provare a inviarlo su Google Search Console. Probabilmente riceverai una risposta che si tratta di una Sitemap HTML. E quando ciò accade, per scoprire la vera causa di ciò, apri la Sitemap XML sul tuo browser e ispeziona la pagina con gli strumenti di sviluppo di Chrome. Se c'è un plug-in o se sta memorizzando nella cache del server, probabilmente vedrai un elenco di cose che si intromettono. Una volta scoperto che esiste una funzionalità di memorizzazione nella cache, puoi andare avanti e modificare le tue configurazioni, svuotare la cache e tutto dovrebbe tornare come è. Ma se non vedi alcuna funzionalità di memorizzazione nella cache che si intromette, è probabile che tu abbia degli errori. E in questo caso, dovresti utilizzare un validatore di mappe del sito XML per verificare se ci sono errori o attributi codificati in modo errato sulla tua mappa del sito.
D: Brillante. E se la tua mappa del sito XML è codificata correttamente, se è un XML corretto, c'è il pericolo che un plug-in di memorizzazione nella cache blocchi la tua mappa del sito XML in modo che non si aggiorni correttamente? O non è un pericolo con un file XML?
K: Questo è un pericolo. Ecco perché ti ho consigliato di assicurarti che non ci sia memorizzazione nella cache nel plug-in. C'è un'impostazione in molti plugin in cui puoi memorizzare nella cache le tue mappe del sito ma non dovresti in quanto potrebbe causare problemi come ho detto. Potrebbe far apparire la mappa del sito XML come un file HTML. Potrebbe creare così tanti errori, quindi è meglio non memorizzare nella cache la tua mappa del sito XML. Per favore, non farlo. È solo meglio di no.
D: E il numero tre non sta dichiarando correttamente una pagina e la sua versione alternativa.
3. Non dichiarare correttamente una pagina e la sua versione alternativa
K: Questo vale per un caso in cui stai implementando il tuo tag hreflang sulla tua mappa del sito XML. E in questo caso, devi specificare l'URL che vuoi essere indicizzato e le sue versioni alternative, incluso se stesso. Ad esempio, diciamo che ho una pagina per gli anglofoni sul mio sito Web e vorrei che fosse indicizzata. Ma allo stesso tempo, ho due versioni alternative. Ho una versione tedesca per chi parla in Svizzera e una versione cinese per utenti cinesi. Quindi, per fare ciò, specificherei l'URL per la pagina in inglese e quindi elencherei queste tre versioni. C'è la versione tedesca per la Svizzera, la versione cinese per la Cina e la stessa versione inglese.
E questi tag sono reciproci. Quindi, se ogni versione alternativa a cui si fa riferimento non punta all'altra, c'è un problema. La tua mappa del sito XML potrebbe presentare problemi in cui i tuoi tag hreflang vengono interpretati in modo errato o vengono completamente ignorati.
D: E questo ci porta al numero quattro, ovvero avere una mappa del sito più grande per sezioni separate di un sito web.
4. Avere una mappa del sito più grande per sezioni separate di un sito web
K: Giusto. Attualmente, Google supporta 50.000 URL in una singola mappa del sito o una dimensione massima della mappa del sito di 50 MB non compressi, a seconda di quello che hai colpito per primo. Ciò non significa che se hai 50.000 URL dovresti elencarli tutti in una pagina. Questa non è una buona pratica, perché potrebbe rendere difficile la risoluzione dei problemi. Non avresti idea di quali sezioni del tuo sito web stiano riscontrando problemi di indicizzazione o scansione, sezioni in cui i motori di ricerca e i crawler non entrano.
Idealmente, dovresti segmentare le tue mappe del sito per sezioni. Ad esempio, se possiedi un sito di e-commerce, puoi creare un'unica mappa del sito per le tue pagine statiche (Chi siamo, termini e condizioni, ecc.) e poi diverse mappe del sito per le pagine delle tue categorie. In questo modo puoi individuare facilmente i problemi e filtrare i rapporti di settore su Google Search Console, le sezioni del tuo sito Web che non vengono scansionate e indicizzate come dovrebbero.
D: C'è un numero massimo di mappe del sito che puoi avere per il tuo sito?
K: Attualmente, non posso davvero mettere un numero in questo momento.
D: Che ne dici di controllare e diagnosticare regolarmente le tue Sitemap XML? C'è qualcosa che dovresti controllare per vedere se ci sono errori una volta al mese?
K: Non lo consiglierei una volta al mese. Se vuoi davvero sapere cosa sta succedendo sul tuo sito web, dovresti controllare la tua Google Search Console, perché è lì che puoi vedere questi errori per la mappa del sito. Dovresti controllarlo periodicamente, quotidianamente se possibile o settimanalmente, a seconda del numero di pagine che pubblichi. Se pubblichi contenuti ogni singolo giorno, ha senso controllarli molto. Ma se le tue pagine cambiano raramente, allora la settimana andrebbe bene. Ma per favore, devi controllarlo.
D: Le persone che leggono, ascoltano o guardano questo stanno pensando che ho bisogno di capire di più sulle mappe dei siti XML. Ci sono risorse che puoi consigliare alle persone per saperne di più sulle mappe dei siti XML?
K: Sì. Dovresti controllare la documentazione di Google. Hanno un'ampia documentazione su cos'è la mappa del sito XML, come crearne una, le migliori pratiche e come gestirla per i siti multilingue. Quasi tutte le informazioni che puoi trovare sono lì.
Sottaceto Pareto - Avere una buona struttura di collegamento interna
D: Stupendo. Chiudiamo con il Pareto Pickle. Pareto dice che puoi ottenere l'80% dei tuoi risultati dal 20% dei tuoi sforzi. Qual è un'attività SEO che consiglieresti che fornisce risultati incredibili per livelli di impegno modesti?
K: Direi una buona struttura di collegamento interna. Questo perché è la principale fonte di scoperta degli URL per i motori di ricerca. Possono seguire i collegamenti all'interno del tuo sito per accedere a pagine importanti del tuo sito web. E oltre a questo, puoi anche utilizzare i link per trasferire il valore SEO anche ad altre pagine. Oppure puoi anche usarlo per indicare l'importanza relativa di una pagina rispetto ad altre e la relazione tra le tue pagine. Quindi sì, una buona struttura di collegamento interna è la migliore.
D: Quindi avere una buona struttura di collegamento interna non significa che le sitemap XML non siano necessarie?
K: Non proprio. Come ho già detto, se si dispone di una buona struttura di collegamento interna e di un sito Web più piccolo, non è una priorità avere una mappa del sito XML. Ma alcuni siti possono vedere più valore da una mappa del sito XML rispetto ad altri. Se hai pagine davvero grandi, puoi avere una buona struttura di link interni, ma chi non vuole più valore? Chi non vuole che i motori di ricerca arrivino alle loro pagine in tempo? Quindi una mappa del sito XML è come una precauzione secondaria che prendi mentre una buona struttura di collegamento interna è il passo principale che fai.
D: È necessaria una Sitemap HTML se si dispone di buoni collegamenti interni?
K: Se gli utenti continuano a riscontrare problemi durante la navigazione nel tuo sito web, allora una Sitemap HTML ha senso.
D: Capito. Quindi, se hai problemi con la classificazione degli URL, o forse con la navigazione, come dici tu, una Sitemap HTML potrebbe essere utile sia per gli utenti che per i motori di ricerca. Ma se tutte le pagine che vuoi indicizzare sono indicizzate, non è necessario avere una Sitemap HTML.
K: Sì, non è necessario. È bello avere in quel caso, ma non un must.
D: Beh, sono stato il tuo ospite, David Bain. Puoi trovare Katherine su techseojournal.com. Katherine, grazie mille per essere presente nel podcast In Search SEO.
K: Grazie per avermi. È stato un piacere.
D: E grazie per l'ascolto. Dai un'occhiata a tutti gli episodi precedenti e iscriviti per una prova gratuita della piattaforma Rank Ranger su rankranger.com.