Studio: il 31% dei siti web internazionali contiene errori hreflang

Pubblicato: 2023-04-04

L'implementazione di hreflang può essere un compito impegnativo per molti SEO. Le innumerevoli variazioni di sintassi tra diverse lingue possono essere difficili per chi ha poca comprensione di più di una lingua.

C'è anche l'ulteriore complessità della comprensione delle sfumature linguistiche specifiche e del targeting regionale che in genere sarebbero comprese solo da un madrelingua o da qualcuno che ha studiato a fondo la lingua.

L'implementazione errata di hreflang può causare molte complicazioni (ad esempio, contenuto duplicato, indicizzazione errata e scarsa visibilità SERP) a scapito delle prestazioni SEO.

È imperativo implementare hreflang con cura. Per fortuna, hreflang è ben documentato e i problemi correlati possono essere identificati attraverso vari strumenti SEO.

Studio degli errori di hreflang

Per determinare quanto sono diffusi i problemi di hreflang e quali sono i più comuni, ho collaborato con NerdyData, che mi ha dato accesso al loro database di siti Web che contengono codice hreflang.

NerdyData ha fornito un elenco di 18.786 siti Web che contengono almeno un'istanza di hreflang che dichiara un'alternativa all'interno del codice sorgente. Pertanto, questo studio tiene conto solo dell'hreflang implementato in <head>, non attraverso le sitemap XML o l'intestazione HTTP.

Ho svolto lo studio di:

  • Esecuzione di crawl in Screaming Frog per convalidare la presenza di hreflang nelle home page.
  • Rimozione dei reindirizzamenti GEO-IP in modo che l'elenco completo degli URL si risolva in 200 secondi.
  • Utilizzo di HreflangChecker.com e Visual SEO Studio per elaborare gli URL in batch per identificare i problemi comuni identificati dagli strumenti.

Il 31,02% dei siti web contiene direttive hreflang contrastanti

I miei risultati mostrano che il 31,02% dei siti web che servono più lingue ha direttive hreflang contrastanti. Possono verificarsi conflitti di hreflang quando una pagina web ha vari tag hreflang per diverse lingue e targeting geografico.

In parole povere, più di un URL è stato assegnato a una singola lingua o regione, inviando segnali confusi ai motori di ricerca. Per esempio:

  • <link rel=”alternate” href=”https://example.com/” hreflang=”en” />
  • <link rel=”alternate” href=”https://example.com/en-uk/” hreflang=”en-gb” />
  • <link rel=”alternate” href=”https://example.com/en-us/” hreflang=”en-gb” />
  • <link rel=”alternate” href=”https://example.com/en-au/” hreflang=”en-au” />

Tale confusione porta potenzialmente a complicazioni relative a contenuti duplicati e classificazione e indicizzazione errate, rendendo difficile un buon posizionamento nella SERP.

Anche se gli utenti trovano la tua pagina web tra quelle con un buon rendimento, subiranno un'esperienza utente scadente se viene loro offerta la versione errata della pagina.

Nel 16,04% dei cluster hreflang mancano i tag autoreferenziali

L'hreflang autoreferenziale si verifica quando una pagina include un tag hreflang che punta al suo URL.

In sostanza, la pagina indica che è disponibile in varie lingue, compresa la lingua originale della pagina.

Nonostante inizialmente appaia come una tattica ridondante, è una buona pratica per la SEO internazionale. Sfortunatamente, il 16,04% dei siti con più lingue non ha tag hreflang autoreferenziali.

I motori di ricerca possono comprendere meglio la relazione tra diverse versioni della stessa pagina quando vengono utilizzati tag hreflang autoreferenziali, comprese le pagine disponibili in diverse lingue.

Dato che hreflang contribuisce come uno dei circa 20 segnali di canonicalizzazione, è un segnale importante da includere.

Il 47,95% dei siti Web non utilizza x-default

L'attributo x-default segnala ai motori di ricerca che una pagina non ha come target una lingua o una posizione specifica, definendola come una versione nella lingua predefinita della pagina.

È particolarmente utile quando una pagina è disponibile in più lingue ma non fornisce contenuti nella lingua preferita dall'utente.

L'attributo x-default non è necessariamente necessario in hreflang. Fino al 47,95% dei siti multilingue attualmente non lo utilizza.

Tuttavia, può essere utile utilizzarlo nei casi in cui un utente cerchi una pagina in una lingua specifica che non è disponibile, in quanto aiuta i motori di ricerca a trovare la versione più appropriata della pagina da visualizzare.

È importante notare che l'attributo x-default dovrebbe essere utilizzato solo se non è disponibile un'altra lingua. Dove esistono altre lingue disponibili, ciascuna dovrebbe essere specificata con un tag hreflang.

Inoltre, x-default non dovrebbe essere utilizzato su pagine specifiche per una particolare lingua o località.

L'8,91% dei cluster hreflang contiene almeno un'istanza di codici lingua non validi

È essenziale utilizzare il formato ISO-639-1 di due lettere all'interno degli attributi hreflang.

Sfortunatamente, è comune che i codici della lingua vadano errati, causando molteplici problemi che possono influire sul targeting internazionale di un sito web.

La mia ricerca ha rilevato che l'8,91% dei siti indirizzati a più di una lingua contiene attualmente codici di lingua sconosciuti.

Potrebbe trattarsi semplicemente di un approccio confuso alla combinazione di codici di lingua e posizione, ma la causa potrebbe essere dovuta a molti problemi comuni.

Alcuni codici linguistici non corrispondono esattamente all'ortografia di un paese.

Ad esempio, potresti aspettarti che il codice della lingua per il croato sia "cr", ma in realtà è "hr". Poiché il codice non è ovvio, è facile commettere errori durante l'implementazione dei codici di lingua.

L'1,6% dei cluster hreflang contiene almeno un'istanza di codici regionali non validi

Contrariamente alla statistica precedente, relativamente pochi cluster hreflang contengono codici regionali non validi.

Sebbene l'utilizzo dei codici regionali ISO-3166-1 di due lettere non sia obbligatorio, è utile quando si sceglie come target la stessa lingua tra due o più paesi con regole ortografiche diverse. Ciò fornisce più contesto ai motori di ricerca, esaminando la posizione e la lingua dell'utente.

Per tornare al mio esempio precedente, devi utilizzare il codice "en-US" per indirizzare gli utenti negli Stati Uniti. Se è impostato su "en-GB", sceglierai come target solo gli utenti con sede in Gran Bretagna, perdendo completamente il pubblico previsto.

Gli errori comuni qui includono:

  • <link rel=”alternate” href=”https://example.com/en-gb/” hreflang=”en-uk” />
  • <link rel=”alternate” href=”https://example.com/en-eu/” hreflang=”en-eu” />

Qui, le voci sono tutte rivolte all'inglese, ma intendono anche rivolgersi al Regno Unito e all'Europa. Sia UK che EU sono codici non validi in quanto è GB (Gran Bretagna) e non puoi scegliere come target l'Europa come continente.

Il targeting per lo spagnolo può anche essere problematico in America Latina, con il cluster che cerca di scegliere come target es-la, es-lx ed es-419 nel tentativo di scegliere come target l'intera regione quando dovresti scegliere come target singoli paesi o lasciare lo spagnolo come generale lingua.

Il 22,46% dei cluster hreflang contiene combinazioni lingua-regione irregolari/insolite

C'è una serie di vantaggi nel prendere di mira paesi senza lingue native con hreflang, uno dei quali è quello di migliorare l'esperienza dell'utente per i non madrelingua.

Ad esempio, l'olandese è la lingua madre dei Paesi Bassi, ma si stima che il 95% della popolazione parli anche inglese. Ci sono anche circa 97.8000 cittadini britannici che vivono nei Paesi Bassi.

Con un numero così elevato di anglofoni, ha senso indirizzare gli utenti nei Paesi Bassi con le pagine del tuo sito web in inglese.

Tuttavia, non tutte le combinazioni hanno senso. Per esempio:

  • <link rel=”alternate” href=”https://example.com/en-vn/” hreflang=”en-vn” />
  • <link rel=”alternate” href=”https://example.com/es-ie/” hreflang=”es-ie” />
  • <link rel=”alternate” href=”https://example.com/zh-zm/” hreflang=”zh-zm” />

Mentre i tre esempi precedenti supereranno un test hreflang e sono tecnicamente accurati, il numero di parlanti cinesi dello Zambia probabilmente produrrà risultati scarsi o nulli nell'avere questa versione alternativa.

La creazione di versioni alternative che hanno poco senso crea richieste di scansione aggiuntive e non necessarie e versioni che Google potrebbe probabilmente ritenere duplicate, ignorando i canonici.


Le opinioni espresse in questo articolo sono quelle dell'autore ospite e non necessariamente Search Engine Land. Gli autori dello staff sono elencati qui.