Studiu: 31% dintre site-urile internaționale conțin erori hreflang

Publicat: 2023-04-04

Implementarea hreflang poate fi o sarcină dificilă pentru mulți SEO. Nenumăratele variații de sintaxă în mai multe limbi pot fi dificile pentru cei care înțeleg puțin mai mult de o limbă.

Există, de asemenea, complexitatea suplimentară a înțelegerii nuanțelor specifice ale limbii și a direcționării regionale, care ar fi înțelese de obicei doar de un vorbitor nativ sau de cineva care a studiat temeinic limba.

Implementarea incorectă a hreflang poate cauza multe complicații (de exemplu, conținut duplicat, indexare eronată și vizibilitate slabă a SERP) dăunătoare performanței SEO.

Este imperativ să implementați hreflang cu grijă. Din fericire, hreflang este bine documentat și problemele conexe pot fi identificate prin diferite instrumente SEO.

Studiul erorilor Hreflang

Pentru a determina cât de răspândite sunt problemele hreflang și care sunt mai frecvente, m-am asociat cu NerdyData, care mi-a oferit acces la baza lor de date cu site-uri web care conțin codul hreflang.

NerdyData a furnizat o listă de 18.786 de site-uri web care conțin cel puțin o instanță de hreflang care declară o alternativă în codul sursă. Astfel, acest studiu ține cont doar de hreflang implementat în <head>, nu prin sitemap-uri XML sau antetul HTTP.

Am realizat studiul prin:

  • Rularea crawlerilor în Screaming Frog pentru a valida prezența hreflang-ului pe paginile de start.
  • Eliminarea redirecționărilor GEO-IP, astfel încât lista completă de adrese URL să se rezolve în 200 de ani.
  • Folosind HreflangChecker.com și Visual SEO Studio pentru a procesa adresele URL în loturi pentru a identifica problemele comune identificate de instrumente.

31,02% dintre site-uri web conțin directive hreflang contradictorii

Constatările mele arată că 31,02% dintre site-urile web care deservesc mai multe limbi au directive hreflang contradictorii. Conflictele hreflang pot apărea atunci când o pagină web are diverse etichete hreflang pentru diferite limbi și direcționare geografică.

Mai simplu spus, mai mult de o adresă URL a fost atribuită unei limbi sau regiuni individuale, trimițând semnale confuze către motoarele de căutare. De exemplu:

  • <link rel="alternate” href="https://example.com/” hreflang="ro” />
  • <link rel="alternate” href="https://example.com/en-uk/” hreflang=”en-gb” />
  • <link rel="alternate” href="https://example.com/en-us/” hreflang=”en-gb” />
  • <link rel="alternate” href="https://example.com/en-au/” hreflang=”en-au” />

O astfel de confuzie poate duce la complicații în jurul conținutului duplicat și a clasării și indexării incorecte, ceea ce face dificilă plasarea corectă în SERP.

Chiar dacă utilizatorii găsesc pagina dvs. web printre cei cu performanțe bune, aceștia vor suferi o experiență de utilizator slabă dacă li se oferă versiunea incorectă a paginii.

16,04% dintre clusterele hreflang lipsesc etichete de auto-referință

Auto-referința hreflang are loc atunci când o pagină include o etichetă hreflang care indică adresa URL a acesteia.

În esență, pagina indică că este disponibilă în diferite limbi, inclusiv în limba originală a paginii.

În ciuda faptului că a apărut inițial ca o tactică redundantă, este o bună practică pentru SEO internațional. Din păcate, 16,04% dintre site-urile cu mai multe limbi nu au etichete hreflang cu auto-referință.

Motoarele de căutare pot înțelege mai bine relația dintre diferitele versiuni ale aceleiași pagini atunci când sunt utilizate etichete hreflang cu auto-referință, inclusiv pagini disponibile în diferite limbi.

Având în vedere că hreflang contribuie ca unul dintre cele aproximativ 20 de semnale de canonizare, este un semnal important de inclus.

47,95% dintre site-uri web nu utilizează x-default

Atributul x-default semnalează motoarelor de căutare că o pagină nu vizează o anumită limbă sau locație, definind-o ca versiune de limbă implicită a paginii.

Este util mai ales atunci când o pagină este disponibilă în mai multe limbi, dar nu oferă conținut în limba preferată a utilizatorului.

Atributul x-default nu este neapărat necesar în hreflang. Până la 47,95% dintre site-urile multilingve nu îl folosesc în prezent.

Cu toate acestea, poate fi benefic de utilizat în cazurile în care un utilizator caută o pagină într-o anumită limbă care nu este disponibilă, deoarece ajută motoarele de căutare să găsească cea mai potrivită versiune a paginii pentru afișare.

Este important de reținut că atributul x-default ar trebui utilizat numai dacă nu este disponibilă o altă limbă. Acolo unde există alte limbi disponibile, fiecare ar trebui să fie specificată cu o etichetă hreflang.

În plus, x-default nu trebuie utilizat în pagini specifice unei anumite limbi sau locații.

8,91% dintre clusterele hreflang conțin cel puțin o instanță de coduri de limbă nevalide

Este esențial să utilizați formatul ISO-639-1 de două litere în cadrul atributelor hreflang.

Din păcate, este obișnuit ca codurile de limbă să meargă greșit, provocând mai multe probleme care pot afecta direcționarea internațională a unui site web.

Cercetarea mea a constatat că 8,91% dintre site-urile care vizează mai mult de o limbă conțin în prezent coduri de limbă necunoscută.

Ar putea fi pur și simplu o abordare confuză pentru combinarea codurilor de limbă și locație, dar multe probleme comune ar putea fi cauza.

Unele coduri de limbă nu se potrivesc cu ortografia unei țări.

De exemplu, vă puteți aștepta ca codul de limbă pentru croată să fie „cr”, dar de fapt este „hr”. Deoarece codul nu este evident, este ușor să faci greșeli atunci când implementezi coduri de limbă.

1,6% dintre clusterele hreflang conțin cel puțin o instanță de coduri de regiune nevalide

Spre deosebire de statistica anterioară, relativ puține grupuri hreflang conțin coduri de regiune nevalide.

Deși nu este necesară utilizarea codurilor de regiune ISO-3166-1 din două litere, aceasta ajută atunci când vizați aceeași limbă între două sau mai multe țări cu reguli de ortografie diferite. Procedând astfel, motoarele de căutare oferă mai mult context, analizând locația și limba utilizatorului.

Pentru a reveni la exemplul meu anterior, trebuie să utilizați codul „en-US” pentru a viza utilizatorii din Statele Unite. Dacă este setat la „en-GB”, veți viza doar utilizatorii din Marea Britanie, pierzând complet publicul vizat.

Erorile comune aici includ:

  • <link rel="alternate” href="https://example.com/en-gb/” hreflang="en-uk” />
  • <link rel="alternate” href="https://example.com/en-eu/” hreflang=”en-eu” />

Aici, toate intrările vizează limba engleză, dar intenționează să vizeze și Marea Britanie și Europa. Atât Marea Britanie, cât și UE sunt coduri nevalide, deoarece este GB (Marea Britanie) și nu puteți viza Europa ca continent.

Direcționarea spaniolă poate fi, de asemenea, problematică în America Latină, grupul încercând să vizeze es-la, es-lx și es-419 în încercarea de a viza regiunea în întregime, atunci când ar trebui să vizați țări individuale – sau lăsând spaniola ca general limba.

22,46% dintre clusterele hreflang conțin combinații neregulate/neobișnuite de limbă-regiune

Există o serie de avantaje în a viza țările fără limbi native cu hreflang, unul major fiind îmbunătățirea experienței utilizatorilor pentru vorbitorii non-nativi.

De exemplu, olandeza este limba maternă a Țărilor de Jos, dar se estimează că 95% din populație vorbește și engleza. Există, de asemenea, aproximativ 97.8000 de cetățeni britanici care locuiesc în Țările de Jos.

Cu un număr atât de mare de vorbitori de limbă engleză, este logic să vizați utilizatorii din Țările de Jos cu paginile site-ului dvs. în limba engleză.

Cu toate acestea, nu toate combinațiile au sens. De exemplu:

  • <link rel="alternate” href="https://example.com/en-vn/” hreflang=”en-vn” />
  • <link rel="alternate” href="https://example.com/es-ie/” hreflang=”es-ie” />
  • <link rel="alternate” href="https://example.com/zh-zm/” hreflang="zh-zm” />

În timp ce cele trei exemple de mai sus vor trece un test hreflang și sunt precise din punct de vedere tehnic, numărul de vorbitori de chineză din Zambia va da probabil puține sau deloc rezultate în a avea această versiune alternativă.

Crearea de versiuni alternative care au puțin sens creează o cerere suplimentară și inutilă de accesare cu crawlere și versiuni pe care Google le poate considera probabil duplicate, depășind canonicalele.


Opiniile exprimate în acest articol sunt cele ale autorului invitat și nu neapărat Search Engine Land. Autorii personalului sunt enumerați aici.