Patru probleme frecvente găsite în sitemap-urile XML și cum să le remediați

Publicat: 2022-10-26


Care sunt problemele comune întâlnite în sitemapurile XML? Ce impact au și cum le remediați?

Despre asta vom discuta astăzi cu o doamnă care, atunci când nu lucrează la proiecte sau nu scrie despre SEO, își petrece timpul cultivând roșii, ardei și ierburi. Ea a fost recent îndrumată de Aleyda Solis și de Coaliția Freelance pentru Țările în Dezvoltare Tech SEO. Și ca antreprenor independent și fondator al Tech SEO Journal. Un călduros bun venit la podcastul In Search SEO, Katherine Nwanorue.

În acest episod, Katherine împărtășește patru probleme comune ale sitemapului XML și cum să le rezolvi, inclusiv:
  • Afișarea adreselor URL neeligibile
  • Eroare de format HTML neacceptată
  • Nedeclararea corectă a unei pagini și a versiunii sale alternative
  • Având un sitemap mai mare pentru secțiuni separate ale unui site web

Katherine: Bună, David. Mulțumesc că m-ai primit.

D: Bună, Katherine. Mă bucur să te am aici. O puteți găsi pe Katherine la techseojournal.com. Deci, Katherine, de ce sunt hărțile de site XML atât de importante?

K: E o întrebare bună. Pentru mine, există două avantaje principale ale unui sitemap XML. În primul rând, ajută motoarele de căutare să găsească paginile dvs. importante. Dacă aveți de-a face cu un site web mai mic, care are 500 de pagini sau mai puțin, o structură internă bună de legături și pagini care nu se schimbă frecvent, atunci a avea o hartă XML a site-ului nu este prioritatea dvs. în acest caz. Dar dacă aveți de-a face cu site-uri web mai mari, în care aveți conținut care se schimbă frecvent, structuri de legături interne slabe și pagini orfane, atunci a avea o hartă a site-ului are sens, deoarece poate ajuta motoarele de căutare să găsească paginile dvs. importante.

Dar aș dori, de asemenea, să menționez că a avea un sitemap XML nu garantează indexarea. Este mai degrabă un indiciu, un indiciu pentru motoarele de căutare. Este ca și cum i-ai spune lui Google: „Hei, am aceste pagini foarte grozave care cred că ar trebui indexate. V-ar deranja să le aruncați o privire?”

Al doilea beneficiu al unei hărți de site XML este că ajută la depanarea problemelor SEO, în special a problemelor de indexare. Dar voi reveni la acesta.

D: Grozav, acum ai spus pentru site-uri mai mari. Aveți în vedere un anumit număr de pagini unde, dacă un site are peste un anumit număr de pagini, atunci este o idee bună să utilizați un sitemap XML?

K: Documentația Google recomandă 500 de pagini sau mai mult, opusul unui site web mai mic. Dar, în majoritatea cazurilor, 1000 de pagini sau mai mult ar putea fi bine.

D: Este grozav să ai numere definitive pe care să te concentrezi acolo. Deci astăzi, împărtășiți cele patru probleme comune cu sitemap-urile XML. Începând cu numărul unu, enumerarea adreselor URL neeligibile.



1. Listarea adreselor URL neeligibile



K: Da, și prin adrese URL neeligibile, mă refer la adresele URL care au generat un cod de eroare 404. Poate că sunt blocați de robots.txt sau au o etichetă noindex sau sunt redirecționați. Acest lucru apare de obicei în cazul în care probabil ați creat un sitemap manual și cumva aceste pagini de eroare au ajuns în fișier. Un alt motiv pentru care apare acest lucru este că poate ați creat un sitemap XML care nu se actualizează automat, este static. Deci, atunci când creați pagini noi pe site-ul dvs. web, acestea nu se reflectă pe harta site-ului. Aceasta este o problemă deoarece, în loc să acceseze cu crawlere paginile dvs. valide, motoarele de căutare pierd timpul încercând să acceseze conținutul dvs. puternic redirecționat sau paginile la care nu ar trebui să acceseze. Și Google a menționat că, dacă nu reușesc să acceseze cu crawlere harta site-ului după mai multe încercări, în cele din urmă vor înceta să mai încerce. Acest lucru înfrânge scopul de a avea un sitemap XML în primul rând.

D: Așadar, dacă păstrați adrese URL neeligibile încorporate în harta dvs. XML de site, atunci în cele din urmă Google va ignora harta dvs. XML sau poate nici măcar nu va avea încredere în întregul dvs. site ca fiind la fel de autorizat. Acest lucru ne duce la numărul doi atunci când un sitemap XML generează o eroare de format HTML neacceptată.



2. Eroare de format HTML neacceptată



K: În primul rând, voi descrie despre ce este un Sitemap HTML. Un Sitemap HTML reprezintă conținutul său, linkurile către paginile dvs. și secțiunile de pe site-ul dvs. De obicei, este destinat utilizatorilor umani să navigheze pe site-ul dvs. Este situat în secțiunea de subsol a site-ului dvs. Și da, în cele mai multe cazuri, motoarele de căutare pot, de asemenea, să urmeze aceste link-uri pentru a vă găsi paginile. Dar aici se termină asemănarea cu un sitemap XML. Un Sitemap HTML nu are o dată de modificare. Dacă aveți videoclipuri, probabil că nici măcar nu puteți conecta acele videoclipuri la harta site-ului HTML.

Dacă doriți cu adevărat să spuneți motoarelor de căutare despre conținutul dvs. existent și actualizat, atunci ar trebui să rămâneți la un sitemap XML. Dar într-un caz în care încercați să trimiteți un sitemap XML și primiți această eroare care este în format HTML, atunci sunt șanse să trimiteți de fapt un fișier în format HTML sau sitemap-ul dvs. are erori care sunt îngreunând lectura.

Un alt motiv obișnuit pentru care apare acest lucru este că există o funcționalitate de stocare în cache pe site-ul dvs. în care un plugin, un server sau o configurație vă împiedică și, în schimb, servește un fișier în format HTML.

D: Sfaturi grozave și acolo. Există vreun avantaj în a avea vreodată un sitemap HTML și un sitemap XML în același timp sau ar fi suficient un sitemap XML în sine?

K: Există beneficii să le ai pe ambele. Dacă poți obține valoare suplimentară în ceva, de ce nu? Dacă paginile dvs. au o adâncime foarte mare de accesare cu crawlere, unde unele pagini sunt greu de accesat, atunci poate că o hartă a site-ului HTML vă poate ajuta să atrageți utilizatorii către paginile în care ar trebui să intre și să-i ajute să navigheze pe site-ul dvs. Pe de altă parte, un sitemap XML este destinat motoarele de căutare. Deci, în acest caz, luați în considerare atât utilizatorii, cât și crawlerele. Deci da, cu siguranță este o idee bună să le aveți pe amândouă.

D: Și, evident, ați vorbit despre importanța codificării corecte a unui sitemap XML. Există undeva unde recomandați să verificați pentru a vedea dacă sitemapurile dvs. XML sunt codificate corect?

K: Da, dacă vă faceți griji că harta dvs. XML de site ar putea fi un fișier HTML, ar trebui să încercați să-l trimiteți pe Google Search Console. Probabil veți primi un răspuns că acesta este un Sitemap HTML. Și când se întâmplă asta, pentru a afla ce cauzează cu adevărat acest lucru, deschideți harta site-ului XML în browser și inspectați pagina cu instrumentele de dezvoltare Chrome. Dacă există un plugin sau dacă este vorba de memorarea în cache pe server, probabil că veți vedea o listă de lucruri care vă stau în cale. Odată ce descoperiți că există o funcționalitate de stocare în cache, puteți continua să vă schimbați configurațiile, să vă ștergeți memoria cache și totul ar trebui să revină așa cum este. Dar dacă nu vedeți că nicio funcționalitate de stocare în cache vă împiedică, atunci probabil că aveți erori. Și în acest caz, ar trebui să utilizați un validator de hărți de site XML pentru a verifica dacă există erori sau atribute codificate greșit pe harta dvs. de site.

D: Genial. Și dacă sitemap-ul dvs. XML este codificat corect, dacă este XML adecvat, există vreun pericol ca un plugin de cache să înghețe harta dvs. XML, astfel încât să nu se actualizeze corect? Sau nu este un pericol cu ​​un fișier XML?

K: Acesta este un pericol. De aceea, v-am recomandat să vă asigurați că nu există memorie cache în plug-in. Există o setare în multe plugin-uri în care vă puteți stoca sitemap-urile în cache, dar nu ar trebui, deoarece ar putea cauza probleme așa cum am menționat. Ar putea face ca sitemap-ul XML să apară ca fișier HTML. Ar putea crea atât de multe erori, așa că este mai bine să nu păstrați în cache harta site-ului XML. Te rog nu. Doar că e mai bine să nu.

D: Și ​​numărul trei nu declară corect o pagină și versiunea ei alternativă.



3. Nu declararea corectă a unei pagini și a versiunii sale alternative



K: Acest lucru se aplică în cazul în care implementați eticheta hreflang pe harta site-ului dvs. XML. Și în acest caz, trebuie să specificați adresa URL pe care doriți să fie indexată și versiunile sale alternative, inclusiv ea însăși. De exemplu, să presupunem că am o pagină pentru vorbitorii de engleză pe site-ul meu și aș dori să fie indexată. Dar, în același timp, am două versiuni alternative. Am o versiune germană pentru vorbitorii din Elveția și o versiune chineză pentru utilizatorii chinezi. Deci, pentru a face acest lucru, aș specifica adresa URL pentru pagina în limba engleză și apoi aș enumera aceste trei versiuni. Există versiunea germană pentru Elveția, versiunea chineză pentru China și versiunea în limba engleză în sine.

Și aceste etichete sunt reciproce. Deci, dacă fiecare versiune alternativă la care se face referire nu indică înapoi la cealaltă, există o problemă. Sitemap-ul dvs. XML poate apărea cu probleme în care etichetele dvs. hreflang sunt interpretate incorect sau sunt complet ignorate.

D: Și ​​asta ne duce la numărul patru, adică avem o hartă mai mare a site-ului pentru secțiuni separate ale unui site web.



4. Averea unui Sitemap mai mare pentru secțiuni separate ale unui site web



K: Corect. În prezent, Google acceptă 50.000 de adrese URL într-un singur sitemap sau o dimensiune maximă a sitemap-ului de 50 MB necomprimat, oricare dintre acestea ați accesat primul. Asta nu înseamnă că, dacă aveți 50.000 de adrese URL, ar trebui să le enumerați pe toate pe o singură pagină. Aceasta nu este o practică bună, deoarece vă poate îngreuna depanarea problemelor. Nu ați avea idee ce secțiuni ale site-ului dvs. au probleme de indexare sau de accesare cu crawlere, secțiuni în care motoarele de căutare și crawlerele nu intră.

În mod ideal, ar trebui să segmentați sitemapurile pe secțiuni. De exemplu, dacă aveți un site de comerț electronic, puteți crea un singur sitemap pentru paginile dvs. statice (Despre noi, termeni și condiții etc.) și apoi diferite sitemap pentru paginile dvs. de categorii. În acest fel, puteți identifica cu ușurință problemele și puteți filtra în rapoartele industriei de pe Google Search Console, secțiunile site-ului dvs. care nu sunt accesate cu crawlere și indexate așa cum ar trebui.

D: Există un număr maxim de hărți de site pe care le puteți avea pentru site-ul dvs.?

K: În prezent, nu pot să-i pun un număr chiar acum.

D: Ce zici de verificarea și diagnosticarea sitemap-urilor dvs. XML în mod regulat? Este ceva ce ar trebui să verificați pentru a vedea dacă există erori o dată pe lună?

K: Nu aș recomanda o dată pe lună. Dacă doriți cu adevărat să știți ce se întâmplă pe site-ul dvs. web, ar trebui să vă verificați Google Search Console, deoarece acolo puteți vedea aceste erori pentru sitemap. Ar trebui să îl verificați periodic, zilnic dacă puteți sau săptămânal, în funcție de numărul de pagini pe care le publicați. Dacă publicați conținut în fiecare zi, atunci este logic să îl verificați mult. Dar dacă paginile tale se schimbă rar, atunci săptămânal ar fi bine. Dar te rog, trebuie să verifici.

D: Oamenii care citesc, ascultă sau urmăresc asta se gândesc că trebuie să înțeleg mai multe despre sitemapurile XML. Există resurse pe care le puteți recomanda oamenilor pentru a afla mai multe despre sitemap-urile XML?

K: Da. Ar trebui să verificați documentația Google. Ei au o documentație extinsă despre ce este un sitemap XML, cum să creați unul, cele mai bune practici și cum să îl gestionați pentru site-urile multilingve. Aproape fiecare informație pe care o puteți găsi este acolo.





Pareto Pickle - Având o structură internă bună de legătură



D: Superb. Să încheiem cu Murătura Pareto. Pareto spune că poți obține 80% din rezultate din 20% din eforturile tale. Care este o activitate SEO pe care ați recomanda-o și care oferă rezultate incredibile pentru niveluri modeste de efort?

K: Aș spune o bună structură internă de legătură. Acest lucru se datorează faptului că este sursa principală de descoperire a adreselor URL pentru motoarele de căutare. Aceștia pot urma link-uri din site-ul dvs. pentru a ajunge la paginile importante de pe site-ul dvs. Și dincolo de aceasta, puteți folosi și link-uri pentru a transmite valoarea SEO și către alte pagini. Sau îl puteți folosi și pentru a indica importanța relativă a unei pagini față de altele și relația dintre paginile dvs. Deci da, o structură bună de legătură internă este cea mai bună.

D: Deci, a avea o structură internă bună de legături nu înseamnă că sitemap-urile XML nu sunt necesare?

K: Nu chiar. După cum am menționat, dacă aveți o structură internă bună de legături și un site web mai mic, nu este o prioritate să aveți o hartă de site XML. Dar unele site-uri pot vedea mai multă valoare dintr-un sitemap XML decât altele. Dacă aveți pagini foarte mari, puteți avea o structură internă bună de legături, dar cine nu vrea mai multă valoare? Cine nu vrea ca motoarele de căutare să ajungă la timp la paginile lor? Așadar, un sitemap XML este ca o precauție secundară pe care o luați, în timp ce o structură internă bună de legături este pasul principal pe care îl faceți.

D: Este necesar un Sitemap HTML dacă aveți legături interne bune?

K: Dacă utilizatorii întâmpină în continuare probleme de navigare la site-ul dvs., atunci un Sitemap HTML are sens.

D: Înțeles. Așadar, dacă întâmpinați probleme cu obținerea clasării URL-urilor sau, poate, cu navigarea, așa cum spuneți, atunci un Sitemap HTML ar putea fi bun atât pentru utilizatori, cât și pentru motoarele de căutare. Dar dacă toate paginile pe care doriți să le indexați sunt indexate, atunci nu este necesar să aveți un Sitemap HTML.

K: Da, nu este necesar. Este frumos să aveți în acest caz, dar nu este un must-have.

D: Ei bine, am fost gazda ta, David Bain. O puteți găsi pe Katherine la techseojournal.com. Katherine, mulțumesc foarte mult pentru că ai participat la podcastul SEO în căutare.

K: Mulțumesc că m-ai primit. A fost o plăcere.

D: Și ​​mulțumesc pentru ascultare. Consultați toate episoadele anterioare și înscrieți-vă pentru o probă gratuită a platformei Rank Ranger pe rankranger.com.