Sitemaps XML și SEO: Ce trebuie să știți
Publicat: 2023-08-16Sitemap-urile XML tocmai au împlinit 18 ani în iunie și, în onoarea introducerii sale cu drepturi depline în vârsta adultă, vă dezvălui cum funcționează sitemap-urile XML, cum să construiți unul și de ce site-urile XML oferă o mulțime de avantaje SEO.
Ce este un sitemap XML?
Pe scurt, o hartă XML a site-ului este un protocol în format XML care informează motoarele de căutare despre adresele URL de pe un site web disponibile pentru accesare cu crawlere.
Sitemap-urile XML au fost menite să partajeze informații despre fiecare adresă URL, cum ar fi:
- Când a fost actualizat ultima dată.
- Cât de des se schimbă.
- Cât de important este în raport cu alte adrese URL de pe site-ul dvs.
Sitemap-urile XML permit motoarelor de căutare să acceseze cu crawlere site-ul dvs. mai eficient dacă anumite adrese URL sunt izolate.
Dacă sunteți un profesionist SEO, probabil că utilizați deja sitemap-uri XML încorporate în pluginul dvs. Yoast WordPress. Dar există o mulțime de extra pe care s-ar putea să le lipsești.
Cum să construiți o hartă de site XML dinamică
Dacă utilizați WordPress, utilizați pluginuri SEO precum Yoast și RankMath pentru a genera o hartă dinamică a site-ului XML.
Dacă nu utilizați WordPress, urmați acești pași pentru a crea un sitemap XML dinamic.
Înțelegeți structura dvs. de navigație
Adunați o listă cu toate adresele URL de pe site și grupați-le pentru a le alinia la structura de navigare și grupările de conținut.
Colaborați cu echipa dvs. de dezvoltatori
Distribuiți lista de adrese URL grupate împreună cu echipa dvs. de dezvoltare pentru a obține ajutorul acestora în crearea unui sitemap XML dinamic folosind Python, PHP sau JavaScript.
Iată un exemplu de codificare a unui sitemap XML dinamic folosind Python:
import xml.etree.ElementTree as ET import datetime # List of URLs (replace these with your actual URLs) urls = [ "https://www.example.com/page1", "https://www.example.com/page2", "https://www.example.com/page3", # Add more URLs here ] # Create the root element urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") # Loop through URLs and create URL entries for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" # You can set this to the desired frequency priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" # You can set this to a value between 0 and 1 # Create the XML tree tree = ET.ElementTree(urlset) # Save the XML to a file tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)
Când lucrez cu dezvoltatori, am folosit Flask și Python împreună pentru a crea o hartă de site XML cu adevărat dinamică, care se schimbă ori de câte ori conținutul site-ului se modifică.
Dacă putem defini ruta dinamică a hărții site-ului pe baza conținutului site-ului web folosind o funcție precum get_dynamic_urls()
, ar trebui să putem prelua toate adresele URL.
@app.route('/sitemap.xml', methods=['GET']) def sitemap(): urls = get_dynamic_urls() # Replace with your dynamic URL retrieval logic urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" xml_content = ET.tostring(urlset, encoding="utf-8") return xml_content, {'Content-Type': 'application/xml'}
Dacă partajați cod pe mai multe proprietăți de domeniu, asigurați-vă că fișierele sunt codificate corect în paginile dvs. HTML.
De exemplu, fișierele dvs. CSS și JavaScript ar trebui să fie conectate folosind etichetele <link>
și <script>
.
Înainte de a partaja codul pe diferite domenii, va trebui să creați un server centralizat pentru a găzdui regulile de hartă site XML partajată.
Veți avea mai multe faze ale sitemap-ului dvs. dinamic XML cu dezvoltatorii dvs. până când toate regulile vor fi confirmate.
Nu uitați să verificați dacă adresele URL dinamice sunt de fapt preluate și integrate în logica sitemapului dvs.
Încărcați pe serverul dvs
Odată ce harta dvs. de site XML este comprimată, încărcați harta de site XML dinamică în directorul rădăcină al site-ului dvs. web.
Trimiteți la motoarele de căutare
Informați motoarele de căutare despre sitemapurile dvs. XML, trimițându-le prin Google Search Console și Bing Webmaster Tools.
Întreținere continuă
O hartă de site XML nu este doar o tactică SEO „setează-l și uită-l”. Este esențial să actualizați harta site-ului XML pe măsură ce site-ul dvs. web se modifică.
15 sfaturi de care trebuie să țineți cont atunci când construiți un sitemap XML
1. Sitemap-urile XML nu sunt un factor de clasare
Când a fost întrebat pe X (anterior Twitter) dacă există un avantaj de clasare în utilizarea sitemap-urilor XML, Gary Illyes de la Google a răspuns:
- „Nu, oricum nu direct.”
2. Google vă poate găsi paginile fără un sitemap
Site-urile web nu au nevoie de o hartă a site-ului dacă sunt mici și conectate corect, Daniel Waisberg, Search Advocate la Google, a distribuit într-un videoclip de instruire Google Search Console.
Cu toate acestea, el a continuat spunând că un sitemap ar putea fi deosebit de util dacă:
- Site-ul este foarte mare.
- Paginile site-ului sunt izolate.
- Site-ul este nou sau se modifică rapid.
De asemenea, este important să rețineți că John Muller de la Google a declarat pe X (anterior Twitter) că a avea o hartă XML a site-ului este o „linie de bază minimă pentru orice site serios”.
3. Google verifică dacă sitemap-ul dvs. XML s-a modificat înainte de reprocesare
Google verifică dacă sitemap-ul dvs. XML s-a schimbat înainte să risipească resurse analizând și procesând din nou fișierul, a confirmat Illyes.
El a declarat într-un program SEO Office Hours.
- „De îndată ce modificați ceva în harta site-ului dvs., fie că este elementul URL sau ultimul mod, harta site-ului va fi analizată din nou și, în general, reprocesată. Asta nu înseamnă că adresele URL vor fi cu siguranță accesate cu crawlere, desigur, ele sunt încă supuse evaluărilor de calitate ca orice altă adresă URL. De asemenea, merită menționat faptul că, dacă eliminați o adresă URL de pe harta site-ului, deoarece poate nu mai există, asta nu înseamnă că va fi eliminată automat din index sau chiar va fi prioritizat pentru accesare cu crawlere, astfel încât să poată fi abandonată mai devreme.”
4. Sitemap-urile XML vă pot indexa mai repede noul conținut
Mueller a confirmat că informarea Google a site-ului dvs. XML este actualizată poate ajuta la indexarea mai rapidă a noului dvs. conținut.
El a împărtășit:
- „Pingarea unui sitemap este puțin diferită decât furnizarea lui în robots.txt – prin ping, semnalați în mod activ o modificare în fișierul sitemap. Dacă doriți să aveți conținut nou indexat rapid, aceasta este o practică bună.”
5. Sitemap-urile XML trebuie să fie codificate UTF-8
Dacă sitemap-ul dvs. XML nu utilizează UTF-8, motoarele de căutare nu o pot citi.
6. Păstrați dimensiunea fișierului sub 50 MB (necomprimat) sau 50.000 de adrese URL
Există limite de dimensiune pentru sitemapurile dvs. XML. Păstrați-l sub 50.000 de adrese URL per sitemap sau 50 MB (necomprimat).
Dacă aveți o dimensiune de fișier mai mare sau mai multe adrese URL, utilizați mai multe sitemap XML.
7. Puteți avea mai multe sitemap XML
Google vă permite să trimiteți mai multe sitemap-uri. Împărțirea sitemap-urilor dvs. în diferite secțiuni ale site-ului dvs. pentru a măsura performanța poate fi utilă.
De exemplu, dacă sunteți un site mare de comerț electronic, puteți segmenta hărțile dvs. de site XML în funcție de tipul de produs (adică, pantofi pentru femei vs. pantofi pentru bărbați).
Sau, dacă aveți mai multe limbi, este posibil să doriți un hreflang legat de harta dvs. XML <loc>.
Dacă aveți limbi alternative, nu se iau în calcul pentru maximum 50.000 de adrese URL.
Sau, dacă aveți o mulțime de videoclipuri sau imagini, puteți separa sitemapurile dvs. XML într-un sitemap XML video și un sitemap XML imagine.
Nu există niciun avantaj de rang în a avea mai multe sitemap-uri XML.
8. Dacă aveți mai multe hărți de site XML, nu uitați să utilizați un fișier index de hărți de site
Dacă aveți mai multe hărți de site XML pentru un site mare, veți dori să trimiteți un fișier index de hărți de site pentru a trimite mai multe hărți de site simultan.
9. Eticheta lastmod ar trebui să fie impecabilă
Eticheta <lastmod>
este una dintre cele mai esențiale părți ale sitemap-ului dvs. XML.
De exemplu, datele mele structurate folosesc data <lastmod> a sitemap-ului meu XML.
Eticheta <lastmod>
indică și motoarele de căutare dacă ați reîmprospătat conținut vechi sau ați lansat conținut nou.
Mueller a confirmat acest lucru declarând:
- „…Dacă schimbați doar subsolul marcajului de timp, sigur, pagina s-a schimbat și din punct de vedere tehnic, dar ar trebui să i se acorde prioritate – probabil că nu.”
Bing a luat chiar și o poziție oficială cu privire la eticheta lastmod
din harta site-ului XML, declarând:
- „Pentru hărțile de site XML, una dintre cele mai importante etichete pe care le puteți include în harta dvs. este eticheta „lastmod”.
10. Sitemap-urile XML ar trebui să includă numai 200 de adrese URL de stare care sunt toate autocanonizate
Nu uitați să păstrați numai adrese URL live, 200 de status, indexabile și auto-canonizate.
Dacă continuați să afișați 404 sau 301 pagini redirecționate, motoarele de căutare ar putea opri complet accesarea cu crawlere a sitemap-ului dvs. XML.
Mueller a răspuns la un comentariu pe X (cunoscut anterior ca Twitter):
- „Ne-am opri să preluăm fișiere sitemap dacă adresele URL sunt invalide, dar dacă returnați conținut sau redirecționați (ceea ce este oarecum recomandat), vom continua să le încercăm. Nu ar trebui să cauzeze probleme, deoarece fișierele sitemap sunt doar o mică parte din toate adresele URL preluate de pe un site.”
11. Motoarele de căutare vă pot verifica harta site-ului XML zilnic
Fabrice Canel de la Microsoft a spus că Microsoft verifică zilnic harta dvs. XML de site.
În timp ce Mueller a spus că Google vă verifică sitemap-ul XML pe baza frecvenței (alias, eticheta <lastmod>
).
12. Viteza paginii afectează indirect harta dvs. XML de site
Știm cu toții cât de vitală este viteza paginii pentru eforturile noastre de SEO. Dar cum influențează un site web cu performanțe lente harta dvs. XML?
Mueller a confirmat că viteza paginii nu ar trebui să afecteze harta site-ului dvs. XML, declarând:
- „Atâta timp cât nu expiră, ar trebui să fii bine. Poate salvați cea mai recentă versiune în cache pentru a preveni încărcarea inutilă a serverului?”
Adevărul este că am lucrat pe site-uri web cu performanțe lente, unde harta site-ului XML nu se încarcă atunci când motoarele de căutare accesează cu crawlere site-ul, provocând fluctuații majore de clasare.
Există un impact indirect asupra sitemap-ului dvs. XML dacă site-ul dvs. nu se încarcă corect.
Acesta este motivul pentru care este important să utilizați compresia Gzip pentru a reduce dimensiunea fișierului și pentru a accelera timpul de încărcare.
13. Eliminați eticheta <priority> din sitemap-urile dvs. XML
Illyes a comparat eticheta <priority>
din sitemapurile XML cu „un sac de zgomot”.
Deci, dacă depindeți de motoarele de căutare pentru a vă accesa cu crawlere adresele URL în harta site-ului XML pe baza priorității, veți aștepta mult timp.
Vă recomand să eliminați această etichetă din sitemapurile dvs. XML.
14. Dacă aveți probleme legate de structura de navigare, asociați harta site-ului XML cu o hartă a site-ului HTML
Au existat întotdeauna sentimente mixte cu privire la sitemap-urile HTML.
Mueller a spus că sitemapurile HTML „nu ar trebui să fie niciodată necesare”.
El a continuat:
- „M-am răzgândit cu privire la sitemapurile HTML de-a lungul anilor, nu ar trebui să fie niciodată necesare. Site-urile mici și mari ar trebui să aibă întotdeauna o structură de navigare clară. Dacă simțiți nevoia unui sitemap HTML, petreceți timpul îmbunătățind arhitectura site-ului dvs. Sitemap-urile HTML se potrivesc în același coș cu dispozitivele de încărcare HTML.”
<iframe src="https://mastodon.social/@johnmu/109477617298107922/embed" class="mastodon-embed" width="400" allowfullscreen="allowfullscreen"></iframe><script src="https://mastodon.social/embed.js" async="async"></script>
Când lucrați pe site-uri web mari la nivel de întreprindere, există adesea mai multe straturi de factori de decizie pe o structură de navigare a site-ului web. Și de multe ori, cele mai bune practici SEO sunt luate în considerare.
Împerechez atât harta mea XML a site-ului cu o hartă a site-ului HTML până când sunt încrezător în navigarea pe site-ul nostru web și în ierarhia internă a legăturilor.
15. Nu uitați să includeți toate sitemapurile dvs. XML în fișierul robots.txt
Nu uitați să includeți sitemap-urile dvs. XML (toate) ca linkuri în fișierul robots.txt.
Iată un exemplu:
Nu vă faceți griji despre unde ar trebui să ajungă acestea din fișierul robots.txt. Nu există niciun impact asupra locației sitemap-ului dvs. XML în fișierul robots.txt.
Mueller a confirmat acest lucru:
Sitemap-urile XML sunt modelul site-ului dvs. pentru motoarele de căutare
Indiferent dacă lansați o pagină web nouă sau doar adăugați o etichetă canonică la o pagină duplicată, harta site-ului dvs. XML este ceva ce ar trebui să o actualizați 24/7.
Dar fă-o cu prudență.
Deși nu ar trebui să fii paranoic, harta ta XML a site-ului este planul casei tale pentru motoarele de căutare.
Prin urmare, nu uitați să trimiteți sitemap-urile dvs. XML către Google Search Console și Bing Webmaster Tools.
Opiniile exprimate în acest articol sunt cele ale autorului invitat și nu neapărat Search Engine Land. Autorii personalului sunt enumerați aici.