Mapy witryn XML i SEO: co musisz wiedzieć
Opublikowany: 2023-08-16Mapy witryn XML właśnie skończyły 18 lat w czerwcu i aby uczcić ich pełnoprawne wprowadzenie w dorosłość, wyjaśniam, jak działają mapy witryn XML, jak je zbudować i dlaczego mapy witryn XML oferują mnóstwo korzyści SEO.
Co to jest mapa witryny XML?
W skrócie, mapa witryny XML to protokół w formacie XML, który informuje wyszukiwarki o adresach URL w witrynie dostępnej do indeksowania.
Mapy witryn XML miały udostępniać informacje o każdym adresie URL, takie jak:
- Kiedy była ostatnio aktualizowana.
- Jak często się zmienia.
- Jak ważne jest to w odniesieniu do innych adresów URL w Twojej witrynie.
Mapy witryn XML umożliwiają wyszukiwarkom skuteczniejsze indeksowanie Twojej witryny, jeśli niektóre adresy URL są izolowane.
Jeśli jesteś specjalistą SEO, prawdopodobnie korzystasz już z map witryn XML wbudowanych we wtyczkę Yoast WordPress. Ale istnieje wiele dodatków, których możesz przegapić.
Jak zbudować dynamiczną mapę witryny XML
Jeśli używasz WordPressa, wykorzystaj wtyczki SEO, takie jak Yoast i RankMath, aby wygenerować dynamiczną mapę witryny XML.
Jeśli nie używasz WordPressa, wykonaj poniższe kroki, aby zbudować dynamiczną mapę witryny XML.
Zrozum swoją strukturę nawigacyjną
Zbierz listę wszystkich naszych adresów URL w witrynie i pogrupuj je, aby dostosować je do struktury nawigacyjnej i grupowania treści.
Współpracuj ze swoim zespołem programistów
Udostępnij listę zgrupowanych adresów URL swojemu zespołowi programistów, aby uzyskać pomoc w tworzeniu dynamicznej mapy witryny XML przy użyciu języka Python, PHP lub JavaScript.
Oto przykład kodowania dynamicznej mapy witryny XML za pomocą Pythona:
import xml.etree.ElementTree as ET import datetime # List of URLs (replace these with your actual URLs) urls = [ "https://www.example.com/page1", "https://www.example.com/page2", "https://www.example.com/page3", # Add more URLs here ] # Create the root element urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") # Loop through URLs and create URL entries for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" # You can set this to the desired frequency priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" # You can set this to a value between 0 and 1 # Create the XML tree tree = ET.ElementTree(urlset) # Save the XML to a file tree.write("sitemap.xml", encoding="utf-8", xml_declaration=True)
Pracując z programistami, wykorzystałem razem Flask i Python, aby stworzyć prawdziwie dynamiczną mapę witryny XML, która zmienia się za każdym razem, gdy zmienia się zawartość witryny.
Jeśli możemy zdefiniować trasę dynamicznej mapy witryny na podstawie zawartości witryny za pomocą funkcji takiej jak get_dynamic_urls()
, powinniśmy być w stanie pobrać wszystkie adresy URL.
@app.route('/sitemap.xml', methods=['GET']) def sitemap(): urls = get_dynamic_urls() # Replace with your dynamic URL retrieval logic urlset = ET.Element("urlset") urlset.set("xmlns", "http://www.sitemaps.org/schemas/sitemap/0.9") for url in urls: url_elem = ET.SubElement(urlset, "url") loc_elem = ET.SubElement(url_elem, "loc") loc_elem.text = url lastmod_elem = ET.SubElement(url_elem, "lastmod") lastmod_elem.text = datetime.datetime.now().isoformat() changefreq_elem = ET.SubElement(url_elem, "changefreq") changefreq_elem.text = "daily" priority_elem = ET.SubElement(url_elem, "priority") priority_elem.text = "0.5" xml_content = ET.tostring(urlset, encoding="utf-8") return xml_content, {'Content-Type': 'application/xml'}
Jeśli udostępniasz kod w wielu usługach domeny, upewnij się, że pliki są prawidłowo zakodowane na stronach HTML.
Na przykład pliki CSS i JavaScript powinny być połączone za pomocą tagów <link>
i <script>
.
Zanim udostępnisz kod w różnych domenach, musisz utworzyć scentralizowany serwer, który będzie hostował wspólne reguły mapy witryny XML.
Będziesz mieć wiele faz swojej dynamicznej mapy witryny XML ze swoimi programistami, dopóki wszystkie reguły nie zostaną potwierdzone.
Nie zapomnij sprawdzić, czy dynamiczne adresy URL są faktycznie pobierane i integrowane z logiką mapy witryny.
Wgraj na swój serwer
Po skompresowaniu mapy witryny XML prześlij dynamiczną mapę witryny XML do katalogu głównego witryny.
Prześlij do wyszukiwarek
Poinformuj wyszukiwarki o swoich mapach witryn XML, przesyłając je za pośrednictwem Google Search Console i Narzędzi dla webmasterów Bing.
Trwający serwis
Mapa witryny XML to nie tylko taktyka SEO typu „ustaw i zapomnij”. Aktualizowanie mapy witryny XML w miarę zmian w witrynie jest niezbędne.
15 wskazówek, o których należy pamiętać podczas tworzenia mapy witryny XML
1. Mapy witryn XML nie są czynnikiem rankingowym
Zapytany na X (wcześniej na Twitterze), czy korzystanie z map witryn XML ma przewagę w rankingu, Gary Illyes z Google odpowiedział:
- – Nie, w każdym razie nie bezpośrednio.
2. Google może znaleźć Twoje strony bez mapy witryny
Witryny nie potrzebują mapy witryny, jeśli są małe i odpowiednio połączone, Daniel Waisberg, doradca ds. wyszukiwania w Google, udostępnił w filmie szkoleniowym Google Search Console.
Dodał jednak, że mapa witryny może być szczególnie pomocna, jeśli:
- Strona jest naprawdę duża.
- Strony witryny są izolowane.
- Strona jest nowa lub szybko się zmienia.
Należy również zauważyć, że John Muller z Google stwierdził na X (wcześniej na Twitterze), że posiadanie mapy witryny XML to „minimalny punkt odniesienia dla każdej poważnej witryny”.
3. Google sprawdza, czy mapa witryny XML uległa zmianie przed ponownym przetworzeniem
Google sprawdza, czy mapa witryny XML uległa zmianie, zanim zmarnuje zasoby na ponowne analizowanie i przetwarzanie pliku, potwierdził Illyes.
Stwierdził w SEO Office Hours.
- „Gdy tylko zmienisz coś w mapie witryny, czy to element adresu URL, czy ostatni mod, mapa witryny zostanie ponownie przeanalizowana i ogólnie ponownie przetworzona. Nie oznacza to, że adresy URL będą na pewno indeksowane, oczywiście nadal podlegają ocenie jakości, jak każdy inny adres URL. Warto również wspomnieć, że jeśli usuniesz adres URL z mapy witryny, ponieważ być może już nie istnieje, nie oznacza to, że zostanie on automatycznie usunięty z indeksu lub nawet zostanie nadany priorytet indeksowaniu, aby można go było usunąć wcześniej”.
4. Mapy witryn XML umożliwiają szybsze indeksowanie nowych treści
Mueller potwierdził, że poinformowanie Google o aktualizacji mapy witryny XML może przyspieszyć indeksowanie nowych treści.
Podzielił się:
- „Pingowanie mapy witryny różni się nieco od zwykłego udostępnienia jej w pliku robots.txt — wysyłając polecenie ping, aktywnie oznaczasz zmianę w pliku mapy witryny. Jeśli zależy Ci na szybkim indeksowaniu nowych treści, jest to dobra praktyka”.
5. Mapy witryn XML muszą być zakodowane w UTF-8
Jeśli Twoja mapa witryny XML nie używa kodowania UTF-8, wyszukiwarki nie mogą jej odczytać.
6. Utrzymuj rozmiar pliku poniżej 50 MB (nieskompresowany) lub 50 000 adresów URL
Mapy witryn XML mają ograniczenia rozmiaru. Nie przekraczaj 50 000 adresów URL na mapę witryny lub 50 MB (bez kompresji).
Jeśli masz większy rozmiar pliku lub więcej adresów URL, użyj wielu map witryn XML.
7. Możesz mieć wiele map witryn XML
Google umożliwia przesyłanie wielu map witryn. Przydatne może być podzielenie map witryn na różne sekcje witryny w celu pomiaru wydajności.
Na przykład, jeśli prowadzisz dużą witrynę e-commerce, możesz segmentować mapy witryn XML według typu produktu (np. buty damskie i buty męskie).
Lub, jeśli masz wiele języków, możesz potrzebować hreflang powiązanego z mapą witryny <loc> XML.
Jeśli masz języki alternatywne, nie wlicza się to do limitu 50 000 adresów URL.
Lub, jeśli masz dużo filmów lub obrazów, możesz rozdzielić mapy witryn XML na mapę witryny XML wideo i mapę witryny XML obrazu.
Posiadanie wielu map witryn XML nie ma żadnych korzyści z rangi.
8. Jeśli masz wiele map witryn XML, pamiętaj o użyciu pliku indeksu map witryn
Jeśli masz wiele map witryn XML dla dużej witryny, prześlij plik indeksu map witryn, aby przesłać wiele map witryn jednocześnie.
9. Tag lastmod powinien być bezbłędny
Tag <lastmod>
jest jedną z najważniejszych części mapy witryny XML.
Na przykład moje uporządkowane dane wykorzystują datę <lastmod> mojej mapy witryny XML.
Tag <lastmod>
sygnalizuje również wyszukiwarkom, czy odświeżyłeś starą treść, czy uruchomiłeś nową.
Mueller potwierdził to, stwierdzając:
- „…Jeśli tylko zmieniasz stopkę sygnatury czasowej, to jasne, strona też się technicznie zmieniła, ale jeśli to ma być priorytetowe – prawdopodobnie nie”.
Bing zajął nawet oficjalne stanowisko w sprawie tagu lastmod
w mapie witryny XML, stwierdzając:
- „W przypadku map witryn XML jednym z najważniejszych tagów, jakie można umieścić w mapie witryny, jest tag „lastmod”.
10. Mapy witryn XML powinny zawierać tylko 200 adresów URL stanu, z których wszystkie są kanonizowane
Pamiętaj, aby zachować tylko aktywne adresy URL, stan 200, indeksowane i samokanoniczne.
Jeśli nadal będziesz wyświetlać strony przekierowane 404 lub 301, wyszukiwarki mogą całkowicie przestać indeksować Twoją mapę witryny XML.
Mueller odpowiedział na komentarz na X (wcześniej znany jako Twitter):
- „Przestaliśmy pobierać pliki map witryn, jeśli adresy URL są nieprawidłowe, ale jeśli zwracasz treść lub przekierowujesz (co jest trochę zalecane), będziemy nadal je próbować. Nie powinno to powodować problemów, ponieważ ogólnie pliki map witryn to tylko niewielka część wszystkich adresów URL pobranych z witryny”.
11. Wyszukiwarki mogą codziennie sprawdzać mapę witryny XML
Fabrice Canel z firmy Microsoft powiedział, że firma Microsoft codziennie sprawdza mapę witryny XML.
Podczas gdy Mueller powiedział, że Google sprawdza twoją mapę witryny XML na podstawie częstotliwości (inaczej tagu <lastmod>
).
12. Szybkość strony pośrednio wpływa na mapę witryny XML
Wszyscy wiemy, jak ważna jest szybkość strony dla naszych działań SEO. Ale w jaki sposób powolna witryna wpływa na mapę witryny XML?
Firma Mueller potwierdziła, że szybkość strony nie powinna wpływać na mapę witryny XML, stwierdzając:
- „Dopóki nie przekroczy limitu czasu, powinno być dobrze. Może buforować najnowszą wersję, aby zapobiec niepotrzebnemu obciążeniu serwera?”
Prawda jest taka, że pracowałem nad wolno działającymi witrynami, w których mapa witryny XML nie ładuje się, gdy wyszukiwarki indeksują witrynę, co powoduje duże wahania w rankingu.
Nieprawidłowe ładowanie witryny ma pośredni wpływ na mapę witryny XML.
Dlatego ważne jest, aby używać kompresji Gzip, aby zmniejszyć rozmiar pliku i przyspieszyć ładowanie.
13. Usuń tag <priority> z map witryn XML
Illyes porównał tag <priority>
w mapach witryn XML do „szumu”.
Jeśli więc polegasz na wyszukiwarkach, które indeksują Twoje adresy URL w mapie witryny XML na podstawie priorytetu, będziesz długo czekać.
Zalecam usunięcie tego tagu z map witryn XML.
14. Jeśli masz problemy ze strukturą nawigacji, sparuj mapę witryny XML z mapą witryny HTML
Mapy witryn HTML zawsze budziły mieszane uczucia.
Mueller powiedział, że mapy witryn HTML „nigdy nie powinny być potrzebne”.
On kontynuował:
- „Przez lata zmieniłem zdanie na temat map witryn HTML, nigdy nie powinny być potrzebne. Małe i duże witryny powinny zawsze mieć przejrzystą strukturę nawigacyjną. Jeśli czujesz, że potrzebujesz mapy witryny HTML, zamiast tego poświęć czas na ulepszanie architektury witryny. Mapy witryn HTML mieszczą się w tym samym koszu co pokrętła ładowania HTML”.
<iframe src="https://mastodon.social/@johnmu/109477617298107922/embed" class="mastodon-embed" width="400" allowfullscreen="allowfullscreen"></iframe><script src="https://mastodon.social/embed.js" async="async"></script>
Podczas pracy nad dużymi witrynami internetowymi na poziomie przedsiębiorstwa często istnieje wiele warstw decydentów w strukturze nawigacji witryny. I często brane są pod uwagę najlepsze praktyki SEO.
Łączę obie mapy witryny XML z mapą witryny HTML, dopóki nie mam pewności co do nawigacji w naszej witrynie i wewnętrznej hierarchii linków.
15. Nie zapomnij dołączyć wszystkich map witryn XML do pliku robots.txt
Nie zapomnij dołączyć map witryn XML (wszystkich) jako linków w pliku robots.txt.
Oto przykład:
Nie martw się, gdzie w pliku robots.txt powinny się znaleźć. Nie ma to wpływu na lokalizację mapy witryny XML w pliku robots.txt.
Mueller potwierdził to:
Mapy witryn XML to plan Twojej witryny dla wyszukiwarek
Niezależnie od tego, czy uruchamiasz nową stronę internetową, czy po prostu dodajesz tag kanoniczny do zduplikowanej strony, mapa witryny XML jest czymś, co powinieneś aktualizować 24 godziny na dobę, 7 dni w tygodniu.
Ale rób to ostrożnie.
Chociaż nie powinieneś popadać w paranoję, Twoja mapa witryny XML jest planem Twojego domu dla wyszukiwarek.
Nie zapomnij więc przesłać map witryn XML do Google Search Console i Narzędzi dla webmasterów Bing.
Opinie wyrażone w tym artykule są opiniami autora-gościa i niekoniecznie Search Engine Land. Autorzy personelu są wymienieni tutaj.