Badanie: 31% międzynarodowych stron internetowych zawiera błędy hreflang
Opublikowany: 2023-04-04Wdrożenie hreflang może być trudnym zadaniem dla wielu SEO. Niezliczone odmiany składni w kilku językach mogą być trudne dla tych, którzy słabo rozumieją więcej niż jeden język.
Istnieje również dodatkowa złożoność zrozumienia określonych niuansów językowych i kierowania regionalnego, które zazwyczaj są zrozumiałe tylko dla native speakera lub kogoś, kto dokładnie studiował język.
Nieprawidłowa implementacja hreflang może powodować wiele komplikacji (np. powielanie treści, błędne indeksowanie i słabą widoczność w SERP) ze szkodą dla wydajności SEO.
Ostrożne wdrożenie hreflang jest konieczne. Na szczęście hreflang jest dobrze udokumentowany, a powiązane problemy można zidentyfikować za pomocą różnych narzędzi SEO.
Badanie błędów Hreflanga
Aby określić, jak rozpowszechnione są problemy z hreflang i które z nich są bardziej powszechne, nawiązałem współpracę z NerdyData, która dała mi dostęp do ich bazy danych witryn zawierających kod hreflang.
NerdyData dostarczył listę 18 786 stron internetowych, które zawierają co najmniej jedną instancję hreflang deklarującą alternatywę w kodzie źródłowym. Dlatego w tym badaniu uwzględniono tylko hreflang zaimplementowany w <head>, a nie za pomocą map witryn XML lub nagłówka HTTP.
Badanie przeprowadziłam:
- Uruchamianie indeksowania w Screaming Frog w celu sprawdzenia obecności hreflang na stronach głównych.
- Usunięcie przekierowań GEO-IP, aby pełna lista adresów URL została rozwiązana za 200 sekund.
- Wykorzystanie HreflangChecker.com i Visual SEO Studio do przetwarzania adresów URL w partiach w celu zidentyfikowania typowych problemów zidentyfikowanych przez narzędzia.
31,02% stron internetowych zawiera sprzeczne dyrektywy hreflang
Z moich ustaleń wynika, że 31,02% witryn obsługujących wiele języków ma sprzeczne dyrektywy hreflang. Konflikt hreflang może wystąpić, gdy strona internetowa ma różne tagi hreflang dla różnych języków i kierowania geograficznego.
Mówiąc prościej, do jednego języka lub regionu przypisano więcej niż jeden adres URL, wysyłając mylące sygnały do wyszukiwarek. Na przykład:
- <link rel=”alternate” href=”https://example.com/” hreflang=”en” />
- <link rel=”alternate” href=”https://example.com/en-uk/” hreflang=”en-gb” />
- <link rel=”alternate” href=”https://example.com/en-us/” hreflang=”en-gb” />
- <link rel=”alternate” href=”https://example.com/en-au/” hreflang=”en-au” />
Takie zamieszanie potencjalnie prowadzi do komplikacji związanych z duplikatami treści oraz nieprawidłowym rankingiem i indeksowaniem, co utrudnia dobre umieszczenie w SERP.
Nawet jeśli użytkownicy znajdą Twoją stronę internetową wśród tych, które osiągają dobre wyniki, będą ucierpieć z powodu złego doświadczenia użytkownika, jeśli zostanie im wyświetlona niewłaściwa wersja strony.
W 16,04% klastrów hreflang brakuje tagów odnoszących się do siebie
Samoodwołujący się hreflang ma miejsce, gdy strona zawiera tag hreflang wskazujący jej adres URL.
Zasadniczo strona wskazuje, że jest dostępna w różnych językach, w tym w oryginalnym języku strony.
Pomimo tego, że początkowo wydaje się to zbędną taktyką, jest dobrą praktyką dla międzynarodowego SEO. Niestety, 16,04% witryn wielojęzycznych nie ma znaczników hreflang odnoszących się do siebie.
Wyszukiwarki mogą lepiej zrozumieć związek między różnymi wersjami tej samej strony, gdy używane są samoodwołujące się tagi hreflang, w tym strony dostępne w różnych językach.
Biorąc pod uwagę, że hreflang jest jednym z około 20 sygnałów kanonizacji, jest to ważny sygnał, który należy uwzględnić.
47,95% stron internetowych nie korzysta z x-default
Atrybut x-default sygnalizuje wyszukiwarkom, że strona nie jest kierowana na określony język lub lokalizację, definiując ją jako domyślną wersję językową strony.
Jest to szczególnie przydatne, gdy strona jest dostępna w wielu językach, ale nie zawiera treści w preferowanym języku użytkownika.
Atrybut x-default nie jest koniecznie potrzebny w hreflang. Aż 47,95% witryn wielojęzycznych obecnie z niego nie korzysta.
Jednak może być korzystne w przypadkach, gdy użytkownik szuka strony w określonym języku, który nie jest dostępny, ponieważ pomaga wyszukiwarkom znaleźć najbardziej odpowiednią wersję strony do wyświetlenia.
Należy pamiętać, że atrybutu x-default należy używać tylko wtedy, gdy inny język nie jest dostępny. Tam, gdzie istnieją inne dostępne języki, każdy z nich powinien być określony tagiem hreflang.
Ponadto x-default nie powinien być używany na stronach specyficznych dla określonego języka lub lokalizacji.
8,91% klastrów hreflang zawiera co najmniej jedno wystąpienie nieprawidłowego kodu języka
Niezbędne jest użycie dwuliterowego formatu ISO-639-1 w atrybutach hreflang.
Niestety często zdarza się, że kody językowe są błędne, powodując wiele problemów, które mogą wpływać na międzynarodowe kierowanie witryny.
Z moich badań wynika, że obecnie 8,91% witryn kierowanych na więcej niż jeden język zawiera kody nieznanych języków.
Może to być po prostu niejasne podejście do łączenia kodów języka i lokalizacji, ale przyczyną może być wiele typowych problemów.
Niektóre kody języków nie do końca odpowiadają pisowni kraju.
Można na przykład oczekiwać, że kodem języka chorwackiego będzie „cr”, ale w rzeczywistości jest to „hr”. Ponieważ kod nie jest oczywisty, łatwo popełnić błędy podczas implementacji kodów językowych.
1,6% klastrów hreflang zawiera co najmniej jedno wystąpienie nieprawidłowych kodów regionów
W przeciwieństwie do poprzednich statystyk stosunkowo niewiele klastrów hreflang zawiera nieprawidłowe kody regionów.
Używanie dwuliterowych kodów regionu ISO-3166-1 nie jest wymagane, ale pomaga w kierowaniu na ten sam język w dwóch lub więcej krajach o różnych zasadach pisowni. W ten sposób zapewnisz wyszukiwarkom więcej kontekstu, patrząc na lokalizację użytkownika i język.
Aby wrócić do mojego poprzedniego przykładu, musisz użyć kodu „en-US”, aby kierować reklamy do użytkowników w Stanach Zjednoczonych. Jeśli jest ustawiony na „en-GB”, będziesz kierować reklamy tylko do użytkowników z Wielkiej Brytanii, całkowicie pomijając docelowych odbiorców.
Typowe błędy tutaj obejmują:
- <link rel=”alternate” href=”https://example.com/en-gb/” hreflang=”en-uk” />
- <link rel=”alternate” href=”https://example.com/en-eu/” hreflang=”en-eu” />
Tutaj wszystkie wpisy dotyczą języka angielskiego, ale mają również na celu kierowanie na Wielką Brytanię i Europę. Zarówno Wielka Brytania, jak i UE są nieprawidłowymi kodami, ponieważ jest to GB (Wielka Brytania), a Europy nie można kierować jako kontynentu.
Kierowanie na język hiszpański może być również problematyczne w Ameryce Łacińskiej, gdzie klaster próbuje kierować reklamy na regiony es-la, es-lx i es-419, próbując kierować reklamy na cały region, podczas gdy należy kierować reklamy na poszczególne kraje – lub pozostawiając język hiszpański jako ogólny język.
22,46% klastrów hreflang zawiera nieregularne/nietypowe kombinacje język-region
Kierowanie na kraje bez języków ojczystych za pomocą hreflang ma szereg korzyści, z których główną jest poprawa komfortu użytkowania dla osób, dla których język ten nie jest językiem ojczystym.
Na przykład holenderski jest językiem ojczystym Holandii, ale szacuje się, że 95% populacji mówi również po angielsku. W Holandii mieszka również około 97 8000 obywateli brytyjskich.
Przy tak dużej liczbie osób mówiących po angielsku kierowanie reklam do użytkowników w Holandii za pomocą anglojęzycznych stron internetowych ma sens.
Jednak nie wszystkie kombinacje mają sens. Na przykład:
- <link rel=”alternate” href=”https://example.com/en-vn/” hreflang=”en-vn” />
- <link rel=”alternate” href=”https://example.com/es-ie/” hreflang=”es-ie” />
- <link rel=”alternate” href=”https://example.com/zh-zm/” hreflang=”zh-zm” />
Chociaż trzy powyższe przykłady przejdą test hreflang i są technicznie dokładne, liczba osób mówiących po chińsku w Zambii prawdopodobnie nie przyniesie żadnych rezultatów w przypadku posiadania tej alternatywnej wersji.
Tworzenie alternatywnych wersji, które nie mają większego sensu, powoduje dodatkowe i niepotrzebne żądanie indeksowania oraz wersje, które Google może prawdopodobnie uznać za zduplikowane, zastępując kanoniczne.
Opinie wyrażone w tym artykule są opiniami autora-gościa i niekoniecznie Search Engine Land. Autorzy personelu są wymienieni tutaj.