研究:31% 的國際網站包含 hreflang 錯誤
已發表: 2023-04-04對於許多 SEO 來說,實施 hreflang 可能是一項具有挑戰性的任務。 對於那些只了解一種以上語言的人來說,跨多種語言的無數語法變化可能很困難。
理解特定語言的細微差別和區域定位也增加了複雜性,這通常只有母語人士或徹底研究過該語言的人才能理解。
不正確的 hreflang 實施會導致許多不利於 SEO 性能的並發症(即重複內容、錯誤索引和差的 SERP 可見性)。
必須小心實施 hreflang。 值得慶幸的是,hreflang 有詳細的文檔記錄,並且可以通過各種 SEO 工具識別相關問題。
Hreflang錯誤研究
為了確定 hreflang 問題的普遍程度以及哪些更常見,我與 NerdyData 合作,這讓我可以訪問他們包含 hreflang 代碼的網站數據庫。
NerdyData 提供了一份包含 18,786 個網站的列表,其中至少包含一個 hreflang 實例,在源代碼中聲明了一個替代項。 因此,這項研究只說明了在 <head> 中實現的 hreflang,而不是通過 XML 站點地圖或 HTTP 標頭。
我通過以下方式進行了研究:
- 在 Screaming Frog 中運行爬蟲以驗證主頁上是否存在 hreflang。
- 刪除 GEO-IP 重定向,以便完整的 URL 列表在 200 秒內解析。
- 利用 HreflangChecker.com 和 Visual SEO Studio 批量處理 URL 以識別工具識別的常見問題。
31.02% 的網站包含衝突的 hreflang 指令
我的調查結果顯示,31.02% 的提供多種語言服務的網站存在相互衝突的 hreflang 指令。 當網頁具有針對不同語言和地理定位的各種 hreflang 標籤時,可能會發生衝突的 hreflang。
簡而言之,多個 URL 已分配給一種語言或地區,向搜索引擎發送令人困惑的信號。 例如:
- <link rel=”alternate” href=”https://example.com/” hreflang=”en” />
- <link rel=”alternate” href=”https://example.com/en-uk/” hreflang=”en-gb” />
- <link rel=”alternate” href=”https://example.com/en-us/” hreflang=”en-gb” />
- <link rel=”alternate” href=”https://example.com/en-au/” hreflang=”en-au” />
這種混淆可能導致圍繞重複內容和不正確的排名和索引的複雜化,使其難以在 SERP 中很好地放置。
即使用戶在表現良好的網頁中找到您的網頁,如果為他們提供的頁面版本不正確,他們的用戶體驗也會很差。
16.04% 的 hreflang 集群缺少自引用標籤
當頁麵包含指向其 URL 的 hreflang 標記時,就會發生自引用 hreflang。
本質上,頁面表明它有多種語言版本,包括頁面的原始語言。
儘管最初看起來是一種多餘的策略,但它是國際 SEO 的良好做法。 不幸的是,16.04% 的多語言網站沒有自引用 hreflang 標籤。
當使用自引用 hreflang 標籤時,搜索引擎可以更好地理解同一頁面的不同版本之間的關係,包括不同語言的頁面。
鑑於 hreflang 是大約 20 個規範化信號之一,它是一個需要包含的重要信號。
47.95% 的網站不使用 x-default
x-default 屬性向搜索引擎發出信號,表明頁面不以特定語言或位置為目標,將其定義為頁面的默認語言版本。
當頁面以多種語言提供但不以用戶的首選語言提供內容時,它特別有用。
hreflang 中不一定需要 x-default 屬性。 多達 47.95% 的多語言網站目前沒有使用它。
但是,在用戶使用不可用的特定語言搜索頁面的情況下使用它可能是有益的,因為它可以幫助搜索引擎找到最合適的頁面版本來顯示。
請務必注意,僅當其他語言不可用時才應使用 x-default 屬性。 如果存在其他可用語言,則應使用 hreflang 標記指定每種語言。
此外,x-default 不應在特定語言或位置的特定頁面上使用。
8.91% 的 hreflang 集群至少包含一個無效語言代碼實例
在 hreflang 屬性中使用兩個字母的 ISO-639-1 格式是必不可少的。
不幸的是,語言代碼出錯很常見,會導致多個問題影響網站的國際定位。
我的研究發現,目前有 8.91% 的針對不止一種語言的網站包含未知語言代碼。
這可能只是一種混淆語言和位置代碼的方法,但許多常見問題可能是原因。
某些語言代碼與國家/地區的拼寫不完全匹配。
例如,您可能希望克羅地亞語的語言代碼是“cr”,但實際上是“hr”。 因為代碼不明顯,所以在實現語言代碼時很容易出錯。
1.6% 的 hreflang 集群包含至少一個無效區域代碼實例
與之前的統計數據相反,相對較少的 hreflang 集群包含無效的區域代碼。
雖然不需要使用兩個字母的 ISO-3166-1 區域代碼,但它確實有助於在兩個或多個具有不同拼寫規則的國家/地區之間定位相同的語言。 這樣做可以為搜索引擎提供更多上下文,查看用戶位置和語言。
回到我之前的例子,你必須使用代碼“en-US”來定位美國的用戶。 如果將其設置為“en-GB”,您將只針對英國用戶,完全錯過了您的目標受眾。
這裡的常見錯誤包括:
- <link rel=”alternate” href=”https://example.com/en-gb/” hreflang=”en-uk” />
- <link rel=”alternate” href=”https://example.com/en-eu/” hreflang=”en-eu” />
在這裡,條目都針對英語,但也打算針對英國和歐洲。 UK 和 EU 都是無效代碼,因為它是 GB(大不列顛),您不能將歐洲定位為一個大陸。
西班牙語定位在拉丁美洲也可能存在問題,集群試圖定位 es-la、es-lx 和 es-419 以試圖定位整個區域,而您應該定位單個國家或保留西班牙語作為一般語言。
22.46% 的 hreflang 集群包含不規則/不尋常的語言-區域組合
使用 hreflang 定位沒有母語的國家/地區有一系列好處,其中一個主要好處是改善非母語人士的用戶體驗。
例如,荷蘭語是荷蘭的母語,但估計 95% 的人口也會說英語。 還有大約 97,8000 名英國國民居住在荷蘭。
擁有如此多的英語使用者,將您的英語網站頁面定位到荷蘭的用戶是有道理的。
但是,並非所有組合都有意義。 例如:
- <link rel=”alternate” href=”https://example.com/en-vn/” hreflang=”en-vn” />
- <link rel=”alternate” href=”https://example.com/es-ie/” hreflang=”es-ie” />
- <link rel=”alternate” href=”https://example.com/zh-zm/” hreflang=”zh-zm” />
雖然上面的三個示例將通過 hreflang 測試並且在技術上是準確的,但贊比亞的中文使用者數量可能不會產生這個替代版本的結果。
創建毫無意義的替代版本會產生額外的和不必要的抓取需求以及 Google 可能認為重複的版本,從而覆蓋規範版本。
本文中表達的觀點是客座作者的觀點,不一定是 Search Engine Land。 此處列出了工作人員作者。