Studi: 31% situs web internasional berisi kesalahan hreflang

Diterbitkan: 2023-04-04

Menerapkan hreflang bisa menjadi tugas yang menantang bagi banyak SEO. Variasi sintaks yang tak terhitung jumlahnya di beberapa bahasa bisa jadi sulit bagi mereka yang memiliki sedikit pemahaman tentang lebih dari satu bahasa.

Ada juga kerumitan tambahan dalam memahami nuansa bahasa tertentu dan penargetan regional yang biasanya hanya dipahami oleh penutur asli atau seseorang yang telah mempelajari bahasa tersebut secara menyeluruh.

Implementasi hreflang yang salah dapat menyebabkan banyak komplikasi (yaitu, konten duplikat, pengindeksan yang salah, dan visibilitas SERP yang buruk) yang merugikan kinerja SEO.

Sangat penting untuk mengimplementasikan hreflang dengan hati-hati. Untungnya, hreflang terdokumentasi dengan baik dan masalah terkait dapat diidentifikasi melalui berbagai alat SEO.

Studi kesalahan Hreflang

Untuk menentukan seberapa luas masalah hreflang dan mana yang lebih umum, saya bermitra dengan NerdyData, yang memberi saya akses ke database situs web mereka yang berisi kode hreflang.

NerdyData memberikan daftar 18.786 situs web yang berisi setidaknya satu contoh hreflang yang mendeklarasikan alternatif dalam kode sumber. Dengan demikian, penelitian ini hanya memperhitungkan hreflang yang diimplementasikan di <head>, bukan melalui peta situs XML atau header HTTP.

Saya melakukan penelitian dengan:

  • Menjalankan perayapan di Screaming Frog untuk memvalidasi keberadaan hreflang di beranda.
  • Menghapus pengalihan GEO-IP sehingga daftar lengkap URL selesai dalam 200 detik.
  • Memanfaatkan HreflangChecker.com dan Visual SEO Studio untuk memproses URL secara berkelompok untuk mengidentifikasi masalah umum yang diidentifikasi oleh alat.

31,02% situs web berisi arahan hreflang yang bertentangan

Temuan saya menunjukkan 31,02% situs web yang melayani berbagai bahasa memiliki arahan hreflang yang bertentangan. Konflik hreflang dapat terjadi ketika laman web memiliki berbagai tag hreflang untuk berbagai bahasa dan penargetan geografis.

Sederhananya, lebih dari satu URL telah ditetapkan ke bahasa atau wilayah tertentu, mengirimkan sinyal yang membingungkan ke mesin telusur. Misalnya:

  • <tautan rel=”alternate” href=”https://example.com/” hreflang=”en” />
  • <tautan rel=”alternate” href=”https://example.com/en-uk/” hreflang=”en-gb” />
  • <tautan rel=”alternate” href=”https://example.com/en-us/” hreflang=”en-gb” />
  • <tautan rel=”alternate” href=”https://example.com/en-au/” hreflang=”en-au” />

Kebingungan seperti itu berpotensi menyebabkan komplikasi seputar konten duplikat dan peringkat serta pengindeksan yang salah, sehingga sulit untuk ditempatkan dengan baik di SERP.

Bahkan jika pengguna menemukan halaman web Anda di antara mereka yang berkinerja baik, mereka akan mengalami pengalaman pengguna yang buruk jika disajikan versi halaman yang salah.

16,04% cluster hreflang tidak memiliki tag referensi mandiri

Referensi mandiri hreflang terjadi ketika halaman menyertakan tag hreflang yang menunjuk ke URL-nya.

Intinya, halaman menunjukkan bahwa itu tersedia dalam berbagai bahasa, termasuk bahasa asli halaman tersebut.

Meskipun awalnya muncul sebagai taktik yang berlebihan, ini merupakan praktik yang baik untuk SEO internasional. Sayangnya, 16,04% situs dengan banyak bahasa tidak memiliki tag hreflang referensi sendiri.

Mesin telusur dapat lebih memahami hubungan antara berbagai versi halaman yang sama saat tag hreflang referensi mandiri digunakan, termasuk halaman yang tersedia dalam berbagai bahasa.

Mengingat bahwa hreflang berkontribusi sebagai salah satu dari sekitar 20 sinyal kanonikalisasi, ini merupakan sinyal yang penting untuk disertakan.

47,95% situs web tidak menggunakan x-default

Atribut x-default menandakan ke mesin telusur bahwa halaman tidak menargetkan bahasa atau lokasi tertentu, mendefinisikannya sebagai versi bahasa default halaman.

Ini sangat berguna saat halaman tersedia dalam beberapa bahasa tetapi tidak mengirimkan konten dalam bahasa pilihan pengguna.

Atribut x-default tidak diperlukan di hreflang. Hingga 47,95% situs multibahasa saat ini tidak menggunakannya.

Namun, ini dapat bermanfaat untuk digunakan jika pengguna mencari halaman dalam bahasa tertentu yang tidak tersedia, karena ini membantu mesin pencari menemukan versi halaman yang paling sesuai untuk ditampilkan.

Penting untuk diperhatikan bahwa atribut x-default hanya boleh digunakan jika bahasa lain tidak tersedia. Jika ada bahasa lain yang tersedia, masing-masing harus ditentukan dengan tag hreflang.

Selain itu, x-default tidak boleh digunakan pada halaman khusus untuk bahasa atau lokasi tertentu.

8,91% gugus hreflang berisi setidaknya satu contoh kode bahasa yang tidak valid

Penting untuk menggunakan format dua huruf ISO-639-1 dalam atribut hreflang.

Sayangnya, kesalahan kode bahasa sering terjadi, menyebabkan banyak masalah yang dapat memengaruhi penargetan internasional situs web.

Penelitian saya menemukan bahwa 8,91% situs yang menargetkan lebih dari satu bahasa saat ini berisi kode bahasa yang tidak dikenal.

Ini bisa saja merupakan pendekatan yang membingungkan untuk menggabungkan bahasa dan kode lokasi, tetapi banyak masalah umum yang mungkin menjadi penyebabnya.

Beberapa kode bahasa tidak cocok dengan ejaan suatu negara.

Misalnya, Anda mungkin mengira kode bahasa Kroasia adalah "cr", tetapi sebenarnya "hr". Karena kodenya tidak jelas, mudah membuat kesalahan saat mengimplementasikan kode bahasa.

1,6% cluster hreflang berisi setidaknya satu contoh kode wilayah yang tidak valid

Berlawanan dengan statistik sebelumnya, relatif sedikit gugus hreflang yang berisi kode wilayah yang tidak valid.

Meskipun penggunaan kode wilayah ISO-3166-1 dua huruf tidak diperlukan, hal ini membantu saat menargetkan bahasa yang sama antara dua negara atau lebih dengan aturan ejaan yang berbeda. Melakukan hal itu memberikan lebih banyak konteks ke mesin telusur, melihat ke lokasi dan bahasa pengguna.

Untuk kembali ke contoh saya sebelumnya, Anda harus menggunakan kode “en-US” untuk menargetkan pengguna di Amerika Serikat. Jika disetel ke "en-GB", Anda hanya akan menargetkan pengguna yang berbasis di Inggris, kehilangan audiens yang Anda tuju sepenuhnya.

Kesalahan umum di sini meliputi:

  • <tautan rel=”alternate” href=”https://example.com/en-gb/” hreflang=”en-uk” />
  • <tautan rel=”alternate” href=”https://example.com/en-eu/” hreflang=”en-eu” />

Di sini, semua entri menargetkan bahasa Inggris tetapi juga bermaksud untuk menargetkan Inggris dan Eropa. Inggris dan UE adalah kode yang tidak valid karena GB (Britania Raya), dan Anda tidak dapat menargetkan Eropa sebagai benua.

Penargetan bahasa Spanyol juga dapat menjadi masalah di Amerika Latin, dengan klaster yang mencoba menargetkan es-la, es-lx, dan es-419 dalam upaya untuk menargetkan kawasan secara keseluruhan ketika Anda seharusnya menargetkan masing-masing negara – atau membiarkan bahasa Spanyol sebagai bahasa umum bahasa.

22,46% cluster hreflang berisi kombinasi bahasa-daerah yang tidak biasa/tidak biasa

Ada berbagai manfaat untuk menargetkan negara tanpa bahasa asli dengan hreflang, salah satunya adalah untuk meningkatkan pengalaman pengguna bagi penutur asing.

Misalnya, bahasa Belanda adalah bahasa asli Belanda, tetapi diperkirakan 95% penduduknya juga berbicara bahasa Inggris. Ada juga sekitar 97.8000 warga negara Inggris yang tinggal di Belanda.

Dengan jumlah penutur bahasa Inggris yang begitu tinggi, penargetan pengguna di Belanda dengan halaman situs web bahasa Inggris Anda masuk akal.

Namun, tidak semua kombinasi masuk akal. Misalnya:

  • <tautan rel=”alternate” href=”https://example.com/en-vn/” hreflang=”en-vn” />
  • <tautan rel=”alternate” href=”https://example.com/es-ie/” hreflang=”es-ie” />
  • <tautan rel=”alternate” href=”https://example.com/zh-zm/” hreflang=”zh-zm” />

Sementara tiga contoh di atas akan lulus uji hreflang dan secara teknis akurat, jumlah penutur bahasa Cina di Zambia kemungkinan akan menghasilkan sedikit atau tidak ada hasil dalam versi alternatif ini.

Membuat versi alternatif yang tidak masuk akal menciptakan permintaan perayapan tambahan dan tidak perlu serta versi yang mungkin dianggap Google sebagai duplikasi, mengesampingkan versi kanonis.


Pendapat yang diungkapkan dalam artikel ini adalah dari penulis tamu dan belum tentu Search Engine Land. Penulis staf tercantum di sini.