Ce trebuie să știți despre Canonical Tag SEO
Publicat: 2022-02-22Dacă nu sunteți cunoștinți de tehnologie, eticheta canonică SEO vă poate părea complicat și ciudat. Cu toate acestea, este un instrument important în arsenalul dvs. de optimizare a motoarelor de căutare și de neînlocuit atunci când gestionați conținut duplicat. Înțelegând ce scop servesc canonicalele și cum să le folosiți corect, vă puteți optimiza mai bine paginile și vă puteți menține echitatea linkurilor.
Ca și în cazul oricărui alt aspect al SEO, există multe speculații cu privire la ceea ce canonicalele pot și nu pot face și cum ar trebui utilizate. Deoarece aceste tipuri de etichete există de peste un deceniu, există o mulțime de informații învechite și înșelătoare care circulă pe internet.
Așadar, în acest articol, vorbim despre tot ce trebuie să știți despre SEO etichete canonice în 2022. Citiți mai departe și luați notițe!
Ce sunt etichetele canonice?
Etichetele canonice sunt bucăți de cod care pot fi introduse în secțiunea de cap a codului HTML al unei pagini. Acestea sunt utilizate atunci când un site web are URL-uri cu conținut identic, similar sau strâns înrudit și servesc pentru a notifica motoarele de căutare care este cel mai important.
Etichetele de link canonice arată în felul următor:
<link rel="canonical” href="https://example.com/text/text-text” />
Link-ul din interiorul etichetei este URL-ul paginii principale și, conform reglementărilor Google, ar trebui să fie un URL absolut și nu unul relativ. Aceasta înseamnă că trebuie să utilizați adresa completă a paginii, inclusiv protocolul, domeniul și locația conținutului de pe site-ul dvs.:
<link rel="canonical” href="https://example.com/text/text-text” />
în loc de
<link rel="canonical” href="text/text-text” />
Ce tipuri de pagini au nevoie de etichete canonice?
Chiar dacă nu aveți în mod evident conținut duplicat, cum ar fi pagini repetate, este posibil să aveți totuși adrese URL duplicat care pot deruta roboții și, potențial, pot duce la nereguli la indexare. Acestea pot fi create de sistemul dvs. de management al conținutului (CMS), cauzate de o inconsecvență în modul în care utilizați căile, probleme de protocol și așa mai departe.
Deci, să aruncăm o privire asupra tipurilor de pagini care pot beneficia de eticheta canonică SEO și cum să procedăm în fiecare caz:
HTTP / HTTPS
Google acordă prioritate protocolului HTTPS, așa că, în mod implicit, dacă aveți o pagină atât cu versiunea HTTP, cât și cu versiunea HTTPS și fără redirecționare de la prima către cea din urmă, botul va afișa versiunea HTTPS ca fiind canonică. Dacă nu doriți să utilizați o redirecționare 301 și să renunțați cu totul la versiunea HTTP, ar trebui să adăugați o etichetă canonică la HTTPS.
Cu toate acestea, dacă, dintr-un motiv oarecare, doriți să marcați versiunea HTTP ca fiind cea mai importantă, puteți adăuga eticheta canonică. Rețineți, totuși, că Google poate alege în continuare să afișeze versiunea securizată, în ciuda recomandărilor dvs.
www / non-www
Pentru roboți, https://www.example.com/text și https://example.com/text nu sunt unul și același lucru. În mod ideal, ar trebui să fiți consecvent în utilizarea unei versiuni www sau non-www a link-urilor dvs.
Cu toate acestea, nu puteți fi sigur ce pot introduce vizitatorii dvs. în motoarele de căutare și browsere și ce pot marca aceștia. Canonizarea uneia dintre versiuni va asigura că roboții știu pe care o preferați și se pot concentra asupra ei.
Copii de conținut pe mai multe domenii
Dacă sindicalizați conținut, așa cum fac adesea editorii digitali, sau doriți să publicați un articol pe mai multe domenii, ar trebui să canonizați pagina originală (cea de pe propriul site web).
Acest lucru se poate face prin adăugarea etichetei rel="canonical" la pagina dvs. și cerând editorilor să o adauge la codul paginii lor cu un link către original. În acest fel, tot sucul de link și capitalul propriu vor fi canalizate către site-ul dvs.
În plus, boții întâlnesc același conținut în mai multe locații, nu vor fi confuzi cu privire la ce link să se claseze mai sus.
Pagini mobile
Dacă site-ul dvs. web nu este receptiv și aveți o versiune mobilă de sine stătătoare, Google vede URL-urile desktop și mobile ca pagini separate:
https://m.example.com/text ≠ https://example.com/text
Pentru a evita confuzia și pentru a preveni distribuirea autorității între cei doi, ar trebui să setați doar unul dintre ele drept canonic. Cu indexarea în primul rând pe mobil, cel mai bine este să canonizezi pagina mobilă.
Cu toate acestea, nu ar trebui să vă faceți griji – dacă utilizatorul introduce o interogare pe desktop, boții vor afișa versiunea corespunzătoare în ciuda etichetei.
Pagini AMP
Când aveți o versiune AMP a conținutului, cea mai bună practică este ca pagina AMP să fie găzduită pe o adresă similară cu cea inițială.
https://example.com/news
https://amp.example.com/news
În acest caz, ar trebui să canonizezi pagina principală și să adaugi eticheta canonică cu linkul original în codul versiunii AMP. În acest fel, boții vor identifica mai ușor care este pagina principală.
Link-uri cu parametrii de căutare și ID-urile sesiunilor
ID-urile de sesiune și parametrii URL deseori confundă roboții și pot determina ca aceștia să nu reușească să indexeze corect paginile. Dacă nu poți evita să le folosești, ar trebui să canonizezi pagina principală, astfel încât roboții să știe că extensiile din adresa linkului sunt pur și simplu asta și nu o pagină nouă.
Parametrii sunt folosiți cel mai frecvent pentru a organiza mai bine conținutul de pe site-urile de comerț electronic. Acestea adaugă valori la adresa URL pentru a indica variații ale produsului, cum ar fi culoarea, dimensiunea și tipul, și pot fi utilizate pentru a aplica diferite filtre de căutare, informații de urmărire a campaniei și așa mai departe.
Iată cum poate arăta o pagină cu parametri:
https//www.example.com/page?key1=value1&key2=value2
în loc de
https//www.example.com/page
ID-urile de sesiune pot fi folosite pentru a urmări comportamentul unui utilizator individual pe un site web. De exemplu, într-un magazin de comerț electronic, ID-ul poate fi un înlocuitor de cookie care arată site-ului ce pagini vizitează persoana. Informațiile pot fi folosite astfel încât coșul persoanei și ultimele articole vizitate să fie păstrate până când aceasta părăsește site-ul web.
Iată cum poate arăta o pagină cu un ID de sesiune:
https://example.com/index.jsp;jsessionid=07D3CCD4D9A6A9F3CF9CAD4F9A728F44
în loc de
https//www.example.com/page
În mod ideal, boții ar trebui să fie suficient de inteligenți pentru a recunoaște atât parametrii, cât și ID-urile de sesiune. Cu toate acestea, ocazional, pot deveni confuzi și de aceea setarea etichetelor canonice îi va ajuta să consolideze clasamentul paginilor, în loc să le distribuie.
Același conținut sub diferite categorii
Când aveți același conținut în mai mult de o categorie pe site-ul dvs. web, aveți mai multe adrese URL cu aproape același conținut care duc la aceeași pagină:
https://example.com/category1/text-text/
https://example.com/category2/text-text/
Dacă nu marcați una dintre pagini ca fiind canonică și conectați în mod constant la ea în strategia dvs. internă de construire a linkurilor, bot-ul le va considera duplicate. Nu numai că va pierde timp (și va accesa cu crawlere bugetul) decizia pe care să o arăți utilizatorului, dar le va putea chiar clasa pe cele două separat.
Pagini de auto-referință
Deși poate părea redundant, auto-referința este un lucru și a fost confirmat de John Mueller de la Google că are valoare SEO într-un răspuns la întrebarea unui utilizator pe Reddit:
<link rel="canonical” href="b.html” /> Dacă acesta este pe a.html, atunci este doar un canonic normal (element de legătură canonic din punct de vedere tehnic), dacă este pe b.html, atunci este un auto-referențial unu.
Deoarece nu știi cum se leagă oamenii către paginile tale, unul auto-referențial ajută la curățarea micilor greșeli. De exemplu, dacă un link ajunge la b.html?utm=brânză, atunci de obicei serverul arată doar b.html, iar un element de link canonic autoreferențial ar încuraja motoarele de căutare să folosească doar „b.html” în loc de „b.html?utm=brânză”.
Pe scurt, pagina originală poate și ar trebui să fie, de asemenea, etichetată cu rel=canonic, astfel încât să fie mai clar pentru roboți că este, într-adevăr, originalul.
Versiuni ale limbii site-ului
Dacă aveți versiuni în diferite limbi ale site-ului dvs. web, este posibil să doriți să definiți ca canonică doar una dintre ele. În acest caz, puteți adăuga eticheta de auto-referențiere rel=canonic la codul celui pe care îl considerați principal și le puteți indica pe celelalte.
Pentru ca Google să înțeleagă mai ușor de ce cele două pagini au conținut similar sau același, dar nu este duplicat, ar trebui să utilizați atributele etichetei hreflang. De exemplu, dacă site-ul dvs. are versiuni în engleză Marea Britanie, engleză SUA și spaniolă, puteți adăuga următoarele fragmente la fiecare versiune respectivă:
link rel="alternate" href="http://example.com" hreflang="en-us" />
link rel="alternate” href="http://example.com” hreflang="en-uk” />
link rel="alternate" href="http://example.com" hreflang="en-es" />
și marcați versiunea engleză din SUA drept cea canonică.
Cu toate acestea, rețineți că, în funcție de locația utilizatorului, Google va avea ultimul cuvânt pe ce pagină să-i arate și poate ignora sugestia dvs.
Pentru ce este folosită Canonical Tag SEO?
Pe scurt, scopul principal al SEO etichete canonice este de a gestiona duplicarea și de a păstra echitatea link-urilor. Când, dintr-un motiv sau altul, aveți mai multe adrese URL care duc la aceeași pagină, roboții pot deveni confuzi în ceea ce privește adresa URL să se claseze.
Ca om, vedeți legăturile ca, practic, același lucru. Cu toate acestea, pentru bot, fiecare URL are sensul său. Dacă nu specificați pe care îl considerați mai important, Google va face această alegere pentru dvs. Cu toate acestea, dvs. și Google puteți avea priorități diferite și înțelegere diferită a importanței unui link.
În plus, dacă nu specificați care este calea canonică, fiecare link separat va fi oferit utilizatorilor în rezultatele căutării sub o altă formă. Aceasta înseamnă că toată autoritatea și sucul de legături se vor scurge între pagini, în loc să se acumuleze doar în una dintre ele.
Din nou, Google va decide să accepte una dintre pagini ca fiind canonică, dar dacă nu are instrucțiuni la care să se consulte, teoretic, ar putea lua o decizie diferită de fiecare dată.
De ce nu ar trebui să folosiți greșit etichetele canonice?
Oamenii ar trebui să conecteze cu atenție eticheta canonică SEO. Dacă încercați să manipulați roboții sau să folosiți greșit etichetele dintr-un alt motiv (vom oferi exemple), puteți ajunge să încurcați crawlerele și aceștia pot renunța la indexarea legăturilor dvs.
În plus, canonicalele greșite de pe site-urile mari web vă pot epuiza bugetul de accesare cu crawlere. Dacă roboții nu sunt siguri ce se întâmplă cu paginile dvs., ei vor continua să încerce să-și dea seama, în loc să acceseze cu crawlere noul conținut pe care l-ați publicat. Acest lucru va face ca munca lor să rămână în întârziere și va afecta performanța site-ului dvs. în clasamentul căutării Google.
Pe scurt, dacă folosești în mod greșit canonicalele, riști să creezi probleme în care nu au fost.
Concepții greșite comune despre etichetele canonice SEO
Iată cele mai comune concepții greșite despre etichetele canonice în SEO. L-am rezumat aici pentru o mai bună claritate:
- Google este obligat să le respecte. Fals. Canonicalele sunt recomandări și nu reguli. Acestea servesc ca o modalitate de a sugera Google care pagini duplicat considerați a fi cele mai importante. Cu toate acestea, chiar și cu aceste etichete, roboții pot decide totuși că o altă pagină este mai potrivită și să o aleagă față de cea pe care o doriți.
- Sunt obișnuiți să grupeze conținutul după subiect. Singurul scop al canonicalelor este de a ajuta roboții să rezolve adresele URL duplicat. Aceasta înseamnă că, dacă aveți pagini pe subiecte similare, dar vizați cuvinte cheie diferite și aveți conținut diferit, etichetele canonice nu sunt instrumentul potrivit pentru a-și uni echitatea link-urilor. Dacă două pagini sunt foarte diferite, dar sunt conectate cu un rel=canonic, roboții le vor continua să le acceseze cu crawlere, încercând să înțeleagă de ce eticheta este acolo, iar acest lucru va risipi inutil bugetul de accesare cu crawlere.
- Etichetele canonice pot înlocui redirecționările. Canonicalizarea nu are aceeași pondere cu redirecționările, deoarece, așa cum am menționat mai sus, nu este o directivă, ci o sugestie. Deci, dacă nu doriți ca o pagină să fie accesibilă sau prioritizată, eticheta nu vă va ajuta
- Ar trebui să utilizați întotdeauna Canonicals. Nu neaparat. Scopul aici este de a ocoli problemele tehnice care nu ar trebui să existe în primul rând. Dacă adresele URL sunt consecvente pe întregul site și nu aveți problemele despre care am vorbit mai devreme, este posibil să nu aveți nevoie de etichete canonice. Acestea fiind spuse, dacă nu sunteți sigur, puteți utiliza eticheta rel=canonical pentru a face referire personală numai la paginile care sunt cele mai importante pentru dvs., pentru orice eventualitate.
Cum să consolidați o pagină ca canonică
Deși Google are întotdeauna ultimul cuvânt pe pagina pe care o consideră canonică, există modalități de a o recomanda cu tărie pe cea pe care o preferați.
După cum știu oamenii care s-au ocupat de SEO, Google folosește diverse semnale pentru a decide cum să acceseze cu crawlere, să înțeleagă și să indexeze web-ul. Dacă le folosești pe cele potrivite, este mai probabil să te asculte.
În cazul canonicalelor, John Mueller de la Google spune că roboții, într-adevăr, încearcă să citească ce vrea site-ul să facă.
Deci, cum să-i spui Google ce vrei, în afară de adăugarea etichetei de link rel="canonical" la antetul tău HTML?
Canonizare URL-uri HTTPS
Google preferă cu tărie căile HTTPS față de cele HTTP, deoarece au certificate SSL (sau TLS) și oferă un transfer mai sigur de informații. Deci, dacă linkurile dvs. folosesc ambele tipuri, Google va fi atras de cel HTTPS.
Pentru a evita confuzia roboților și a-i face să aleagă între ceea ce știu că este lucrul corect de făcut și ceea ce se pare că îi forțați să facă, cel mai bine este să canonizezi întotdeauna link-urile HTTPS.
Adăugați numai adresele URL canonizate pe sitemap-ul dvs
Harta site-ului XML este un instrument important în strategia dvs. SEO și vă permite să ajutați roboții să prioritizeze și să vă indexeze conținutul. Google consideră că toate adresele URL din hartă sunt canonice în mod implicit, deoarece acestea ar trebui să fie cele mai importante pagini ale tale – cele pe care îi spui să le indexeze.
Așadar, atunci când vă creați harta, asigurați-vă că adăugați numai paginile pe care le considerați copii master.
Optimizați-vă adresele URL
Boților le pasă și de felul în care arată adresele URL. Aceasta înseamnă dacă utilizatorul le poate înțelege cu ușurință sau nu. Linkurile cu parametri care sunt confuzi sunt mai probabil să fie evitate, deoarece Google tinde să aleagă ceea ce este afișat în SERP-uri. Deși este posibil ca un astfel de link să se clasifice dacă este o potrivire perfectă pentru interogarea utilizatorului, este mai bine să fii sigur decât să-ți pară rău.
Adăugați linkuri interne numai la adresele URL canonice
Legăturile interne sunt o modalitate excelentă de a arăta Google care link-uri au mai multă greutate decât altele. Când adăugați linkuri la articolele dvs., asigurați-vă că acestea sunt întotdeauna canonizate și că indică adresa URL principală. Astfel, boții vor ști care pagini sunt mai importante și le vor considera mai relevante.
Utilizați redirecționări
Când una dintre paginile duplicat nu vă mai este de folos, cel mai bun mod de a-i spune Google că nu doriți ca aceasta să fie accesată cu crawlere și indexată este să creați o redirecționare a serverului 301. Astfel, în loc să viziteze ambele pagini și să fie nevoiți să aleagă, boții o vor sări complet pe cea învechită în favoarea celei noi.
Acest lucru este recomandat în special atunci când instalați SSL sau TLS pe site-ul dvs. web și toate linkurile dvs. HTTP devin HTTPS. Crearea redirecționărilor va asigura că oricine are linkul vechi marcat sau backlink va fi redirecționat automat către noua adresă securizată. Acest lucru îi va scuti pe roboții de a fi nevoiți să ia singuri o decizie.
Cu toate acestea, rețineți că, cu redirecționări, vechea pagină devine complet inaccesibilă atât pentru Google, cât și pentru utilizatori. Aceasta este o măsură drastică și ar trebui folosită numai dacă într-adevăr nu mai aveți nevoie de pagină, dar doriți să păstrați echitatea acesteia. De asemenea, prea multe redirecționări pot, potențial, să vă încetinească site-ul.
Concluzie
SEO-ul etichetelor canonice nu este complicat când îl înțelegi și știi cum să folosești etichetele potrivite.
Ceea ce este important de reținut, este că scopul principal al atributelor rel=canonical este de a gestiona duplicarea adreselor URL și de a ajuta roboții să descopere de ce adrese URL diferite indică conținut similar.
Dacă nu sunteți pasionat de tehnologie și aveți nevoie de ajutor pentru gestionarea SEO canonică a site-ului dvs., nu ezitați să ne sunați!