Cum să eliminați datele sensibile ale clienților din indexul Google

Publicat: 2023-08-07

Clasare mai bună a cuvintelor cheie. Mai mult trafic. Conversii suplimentare din căutarea organică. Acestea sunt KPI-urile folosite pentru a măsura performanța SEO.

Dar dincolo de valorile de creștere, există un element cheie pe care unii consultanți sau agenții îl trec cu vederea atunci când gestionează campaniile SEO ale unui client:

Prevenirea apariției conținutului confidențial al clientului în rezultatele căutării Google.

Atunci când este neglijat, acest lucru poate duce la o încălcare a încrederii sau la un litigiu costisitor care poate pune capăt unei relații cu clientul.

Toate acestea nu trebuie să se întâmple dacă știți cât de ușor pot intra datele clienților în indexul Google și cum să le evitați.

Descoperiți problema critică de indexare a căutării pe care mulți SEO-uri o scapă, expunerea accidentală a datelor clienților pe Google și modalități de deindexare a unui astfel de conținut.

Cum am găsit date sensibile

Sunt un consultant SEO independent cu normă întreagă, care a colaborat cu diverse companii mijlocii din 2018, având rezultate de căutare organice îmbunătățite de peste 10 ani.

Când fac un audit tehnic SEO, folosesc un operator de căutare pe site (intrand site:domain.com) pe Google pentru a verifica rezultatele. Aici, pot vedea rapid cum arată numele site-urilor, titlurile, adresele URL și fragmentele din diferite categorii de pagini.

Observ, de asemenea, modele de ceea ce este indexat, poate adăugând cuvinte cheie la operator pentru a deveni mai precis atunci când este necesar.

Pentru majoritatea clienților, voi observa uneori site-urile de dezvoltare/testare/proiectare indexate, conținut subțire care diluează echitatea link-urilor sau dăunează eficacității accesării cu crawlere (sau duc la canibalizarea cuvintelor cheie) și pagini de destinație plătite care nu sunt menite să se claseze.

Am început să detectez, totuși, cu o frecvență alarmantă, ceva unic pentru clienții SaaS:

Paginile de obicei din subdomenii la care nimeni nu se gândește vreodată – fie în echipele de marketing, fie în echipele de produse – sunt indexate.

Cele mai inofensive sunt subdomeniile clienților care își personalizează experiența de conectare (de exemplu, client.example.com ).

Chiar și aici, un client poate să nu-și dorească să aibă numele în rezultatele căutării. În funcție de produsul dvs., acest lucru ar putea dezvălui un factor de diferențiere sau o vulnerabilitate față de concurenți.

În cazuri mult mai grave, pot fi găsite formulare bazate pe web cu date colectate (de la anumite persoane).

În cele mai rele cazuri (și cu interogarea de căutare corectă), chiar și câmpurile de formular ar putea fi accesate și modificate din cauza lipsei de protecție prin parolă.

Deși nu are legătură cu creșterea prin căutare organică, mă grăbesc să le subliniez. Mi s-a părut evident că aici ar putea fi mult în joc.

În cel puțin mai multe cazuri, aceasta a devenit o problemă „toate mâinile pe punte”, prin aceea că mi s-a cerut să scot aceste date din rezultatele căutării mai repede decât în ​​cel mai scurt timp posibil.

Un CEO a menționat că consultanții săi de securitate nu au menționat niciodată această posibilitate. Acest lucru a fost găsit rapid printr-un pas de bază pe care majoritatea SEO-ului l-ar face într-un audit.

Pentru a fi corect, este nevoie aproape întotdeauna de o căutare neobișnuită pentru a găsi astfel de pagini.

Totuși, luați în considerare căutările ciudate în care ar intra clienții, poate chiar echipa dvs. de conducere, ca să nu mai vorbim de rivali. (Nu uitați niciodată de statistica de durată conform căreia 15% dintre interogările de căutare de pe Google sunt unice!)

Chiar dacă nu este o problemă legală, datele sensibile din rezultatele căutării găsite mai întâi de clienți ar putea dăuna relației dvs.


Obțineți buletinele informative zilnice pe care se bazează marketerii.

Se procesează... Vă rugăm să așteptați.

Vezi termenii.


De ce sunt aceste date chiar și pe Google?

Un singur link, discret către o pagină din orice resursă accesată de motoarele de căutare, oriunde pe web, este tot ce este nevoie:

  • Pagina este listată în harta dvs. XML de site, chiar dacă nu este legată de site-ul dvs.?
  • Ar fi putut exista vreo referință pe site-ul dvs. în trecut sau ceva care trece neobservat în JavaScript?
  • De cele mai multe ori, clientul face link-uri către pagină – dar este destinat doar să vadă anumite persoane, cum ar fi participanții la sondaj, nu publicul larg.

Din fericire, conștientizarea reprezintă mai mult de jumătate din luptă aici. Odată ce știți paginile care trebuie eliminate din căutare, puteți porni rapid procesul de corectare, începând cu Google.

Cum să deindexați rapid conținutul în Google

Găsiți un model pentru adresele URL cu date sensibile afișate în rezultatele căutării Google

De exemplu, este obișnuit să aveți un subdomeniu intitulat data.example.com care găzduiește versiunea web a produsului dvs. SaaS. Puteți utiliza operatorul de căutare pe site pentru a scana paginile cu rezultate.

Utilizați raportul de indexare a paginilor din Google Search Console (GSC) pentru a vedea toate adresele URL indexate

Este posibil să nu arate totul. Contactarea echipei dvs. de produse în acest sens ar putea fi de ajutor, deoarece acestea vă pot oferi tot ce aveți nevoie mai rapid și mai precis.

Raport de indexare a paginii

Verificați de două ori adresele URL

Confirmați utilizând instrumentul de inspecție URL pentru fiecare URL, dacă este posibil sau cel puțin un eșantion, în GSC, în cazul în care linkurile pe care le-ați găsit nu mai sunt în acele locații.

Raport de indexare a paginii

Pentru a găsi paginile ofensive, luați în considerare toate versiunile URL care se pot canoniza în ceea ce vedeți în rezultatele căutării.

Cu adresa URL canonică eliminată, versiunile alternative pot fi indexate.

Aplicați modelul (al doilea buton radio sub Solicitare nouă ), probabil un subdomeniu sau enumerați fiecare adresă URL făcând o nouă solicitare în instrumentul de eliminare GSC.

eliminări GSC

Pentru un set limitat de pagini, utilizarea instrumentului de inspecție URL odată ce acest pas este aplicat poate accelera eliminarea și poate confirma, de asemenea, cea mai recentă stare. Acest lucru trebuie făcut pe rând. (Deși nu este gigantul care este Google, cel puțin astăzi, ar trebui să faceți acest lucru și în instrumentul de blocare URL al Microsoft Bing.)

GSC - Mutări temporare

Făcând acești pași, eliminarea din indexul Google va dura doar șase luni.

Nu va împiedica problema pentru totdeauna sau să apară pe alte motoare de căutare, așa că va trebui să faceți un pas final mai jos.

Cum să eliminați permanent conținutul de pe Google

Două metode pot funcționa aici:

1. Folosiți o etichetă meta robots noindex în secțiunea de cap a paginilor respective

Ar trebui să solicitați dezvoltatorilor dvs. web să adauge acest lucru la șablonul de pagină pentru a-l replica în toate paginile.

  • Pentru PDF-uri, imagini și alt conținut non-HTML, puteți adăuga un antet HTTP X-Robots-Tag cu o valoare fie noindex/none. Acest lucru este valabil și pentru pagini HTML obișnuite, dar nu la fel de rapid de implementat.

Notă: nu utilizați regulile de interzicere a robots.txt (excepție pentru imagini), care funcționează numai dacă nu există nicio problemă în primul rând. A disallow blochează accesarea cu crawlere, dar nu indexarea.

2. Poartă conținutul

Protejarea cu parolă a paginilor dvs. web sau a fișierelor vă va asigura că numai utilizatorii autorizați le pot accesa. Aceasta este, de asemenea, o altă modalitate de a vă bloca afișarea conținutului pe Google.

Prevenirea apariției conținutului sensibil în rezultatele căutării

După ce ați făcut unul dintre acești pași, puteți fi sigur că paginile cu date sensibile ale clienților vor fi șterse și nu vor intra din nou în indexul Google, paginile fiind eliminate în decurs de o zi, în majoritatea cazurilor.

Cu bună-credință, ar trebui să le spuneți clienților dumneavoastră exact ce s-a întâmplat. Nu uitați că nimic nu dispare complet pe web.


Opiniile exprimate în acest articol sunt cele ale autorului invitat și nu neapărat Search Engine Land. Autorii personalului sunt enumerați aici.