Jak usunąć poufne dane klienta z indeksu Google

Opublikowany: 2023-08-07

Lepsze rankingi słów kluczowych. Więcej ruchu. Dodatkowe konwersje z wyszukiwania organicznego. Są to wskaźniki KPI używane do pomiaru wydajności SEO.

Ale poza wskaźnikami wzrostu istnieje kluczowy element, który niektórzy konsultanci lub agencje pomijają podczas zarządzania kampaniami SEO klienta:

Zapobieganie pojawianiu się poufnych treści klienta w wynikach wyszukiwania Google.

W przypadku zaniedbania może to doprowadzić do naruszenia zaufania lub kosztownych procesów sądowych, które mogą ostatecznie zakończyć relację z klientem.

To wszystko nie musi się zdarzyć, jeśli wiesz, jak łatwo dane klientów mogą trafić do indeksu Google i jak tego uniknąć.

Odkryj krytyczny problem z indeksowaniem wyszukiwania, który pomija wielu specjalistów SEO, przypadkowe ujawnienie danych klientów w Google oraz sposoby deindeksowania takich treści.

Jak znalazłem poufne dane

Jestem pełnoetatowym niezależnym konsultantem SEO, który od 2018 roku współpracuje z różnymi firmami średniej wielkości, poprawiając organiczne wyniki wyszukiwania przez ponad 10 lat.

Podczas przeprowadzania technicznego audytu SEO używam operatora wyszukiwania w witrynie (wpisując site:domain.com) w Google, aby sprawdzić wyniki. Tutaj mogę szybko zobaczyć, jak nazwy witryn, tytuły, adresy URL i fragmenty wyglądają w różnych kategoriach stron.

Zauważam również wzorce tego, co jest indeksowane, być może dodawanie słów kluczowych do operatora, aby w razie potrzeby uzyskać bardziej szczegółowe informacje.

W przypadku większości klientów czasami zauważam, że strony deweloperskie/testowe/pomostowe są indeksowane, rzadka treść osłabia wartość linków lub szkodzi skuteczności indeksowania (lub prowadzi do kanibalizacji słów kluczowych) oraz płatne strony docelowe, które nie mają na celu pozycjonowania.

Zacząłem jednak wykrywać z alarmującą częstotliwością coś unikalnego dla klientów SaaS:

Strony zazwyczaj w subdomenach, o których nikt nigdy nie myśli – ani w zespołach marketingowych, ani w zespołach produktowych – które mają być indeksowane.

Najbardziej nieszkodliwe są subdomeny klientów, które dostosowują sposób logowania (np. client.example.com ).

Nawet tutaj klient może nie chcieć, aby jego nazwisko pojawiało się w wynikach wyszukiwania. W zależności od produktu może to ujawnić wyróżnik lub lukę w stosunku do konkurencji.

W znacznie poważniejszych przypadkach można było znaleźć formularze internetowe z zebranymi danymi (od konkretnych osób).

W najgorszych przypadkach (i przy odpowiednim zapytaniu) nawet pola formularza mogą być dostępne i zmieniane z powodu braku ochrony hasłem.

Chociaż nie jest to związane z rozwojem dzięki wyszukiwaniu organicznemu, szybko zwracam na to uwagę. Wydawało mi się oczywiste, że stawka może być tutaj bardzo wysoka.

W co najmniej kilku przypadkach stało się to problemem „wszystkich rąk na pokład”, ponieważ poproszono mnie o usunięcie tych danych z wyników wyszukiwania szybciej niż jak najszybciej.

Jeden z dyrektorów generalnych wspomniał, że jego konsultanci ds. bezpieczeństwa nigdy nie wspominali o takiej możliwości. Zostało to szybko znalezione dzięki podstawowemu krokowi, który większość SEO wykonałaby podczas audytu.

Szczerze mówiąc, znalezienie tego rodzaju stron prawie zawsze wymaga niecodziennego wyszukiwania.

Weź jednak pod uwagę dziwne wyszukiwania, w które wprowadziliby się klienci, a może nawet Twój zespół kierowniczy – nie wspominając o rywalach. (Nigdy nie zapominaj o trwałych statystykach, według których 15% zapytań w Google jest unikalnych!)

Nawet jeśli nie jest to kwestia prawna, poufne dane w wynikach wyszukiwania znalezione przez klientów jako pierwsze mogą zaszkodzić waszym relacjom.


Otrzymuj codzienny biuletyn wyszukiwania, na którym polegają marketerzy.

Przetwarzanie ... Proszę czekać.

Zobacz warunki.


Dlaczego te dane są w ogóle w Google?

Wystarczy jeden, niepozorny link do strony z dowolnego zasobu dostępnego dla wyszukiwarek w dowolnym miejscu w sieci:

  • Czy strona jest wymieniona w Twojej mapie witryny XML, nawet jeśli nie ma do niej linku w Twojej witrynie?
  • Czy w przeszłości w Twojej witrynie mogło znajdować się odwołanie lub coś, co pozostaje niezauważone w JavaScript?
  • Najczęściej klient odsyła do strony – ale jest ona przeznaczona tylko dla określonych osób, na przykład uczestników ankiety, a nie dla ogółu społeczeństwa.

Na szczęście świadomość to tutaj więcej niż połowa sukcesu. Gdy znasz już strony, które mają zostać usunięte z wyszukiwania, możesz szybko rozpocząć proces poprawiania, zaczynając od Google.

Jak szybko zdeindeksować treści w Google

Znajdź wzorzec dla adresów URL z poufnymi danymi wyświetlanymi w wynikach wyszukiwania Google

Na przykład często istnieje subdomena o nazwie data.example.com, w której znajduje się internetowa wersja produktu SaaS. Możesz użyć operatora wyszukiwania w witrynie, aby przeskanować strony wyników.

Użyj raportu indeksowania stron w Google Search Console (GSC), aby wyświetlić wszystkie zindeksowane adresy URL

To może nie pokazać wszystkiego. Pomocne może być skontaktowanie się w tej sprawie z zespołem ds. produktu, ponieważ może on zapewnić wszystko, czego potrzebujesz, szybciej i dokładniej.

Raport indeksowania strony

Sprawdź dokładnie swoje adresy URL

Potwierdź za pomocą narzędzia do sprawdzania adresów URL dla każdego adresu URL, jeśli to możliwe, lub przynajmniej próbki, w GSC na wypadek, gdyby znalezione linki nie znajdowały się już w tych lokalizacjach.

Raport indeksowania strony

Aby znaleźć naruszające zasady strony, weź pod uwagę wszystkie wersje adresów URL, które mogą kanonizować w kierunku tego, co widzisz w wynikach wyszukiwania.

Po usunięciu kanonicznego adresu URL alternatywne wersje mogą zostać zindeksowane.

Zastosuj wzorzec (drugi przycisk opcji w obszarze Nowa prośba ), prawdopodobnie subdomenę lub wyświetl listę wszystkich adresów URL, wysyłając nowe żądanie w narzędziu do usuwania GSC.

przeprowadzki GSC

W przypadku ograniczonego zestawu stron użycie narzędzia do sprawdzania adresów URL po wykonaniu tego kroku może przyspieszyć usuwanie i potwierdzić najnowszy stan. Należy to robić pojedynczo. (Chociaż nie jest gigantem, jakim jest Google, przynajmniej dzisiaj, powinieneś to zrobić również w narzędziu Block URL firmy Microsoft Bing).

SGR – Tymczasowe przeprowadzki

Po wykonaniu tych kroków usunięcie z indeksu Google potrwa tylko sześć miesięcy.

Nie zapobiegnie to na stałe ani nie zapobiegnie występowaniu problemu w innych wyszukiwarkach, więc musisz wykonać ostatni krok poniżej.

Jak trwale usunąć treści z Google

Mogą tu zadziałać dwie metody:

1. Użyj meta tagu robots noindex w sekcji head tych stron

Twoi twórcy stron internetowych powinni dodać to do szablonu strony, aby powielić je na wszystkich stronach.

  • W przypadku plików PDF, obrazów i innych treści innych niż HTML można dodać nagłówek HTTP X-Robots-Tag z wartością noindex/none. Dotyczy to również zwykłych stron HTML, ale implementacja nie jest tak szybka.

Uwaga: nie używaj reguł blokowania pliku robots.txt (wyjątek dla obrazów), które działają tylko wtedy, gdy nie ma problemu. Nie zezwalaj blokuje indeksowanie, ale nie indeksowanie.

2. Bramka treści

Zabezpieczenie stron internetowych lub plików hasłem zapewni dostęp do nich tylko autoryzowanym użytkownikom. To także kolejny sposób na zablokowanie wyświetlania treści w Google.

Zapobieganie pojawianiu się wrażliwych treści w wynikach wyszukiwania

Po wykonaniu jednej z tych czynności możesz mieć pewność, że strony zawierające poufne dane klientów zostaną usunięte i nie zostaną ponownie wprowadzone do indeksu Google. W większości przypadków strony zostaną usunięte w ciągu jednego dnia.

W dobrej wierze powinieneś dokładnie powiedzieć swoim klientom, co się stało. Pamiętaj tylko, że w sieci nic nigdy nie znika całkowicie.


Opinie wyrażone w tym artykule są opiniami autora-gościa i niekoniecznie Search Engine Land. Autorzy personelu są wymienieni tutaj.