So entfernen Sie vertrauliche Kundendaten aus dem Google-Index

Veröffentlicht: 2023-08-07

Bessere Keyword-Rankings. Mehr Verkehr. Zusätzliche Conversions aus der organischen Suche. Dies sind die KPIs, die zur Messung der SEO-Leistung verwendet werden.

Doch über die Wachstumskennzahlen hinaus gibt es ein Schlüsselelement, das manche Berater oder Agenturen bei der Verwaltung der SEO-Kampagnen eines Kunden übersehen:

Verhindern, dass vertrauliche Kundeninhalte in den Google-Suchergebnissen angezeigt werden.

Wenn dies vernachlässigt wird, kann dies zu einem Vertrauensbruch oder einem teuren Rechtsstreit führen, der letztendlich zum Ende einer Kundenbeziehung führen kann.

All dies muss nicht passieren, wenn Sie wissen, wie leicht Kundendaten in den Index von Google gelangen und wie Sie dies vermeiden können.

Entdecken Sie das kritische Suchindizierungsproblem, das viele SEOs übersehen, die versehentliche Offenlegung von Kundendaten auf Google und Möglichkeiten zur Deindizierung solcher Inhalte.

Wie ich sensible Daten gefunden habe

Ich bin ein hauptberuflicher, unabhängiger SEO-Berater, der seit 2018 mit verschiedenen mittelständischen Unternehmen zusammenarbeitet und seit über 10 Jahren die organischen Suchergebnisse verbessert.

Wenn ich ein technisches SEO-Audit durchführe, verwende ich einen Website-Suchoperator (Eingabe von site:domain.com) bei Google, um die Ergebnisse zu überprüfen. Hier kann ich schnell sehen, wie Site-Namen, Titel, URLs und Snippets in verschiedenen Seitenkategorien aussehen.

Mir sind auch Muster bei der Indizierung aufgefallen, vielleicht das Anhängen von Schlüsselwörtern an den Operator, um bei Bedarf spezifischer zu werden.

Bei den meisten Kunden stelle ich manchmal fest, dass Entwicklungs-/Test-/Staging-Websites indiziert werden, dünner Content die Link-Equity verwässert oder die Crawling-Effizienz beeinträchtigt (oder zu einer Keyword-Kannibalisierung führt) und bezahlte Landingpages, die nicht für ein Ranking gedacht sind.

Ich habe jedoch mit alarmierender Häufigkeit etwas festgestellt, das bei SaaS-Kunden einzigartig ist:

Seiten, die typischerweise unter Subdomains liegen, an deren Indexierung niemand denkt – weder im Marketing noch im Produktteam.

Am harmlosesten sind Kunden-Subdomains, die ihre Anmeldeerfahrung anpassen (z. B. client.example.com ).

Auch hier möchte ein Kunde möglicherweise nicht, dass sein Name in den Suchergebnissen erscheint. Abhängig von Ihrem Produkt könnte dies ein Unterscheidungsmerkmal oder eine Schwachstelle gegenüber der Konkurrenz aufzeigen.

In weitaus schwerwiegenderen Fällen könnten webbasierte Formulare mit gesammelten Daten (von bestimmten Personen) gefunden werden.

Im schlimmsten Fall (und bei richtiger Suchanfrage) konnten aufgrund fehlenden Passwortschutzes sogar Formularfelder aufgerufen und verändert werden.

Auch wenn es nichts mit Wachstum durch organische Suche zu tun hat, möchte ich schnell darauf hinweisen. Mir schien klar, dass hier viel auf dem Spiel stehen könnte.

In zumindest mehreren Fällen wurde dies zu einem „All-Hands-on-Deck“-Problem, da ich gebeten wurde, diese Daten schneller als möglich aus den Suchergebnissen zu entfernen.

Ein CEO erwähnte, dass seine Sicherheitsberater diese Möglichkeit nie erwähnt hätten. Dies wurde schnell durch einen grundlegenden Schritt festgestellt, den die meisten SEOs bei einem Audit durchführen würden.

Fairerweise muss man sagen, dass es fast immer eine ungewöhnliche Suche erfordert, um solche Seiten zu finden.

Bedenken Sie jedoch die seltsamen Suchanfragen, die Kunden, vielleicht sogar Ihr Führungsteam, durchführen würden – ganz zu schweigen von Konkurrenten. (Vergessen Sie nie die dauerhafte Statistik, dass 15 % der Suchanfragen bei Google eindeutig sind!)

Auch wenn es sich nicht um ein rechtliches Problem handelt, könnten sensible Daten in Suchergebnissen, die von Kunden zuerst gefunden werden, dennoch Ihrer Beziehung schaden.


Erhalten Sie den täglichen Newsletter, auf den sich Suchmaschinenmarketing verlassen.

Verarbeite .. Bitte warten.

Siehe Bedingungen.


Warum sind diese Daten überhaupt bei Google?

Ein einziger, unauffälliger Link zu einer Seite von einer beliebigen Ressource, auf die Suchmaschinen irgendwo im Web zugreifen, genügt:

  • Ist die Seite in Ihrer XML-Sitemap aufgeführt, auch wenn sie nicht auf Ihrer Website verlinkt ist?
  • Könnte es in der Vergangenheit einen Verweis auf Ihrer Website gegeben haben oder etwas, das in JavaScript unbemerkt bleibt?
  • In den meisten Fällen verlinkt der Kunde auf die Seite – diese ist jedoch nur für bestimmte Personen, beispielsweise Umfrageteilnehmer, und nicht für die breite Öffentlichkeit gedacht.

Zum Glück ist Bewusstsein hier mehr als die halbe Miete. Sobald Sie wissen, welche Seiten aus der Suche entfernt werden sollen, können Sie schnell mit dem Korrekturprozess beginnen, beginnend mit Google.

So deindizieren Sie Inhalte in Google schnell

Finden Sie ein Muster für URLs mit vertraulichen Daten, die in den Google-Suchergebnissen angezeigt werden

Beispielsweise ist es üblich, eine Subdomain mit dem Titel data.example.com zu haben, die die webbasierte Version Ihres SaaS-Produkts beherbergt. Sie können den Site-Suchoperator verwenden, um Ergebnisseiten zu scannen.

Verwenden Sie den Seitenindizierungsbericht in der Google Search Console (GSC), um alle indizierten URLs anzuzeigen

Dies zeigt möglicherweise nicht alles. Es könnte hilfreich sein, sich diesbezüglich an Ihr Produktteam zu wenden, da dieses möglicherweise alles, was Sie benötigen, schneller und genauer bereitstellen kann.

Bericht zur Seitenindizierung

Überprüfen Sie Ihre URLs noch einmal

Bestätigen Sie dies, indem Sie nach Möglichkeit das URL-Inspektionstool für jede URL oder zumindest eine Probe in GSC verwenden, falls sich die von Ihnen gefundenen Links nicht mehr an diesen Stellen befinden.

Bericht zur Seitenindizierung

Um die anstößigen Seiten zu finden, berücksichtigen Sie alle URL-Versionen, die möglicherweise auf das kanonisieren, was Sie in den Suchergebnissen sehen.

Wenn die kanonische URL entfernt wird, werden die alternativen Versionen möglicherweise indiziert.

Wenden Sie das Muster an (das zweite Optionsfeld unter „Neue Anfrage “), wahrscheinlich eine Subdomain, oder listen Sie jede URL auf, indem Sie im GSC Removals-Tool eine neue Anfrage stellen.

GSC-Umzüge

Bei einer begrenzten Anzahl von Seiten kann die Verwendung des URL-Inspektionstools nach Anwendung dieses Schritts die Entfernung beschleunigen und auch den neuesten Status bestätigen. Dies muss einzeln erfolgen. (Obwohl es zumindest heute nicht der Riese von Google ist, sollten Sie dies auch im Block-URL-Tool von Microsoft Bing tun.)

GSC – Vorübergehende Umzüge

Durch diese Maßnahmen wird die Entfernung aus dem Google-Index nur sechs Monate dauern.

Dadurch wird das Problem nicht für immer behoben oder verhindert, dass es bei anderen Suchmaschinen auftritt. Daher müssen Sie unten einen letzten Schritt ausführen.

So entfernen Sie Inhalte dauerhaft von Google

Hier können zwei Methoden funktionieren:

1. Verwenden Sie im Kopfbereich dieser Seiten ein Noindex-Meta-Robots-Tag

Sie sollten Ihre Webentwickler dies zur Seitenvorlage hinzufügen lassen, um es auf allen Seiten zu replizieren.

  • Für PDFs, Bilder und andere Nicht-HTML-Inhalte können Sie einen X-Robots-Tag-HTTP-Header mit dem Wert noindex/none hinzufügen. Dies gilt auch für normale HTML-Seiten, ist jedoch nicht so schnell umzusetzen.

Hinweis: Verwenden Sie keine robots.txt-Disallow-Regeln (Ausnahme für Bilder), die nur funktionieren, wenn überhaupt kein Problem vorliegt. Eine Nichtzulassung blockiert das Crawlen, aber nicht die Indizierung.

2. Gaten Sie den Inhalt ein

Durch den Passwortschutz Ihrer Webseiten oder Dateien wird sichergestellt, dass nur autorisierte Benutzer darauf zugreifen können. Dies ist auch eine weitere Möglichkeit, die Anzeige Ihrer Inhalte auf Google zu blockieren.

Verhindern, dass vertrauliche Inhalte in Suchergebnissen angezeigt werden

Nachdem Sie einen dieser Schritte ausgeführt haben, können Sie sicher sein, dass Seiten mit sensiblen Kundendaten entfernt werden und nicht erneut in den Google-Index aufgenommen werden. In den meisten Fällen werden die Seiten innerhalb eines Tages entfernt.

In gutem Glauben sollten Sie Ihren Kunden genau sagen, was passiert ist. Denken Sie daran, dass nichts im Internet jemals vollständig verschwindet.


Die in diesem Artikel geäußerten Meinungen sind die des Gastautors und nicht unbedingt die von Search Engine Land. Die Autoren unserer Mitarbeiter sind hier aufgelistet.