Google Analytics Spam entfernen

Spam Filter für Google Analytics

Web Analytics

Spam ist ein Problem der Web-Analyse. Zu häufig bleibt er unbemerkt und verunreinigt die Datengrundlage von Entscheidungen. Spam-, Bot- oder Fake-Traffic aus Google Analytics-Daten zu entfernen ist unabdinglich, wenn Sie saubere und zuverlässige Daten haben möchten. Glücklicherweise können Filter helfen diesen falschen Traffic zu minimieren. Es gibt leider keine 100%-Lösung, daher sollte man sich in regelmäßigen Abständen um Spam-Traffic kümmern.

Wir konzentrieren uns in diesem Artikel zunächst auf die Ursache des Problems, bevor wir zu einigen Lösungsansätzen kommen.

Arten von Spam

Lassen Sie uns zunächst einen Blick darauf werfen wie Spammer arbeiten, um Ihre Analytics-Daten zu verunreinigen. Die zwei gängigsten Methoden sind via:

  • Crawler / Bots
  • Measurement Protocol

Aktuell nimmt das Measurement Protocol davon den größten Teil ein. Der meiste Fake-Traffic hat Ihre Website nämlich noch nie besucht.

Crawler / Bots

Webcrawler oder Bots sind Softwareprogramme, die Websites im Internet automatisch besuchen. Viele Crawler, wie zum Beispiel Suchmaschinen-Bots von Google & Co., haben eine bestimmte Funktion. Besuche von solchen Bots werden nicht von Google Analytics erfasst. Spam-Crawler hingegen geben sich als Nutzer aus und hinterlassen gefälschte Daten in Web-Analyse-Systemen. Sie machen nur einen geringen Teil des Spam-Traffics aus.

Measurement Protocol Spam

Seit der Einführung des Measurement Protocols ist Google Analytics leistungsfähiger als jemals zuvor. Das Measurement Protocol macht eine einfache Integration verschiedener Systeme in Google Analytics möglich.
Gleichzeitig ist das Measurement Protocol aber auch eine Schwachstelle. Mit Ihrer Tracking-ID, die öffentlich zugänglich ist, kann jeder alles an Ihr Google Analytics-Konto senden. Bei dieser Form des Spams werden über das Measurement Protocol an zufällig generierte Tracking-IDs Informationen verschickt. Die Dimension dieser Methode bewegt sich im Millionen-Bereich. Der meiste Spam, den Sie in Ihrem Google Analytics-Konto sehen, hat Ihre Website also noch nicht mal besucht.
Durch die Verwendung dieser Methode kann fast jede beliebige Dimension oder Metrik manipuliert werden. Measurement Protocol Spam beschränkt sich daher nicht nur auf Referrer-Spam, sondern taucht auch in Events oder im Keyword-Bericht auf.

Gründe für den Spam-Traffic

Warum sollte sich jemand überhaupt die Mühe machen, Google Analytics-Spam zu erstellen? Tatsächlich gibt es eine Reihe von Gründen:

  • Traffic generieren
    Durch Fake-Traffic wird versucht Besucher für die eigene Seite zu generieren. Hierbei nutzt man die Neugier von Google-Analytics-Nutzern, sich Referrer-Quellen anzuschauen. Fake-Traffic läuft mitunter in Millionen von Google Analytics-Konten auf. Sollte davon nur ein Bruchteil die Spam-Seite besuchen, sprechen wir schon von einer erheblichen Menge an Traffic.
  • Verbreitung von Malware
    Die Verbreitung von Schadsoftware auf den Seiten von Spammern ist meist das Hauptziel.
  • Propaganda
    Teilweise wird Fake-Traffic genutzt um politische Überzeugungen und Propaganda zu verbreiten. Der bekannteste Fall war hier der Pro-Trump-Spam.

Google Analytics Spam Filter

Die im Folgenden beschriebenen Lösungen verwenden Google Analytics-Filter. Um Probleme und Verwirrungen zu vermeiden, benötigen Sie ein grundlegendes Verständnis der Funktionsweise von Filtern. Spam-Filter in Google Analytics

Was man nicht machen sollte:

Es gibt mehrere Lösungsansätze um Measurement Protocol - Spam zu reduzieren. Ein Ansatz von searchviu.com greift auf eine Art Passwort-ID zurück und setzt den Google Tag Manager voraus. Ohne Google Tag Manager greifen wir auf eine Hostname-Lösung zurück. Grundsätzlich empfehlen wir Ihnen den Google Tag Manager zu nutzen. Wir arbeiten in beiden Lösungen mit einem Google-Analytics Filter. Filter arbeiten auf Datenansichts-Ebene und schließen bestimmten Traffic ein bzw. aus.

Die Einstellung "Alle Treffer von bekannten Bots und Spidern ausschließen" reicht nicht aus. Sie hat kaum Einfluss auf Spam-Traffic.

Google Tag-Manager Lösung:
Benutzerdefinierte Dimension übermitteln

Um Herr des Measurement-Spams zu werden, werden wir alle Daten, die an unsere Google Analytics-Property gesendet werden, mit einer ID sichern. Wir übermitteln zusätzlich zu Pageviews oder Events, einfach einen Wert für eine benutzerdefinierten Dimension. Dieser Wert ist zwar für Außenstehende einzusehen, aber dafür muss man die Website aktiv aufrufen. Da Measurement-Spam vollautomatisiert Tracking-IDs aufruft, ohne Ihre Website jemals zu besuchen, hilft diese Lösung trotzdem. Durch unsere ID werden diese Aufrufe von Außen unterbunden.

Anleitung

Fügen Sie in Google Analytics eine neue benutzerdefinierte Dimension hinzu: Benutzerdefinierte Dimension erstellen Nachdem Sie die Dimension gespeichert haben, merken Sie sich die Indexnummer. Sie benötigen Diese für den Google Tag Manager.

Im Google Tag Manager fügen Sie der Einstellungsvariable, die Sie für den Tracking-Code nutzen, die Indexnummer der Dimension und Ihre "ID" hinzu. Benutzerdefinierte Dimension im Tag Manager Da die Einstellungsvarbiable bei jedem Event, Pageview etc. gefeuert wird, sollte absofort auch die Sicherungs-ID mitgeschickt werden.

Im nächsten Schritt erstellen wir einen neuen Filter in Google Analytics, der nur noch Daten zu lässt, der mit dieser ID versehen ist: Google Analytics Filter ID Nachdem Sie den Filter gespeichert haben, sollten Ihre neu erhohbenen Daten vom Measurement-Spam befreit sein.

Hostname-Filter Lösung

Mit Hilfe dieses Filters lassen wir nur Google-Analytics-Daten zu, die über einige wenige Hostnames generiert werden. In den meisten Fällen handelt es sich hierbei um den Hostnamen Ihrer Domain und Subdomains sowie Diensten wie Google-Translate.

Um diesen Filter zu erstellen, müssen Sie zunächst eine Liste der relevanten Hostnamen erstellen.

Um eine Liste aller aktiven Hostnamen zu erhalten, navigieren Sie zum Netzwerkbericht in Google Analytics und wechseln Sie dort die primäre Dimension in “Hostname”: Hostename Bericht in Google Analytics

Die relevanten Hostnames setzen wir nun mit einem RegEx-Befehl für den Filter zusammen:

domain.de|www.domain.de|subdomain.domain.de|subdomain2.domain.de

Um sicherzustellen, dass Sie der RegEx-Befehl funktioniert, testen Sie den Ausdruck direkt im Hostname-Bericht: RegEx Hostename Bericht in Google Analytics

Das | steht für "oder". Sollten Sie noch nicht mit RegEx-Ausdrücken vertraut sein, haben wir einen Google Analytics RegEx-Leitfaden für Sie zusammengestellt

Wenn der RegEx-Befehl ordnungsgemäß funktioniert, ist es Zeit den Filter zu erstellen. Navigieren Sie hierfür zu den Filtereinstellungen der Datenansicht. Diese finden Sie unter "Verwaltung".
Erstellen Sie einen neuen Filter. Geben Sie Ihrem Filter einen eindeutigen Namen und wählen als Filtertyp "Benutzerdefiniert". Wählen Sie "Einschließen" und als Feld "Hostname". Fügen Sie dann Ihren RegEx-Befehl ein und testen Sie Ihren Filter. Filter Hostname Konfiguration

Achtung:
Auch wenn der RegEx-Befehl im Bericht geklappt hat, empfehlen wir den Filter zunächst in einem Testprofil zu testen.

Dieser Ansatz sollte eine solide Lösung für Measurement-Spam bieten. Es ist aber wichtig in regelmäßigen Abständen einen Blick auf die Hostnames der ungefilterten Datenansichten zu werfen, um eventuelle neue und gute Hostnames zu identifizieren. Sollten Sie außerdem Ihren Tracking-Code auf weiteren Domains / Subdomains installieren, stellen Sie sicher diese neuen Hostnames auch zu Ihrem Filter hinzuzufügen.

Benötigen Sie Unterstützung bei der Konfiguration? Wir sind hier, um zu helfen.

Wir hoffen, dass Sie diese Anleitung zur Bekämpfung von Spam-Traffic in Google Analytics hilfreich finden. Wenn Sie Fragen oder Feedback haben, senden Sie uns gerne eine Nachricht.

Übrigens: Wir helfen Ihnen kostenlos bei der ordnungsgemäßen Einrichtung und Konfiguration der Spam-Maßnahme in Google Analytics.

Historische Daten von Spam-Traffic bereinigen

Historische Daten können in Google Analytics nicht geändert werden.

Es gibt jedoch die Möglichkeit die Daten mithilfe eines Segments zu filtern. Wir haben daher alle möglichen Referral-Spam-Filter-Listen zusammengetragen und ein Segment erstellt, welches Sie sich einfach in Ihr Google Analytics-Konto importieren können. Sie müssen lediglich in der ersten Bedingung Ihre Hostname-Regex von oben einfügen:

Spam Segment für Google Analytics

Wir haben was vergessen? Teilen Sie uns gerne Verbesserungsvorschläge über unser Kontaktformular mit.

Fazit und Gedanken zu Spam-Traffic

Spam in Google Analytics ist keine neue Sache und frustriert Web Analysten schon seit geraumer Zeit. Mit den hier beschriebenen Methoden und Segmenten können Sie Ihre Google Analytics Daten in gewisser Weise schützen. Wir hoffen, dass es in Zukunft automatisierten Spam-Schutz von Google selbst gibt - der nicht darauf aus ist Spam zu indentifizieren, sondern echte Nutzer. In diesem Sinne:
¯_(ツ)_/¯(ಠ益ಠ)(ಥ‿ಥ)(ʘ‿ʘ)

Philippe Großmann
Philippe Großmann
Philippe Großmann ist Online Marketing Consultant und Gründer von keyperformance.

Über den Autor

Philippe Großmann

Philippe Großmann

Philippe entwickelt Online Marketing Kampagnen, ist Web-Analytics Enthusiast und ein großer Fan von PPC-Marketing.

Fragen zu diesem Artikel? Frag den Autor.

Diesen Artikel bewerten

Wir freuen uns jederzeit über Feedback:

4.8(4 Bewertung/en)