Stichprobenerhebung Google Analytics

Google Analytics Sampling – Data Sampling (Stichprobenerhebung) verstehen

Jeder Google Analyitcs Nutzer hat das wahrscheinlich schon durchgemacht:
Machmal wollen absolute Zahlen in verschiedenen Berichten von Google Analytics einfach nicht stimmen.

Daraufhin wird alles mehrfach überprüft, aber die Daten wollten einfach nicht passen.

Man ist (vermutlich) Googles Stichprobenerhebung oder auch Data Sampling in die Falle gegangen.

In diesem Artikel haben wir zusammengefast was Google Analytics Sampling ist, wie es funktioniert und warum Google es überhaupt nutzt.

Was ist Data Sampling in Google Analytics?

Google nutzt Data Sampling um die Leistung seiner Abfragen und Berechnungen zu beschleunigen.
Data Sampling, oder auch Stichprobenerhebung genannt, ist ein Prozess, der in der Statistik üblich ist, um nicht alle vorhandenen Datensätze analysieren zu müssen. Stattdessen wird eine repräsentative Teilmenge von Daten verwendet, aufbereitet, analysiert und letztendlich auf die Gesamtmenge hochgerechnet.
Das Ziel von Data Sampling ist es, Muster und Trends in größeren Datensätzen mit geringeren Rechenaufwand zu identifizieren.

Wie erkenne ich das Data Sampling?

Sie können jederzeit erkennen, wann es zu Stichprobenerhebungen kommt.
Google kennzeichnet nämlich immer, ob und wann Data Sampling genutzt wird. Generell gilt, dass für Standardberichte, ohne Segmente und normale Zeiträume, keine Stichproben erhoben werden.

Bei der Nutzung von

  • benutzerdefinierten Berichten
  • Segmenten
  • Dimensionen
  • Betrachtung langer Zeiträume

können die Daten gesampelt werden.
Data Sampling startet für gewöhnlich bei Berichten, die über 500.000 Sitzungen beinhalten.
Ob und in welchem Umfang die angezeigten Datensätze gesampelt wurden findet man in der oberen rechten Ecke neben dem Namen des aktuellen Berichtes:

Data Sampling Stichprobenerhebung Google Analytics Ansicht

Die Icons neben dem Bericht geben euch Aufschluss über das Google Analytics Sampling:

Gruen Stichprobenerhebung Google Analytics

Grün = Datenqualität hoch – Sampling niedrig bis gar nicht angewendet

Gelb Stichprobenerhebung Google Analytics

Gelb = Data Sampling wurde auf der aktuellen Ansicht angewendet

Wie muss ich mit Data Sampling umgehen?

Man muss sich einfach bewusst sein, dass bei der Betrachtung größerer Datenmengen die Zahlen nicht zu 100% der Wahrheit entsprechen – und das ist auch nicht schlimm.
Für die meisten Zwecke reichen die Daten aus den Stichprobenerhebungen aus.
Diese haben in der Regel nämlich keine Auswirkungen auf die gewonnenen Einsichten.

Mit absoluten Zahlen und Daten sollte man in keinem Web-Analyse Tool arbeiten.

Eine Testreihe von Moz.com hat ergeben, dass das Sampling im Allgemeinen ziemlich genaue Daten liefert.

Wenn Websiten keinen hohen Traffic aufweisen (z. B. weniger als 1.000 Sitzungen pro Monat), brauch man sich keine Sorgen über mögliches Data Sampling machen.
Aber Achtung: auch bei einer Website mit wenigen Sitzungen kann es bei Betrachtung eines längeren Zeitraums zur Stichprobenerhebung kommen.

Was kann ich gegen Data Sampling unternehmen?

Data Sampling ist nichts schlechtes. Aber unter Umständen braucht man akkuratere Daten, auf die man sich (halbwegs) verlassen kann. Es gibt Mittel und Wege das Data Sampling in Google Analytics zu umgehen.

Oftmals ist es möglich, die gewünschten Kennzahlen auf alternative Weise zu rekonstruieren, ohne dass eine Stichprobenerhebung erfolgt. Das bedeutet in erster Linie die Vermeidung von Segmenten und Sekundär Dimensionen.

Eine weitere Möglichkeit, Probleme im Zusammenhang mit Data Sampling zu vermeiden, ist das Google Analytics Spreadsheet Add-On. Hiermit kann man eine große Anzahl kleinerer Berichte anfordern und diese dann in Google Sheets zusammenführen.
Wir bei keyperformance nutzen dieses Add-On regelmäßig, um Daten aus der Analytics API abzufragen.

Sollte diese Lösung nicht passen, könnte man auch einen Blick auf Google Analytics Premium werfen.
Eine der Vorteil von GA-Premium besteht darin, dass die Sampling Schwelle von 500.000 Sitzungen auf 10 Millionen erhöht wird. Das lässt sich Google aber auch gut bezahlen. In den meisten Fällen sollten die oben genannten Lösungen, aber mehr als ausreichend sein.

Zusammenfassung:

Data Sampling fällt unter die eher technischen Aspekte der Analytik, aber das Verständnis auf einer grundlegenden Ebene hilft bei der richtigen Interpretation von Google Analytics Daten.
Bei der Erstellung von Berichten für Kunden oder Vorgesetzte sollte man Google Analytics Sampling im Hinterkopf behalten um Fragen zu Diskrepanzen in Berichten recht leicht beantworten zu können.