DIGITALE KONZEPTE
MIT MEHR WERT.

DIGITALE KONZEPTE MIT MEHR WERT.

Spam in Google Analytics herausfiltern

03.09.2015 in DeutschOnline-Marketing  von Katrin Mathis

In fast allen Google Analytics Konten verfälscht Spam seit einigen Monaten die Daten. Im letzten Beitrag habe ich Ihnen gezeigt, welche Arten von Spam auftreten und wie Sie Spam erkennen. Falls Sie Spam in Google Analytics entdeckt haben, ist das kein Grund zur Panik. In diesem Beitrag zeige ich Ihnen, wie Sie unerwünschte Zugriffe herausfiltern und so falsche Schlüsse aufgrund verzerrter Daten vermeiden.

 

Die unterschiedlichen Arten von Spam lassen sich durch drei Filter greifen:

  • Ein Filter, der unerwünschte Kampagnenquellen ausschließt, hilft gegen Referrer Spam, Kampagnen Spam und Event Spam
  • Ein Filter, der nur gültige Hostnamen einschließt, hilft auch langfristig gegen Ghost Spam in Form von Direct Spam und Organic Spam
  • Ein Filter, der unerwünschte Keywords ausschließt, hilft zusätzlich gegenOrganic Spam, der eigentlich gültige Hostnamen missbraucht

Segment für bestehende Daten

Bereits in wenigen Minuten erstellen Sie ein erweitertes Segment, um Spam aus bestehenden Google Analytics Daten herauszufiltern.

 

Noch schneller geht es, wenn Sie sich meine Filtereinstellungen herunterladen (Update: 13.05.2016). Mit einem Klick übernehmen Sie die Konfiguration für ein erweitertes Segment gegen Spam in Ihr Google Analytics Konto. Sie brauchen lediglich noch Ihre Domain und weitere gültige Hostnamen einzufügen.

 

Segment herunterladen

Unerwünschte Kampagnenquellen ausschließen

Erstellen Sie ein neues erweitertes Segment. Filtern Sie damit die Sitzungen nach Quelle stimmt nicht mit regulärem Ausdruck überein und listen Sie alle Quellen, die Sie als Spam erkannt haben. Trennen Sie die einzelnen Domains mit einem |, das steht in regulären Ausdrücken für ein "oder." Zusätzlich müssen Sie die Punkte in den Domains mit einem \ maskieren, denn diese haben in regulären Ausdrücken normalerweise eine andere Bedeutung.

Google Analytics Spam aus Besucherquellen herausfiltern

Um das Segment nicht bei jeder Spam-Quelle, die neu in meinen Berichten auftaucht, anpassen zu müssen, verwende ich eine ausführliche Liste bekannter Spam-Quellen.

Gültige Hostnamen einschließen

Da Direct Spam nur über den Hostnamen erkannt werden kann, ist ein zusätzlicher Filter nötig. Hier empfiehlt es sich, gültige Hostnamen einzuschließen, um weitere Anpassungen in Zukunft zu vermeiden. Ermitteln Sie zunächst die für Ihre Website gültigen Hostnamen. Schauen Sie sich dazu die Liste der Hostnamen unter Zielgruppe > Anbieter > Hostnamen an. Gültig sind alle Hostnamen, die Ihrer Domain entsprechen oder Drittanbieter, die Sie eingebunden haben. Darüber hinaus ist beispielsweise auch translate.googleusercontent.com gültig. Dieser Hostname wird gesetzt, wenn sich Benutzer Ihre Website mit Google Translate übersetzen lassen. Viele anderen Hostnamen, auch wenn Sie nach bekannten Seiten wie google.com klingen, sind Spam.

Gültige Hostnamen in Google Analytics ermitteln

Fügen Sie Ihrem erweiterten Segment eine neue Bedingung hinzu. Filtern Sie nach Hostname stimmt mit regulärem Ausdruck überein und listen Sie die vorher identifizierten gültigen Hostnamen wieder mit einem | als Trennstrich und einem \ vor den Punkten. Achten Sie darauf, dass der Filter auf Einschließen steht und testen Sie, ob nach Anwenden des Segments nur noch die gewünschten Hostnamen in der Liste auftauchen.

Google Analytics gültige Hostnamen einschließen gegen Spam

Unerwünschte Keywords ausschließen

Einige Spammer haben in der Zwischenzeit erkannt, dass viele Benutzer googleusercontent.com auf Ihre Whitelist der gültigen Hostnamen aufnehmen und nutzen dies als Hintertür für Spam. Beispielsweise taucht in den Berichten zu den organischen Keywords sexyali.com als Keyword mit Hostname translate.googleusercontent.com auf. Diese Form von Organic Spam unterbinden Sie, indem Sie zusätzlich unerwünschte Keywords herausfiltern. Filtern Sie nach Keywords stimmt nicht mit regulärem Ausdruck überein und listen Sie die Keywords, die Sie als Spam erkannt haben mit einem | als Trennzeichen.

Google Analytics Spam aus Keywords herausfiltern

Filter für zukünftige Daten

Nachteil der Segmente ist, dass diese jedes Mal aktiviert werden müssen. Dauerhaft herausfiltern lässt sich der Spam über Filter in der Datenansicht. Diese Filter wirken sich jedoch erst in der Zukunft und nicht rückwirkend auf die Daten aus.

 

Spam in Google Analytics herausfiltern

Da Filter die Daten dauerhaft verändern, sollten Sie unbedingt immer eine ungefilterte Datenansicht behalten. Legen Sie also zunächst in Verwalten > Datenansicht eine neue Datenansicht an. Übernehmen Sie die Filtereinstellungen aus dem erweiterten Segment in das Filtermuster.

 

Dort stoßen Sie schnell an eine Grenze: In den Filtern der Datenansicht sind nur maximal 255 Zeichen erlaubt. Es gibt verschiedene Möglichkeiten, damit umzugehen. Für mich persönlich besteht der schnellste und sicherste Weg darin, die Filterbedingungen auf mehrere Filter aufzuteilen.

Spam Filter in Google Analytics

Was nicht hilft

Das Problem ist so verbreitet, dass sich im Internet viele Anleitungen finden. Vertrauen Sie diesen nicht blind, denn nicht alle Maßnahmen sind tatsächlich wirksam und sinnvoll.

Spam serverseitig blockieren

Der sauberste Weg, unerwünschte Crawler von der eigenen Website fernzuhalten ist sicherlich, diese Zugriffe direkt serverseitig zu blockieren. Das geht beispielsweise über eine Konfigurationsdatei namens .htaccess auf dem Webserver. Damit kann man unerwünschten Domains den Aufruf der Website ganz verbieten oder Sie zu Ihrer eigenen Domain zurückleiten.

 

Doch das ist nur die halbe Miete. Bei Ghost Spam werden Seitenaufrufe direkt an zufällig ausgewählte Google Analytics Konten gesendet. Da bei diesen Sitzungen nie ein tatsächlicher Seitenaufruf stattgefunden hat, können diese auch nicht über den Server abgefangen werden.

Bots herausfiltern

Nicht alle Crawler sind schlecht. Viele sind nützlich und sorgen etwa dafür, dass Ihre Website in Suchmaschinen auffindbar ist. Daher sollte man diesen Zugriff auf die Website gewähren, die Zugriffe in Google Analytics aber herausfiltern. Das geht ganz einfach über Verwalten > Datenansicht > Einstellungen der Datenansicht mit einem Häkchen bei „Alle Treffer von bekannten Bots und Spidern ausschließen.“ Damit werden alle von Google berücksichtigen Bots und Spider ab diesem Zeitpunkt nicht mehr in Google Analytics angezeigt.

 

Doch das wirkt sich meiner Erfahrung nach leider nur minimal aus. Bis Google weiter reagiert, müssen Sie selbst aktiv werden und den Spam aus Ihren Berichten herausfiltern.

Verweise ausschließen

Manch einer kommt auf die Idee, unerwünschte Verweise über die Google Analytics Oberfläche auszuschließen. In Verwalten > Property > Tracking-Informationen > Verweis-Ausschlussliste findet sich die Möglichkeit, Domains aus Verweiszugriffen auszuschließen.

 

Doch Vorsicht: Verweise, die Sie hier eintragen, werden zukünftig als direkte Zugriffe gezählt, landen jedoch weiterhin in Ihren Berichten und verfälschen diese damit erst recht!

Fazit

Die gute Nachricht ist, dass Ihre Daten trotz Spam nicht dauerhaft verfälscht sind. Sie können Spam leicht herausfiltern und nur tatsächliche Zugriffe analysieren. Dazu empfehle ich Ihnen folgende Vorgehensweise in Google Analytics:

  • Filtern Sie bekannte Bots und Spider über die Einstellungen der Datenansicht heraus
  • Erstellen Sie ein erweitertes Segment mit Filter auf gültige Hostnamen sowie unerwünschte Kampagnenquellen und Keywords
  • Richten Sie eine neue Datenansicht ein und übernehmen Sie die Filtereinstellungen des Segments zusätzlich in dauerhafte Filter

 

Wenn Spam erst einmal in Ihren Berichten auftaucht, ist es bereits zu spät. Anpassungen der Filter wirken sich erst ab diesem Zeitpunkt auf die Datenansicht aus. Deshalb empfehle ich Ihnen, Filter und erweiterte Segmente immer gleichzeitig anzupassen. Sie müssen zwar daran denken, die erweiterten Segmente bei der Auswertung zu aktivieren, aber nur so erhalten Sie saubere Daten auch für zurückliegende Zeiträume.

 

Die schlechte Nachricht ist, dass ein einmaliges Einrichten der Filter und Segmente nicht ausreicht. Spam taucht aus immer neuen Quellen auf. Überprüfen Sie Ihr Konto regelmäßig und passen Sie Filter und Segmente wenn nötig an.

 

 

Wenn Sie sich unsicher sind, ob Ihr Google Analytics Konto von Spam betroffen ist und wie Sie die richtigen Filter dafür einrichten, sprechen Sie mich an. Ich analysiere Ihr Konto, richte korrekte Filter für Sie ein und aktualisiere die Filter auf Wunsch regelmäßig.

Kommentar(e)

Kommentieren





Zurück

Katrin Mathis, UX Konzepterin und Service Designerin aus Freiburg

Katrin Mathis
MBA in Service Innovation & Design und BSc in OnlineMedien berät seit über 10 Jahren Unternehmen, die digitale Transformation zum Nutzen ihrer Kunden einzusetzen.

 

Treffen Sie mich persönlich

  • 7. August macs Forum beim wvib
  • 31. August Eurobike, Friedrichshafen