Falsche Zugriffe durch Google Instant Preview in Analytics
Seit ein paar Wochen bietet Google eine Vorschau der Ergebnisseite in den Suchergebnissen. Um diese Vorschau zu erstellen, surft ein Google Bot die Seite ab und speichert die gerenderte Seite. Dieser Bot ist so gut, dass er sogar JavaScript (Tracking)codes auslöst – und damit die Zugriffsdaten verfälscht.. Es ist nicht klar, wann der Bot kommt, letztlich wird aber wohl jede Seite, die in einem Google Suchergebnis auftauchen kann, früher oder später vom Bot Besuch bekommen.
Der überträgt als Agentstring
Mozilla/5.0 (en-us) AppleWebKit/525.13 (KHTML, like Gecko; Google Web Preview) Version/3.1 Safari/525.13
womit man in Google Analytics nicht so viel anfangen kann, da dort nur Browser, Betriebssystem und Version ausgewiesen werden, nicht aber der komplette Agentstring (jedenfalls in keinem Standard Report).
Man kann den Bot ganz gut am Netzwerkprovider erkennen: dort wird Google Inc. ausgewiesen. Außerdem zeichnen sich die Visits durch eine hohe Abbruchrate aus. In den Reports, in denen ich nachschauen konnte, halten sich die Zugriffe über den Bot in Grenzen, dennoch sind sie nicht “echt” und sollten somit gefiltert werden.
Google ist das Problem heute angegangen und filtert die Views durch Instant Preview bei Analytics direkt selber raus. Wenn man die Zugriffe der letzten Wochen über Google Inc. betrachtet, bekommt man einen ganz guten Eindruck, wieviele Zugriffe dadurch entstanden. Am einfachsten erstellt man dafür ein Benutzerdefiniertes Segment, eine Anleitung findet sich bei WebShare.
Die Zahl der Aufrufe hielt sich bislang in Grenzen, allerdings muss das ja nicht so bleiben. Keine Ahnung, ob und wie schnell andere Trackinganbieter bereits reagiert haben. Bei einigen Tools kann man entsprechende Filter selber definieren, häufig aber kann man auf so tiefer Ebene nicht ins System eingreifen.
Alternativ zum Filter kann man den Trackingcodeaufruf in eine JavaScript- oder z.B. PHP-Abfrage des Agents packen – diese ruft den Trackingcode nur auf, wenn der Agent eben nicht der Google Preview ist. Hier ein Beispiel (ebenfalls von WebShare):
<?php $uAgent=$_SERVER['HTTP_USER_AGENT'];
$googlePrev=true;
if(strpos($uAgent,"Google Web Preview")>0){
$googlePrev=false;
}
?>
...
<?php if($googlePrev){ ?>
<script type="text/javascript">
var pageTracker = _gat._getTracker("UA-1111111-1");
pageTracker._trackPageview();
</script>
<?php } ?>
Das Thema “Datensauberkeit” muss man also nach wie vor im Auge haben, auch wenn mit JavaScript-Tags der größte Teil Bot-Zugriffe bereits ausgeschlossen ist. Der Facebook-Likeme Button war/ist ein Beispiel für solche fälschlich generierten Zugriffe.
Tauchte das Problem nur bei Google auf oder auch bei anderen Analytics Lösungen? Kennt ihr ähnliche Fälle oder Probleme?


Letzte Kommentare