Schätzungsweise die Hälfte aller kommerziellen Websites setzt Google Analytics ein. Genaue Zahlen zur Verbreitung und zur tatsächlichen Nutzung gibt es allerdings nicht. Mit der zunehmenden Verbreitung und vor dem Hintergrund der zahlreichen Missbrauchsfälle bei Datenerhebung und -nutzung im Internet steigt aber die Zahl der Menschen, die das Gratistool skeptisch sehen. Ausdruck dieser abwehrenden Haltung ist etwa die Kritik einiger Datenschutzbeauftragter oder der Verzicht des nordrhein-westfälischen Landtags auf Google Analytics.
Viele Internetnutzer sind daher verunsichert. Denn es mangelt an Informationen darüber, was für Daten über sie gesammelt werden und was mit diesen geschieht. Aber auch Websitebetreibern ist unklar, wie sie Statistikwerkzeuge richtig einsetzen. Dies rührt daher, dass die geltenden Gesetze nicht auf die aktuellen technischen Entwicklungen zugeschnitten sind und unterschiedlich interpretiert werden können.
Bis die Gesetze konkretisiert oder vor Gericht Präzedenzfälle entschieden werden, verbleiben Unklarheiten. ZDNet sprach mit Philipp Ebneter, Senior Project Manager beim Dienstleister Namics, und Matthias Ebneter, Rechtsanwalt bei Rentsch & Partner in Zürich, darüber, wie Website-Betreiber und Internetnutzer mit der Situation umgehen können.
ZDNet:Welche Daten sammelt Google?
Philipp Ebneter: Bei Google Analytics werden – genauso wie bei anderen Statistiktools auch – hauptsächlich Informationen zu Besucherverhalten, der technischen Ausstattung des Computers und über die Herkunft der Besucher ausgewertet. Dies geschieht meist auf einem hochaggregierten Level und vollkommen anonym, denn für viele Analysen sind nicht die einzelnen Besucher relevant, sondern generelle Nutzungsmuster.
ZDNet: Und wie werden die Daten erfasst?
Philipp Ebneter: Dies geschieht im Fall von sogenannten „client-basierten“ Systemen (zu denen auch Google Analytics gehört) durch einen in die Website eingebetteten Code, der ohne Zutun des Besuchers automatisch ausgeführt wird. Er sorgt dafür, dass die Nutzungsdaten zu Google gesendet und anschließend vom Website-Betreiber ausgewertet werden können. Um die Aussagekraft der Auswertungen zu verbessern, versucht man, einen Besucher auch über zeitlich auseinanderliegende Besuche hinweg verfolgen zu können.
Der naheliegendste Weg wäre die Identifikation anhand der IP-Adresse. Da aber die meisten Besucher von Websites nicht über eine statische IP-Adresse verfügen und zum Beispiel Router mit NAT die Wiedererkennung eines Nutzers erschweren, versucht man, die Resultate mittels Cookies zu verbessern. Auf dem Computer des Besuchers wird also eine kleine Textdatei – im Falle von Google Analytics mit dem Namen „utma“ – mit einer Zufallsnummer abgelegt, anhand derer sich ein einzelner Besucher relativ gut von anderen unterscheiden und somit als wiederkehrender Besucher erkennen lässt.
ZDNet: Beim Aufruf einer Website schreiben doch nahezu alle Webserver ein Logfile, das sich auslesen und statistisch auswerten lässt. Wie unterscheidet sich Google Analytics davon?
Philipp Ebneter: Bei der klassischen Logfile-Analyse werden die Daten direkt auf dem Webserver gesammelt und bleiben in der Regel auch dort. Wird Google Analytics eingesetzt, werden die Daten auch an Google gesendet und dort weiterbearbeitet. Zusätzlich setzt Google Analytics die eben erwähnte Identifizierung mittels Cookie ein, um wiederkehrende Besucher leichter zu erkennen.
Weil extrem viele Websites Google Analytics verwenden, laufen bei Google große Mengen an Nutzungsdaten zusammen. Würde Google die Daten all dieser verschiedenen Websites verknüpfen, könnten sie einen Besucher über mehrere Websites – die Google Analytics verwenden – verfolgen und somit eine Art „anonymes Nutzerprofil“ erstellen. Nutzt ein Besucher zusätzlich personalisierte Dienste von Google, für die sein Name und weitere Daten erfasst werden, verfügt Google über sehr viele Datenbestandteile, um theoretisch die Anonymität des Nutzerprofils aufzuheben und das Profil einem konkreten Nutzer zuzuordnen.
OutSystems-Studie: 62 Prozent der Befragten haben Sicherheits- und Governance-Bedenken bei Softwareentwicklung mit KI-Unterstützung.
Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…
Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…
Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.
Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…
Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…