Google hat mit Rappor eine quelloffene Software vorgelegt, die via den Browser Chrome offenbarte persönliche Daten randomisiert, also statt der echten Daten zu einem gewissen Teil zufällig generierte übergibt. Wie Google-Manager Úlfar Erlingsson in einem Blogbeitrag berichtet, wird sie zu Forschungszwecken eingesetzt: Google sammelt so eine große Zahl an Daten zur Software-Nutzung von Freiwilligen, ohne auf die Einzelpersonen rückschließen zu können.
Dank Rappor könne der Konzern „den Wald der Client-Daten untersuchen, ohne die Möglichkeit, einzelne Bäume zu begutachten“, heißt es in einem Schriftstück, das das Konzept erläutert. Konkret kam Rappor schon in einem Malware-Erforschungsprogramm zum Einsatz. Rund 14 Millionen Freiwillige nahmen daran teil. Gesammelt wurden vor allem die Homepage-Einstellungen, da es Google um Schadprogramme ging, die an dieser Einstellung Änderungen vornehmen.
Die Randomisierung der Daten auf dem Client-Rechner bezeichnen die Autoren als „starke Garantie für die Privatsphäre“. Weder Google selbst noch Hacker oder Überwachungsprogramme könnten leicht an die realen Angaben eines Individuums kommen.
Dahinter steht das Prinzip, einen bestimmten Prozentsatz der Daten zu verfälschen. Dadurch ermöglicht eine umfangreiche Stichprobe weiterhin sinnvolle statistische Aussagen. Je mehr Angaben eingehen, desto leichter ist das Rauschen auszufiltern. Betrachtet man aber einen einzelnen Teilnehmer, ist offen, ob seine Angabe der Wahrheit entspricht oder zufällig erzeugt wurde.
Im Fall der Studie zu den Homepage-Einstellungen eliminierte Google das Rauschen, indem es nur Seiten berücksichtigte, die mindestens 14.000-mal genannt wurden. Diese Schwelle überschritten von 8616 genannten Webseiten nur etwa 0,5 Prozent, die aber 85 Prozent der Teilnehmer eingestellt hatten – und dabei konnte es sich dann nicht mehr um Zufall handeln.
Das Randomisierungsverfahren ist zwar seit Jahrzehnten bekannt, als Problem galt aber bisher, dass wiederholte Antworten einer Einzelperson letztlich doch die wahre Antwort offenbarten. Google hat diese Schwachstelle nach eigenen Angaben durch ein „elegantes“ Verfahren namens „memoization“ beseitigt. Dennoch lasse sich nicht ganz vermeiden, dass sich über längere Zeiträume bestimmte Muster zeigten, schreiben die Autoren von Rappor.
Da Rappor im Quelltext vorliegt, kann es auch in andere Programme integriert werden. Google fordert sogar ausdrücklich dazu auf: Es „gibt die Kontrolle über die Daten von Einzelpersonen zurück in deren Hände.“
[mit Material von Stephen Shankland, News.com]
Tipp: Wie gut kennen Sie Google? Testen Sie Ihr Wissen – mit dem Quiz auf silicon.de.
Der Cybersecurity Report von Hornetsecurity stuft 2,3 Prozent der Inhalte gar als bösartig ein. Die…
Die Hintermänner haben es auf Zugangsdaten zu Microsoft Azure abgesehen. Die Kampagne ist bis mindestens…
Cloud-Plattform für elektronische Beschaffungsprozesse mit automatisierter Abwicklung elektronischer Rechnungen.
Mindestens eine Schwachstelle erlaubt eine Remotecodeausführung. Dem Entdecker zahlt Google eine besonders hohe Belohnung von…
Nur rund die Hälfte schaltet während der Feiertage komplett vom Job ab. Die anderen sind…
Security-Experten von Check Point sind einer neuen Angriffsart auf die Spur gekommen, die E-Mail-Schutzmaßnahmen umgehen…