Browser-Add-on von Google sendet falsche persönliche Daten

Nur ein bestimmter Anteil der im Rahmen einer Untersuchung erhobenen Daten wird verfälscht. So sind keine Rückschlüsse auf Einzelpersonen möglich. Das Rauschen lässt sich aber mit steigender Teilnehmerzahl zunehmend eliminieren.

Google hat mit Rappor eine quelloffene Software vorgelegt, die via den Browser Chrome offenbarte persönliche Daten randomisiert, also statt der echten Daten zu einem gewissen Teil zufällig generierte übergibt. Wie Google-Manager Úlfar Erlingsson in einem Blogbeitrag berichtet, wird sie zu Forschungszwecken eingesetzt: Google sammelt so eine große Zahl an Daten zur Software-Nutzung von Freiwilligen, ohne auf die Einzelpersonen rückschließen zu können.

Google Chrome

Dank Rappor könne der Konzern „den Wald der Client-Daten untersuchen, ohne die Möglichkeit, einzelne Bäume zu begutachten“, heißt es in einem Schriftstück, das das Konzept erläutert. Konkret kam Rappor schon in einem Malware-Erforschungsprogramm zum Einsatz. Rund 14 Millionen Freiwillige nahmen daran teil. Gesammelt wurden vor allem die Homepage-Einstellungen, da es Google um Schadprogramme ging, die an dieser Einstellung Änderungen vornehmen.

Die Randomisierung der Daten auf dem Client-Rechner bezeichnen die Autoren als „starke Garantie für die Privatsphäre“. Weder Google selbst noch Hacker oder Überwachungsprogramme könnten leicht an die realen Angaben eines Individuums kommen.

Dahinter steht das Prinzip, einen bestimmten Prozentsatz der Daten zu verfälschen. Dadurch ermöglicht eine umfangreiche Stichprobe weiterhin sinnvolle statistische Aussagen. Je mehr Angaben eingehen, desto leichter ist das Rauschen auszufiltern. Betrachtet man aber einen einzelnen Teilnehmer, ist offen, ob seine Angabe der Wahrheit entspricht oder zufällig erzeugt wurde.

Je größer die Stichprobe, desto stärker lässt sich Rauschen durch zufällig generierte Antworten eliminieren (Grafik: Google).Je größer die Stichprobe, desto stärker lässt sich Rauschen durch zufällig generierte Antworten eliminieren (Grafik: Google).

Im Fall der Studie zu den Homepage-Einstellungen eliminierte Google das Rauschen, indem es nur Seiten berücksichtigte, die mindestens 14.000-mal genannt wurden. Diese Schwelle überschritten von 8616 genannten Webseiten nur etwa 0,5 Prozent, die aber 85 Prozent der Teilnehmer eingestellt hatten – und dabei konnte es sich dann nicht mehr um Zufall handeln.

Das Randomisierungsverfahren ist zwar seit Jahrzehnten bekannt, als Problem galt aber bisher, dass wiederholte Antworten einer Einzelperson letztlich doch die wahre Antwort offenbarten. Google hat diese Schwachstelle nach eigenen Angaben durch ein „elegantes“ Verfahren namens „memoization“ beseitigt. Dennoch lasse sich nicht ganz vermeiden, dass sich über längere Zeiträume bestimmte Muster zeigten, schreiben die Autoren von Rappor.

Da Rappor im Quelltext vorliegt, kann es auch in andere Programme integriert werden. Google fordert sogar ausdrücklich dazu auf: Es „gibt die Kontrolle über die Daten von Einzelpersonen zurück in deren Hände.“

[mit Material von Stephen Shankland, News.com]

Tipp: Wie gut kennen Sie Google? Testen Sie Ihr Wissen – mit dem Quiz auf silicon.de.

Themenseiten: Browser, Chrome, Google, Marktforschung, Privacy, Secure-IT

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

ZDNet für mobile Geräte
ZDNet-App für Android herunterladen Lesen Sie ZDNet-Artikel in Google Currents ZDNet-App für iOS

Artikel empfehlen:

Neueste Kommentare 

Noch keine Kommentare zu Browser-Add-on von Google sendet falsche persönliche Daten

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *