Wissenschaftler veröffentlichen gesammelte Daten von 70.000 OkCupid-Mitgliedern

Sie enthalten Angaben zu sexuellen Neigungen und Präferenzen. Experten glauben, dass sich viele davon problemlos Realnamen zuordnen lassen. Die Daten sind bei OkCupid öffentlich einsehbar - wenn auch jeweils nur isoliert. Das Portal beklagt einen Verstoß gegen seine Nutzungsbedingungen.

Dänische Wissenschaftler haben Daten von rund 70.000 Mitgliedern der Partnerbörse OkCupid veröffentlicht. Sie enthalten neben dem Nutzernamen auch Angaben zur sexuellen Orientierung und Vorlieben. Die beiden Forscher wollen sie damit „in nützlicher Form“ für die Wissenschaft zugänglich machen. Ihr Vorgehen wird jedoch weithin in Frage gestellt, verbunden mit einer Forderung nach Ethikregeln für die Wissenschaft.

OkCupid präsentiert sich datenorientiert (Screenshot: ZDNet.de).Die Daten wurden zwischen November 2014 und März 2015 von zufälligen Konten mit einem Scraper-Programm zusammengetragen. Bei OKCupid sind sie öffentlich einsehbar – aber für nicht eingeloggte Nutzer jeweils nur in einer Auswahl. Eingeloggte Anwender dagegen können alle Antworten sehen, die der jeweilige Nutzer auf einen Fragenkatalog von OKCupid gegeben hat – etwa zu Drogeneinnahme, Fesselung und bevorzugten romantischen Situationen.

Die gesammelten Daten legen nun Emil Kirkegaard von der Universität Aarhus und Julius Bjerrekær von der Universität Aalborg im Rahmen eines Forschungsberichts mit dem Titel „The OKCupid dataset: A very large public dataset of dating site users“ vor. Sie räumen ein, dass es möglich sein kann, die Identität einzelner Anwender durch Analyse dieser Daten zu ermitteln. Auch konstatieren sie schon eingangs, dass es ethische Einwände gegen die Veröffentlichung geben könnte. Allerdings seien alle enthaltenen Daten ohnehin öffentlich zugänglich gewesen.

ANZEIGE

Interview mit Samsungs SSD-Spezialist Marcel Binder

Im Interview mit ZDNet erläutert Marcel Binder, Technical Product Manager Marketing bei Samsung, die Vorteile durch den Einsatz von SSDs. Dabei geht er auch auf aktuelle Schnittstellen, Speicherdichten sowie Samsung V-NAND-Technik ein.

Scott Weingart von der US-Universität Carnegie Mellon geht in einer auf Twitter geäußerten Kritik an der Veröffentlichung deutlich weiter: Er behauptet, er könne die Daten von mindestens 10.000 OkCupid-Nutzern mit Realnamen abgleichen und dabei mehr als 90 Prozent Trefferquote erreichen. Außerdem weist er in einem seiner zahlreichen Tweets zum Thema darauf hin, dass der Scraper (dessen Quelltext vorliegt) bei OkCupid eingeloggt war. Unklar ist, ob er auf nicht öffentliche Daten zugegriffen hat.

OkCupid sagte gegenüber Motherboard, die Veröffentlichung sei ein Verstoß gegen seine Nutzungsbedingungen. Vom juristischen Standpunkt aus könnten sie dagegen legal sein, wenn sich die gesammelten Daten auf öffentlich verfügbare beschränken.

Die Universität Aarhus hat sich (ebenfalls auf Twitter) von der Veröffentlichung ihres Studenten distanziert. Auch Kirkegaard selbst habe erklärt, seine Forschungsarbeit sei privater Natur. Die Universität will sich weiter mit dem Fall befassen.

Ein Interview mit Motherboard lehnte Kirkegaard ab, bis sich „der Staub etwas gelegt“ habe. Er versah den Datensatz auch mit einem Passwortschutz. Forscher anderer Einrichtungen, die das Material analysieren wollten, können bei ihm den Schlüssel beantragen. Allerdings scheinen ältere, nicht geschützte Versionen der Datei weiter zugänglich.

[mit material von Charlie Osborne, ZDNet.com]

Tipp: Wie gut kennen Sie Soziale Netzwerke? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Neueste Kommentare 

Noch keine Kommentare zu Wissenschaftler veröffentlichen gesammelte Daten von 70.000 OkCupid-Mitgliedern

Kommentar hinzufügen

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *