Categories: Sicherheit

Wissenschaftler veröffentlichen gesammelte Daten von 70.000 OkCupid-Mitgliedern

Dänische Wissenschaftler haben Daten von rund 70.000 Mitgliedern der Partnerbörse OkCupid veröffentlicht. Sie enthalten neben dem Nutzernamen auch Angaben zur sexuellen Orientierung und Vorlieben. Die beiden Forscher wollen sie damit „in nützlicher Form“ für die Wissenschaft zugänglich machen. Ihr Vorgehen wird jedoch weithin in Frage gestellt, verbunden mit einer Forderung nach Ethikregeln für die Wissenschaft.

Die Daten wurden zwischen November 2014 und März 2015 von zufälligen Konten mit einem Scraper-Programm zusammengetragen. Bei OKCupid sind sie öffentlich einsehbar – aber für nicht eingeloggte Nutzer jeweils nur in einer Auswahl. Eingeloggte Anwender dagegen können alle Antworten sehen, die der jeweilige Nutzer auf einen Fragenkatalog von OKCupid gegeben hat – etwa zu Drogeneinnahme, Fesselung und bevorzugten romantischen Situationen.

Die gesammelten Daten legen nun Emil Kirkegaard von der Universität Aarhus und Julius Bjerrekær von der Universität Aalborg im Rahmen eines Forschungsberichts mit dem Titel „The OKCupid dataset: A very large public dataset of dating site users“ vor. Sie räumen ein, dass es möglich sein kann, die Identität einzelner Anwender durch Analyse dieser Daten zu ermitteln. Auch konstatieren sie schon eingangs, dass es ethische Einwände gegen die Veröffentlichung geben könnte. Allerdings seien alle enthaltenen Daten ohnehin öffentlich zugänglich gewesen.

ANZEIGE

Interview mit Samsungs SSD-Spezialist Marcel Binder

Im Interview mit ZDNet erläutert Marcel Binder, Technical Product Manager Marketing bei Samsung, die Vorteile durch den Einsatz von SSDs. Dabei geht er auch auf aktuelle Schnittstellen, Speicherdichten sowie Samsung V-NAND-Technik ein.

Scott Weingart von der US-Universität Carnegie Mellon geht in einer auf Twitter geäußerten Kritik an der Veröffentlichung deutlich weiter: Er behauptet, er könne die Daten von mindestens 10.000 OkCupid-Nutzern mit Realnamen abgleichen und dabei mehr als 90 Prozent Trefferquote erreichen. Außerdem weist er in einem seiner zahlreichen Tweets zum Thema darauf hin, dass der Scraper (dessen Quelltext vorliegt) bei OkCupid eingeloggt war. Unklar ist, ob er auf nicht öffentliche Daten zugegriffen hat.

OkCupid sagte gegenüber Motherboard, die Veröffentlichung sei ein Verstoß gegen seine Nutzungsbedingungen. Vom juristischen Standpunkt aus könnten sie dagegen legal sein, wenn sich die gesammelten Daten auf öffentlich verfügbare beschränken.

Die Universität Aarhus hat sich (ebenfalls auf Twitter) von der Veröffentlichung ihres Studenten distanziert. Auch Kirkegaard selbst habe erklärt, seine Forschungsarbeit sei privater Natur. Die Universität will sich weiter mit dem Fall befassen.

Ein Interview mit Motherboard lehnte Kirkegaard ab, bis sich „der Staub etwas gelegt“ habe. Er versah den Datensatz auch mit einem Passwortschutz. Forscher anderer Einrichtungen, die das Material analysieren wollten, können bei ihm den Schlüssel beantragen. Allerdings scheinen ältere, nicht geschützte Versionen der Datei weiter zugänglich.

[mit material von Charlie Osborne, ZDNet.com]

Tipp: Wie gut kennen Sie Soziale Netzwerke? Überprüfen Sie Ihr Wissen – mit 15 Fragen auf silicon.de.

Florian Kalenda

Seit dem Palm Vx mit Klapp-Tastatur war Florian mit keinem elektronischen Gerät mehr vollkommen zufrieden. Er nutzt derzeit privat Android, Blackberry, iOS, Ubuntu und Windows 7. Die Themen Internetpolitik und China interessieren ihn besonders.

Recent Posts

Konsolidierte und strukturierte Daten für medizinische Versorgung

Telekom und vitagroup stellen Kliniken offene Plattform zur Verfügung, die Gesundheitsdaten unabhängig von einzelnen Herstellern…

21 Stunden ago

Zahl der Webauftritte sinkt wieder

Auch 2023 war kein gutes Jahr für die Hoster von KMU-Webseiten. Erneut schlossen viele Mittelständler…

22 Stunden ago

Pwn2Own: Google verteilt Sicherheitsupdate für Chrome

Es schließt zwei schwerwiegende Lücken, die eine Remotecodeausführung erlauben. Darüber hinaus stopft Google ein kritisches…

2 Tagen ago

IT-Verzicht fürs Klima – wie viele sind dazu bereit?

Der Digitalverband Bitkom hat 1.000 Deutsche danach befragt, auf welche Angebote sie aus Gründen des…

2 Tagen ago

BSI warnt Microsoft-Exchange-Nutzer

Laut Bundesamt sind mindestens 17.000 Instanzen in Deutschland durch eine oder mehrere kritische Schwachstellen verwundbar.

2 Tagen ago

Apple kündigt Entwicklerkonferenz WWDC 2024 für 10. Juni an

Die Veranstaltung startet wie in jedem Jahr mit einer Keynote. Apple verspricht Neuerungen für alle…

2 Tagen ago