Auch anonymisierte Datensätze von Transaktionen lassen sich leicht zuordnen Kreditkarten-Daten: Von wegen anonym - scinexx | Das Wissensmagazin
Anzeige
Anzeige

Auch anonymisierte Datensätze von Transaktionen lassen sich leicht zuordnen

Kreditkarten-Daten: Von wegen anonym

Auch anonymisierte Kreditkarten-Daten lassen sich zuordnen © thinkstock

Wer mit der Kreditkarte einkauft, gibt mehr von sich preis als er glaubt: Selbst aus anonymisierten Daten von gut einer Million Kartennutzern ist es Forschern gelungen, Individuen zu identifizieren und ihre Einkäufe zuzuordnen. Schon vier Informationen zu Zeit und Ort reichten aus, um 90 Prozent der Nutzer zuzuordnen. Solche anonymisierten Finanzdaten werden von Forschung und Unternehmen genutzt – für einen echten Datenschutz müsse daher dringend mehr getan werden, konstatieren die Forscher im Fachmagazin „Science“.

Wir hinterlassen heute bei fast allem, was wir tun, eine digitale Spur: Smartphones, Autos oder Kreditkarten liefern Daten darüber, wo wir sind, mit wem wir kommunizieren oder was wir ausgeben. Einerseits ist das eine große Chance: Big Data, die statistische Auswertung großer Datenmengen, gilt heute immerhin als eine der wichtigsten Helfer der Forschung. Andererseits aber gefährden diese Datenspuren auch unsere Privatsphäre, sie machen und „gläsern“ auch da, wo wir es nicht wollen.

Wie anonym sind die Daten wirklich?

„Gerade finanzielle Metadaten haben großes Potenzial, sind aber auch extrem persönlich und hochsensibel“, erklären Yves-Alexandre de Montjoye vom Massachusetts Institute of Technology (MIT) und seine Kollegen. Um Missbrauch zu verhindern, werden diese Daten daher anonymisiert gespeichert. Bei Kreditkarten-Transaktionen werden beispielsweise Namen, Kontonummern oder andere offensichtliche Anhaltspunkte entfernt.

Übrig bleibt eine abstrakte User-ID, eine Zeit, eine Geldsumme und der Laden oder Ort, an dem wir die Kreditkarte genutzt haben. Sammlungen solcher einfach anonymisierter Kreditdaten sind für Forscher und auch Unternehmen zugänglich. Aber wie sicher sind sie? Genau diese Frage haben de Montjoye und seine Kollegen geprüft.

Zwei Infos – ein Treffer

Für ihre Studie nutzten sie eine Sammlung von Kreditkartendaten von 1,1 Millionen Nutzern, die innerhalb von drei Monaten in rund 10.000 Läden eingekauft hatten. Die große Frage war: Ist es möglich, einzelne Nutzer in diesem Datensatz zu identifizieren, wenn ich ein Minimum an Zusatzinformationen besitze? An einem konkreten Beispiel erklärt: Wir suchen nach einer Person, über die wir nur zwei Dinge wissen: Er ging am 23. September zum Bäcker und am 24. September in ein bestimmtes Restaurant.

Anzeige

„Wenn wir nun die Kreditkartendaten durchsuchen, dann gibt es im gesamten Datensatz nur eine Person, auf die dies zutrifft“, erklären die Forscher. Damit aber ist die Person ihrer User-ID zugeordnet, die Anonymität ist verloren. „Wir kennen nun auch alle anderen seiner Transaktionen, beispielsweise dass er am gleichen Tag auch Schuhe und Lebensmittel einkaufte und wie viel er dafür ausgegeben hat“, so die Forscher.

Vier Angaben reichen aus

Ihre Tests zeigten, dass nur vier solcher Zeit-Ort-Angaben ausreichen, um 90 Prozent aller Personen in einer anonymisierten Kreditdaten-Sammlung zu identifizieren. Und selbst wenn die Angaben weniger spezifisch sind, lassen sich Einzelpersonen zuordnen: Hat man nur eine Straße statt eines Ladens und eine Zeitspanne von einer Woche statt eines Tages, dann benötigt man zwar ein paar mehr solcher Zeit-Ort-Angaben, identifizieren kann man den Nutzer aber dennoch ohne große Probleme, wie die Forscher berichten.

„Unsere Ergebnisse zeigen, dass der Schutz der personenbezogenen Daten, wie in den USA und der EU angewendet, nicht ausreicht, um die Daten Einzelner zu schützen“, konstatieren de Montjoye und seine Kollegen. Nach diesem sind zwar direkte Informationen zur Identität wie Namen, E-Mail-Adressen oder Kreditkartennummern geschützt, nicht aber die restlichen finanziellen Metadaten.

Wenn Metadaten zugänglich gemacht werden, müssen nach Ansicht der Forscher dringend fortgeschrittenere Technologien zur Anonymisierung und zum Datenschutz eingesetzt werden. (Science, 2015; doi: 10.1126/science.1256297)

(Science, 30.01.2015 – NPO)

Anzeige

In den Schlagzeilen

Diaschauen zum Thema

Dossiers zum Thema

CeBIT 2014 - Trends und Neuheiten in der Welt der IT

News des Tages

Tornado

Tornados widerlegen Theorie

Die geheime Sprache des Blinzelns

Ungewöhnliche Doppelstern-Geburt

Dinosaurier-Abdrücke mit Schuppen und Haut

Wichtiger Schritt zum Quanteninternet

Bücher zum Thema

Die berechnete Welt - Leben unter dem Einfluss von Algorithmen Von Nora S. Stampfl

Das Buch der Zahlen - Das Geheimnis der Zahlen und wie sie die Welt veränderten von Peter Bentley

50 Schlüsselideen Digitale Kultur - Tom Chatfield und Carl Freytag

Darf ich Zahlen? - Geschichten aus der Mathematik von Günter M. Ziegler

Top-Clicks der Woche

Anzeige
Anzeige