• Schalter wissen.de
  • Schalter wissenschaft
  • Schalter scinexx
  • Schalter scienceblogs
  • Schalter damals
  • Schalter natur
Scinexx-Logo
Logo Fachmedien und Mittelstand
Scinexx-Claim
Facebook-Claim
Google+ Logo
Twitter-Logo
YouTube-Logo
Feedburner Logo
Samstag, 01.10.2016
Hintergrund Farbverlauf Facebook-Leiste Facebook-Leiste Facebook-Leiste
Scinexx-Logo Facebook-Leiste

Kreditkarten-Daten: Von wegen anonym

Auch anonymisierte Datensätze von Transaktionen lassen sich leicht zuordnen

Wer mit der Kreditkarte einkauft, gibt mehr von sich preis als er glaubt: Selbst aus anonymisierten Daten von gut einer Million Kartennutzern ist es Forschern gelungen, Individuen zu identifizieren und ihre Einkäufe zuzuordnen. Schon vier Informationen zu Zeit und Ort reichten aus, um 90 Prozent der Nutzer zuzuordnen. Solche anonymisierten Finanzdaten werden von Forschung und Unternehmen genutzt - für einen echten Datenschutz müsse daher dringend mehr getan werden, konstatieren die Forscher im Fachmagazin "Science".
Auch anonymisierte Kreditkarten-Daten lassen sich zuordnen

Auch anonymisierte Kreditkarten-Daten lassen sich zuordnen

Wir hinterlassen heute bei fast allem, was wir tun, eine digitale Spur: Smartphones, Autos oder Kreditkarten liefern Daten darüber, wo wir sind, mit wem wir kommunizieren oder was wir ausgeben. Einerseits ist das eine große Chance: Big Data, die statistische Auswertung großer Datenmengen, gilt heute immerhin als eine der wichtigsten Helfer der Forschung. Andererseits aber gefährden diese Datenspuren auch unsere Privatsphäre, sie machen und "gläsern" auch da, wo wir es nicht wollen.

Wie anonym sind die Daten wirklich?


"Gerade finanzielle Metadaten haben großes Potenzial, sind aber auch extrem persönlich und hochsensibel", erklären Yves-Alexandre de Montjoye vom Massachusetts Institute of Technology (MIT) und seine Kollegen. Um Missbrauch zu verhindern, werden diese Daten daher anonymisiert gespeichert. Bei Kreditkarten-Transaktionen werden beispielsweise Namen, Kontonummern oder andere offensichtliche Anhaltspunkte entfernt.

Übrig bleibt eine abstrakte User-ID, eine Zeit, eine Geldsumme und der Laden oder Ort, an dem wir die Kreditkarte genutzt haben. Sammlungen solcher einfach anonymisierter Kreditdaten sind für Forscher und auch Unternehmen zugänglich. Aber wie sicher sind sie? Genau diese Frage haben de Montjoye und seine Kollegen geprüft.


Zwei Infos – ein Treffer


Für ihre Studie nutzten sie eine Sammlung von Kreditkartendaten von 1,1 Millionen Nutzern, die innerhalb von drei Monaten in rund 10.000 Läden eingekauft hatten. Die große Frage war: Ist es möglich, einzelne Nutzer in diesem Datensatz zu identifizieren, wenn ich ein Minimum an Zusatzinformationen besitze? An einem konkreten Beispiel erklärt: Wir suchen nach einer Person, über die wir nur zwei Dinge wissen: Er ging am 23. September zum Bäcker und am 24. September in ein bestimmtes Restaurant.

"Wenn wir nun die Kreditkartendaten durchsuchen, dann gibt es im gesamten Datensatz nur eine Person, auf die dies zutrifft", erklären die Forscher. Damit aber ist die Person ihrer User-ID zugeordnet, die Anonymität ist verloren. "Wir kennen nun auch alle anderen seiner Transaktionen, beispielsweise dass er am gleichen Tag auch Schuhe und Lebensmittel einkaufte und wie viel er dafür ausgegeben hat", so die Forscher.

Vier Angaben reichen aus


Ihre Tests zeigten, dass nur vier solcher Zeit-Ort-Angaben ausreichen, um 90 Prozent aller Personen in einer anonymisierten Kreditdaten-Sammlung zu identifizieren. Und selbst wenn die Angaben weniger spezifisch sind, lassen sich Einzelpersonen zuordnen: Hat man nur eine Straße statt eines Ladens und eine Zeitspanne von einer Woche statt eines Tages, dann benötigt man zwar ein paar mehr solcher Zeit-Ort-Angaben, identifizieren kann man den Nutzer aber dennoch ohne große Probleme, wie die Forscher berichten.

"Unsere Ergebnisse zeigen, dass der Schutz der personenbezogenen Daten, wie in den USA und der EU angewendet, nicht ausreicht, um die Daten Einzelner zu schützen", konstatieren de Montjoye und seine Kollegen. Nach diesem sind zwar direkte Informationen zur Identität wie Namen, E-Mail-Adressen oder Kreditkartennummern geschützt, nicht aber die restlichen finanziellen Metadaten.

Wenn Metadaten zugänglich gemacht werden, müssen nach Ansicht der Forscher dringend fortgeschrittenere Technologien zur Anonymisierung und zum Datenschutz eingesetzt werden. (Science, 2015; doi: 10.1126/science.1256297)
(Science, 30.01.2015 - NPO)
 
Printer IconShare Icon