Home

kAnonymität

k-Anonymität ist ein Datenschutzprinzip, das bei der Veröffentlichung personenbezogener Mikrodaten verwendet wird. Eine Datenmenge besitzt die Eigenschaft k-Anonymität, wenn jeder Datensatz in Bezug auf eine festgelegte Gruppe von Merkmalen, den Quasi-Identifikatoren, mit mindestens k-1 weiteren Datensätzen identisch ist. Typische Quasi-Identifikatoren sind Merkmale wie Alter, Postleitzahl oder Geschlecht; obwohl einzelne Merkmale allein möglicherweise nicht eindeutig sind, macht die Kombination dieser Merkmale eine Identifizierung unsicher, solange mindestens k Datensätze dieselbe Merkmalskombination teilen. Dadurch ist eine Person in dem Datensatz durch mindestens k-1 andere Personen nicht unterscheidbar.

Um k-Anonymität zu erreichen, kommen Techniken wie Generalisierung (einzelne Werte durch allgemeinere Bereiche ersetzen) und Suppression

K-Anonymität schützt vor identifikationsbasierten Angriffen, jedoch nicht vor Attribut-Disclosure. Insbesondere können homogene Gruppen oder Hintergrundwissen zu

Historisch wurde der Begriff in der Datenschutzforschung von Latanya Sweeney eingeführt (frühe 2000er Jahre). K-Anonymität wird

(Auslassen
oder
Verbergen
von
Werten)
zum
Einsatz.
Die
Daten
werden
in
Äquivalenzklassen
gruppiert,
sodass
jede
Klasse
mindestens
k
Datensätze
enthält.
Ziel
ist
es,
ein
Gleichgewicht
zwischen
Privatsphäre
und
Nutzbarkeit
der
Daten
zu
finden.
Verletzungen
führen,
sodass
zusätzliche
Ansätze
wie
L-Diversität
(vielfältige
sensible
Werte
in
jeder
Klasse)
oder
T-Closeness
vorgeschlagen
wurden,
um
das
Risiko
weiter
zu
minimieren.
heute
weiterhin
als
Grundlage
bei
der
Veröffentlichung
sensibler
Mikrodaten
genutzt
und
bildet
oft
die
Basis
weiterer
Privatsphäre-Modelle.