Home

Assoziationsregeln

Assoziationsregeln sind ein Verfahren des Data Mining, das Zusammenhänge zwischen Merkmalen oder Elementen in Transaktionsdaten beschreibt. Typisch werden sie aus Einkaufsdaten gewonnen, wobei Regelstrukturen der Form X -> Y aufeinanderfolgende oder gleichzeitige Vorkommen von Elementen dokumentieren.

Ein X bezeichnet den Antezedens der Regel, Y den Konsequenten. Wichtige Kennzahlen sind der Support, die Konfidenz

Zur Gewinnung werden häufige Itemsets mit Mindest-Support gesucht (Beispiele: Apriori, FP-Growth). Aus diesen Itemsets lassen sich

Anwendungen finden sich insbesondere in der Marktbasket-Analyse, beim Cross-Selling, im Layout von Regalen, in Empfehlungssystemen und

Begrenzungen umfassen eine potenziell hohe Anzahl an Regeln, Redundanz und spärliche Aussagen bei niedrigen Support-Werten. Regeln

Historisch führten die Arbeiten von Agrawal und Srikant in den 1990er Jahren die Methode in der Marktkorb-Analyse

und
der
Lift.
Der
Support
von
X
∪
Y
ist
der
Anteil
der
Transaktionen,
in
denen
sowohl
X
als
auch
Y
auftreten;
die
Konfidenz
ist
P(Y|X)
=
Support(X
∪
Y)
/
Support(X);
der
Lift
ist
Konfidenz
geteilt
durch
den
Anteil
von
Y
in
der
Gesamtheit
der
Transaktionen.
Höhere
Werte
deuten
auf
stärkere
Assoziationen
hin;
Lift
>
1
spricht
für
positive
Abhängigkeit.
mit
ausreichender
Konfidenz
Regeln
ableiten,
etwa
X
->
Y
mit
Konfidenz
≥
Min-Konfidenz.
Die
Wahl
von
Schwellenwerten
beeinflusst
die
Zahl
und
Relevanz
der
Regeln.
in
der
Web-
oder
Nutzungsanalyse.
Über
die
reine
Statistik
hinaus
werden
Regeln
oft
interpretiert,
um
Geschäftsprozesse
zu
optimieren.
zeigen
Korrelation,
nicht
Kausalität,
und
können
durch
Bias
oder
unvollständige
Daten
verzerrt
sein.
Daher
ist
eine
zusätzliche
Bewertung
mit
weiteren
interessierten
Kennzahlen
und
Domänenwissen
sinnvoll.
ein;
seitdem
wurden
Algorithmen
wie
Apriori
und
FP-Growth
entwickelt.