Home

multinomiallogistische

Die multinomiale logistische Regression (multinomiale Logit-Regression) ist ein statistisches Modell zur Zuordnung einer kategorialen Zielgröße Y mit mehr als zwei nicht ordinalen Kategorien zu Prädiktoren X. Ziel ist es, die Wahrscheinlichkeiten P(Y=k|X) für alle Kategorien k = 1,…,K zu schätzen.

Das Modell basiert auf der Idee, die Log-Wahrscheinlichkeiten relativ zu einer Referenzkategorie linear in den Prädiktoren

Die Schätzung erfolgt durch Maximum-Likelihood-Schätzung. Modelle werden häufig mit Wald- oder Likelihood-Ratio-Tests geprüft; Gütemaße wie Log-Likelihood,

Wesentliche Annahmen sind die Unabhängigkeit der Irrelevanten Alternativen (IIA); bei Verstößen können Nested- oder Mixed-Logit-Modelle sinnvoll

zu
modellieren.
Typischerweise
wird
eine
Basis-Kategorie
K
festgelegt.
Für
k
=
1,…,K−1
gilt:
P(Y=k|X)
=
exp(Xβ_k)
/
(1
+
Σ_{l=1}^{K−1}
exp(Xβ_l)),
und
P(Y=K|X)
=
1
/
(1
+
Σ_{l=1}^{K−1}
exp(Xβ_l)).
Die
Parameter
β_k
werden
so
bestimmt,
dass
die
Modellwahrscheinlichkeiten
für
alle
Kategorien
addieren
und
zu
1
summieren.
β_k_j
interpretiert
man
als
Veränderung
der
log-Wahrscheinlichkeit
von
Kategorie
k
gegenüber
der
Referenzkategorie
pro
Einheit
des
Prädiktors
j;
exponentierte
Koeffizienten
β_k_j
ergeben
relative
Risikoverhältnisse
(oder
Odds
Ratios)
relativ
zur
Referenzkategorie.
AIC/BIC
und
pseudo-R^2
(z.
B.
McFadden)
dienen
der
Modellbewertung.
Anwendungsbereiche
sind
Klassifikation
mit
mehr
als
zwei
Outcomes,
z.
B.
Wahlabsicht,
Produktauswahl
oder
Krankheitskategorien.
sein.
Die
multinomiale
logistische
Regression
ist
flexibel
und
erfordert
keine
ordinale
Annahme,
doch
steigt
mit
der
Zahl
der
Kategorien
die
Komplexität
und
der
Datenbedarf.