Mischungsmodell
Mischungsmodell ist in der Statistik ein probabilistisches Modell, das davon ausgeht, dass die beobachteten Daten aus einer Mischung mehrerer Teilverteilungen stammen. Ein endliches Mischungsmodell mit K Komponenten hat f(x) = sum_{k=1}^K pi_k f_k(x), mit pi_k > 0 und sum_k pi_k = 1; f_k(x) ist die Dichte der k-ten Komponente. Die Komponenten können unterschiedliche Verteilungen haben.
Typisch wird ein latentes Variablenmodell verwendet: Eine Beobachtung gehört mit einer gewissen Wahrscheinlichkeit einer Komponente k
Parameter werden meist mittels Maximum Likelihood geschätzt. Der Standardalgorithmus ist EM (Expectation-Maximization): E-Schritt berechnet Verantwortlichkeiten gamma_{nk}
Varianten umfassen finite und unendliche Mischungen. Unendliche Mischungen verwenden Bayes-Verfahren (z. B. Dirichlet-Process-Mischmodelle) und passen die
Anwendungen finden sich in Clustering, Dichteschätzung, Mustererkennung, Bildverarbeitung, Genomik und Finanzwesen. Vorteile sind Flexibilität und Subpopulationen-Interpretierbarkeit;