blandningsmodeller
Blandningsmodeller är probabilistiska modeller som används för att beskriva data som kommer från flera underpopulationer eller komponenter. En blandning representeras som en viktad summa av komponentfördelningar, där varje komponent har sin egen fördelning och varje observation antas uppkomma från en viss komponent med en viss sannolikhet. Den generella formen är f(x) = sum_k pi_k f_k(x), där pi_k är blandningsvikten (summa över k av pi_k = 1) och f_k(x) är komponentens fördelning.
Modellens kärna är latent variabel, ofta betecknad Z, som indikeras vilken komponent som genererade varje observation.
Vanliga tillvägagångssätt för parameteruppskattning är maximum likelihood via EM-algoritmen, där E-steget beräknar ansvarigheter och M-steget uppdaterar
Väljs antal komponenter K kan göras genom modellurval med information kriterier som BIC eller AIC, eller via
Användningar omfattar klustring, densitetsestimering, anomalidetektion, signalbehandling och biostatistik. Blandningsmodeller utgör också grund för vidare konstruktioner som