sekoitusmalleja
Sekoitusmallit ovat tilastollisia malleja, joissa havaintoja tulkitaan useamman kuin yhden taustajakauman sekoituksena. Jokainen havainto voi syntyä jostakin komponentista, mutta komponentin oikeaa kuuluvuusta ei tiedetä. Malli määritellään komponenttien painojen pi_k ja kunkin komponentin jakauman f_k(x | theta_k). Yhteinen tiheys on f(x) = sum_{k=1}^K pi_k f_k(x | theta_k), jossa pi_k ≥ 0 ja sum pi_k = 1.
Yleisin esimerkki on finite mixture of distributions, tyypillisesti sekoitus Gaussisia jakaumia, jolloin f_k(x | mu_k, Sigma_k) on
Estimointi ja tulkinta: parametreina ovat komponenttien painot pi_k ja kunkin komponentin parametrit theta_k. Estimointi suoritetaan usein
Mallin valinta ja rajoitteet: oikean komponenttien määrän K löytää informaatiokriteerien kuten BIC tai AIC avulla, ristiin
Laajennukset: finite-mallien lisäksi on infinite us, kuten Dirichlet-prosessin sekoitukset, sekä hierarkkiset tai regressiiviset sekoitusmallit, jotka laajentavat