Segamudelid
Segamudelid on statistilised mudelid, mis kirjeldavad andmekogumit kui segu mitmest eristatavast komponendist. Iga tähelepanek X_i on genereeritud ühe komponendi all, mida tähistab latentne indikaator Z_i ∈ {1,...,K}. Komponentide seguga kirjeldatakse tihedusi f_k(x) ning kogu mudeli tihedus on f(x) = Σ_{k=1}^K π_k f_k(x), kus π_k on komponendi esinemise tõenäosus ja Σ π_k = 1.
Z_i määrab, milline komponent vastutab iga vaatluse eest, kuid see on märkimatu (latentne). Seetõttu on segamudeli
Segamudeli identifitseerimisega võib tekkida probleeme, eriti kui komponendid on sarnased või kui kategooriadi nimekirja (etikette) järjestus
Hindamine toimub peamiselt maksimaalse tõenäosuse või tema bayesi meetodite kaudu. Levinud lähenemised on EM-algoritm, mis täidab
Kõige levinumad näited on Gaussian Mixture Models, kuid segamudeleid kasutatakse laialdaselt tiheduste modelleerimises, klasterdamises, anomaalia tuvastamises,
Seotud mõisted hõlmavad latent set, EM-algoritm, Bayesian inference ja nonparametric mixtures.