Sekamalleja
Sekamalleja, eli sekamallit, ovat tilastollisia malleja, joissa dataa tulkitaan siten, että havaintoja pidetään peräisin useamman jakauman sekoituksesta. Jokaisella komponentilla on oma jakaumansa ja sekoitusprosenttinsa, jotka kuvaavat sitä, kuinka todennäköistä on, että jokainen havainto kuuluu kyseiseen komponenttiin. Sekamallit mahdollistavat tietojen tiivistämisen ja erottelun erilaisten alijoukkojen ominaisuuksien perusteella ilman, että ryhmät ovat ennalta tunnistettavissa.
Kokonaisuus sisältää latenttivariaatien eli komponenttien identiteetin, jota ei havaita suoraan. Jokaisella havainnoilla on piilotettu merkkaaja, jonka
Yleisessä muodossa yleisin esimerkki on Gaussian sekamalli, jossa jokainen komponentti on normaalijakauma, mutta sekamalleja voidaan käyttää
Estimointi tapahtuu tavallisesti maksim likelihoodin periaatteella, useimmiten EM-algoritmilla (Expectation-Maximization), joka iteratiivisesti arvioi piilotettujen tunnusten odotukset ja
Sovelluksia ovat klusterointi, tiheysennuste, poikkeavuuksien havaitseminen sekä yleinen tilastollinen mallintaminen. Haasteisiin kuuluu identifioitavuusongelmat (merkintöjen vaihtelu), herkkyys