Dirichletprosessit
Dirichletprosessit ovat Bayesian-nonparametrisen tilaston työkaluja, jotka määrittelevät priorijakauman satunnaiselle jakaumalle G, joka asuu avaruudessa Θ. Dirichletprosessi DP(α, H) koostuu kaksi parametriä: koncentration-parametri α > 0 ja perustaju Jakauma H, jonka mukaan uudet massat jaatuvat. DP on random probability measure, eli sen todellinen jakauma on arpoutunut näistä parametreistä.
Ydinsä mukaan DP on määritelty siten, että jokaiselle yksittäiselle epäjatküyhmälle A1, ..., Ak ⊂ Θ kattavalle osajoukolle on yhteinen
Dirichletprosessi on käytännössä a.s. diskreetti, eli näytteet G koostuvat massapisteistä θk ja massat πk. Yleisimmät representaatiot
Yksi keskeinen ominaisuus on ennustava kaava: seuraava havainto θn+1 saa olemassa olevien atomien massojen mukaan ja
Käyttökohteita ovat muun muassa DP-sekoitusmallit (DP–mixture), joissa DP prioroi jakauman yksikköjen jakaumia ja mahdollistaa joustavan klusterointimallin.