GMMHMMmodellen
GMMHMMmodellen är en statistisk modell som används inom automatiskt taligenkännande. Den kombinerar Gaussian Mixture Models (GMM) för att beskriva akustikens kontinuerliga observationer och Hidden Markov Models (HMM) för tidsmässig struktur.
HMM består av tillstånd som representerar fonem eller subfonetiska enheter; varje tillstånd har en emission distribution
Träning sker vanligtvis med maximal sannolikhet genom Baum-Welch-algoritmen (en form av expectation-maximization) för att uppskatta övergångsprobabiliteterna
Historiskt spelade GMMHMMmodellen en dominerande roll inom taligenkänning från slutet av 1980-talet fram till början av
Begränsningar i GMMHMM-modellen inkluderar begränsningar i att fånga långa beroenden och akustiska variationer, beräkningskomplexitet samt risk