GMMHMMmodellen - Infinite Lexicon - Infinite Lexicon

GMMHMMmodellen

GMMHMMmodellen är en statistisk modell som används inom automatiskt taligenkännande. Den kombinerar Gaussian Mixture Models (GMM) för att beskriva akustikens kontinuerliga observationer och Hidden Markov Models (HMM) för tidsmässig struktur.

HMM består av tillstånd som representerar fonem eller subfonetiska enheter; varje tillstånd har en emission distribution

Träning sker vanligtvis med maximal sannolikhet genom Baum-Welch-algoritmen (en form av expectation-maximization) för att uppskatta övergångsprobabiliteterna

Historiskt spelade GMMHMMmodellen en dominerande roll inom taligenkänning från slutet av 1980-talet fram till början av

Begränsningar i GMMHMM-modellen inkluderar begränsningar i att fånga långa beroenden och akustiska variationer, beräkningskomplexitet samt risk

feature-värden.

i

Viterbi-algoritmen

stato-sekvensen

observationerna.

kontextberoende

triphone-tillstånd.

i

transformeringstekniker

parameteröverföringar.

Programvaruverktyg

GMM-HMM-modeller.

överanpassning.

DNN-HMM-modeller

i

tillämpningar,