puheensegmentointia - Infinite Lexicon - Infinite Lexicon

puheensegmentointia

Puheensegmentointi on prosessi, jolla jatkuva puhe jaetaan pienempiin yksiköihin, kuten sanoihin, foneemeihin tai sylabeihin. Se on keskeinen etappi puheentunnistuksessa ja muissa puheentutkimuksen sovelluksissa, joissa halutaan löytää puhepaneelien alku- ja lopetuskohdat sekä projektien avulla jäsennellä puhuttu teksti.

Tasoja ja tavoitteita voidaan tarkastella eri tasoina. Yleisintä on sanamäärien rajojen määritys, eli sanojen rajojen havaitseminen

Menetelmät ovat kehittyneet perinteisistä tilastollisista malleista kohti end-to-end-neuroverkkoja. Varhaisissa järjestelmissä käytettiin piirteistettyjä akustisia malleja ja piilotettuja

Arviointi perustuu muun muassa boundary error rateen (BER), sanamärien virherajaan (WER) sekä foneemien virherajaan (PER) ja

äänteellisesti

Puheensegmentoinnin

puheentunnistuksen

kokonaistehokkuuteen

puheaktuaalisuuteen.

RNN-transduktorimallit

järjestelmistä

Puheensegmentointi

puheentunnistuksen

kieliteknologian

kokonaisuuksiin.