puheensegmentointia
Puheensegmentointi on prosessi, jolla jatkuva puhe jaetaan pienempiin yksiköihin, kuten sanoihin, foneemeihin tai sylabeihin. Se on keskeinen etappi puheentunnistuksessa ja muissa puheentutkimuksen sovelluksissa, joissa halutaan löytää puhepaneelien alku- ja lopetuskohdat sekä projektien avulla jäsennellä puhuttu teksti.
Tasoja ja tavoitteita voidaan tarkastella eri tasoina. Yleisintä on sanamäärien rajojen määritys, eli sanojen rajojen havaitseminen
Menetelmät ovat kehittyneet perinteisistä tilastollisista malleista kohti end-to-end-neuroverkkoja. Varhaisissa järjestelmissä käytettiin piirteistettyjä akustisia malleja ja piilotettuja
Arviointi perustuu muun muassa boundary error rateen (BER), sanamärien virherajaan (WER) sekä foneemien virherajaan (PER) ja