kõnetuvastuse
Kõnetuvastus on tehnoloogia, mille eesmärk on teisendada inimese kõne masinloetavaks tekstiks või muuks analüüsitavaks kujuks. Süsteemid võivad töötada nii reaalajas kui ka salvestatud kõne transkribeerimiseks ning sageli kaasneb nendega keelelise mõistmise ja kontekstianalüüsi komponent.
Traditsiooniliselt tuginesid süsteemid HMM-GMM akustilistele mudellidele ja n-grammkeelemodellidele. Dekooder ühendab akustilised tõendid ja keelemodellide tõenäosused, et
Viimastel aastatel on laialdaselt kasutusele võetud end-to-end mudelid, mis ühendavad akustika ja keeleanalüüsi otse sügavõppega, näiteks
Koolitus nõuab suuri ja kvaliteetseid transkriptikogumeid; andmekogud hõlmavad erinevaid helikvaliteete, aktsente ja kõnelejaid. Hinnanguks kasutatakse tavaliselt
Rakendused hõlmavad virtuaalseid assistente, kõnetõlget, diktsioonisüsteeme ja automaatset transkriptsiooni kõnede või meediasisu jaoks. Eesti keeles kõnetuvastus