puheteknologiassa
Puheteknologia viittaa tietokonejärjestelmiin ja ohjelmistoihin, jotka mahdollistavat ihmispuheen käsittelyn ja tuottamisen. Se jakautuu karkeasti kahteen pääalueeseen: puheentunnistukseen (ASR, Automatic Speech Recognition) ja puhesynteesiin (TTS, Text-to-Speech). Puheentunnistus muuntaa puhutun kielen tekstimuotoon, kun taas puhesynteesi muuntaa tekstin puhutuksi puheeksi.
Puheentunnistusteknologia on kehittynyt merkittävästi viime vuosikymmeninä, ja sitä käytetään laajasti äänikomennoissa, puhelinpalveluissa, transkriptiopalveluissa ja puheohjatuissa käyttöliittymissä.
Puhesynteesin tavoitteena on luoda luonnollisen kuuloisia puheääniä tietokoneella. Alkuvaiheen järjestelmät tuottivat robottimaista puhetta, mutta nykyään kehittyneet
Yhdistettynä puheentunnistus ja -synteesi muodostavat perustan monille vuorovaikutteisille sovelluksille, jotka mahdollistavat saumattomamman kommunikoinnin ihmisen ja koneen