puheteknologiassa - Infinite Lexicon - Infinite Lexicon

puheteknologiassa

Puheteknologia viittaa tietokonejärjestelmiin ja ohjelmistoihin, jotka mahdollistavat ihmispuheen käsittelyn ja tuottamisen. Se jakautuu karkeasti kahteen pääalueeseen: puheentunnistukseen (ASR, Automatic Speech Recognition) ja puhesynteesiin (TTS, Text-to-Speech). Puheentunnistus muuntaa puhutun kielen tekstimuotoon, kun taas puhesynteesi muuntaa tekstin puhutuksi puheeksi.

Puheentunnistusteknologia on kehittynyt merkittävästi viime vuosikymmeninä, ja sitä käytetään laajasti äänikomennoissa, puhelinpalveluissa, transkriptiopalveluissa ja puheohjatuissa käyttöliittymissä.

Puhesynteesin tavoitteena on luoda luonnollisen kuuloisia puheääniä tietokoneella. Alkuvaiheen järjestelmät tuottivat robottimaista puhetta, mutta nykyään kehittyneet

Yhdistettynä puheentunnistus ja -synteesi muodostavat perustan monille vuorovaikutteisille sovelluksille, jotka mahdollistavat saumattomamman kommunikoinnin ihmisen ja koneen

piilomarkov-malleja

äänisignaaleja

koneoppimisella

puheentunnistuksen

parantamisessa.

TTS-järjestelmät

lukulaitteissa,

opastusjärjestelmissä

virtuaaliavustajissa.

parametripohjainen

neuroverkkoihin

yleistymässä.