röstfunktioner
Röstfunktioner är funktioner i programvara och enheter som gör det möjligt att kommunicera eller styra teknik med tal. De vanligaste delarna är taligenkänning (ASR), som konverterar tal till text; text-till-tal (TTS), som omvandlar text till tal; och röststyrning eller dialoggränssnitt, där användaren interagerar med enheten via tal. Röstfunktioner kan bearbetas lokalt eller i molnet och används i sammanhang som assistenter, tillgänglighet och fordonsystem.
Tekniskt bygger röstfunktioner på inspelat ljud, förbehandling av signalerna och modeller som tolkar språket. I ASR
Användningsområden inkluderar virtuella assistenter och röstbaserade gränssnitt i smartphones, datorer och smarta högtalare; handsfree-styrning i bilar;
Utmaningar och överväganden inkluderar noggrannhet i olika språk och dialekter, hantering av brusiga miljöer och kontext;