beszédszintézis
A beszédszintézis olyan számítógépes technológia, amely szövegből vagy más bemeneti adatokból emberi beszédet állít elő. A generált beszéd általában érthető és kifejező, és gyakran használják képernyőolvasókban, hangalapú asszisztensekben, navigációs rendszerekben és egyéb beszédalapú alkalmazásokban.
Historikusan több megközelítés alakult ki. A korai rendszerek szabályalapú átírásra és fonetikai transzkripcióra támaszkodtak. A 1980–1990-es
Fő összetevők: szöveg-normalizálás és grapheme-to-phoneme átalakítás, nyelvtani és prosodiai tervezés a hangmagasság, időzítés és hangsúlyozás meghatározásához,
Alkalmazási területek közé tartozik a képernyőolvasók, oktatási segédanyagok, navigációs és információs rendszerek, virtuális asszisztensek, és beszédalapú
Értékelés és szabványok: MOS (mean opinion score), ABX vagy MUSHRA típusú tesztek mérik a természetességet és