beszédszintézis - Infinite Lexicon - Infinite Lexicon

beszédszintézis

A beszédszintézis olyan számítógépes technológia, amely szövegből vagy más bemeneti adatokból emberi beszédet állít elő. A generált beszéd általában érthető és kifejező, és gyakran használják képernyőolvasókban, hangalapú asszisztensekben, navigációs rendszerekben és egyéb beszédalapú alkalmazásokban.

Historikusan több megközelítés alakult ki. A korai rendszerek szabályalapú átírásra és fonetikai transzkripcióra támaszkodtak. A 1980–1990-es

Fő összetevők: szöveg-normalizálás és grapheme-to-phoneme átalakítás, nyelvtani és prosodiai tervezés a hangmagasság, időzítés és hangsúlyozás meghatározásához,

Alkalmazási területek közé tartozik a képernyőolvasók, oktatási segédanyagok, navigációs és információs rendszerek, virtuális asszisztensek, és beszédalapú

Értékelés és szabványok: MOS (mean opinion score), ABX vagy MUSHRA típusú tesztek mérik a természetességet és

a

egységhangokat

a

beszédfolyamat

A

a

a

a

forradalmasították

a

természetesebb

a

A

megközelítések

a

a

a

A

beszédstílusok,

beállítását

természetesebb,

kontextusfüggetlen

többnyelvűség,

a

használatával

érthetőséget.

Szabványosítási

a

finomhangolását.