spraaktechnologie

Spraaktechnologie is het vakgebied dat menselijke spraak omzet in computerverwerking en andersom. Het omvat onder andere automatische spraakherkenning (ASR), tekst-naar-spraak (TTS), spraakbegrip en dialoogsystemen. ASR zet gesproken taal om in geschreven tekst; TTS genereert gesproken output uit geschreven tekst. Spraakbegrip probeert de intentie, entiteiten en context achter een gesproken uiting te achterhalen, terwijl dialoogsystemen interacties met gebruikers voeren via stem.

Toepassingen zijn onder meer toegankelijkheidsdiensten voor doven en slechthorenden, klantenservice via spraakbots, handsfree bediening in voertuigen,

Technisch gezien draait spraaktechnologie op neurale en statistische modellen, vaak end-to-end modellen voor ASR en neural

Uitdagingen zijn onder andere variatie in stem en uitspraak, achtergrondgeluid, emoties en intentie correct interpreteren, biases

Toekomstige ontwikkelingen omvatten on-device verwerking, betere meertalige ondersteuning, meer natuurlijke interacties en robuuste prestaties in realtime

spraakgestuurde

taalondersteuning

gestructureerde

woordfoutpercentage

beveiligingsrisico’s

spraaktechnologie

privacyregelgeving

Spraaktechnologie

interdisciplinaire