spraaktechnologie
Spraaktechnologie is het vakgebied dat menselijke spraak omzet in computerverwerking en andersom. Het omvat onder andere automatische spraakherkenning (ASR), tekst-naar-spraak (TTS), spraakbegrip en dialoogsystemen. ASR zet gesproken taal om in geschreven tekst; TTS genereert gesproken output uit geschreven tekst. Spraakbegrip probeert de intentie, entiteiten en context achter een gesproken uiting te achterhalen, terwijl dialoogsystemen interacties met gebruikers voeren via stem.
Toepassingen zijn onder meer toegankelijkheidsdiensten voor doven en slechthorenden, klantenservice via spraakbots, handsfree bediening in voertuigen,
Technisch gezien draait spraaktechnologie op neurale en statistische modellen, vaak end-to-end modellen voor ASR en neural
Uitdagingen zijn onder andere variatie in stem en uitspraak, achtergrondgeluid, emoties en intentie correct interpreteren, biases
Toekomstige ontwikkelingen omvatten on-device verwerking, betere meertalige ondersteuning, meer natuurlijke interacties en robuuste prestaties in realtime