Home

spraaktechnologie

Spraaktechnologie is het vakgebied dat menselijke spraak omzet in computerverwerking en andersom. Het omvat onder andere automatische spraakherkenning (ASR), tekst-naar-spraak (TTS), spraakbegrip en dialoogsystemen. ASR zet gesproken taal om in geschreven tekst; TTS genereert gesproken output uit geschreven tekst. Spraakbegrip probeert de intentie, entiteiten en context achter een gesproken uiting te achterhalen, terwijl dialoogsystemen interacties met gebruikers voeren via stem.

Toepassingen zijn onder meer toegankelijkheidsdiensten voor doven en slechthorenden, klantenservice via spraakbots, handsfree bediening in voertuigen,

Technisch gezien draait spraaktechnologie op neurale en statistische modellen, vaak end-to-end modellen voor ASR en neural

Uitdagingen zijn onder andere variatie in stem en uitspraak, achtergrondgeluid, emoties en intentie correct interpreteren, biases

Toekomstige ontwikkelingen omvatten on-device verwerking, betere meertalige ondersteuning, meer natuurlijke interacties en robuuste prestaties in realtime

spraakgestuurde
assistenten,
medische
transcriptie
en
ondertiteling.
De
meeste
systemen
zijn
beschikbaar
voor
een
groeiend
aantal
talen,
maar
taalondersteuning
varieert
sterk
tussen
talen
en
domeinen.
TTS.
Succesvolle
systemen
vereisen
grote
gestructureerde
datasets,
krachtige
rekenkracht
en
aandacht
voor
privacy.
Evaluatie
gebeurt
met
metrics
zoals
woordfoutpercentage
(WER)
voor
ASR
en
mean
opinion
score
(MOS)
of
objective
quality
metrics
voor
TTS.
in
trainingsdata,
en
privacy-
en
beveiligingsrisico’s
rond
spraaktechnologie
en
stembiometrie.
Datawetgeving
en
privacyregelgeving
zoals
de
AVG
in
de
EU
beïnvloeden
hoe
data
verzameld
en
gebruikt
mogen
worden.
omgevingen,
met
aandacht
voor
ethische
en
transparante
toepassingen.
Spraaktechnologie
is
een
interdisciplinaire
discipline
die
linguïstiek,
machine
learning
en
human-computer
interaction
combineert
en
snel
evolueert.