steminvoer
Steminvoer is het proces waarbij gesproken taal wordt geregistreerd en omgezet in bruikbare data voor computers en apparaten. De term is samengesteld uit stem (voice) en invoer (input) en omvat doorgaans het opnemen van audio met een microfoon, het voorbewerken van het geluid en het omzetten naar tekst of directe opdrachten via spraakherkenning.
Het proces omvat meerdere lagen: de opname van audiogegevens, ruisonderdrukking en normalisatie, feature-extractie, en het gebruik
Toepassingen zijn onder meer spraakassistenten op smartphones en slimme luidsprekers, dictatie in tekstverwerkers, handsfree bediening in
Belangrijke uitdagingen zijn onder meer de nauwkeurigheid bij achtergrondgeluid, variaties in taal en accent, latency en
Zie ook: spraakherkenning, spraakbesturing, stemassistenten, spraaktechnologie.