Sprachinput
Sprachinput bezeichnet die Nutzung gesprochener Sprache zur Eingabe von Informationen oder Befehlen in Computersysteme, mobile Endgeräte und andere Anwendungen. Ziel ist es, gesprochene Äußerungen automatisch in Text zu transkribieren oder in Steuerbefehle zu übersetzen. Es umfasst Diktier-, Befehls- und Dialogschnittstellen.
Technisch basiert Sprachinput auf Spracherkennung (ASR). Moderne Systeme kombinieren akustische Modelle, Sprachmodelle und Decoder, oft mit
Anwendungsbereiche reichen vom Sprachdiktat in Textverarbeitung, über Sprachsteuerung von Smartphones, Smart-Home-Geräten und Fahrzeugen, bis zur Transkription
Herausforderungen sind Störgeräusche, Akzente, Mehrsprachigkeit und domänenabhängige Terminologie. Sprachverarbeitung erfordert oft große Datenmengen; Latenz, Datenschutz und
Historisch entwickelte sich Sprachinput von frühen Spracherkennungssystemen der 1950er Jahre, die nur Ziffern erkennen konnten (Bell