Sprachinput

Sprachinput bezeichnet die Nutzung gesprochener Sprache zur Eingabe von Informationen oder Befehlen in Computersysteme, mobile Endgeräte und andere Anwendungen. Ziel ist es, gesprochene Äußerungen automatisch in Text zu transkribieren oder in Steuerbefehle zu übersetzen. Es umfasst Diktier-, Befehls- und Dialogschnittstellen.

Technisch basiert Sprachinput auf Spracherkennung (ASR). Moderne Systeme kombinieren akustische Modelle, Sprachmodelle und Decoder, oft mit

Anwendungsbereiche reichen vom Sprachdiktat in Textverarbeitung, über Sprachsteuerung von Smartphones, Smart-Home-Geräten und Fahrzeugen, bis zur Transkription

Herausforderungen sind Störgeräusche, Akzente, Mehrsprachigkeit und domänenabhängige Terminologie. Sprachverarbeitung erfordert oft große Datenmengen; Latenz, Datenschutz und

Historisch entwickelte sich Sprachinput von frühen Spracherkennungssystemen der 1950er Jahre, die nur Ziffern erkennen konnten (Bell

End-to-end-Ansätze

Übersetzungsdiensten.

Cloud-Lösungen.

Wortfehlerquote

End-to-end-Systemen

Spracherkennung

Datenschutzregelungen