Gesprächsschnittstellen
Gesprächsschnittstellen bezeichnen Benutzerschnittstellen, die eine Kommunikation in natürlicher Sprache zwischen Mensch und Computer ermöglichen. Sie umfassen sowohl sprachbasierte als auch textbasierte Interaktionen und kommen in Verbraucher- wie Unternehmensanwendungen zum Einsatz. Typisch verbinden sie Spracherkennung, Sprachverständnis, Dialogführung und eine Ausgabe in Text oder Sprache.
Die Kernkomponenten einer Gesprächsschnittstelle umfassen Eingabe (Sprach- oder Texteingabe), Verstehen (NLU, Intent- und Entity-Erkennung), Dialogmanagement (Kontextführung
Zwei Hauptformen unterscheiden sich in Zielsetzung und Tonfall: task-orientierte Schnittstellen, die spezifische Aufgaben erledigen sollen, und
Anwendungen finden sich in Kundendienstsystemen, auf Mobilgeräten, in Smart-Home-Ökosystemen, Fahrzeugassistenzsystemen und im Gesundheitswesen. Sie dienen der
Design und Evaluation fokussieren sich auf Task-Erfolg, Benutzerzufriedenheit, Fehlertoleranz und schnelle Reaktion. Typische Kennzahlen umfassen Erfolgsquote,
Herausforderungen umfassen Mehrdeutigkeit, raum- und sprachspezifische Unterschiede, Kontextwechsel, Privatsphäre, Bias sowie Barrierefreiheit. Zukünftige Trends beinhalten end-to-end-Modelle,