Sprachgeneration
Sprachgeneration bezeichnet die automatische Erzeugung von gesprochenen oder schriftlichen sprachlichen Äußerungen durch Computersysteme. In der Praxis werden verschiedene Teilbereiche unter diesem Begriff zusammengefasst, je nach Kontext: Text-zu-Sprache (TTS), bei dem aus geschriebenem Text gesprochene Sprache entsteht, sowie die generelle automatische Erzeugung sprachlicher Ausgaben in der natürlichen Sprachverarbeitung (Natural Language Generation, NLG).
Technisch umfasst Sprachgeneration typischerweise eine mehrstufige Pipeline. Zunächst erfolgt Textvorverarbeitung und Normalisierung, gefolgt von linguistischer oder
Anwendungsfelder umfassen barrierefreie Technologien, Sprachassistenten, Navigationssysteme, Kundendienst, E-Learning, Medienproduktion und Robotik. Durch personalisierte Stimmen und Tempoanpassung
Herausforderungen betreffen die Natürlichkeit und Vielseitigkeit der Sprache, Mehrsprachigkeit, Dialekte, Emotion und Kontextsensitivität. Technisch bleibt die
Der Stand der Forschung zielt auf noch natürlicher klingende Stimmen, schnellere Inferenz und bessere Prosodiesteuerung, inklusive