Home

Sprachverarbeitung

Sprachverarbeitung ist ein interdisziplinäres Feld, das sich mit der automatisierten Analyse, Verarbeitung und Erzeugung menschlicher Sprache befasst. In der Informatik umfasst es Aspekte der Sprachtechnologie (Speech Technology), der Sprachverarbeitung im weiteren Sinn der natürlichen Sprache (NLP) sowie der Sprachsynthese.

Zu den Kernbereichen gehören Spracherkennung (Automatic Speech Recognition, ASR), die gesprochene Sprache in Text umwandelt; Sprachsynthese

Technisch beruhen viele Systeme auf Signalverarbeitung und Mustererkennung. Merkmalsextraktion (etwa MFCCs, Spektralfeatures), akustische Modelle (GMM-HMM, Deep

Anwendungen finden sich in Sprachassistenten, Fahrzeugen, Kundendiensten, Barrierefreiheit, Übersetzung und Inhaltsanalyse. Herausforderungen umfassen Mehr- bzw. Dialektsprachen,

Historisch reicht die Entwicklung von frühen Signalverarbeitungssystemen über statistische Spracherkennung bis zu modernen Deep-Learning-Ansätzen; zentrale Meilensteine

(Text-to-Speech,
TTS),
die
geschriebenen
Text
in
hörbare
Sprache
überführt;
Sprachanalyse
und
Sprachverarbeitung,
die
linguistische
Strukturen
und
Bedeutungen
extrahiert;
Sprachdialogsysteme
und
Chatbots;
sowie
maschinelle
Übersetzung.
Neural
Networks,
Transformer-basierte
Architekturen)
und
end-to-end
Ansätze
sind
gebräuchlich.
In
der
Verarbeitung
natürlicher
Sprache
kommen
Tokenisierung,
Syntax-
und
Semantik-Parsing,
Named-Entity
Recognition,
Lemmatisierung
und
moderne
Sprachmodelle
zum
Einsatz.
Die
Leistungsbewertung
erfolgt
unter
anderem
mit
Word
Error
Rate
(WER)
bei
ASR,
MOS-Skalen
für
TTS,
sowie
BLEU-
oder
METEOR-Metriken
bei
Übersetzung.
Geräuschsituationen,
Ressourcenknappheit
für
wenig
vertretene
Sprachen
sowie
ethische
Fragen
zu
Privatsphäre,
Bias
und
Sicherheit.
sind
HMM-basierte
Systeme
und
der
Durchbruch
transformerbasierter
Modelle.