Home

Sprachsignals

Sprachsignale bezeichnet Signale, die menschliche Sprache transportieren. In der Technik umfasst der Begriff akustische Sprachsignale, die als Schallwellen entstehen und durch Mikrofone erfasst oder in der Analyse als digitale Signale verarbeitet werden. Sprachsignale können sowohl natürlich aufgenommen als auch synthetisch erzeugt sein und dienen als Grundlage vieler sprachbasierter Anwendungen.

Typische Eigenschaften von Sprachsignalen sind ihre zeitliche Variation und Nicht-Stationarität. Voiced-Abschnitte resultieren aus glottaler Stimmproduktion, unvoiced

Repräsentationen von Sprachsignalen erfolgen im Zeitbereich, im Frequenzbereich oder im Zeit-Frequenz-Bereich. Wichtige Darstellungen sind das Wellenformsignal,

Anwendungen umfassen Spracherkennung, Sprachsynthese, Sprachverbesserung, Sprecheridentifikation, Sprachtelekommunikation und forensische Phonetik. Herausforderungen sind Variabilität zwischen Sprechern

Abschnitte
aus
turbulenten
Luftströmungen.
Typische
Merkmale
sind
die
Grundfrequenz
F0,
Formanten
der
vokalischen
Resonanzen,
Energieverlauf
und
Intonation.
Die
Art
der
Aussprache,
der
Sprecher
und
der
Kontext
beeinflussen
Lautstärke,
Geschwindigkeit
und
Tonhöhe
erheblich.
das
Spektrum
und
das
Spektrogramm.
Für
die
Analyse
und
Verarbeitung
werden
Merkmale
wie
MFCCs,
Pitch-Kurven
und
Energieprofile
verwendet.
Zur
Aufnahme
gelten
übliche
Abtastraten
von
8
kHz
in
der
Telekommunikation
bis
zu
16–44
kHz
für
hochauflösende
Aufnahmen.
Sprachsignale
können
unkomprimiert
oder
komprimiert
gespeichert
werden
(z.
B.
PCM,
MP3,
Opus).
und
Sprachen,
Hintergrundrauschen,
Akzente,
Mehrkanal-
und
Raumverhältnisse
sowie
Datenschutz-
und
Ethikfragen.
Die
Feldbezeichnung
umfasst
Sprachsignalverarbeitung,
Sprachsynthese
und
robuste
Sprachtechnologien.