Transkriptionsdaten
Transkriptionsdaten bezeichnet in der Sprachwissenschaft und verwandten Feldern die Daten, die aus der Transkription von gesprochener Sprache entstehen. Sie bestehen aus Texttranskripten, oft ergänzt durch zeitliche Markierungen, Sprecherkennungen und Metadaten, die die Aufnahmeumstände dokumentieren. Ziel ist es, gesprochene Äußerungen systematisch zu dokumentieren und für linguistische Analysen, Korpora oder Sprachdokumentation nutzbar zu machen.
Transkriptionsdaten können verschiedene Formen annehmen: Orthografische Transkriptionen in Standard- oder Dialekt-Schreibweisen; phonetische oder phonemische Transkriptionen (IPA);
Für Speicherung und Austausch nutzen Transkriptionsdaten gängige Formate und Standards: ELAN-Dateien, die Annotationen zeitsynchronisiert in XML
Anwendungen umfassen Spracherhebung, Korpusforschung, Dialekt- und Sprachkontaktstudien, Sprachtherapie und Dokumentation seltener Sprachen. Die Erstellung von Transkriptionsdaten