transcriptiecontrole
Transcriptiecontrole is een gestructureerd proces waarbij transcripts van audio- of videomateriaal worden geverifieerd en gecorrigeerd om trouw te blijven aan de gesproken bron. Het omvat het corrigeren van spelfouten, interpunctie, tijdcodes en de aanduiding van sprekers, evenals het controleren op consistentie met de opname.
Toepassingsgebieden zijn onder meer kwalitatief onderzoek, journalistiek, rechtsgang en rechtbankverslaggeving, medische dossiers en taaltechnologie- of NLP-projecten
De workflow omvat doorgaans: initiële transcriptie; zelfcontrole door de maker; controle door een tweede transcribent; consensusredactie
Technieken en hulpmiddelen bestaan uit handmatig proeflezen, combinatie met automatische spraakherkenning (ASR) uitlijning met audio, speaker
Kwaliteitsnormen richten zich op nauwkeurigheid, volledigheid en consistentie. Naast WER worden er vaak metrics voor annotator-geschiktheid
Uitdagingen zijn onder meer variatie in uitspraak, ruis, overlappende spraak, jargon, onbekend vocabulaire en meertalige opnames.
Transcriptiecontrole draagt bij aan de betrouwbaarheid van onderzoeksresultaten, de juridische geldigheid van verslaggeving en de kwaliteit