karakterfoutwaarde

Karakterfoutwaarde, vaak afgekort als CER (Character Error Rate), is een maatstaf voor de nauwkeurigheid van een getranscribeerde tekst ten opzichte van een referentietekst. Het geeft aan welk aandeel karakters fout zijn geclassificeerd en wordt gebruikt om de kwaliteit van systemen zoals optische-tekstenherkenning (OCR), spraak-naar-tekst (ASR) en handschriftherkenning te evalueren.

De CER wordt meestal berekend als (S + D + I) / N, waarbij S het aantal substitutions (vervangingen),

CER is een karakterlaag-evaluatiemaatstaf en verschilt van woordfoutwaarde (WER) doordat het op tekens in plaats van

Toepassingen omvatten kwaliteitsbeoordeling van OCR-systemen, transcriptieprojecten, ondertiteling en linguïstisch onderzoek. Een lagere CER wijst op een

D

(verwijderingen)

I

N

Levenshtein-afstand

normalisatiekeuzes,

hoofdlettergebruik

nauwkeurigheid;

getranscribeerde