tekstgenkendelse
Tekstgenkendelse, eller optisk tegngenkendelse (OCR), er teknologier og processer til at konvertere billeder af tekst til maskinlæsbar tekst. Den gør det muligt at digitalsere papirbaserede dokumenter og gøre tekst søgbar og redigerbar.
Historisk set begyndte OCR i midten af det 20. århundrede med simple mønstergenkendelsesbaserede systemer og senere
Teknikker og pipeline: En typisk tekstgenkendelsesproces indebærer billedforbehandling, sektionering af tekstblokke og tegn, karaktergenkendelse og efterbehandling
Anvendelser: OCR bruges bredt til digitalisering af arkiver, faktura- og kontraktbehandling, post og billetter, samt mobilapplikationer
Udfordringer: Variabilitet i skrifttyper og sprog, stavemåder, håndskrift, støj og dårlige billedkvalitet samt komplekse layout kan
Måling og værktøjer: Nøjagtighed måles ofte i karakter- eller ordfejl (CER/WER). Der findes både open source-rammer