Karaktergenkendelse
Karaktergenkendelse, også kendt som optisk tegn-genkendelse (OCR), er en teknologi, der konverterer billeddata af trykte eller håndskrevne tegn til maskinlæsbar tekst. Formålet er at digitalisere dokumenter, muliggøre søgbarhed og automatiseret dataudtræk.
Processen spænder fra tegngenkendelse til layoutforståelse. Den kan anvendes på både trykte tegn og håndskrift og
Typisk pipeline: billedforbehandling (støjfjernelse, kontrastjustering), segmentation (opdeling i tegn eller ord), funktionsekstraktion og klassificering. Post-processing med
Metoder har udviklet sig fra traditionelle teknikker som template matching og statistiske modeller til dybe neurale
Udfordringer inkluderer støj, lav opløsning, varierende skrifttyper og håndskrift samt komplekse layout. Nøjagtigheden påvirkes af sprog,