tekstgjenkjenning
Tekstgjenkjenning, ofte referert til som optisk tekstgjenkjenning (OCR), er prosessen med å konvertere bilder som inneholder tekst til maskinlesbar tekst. Den omfatter både trykt og håndskrevet tekst og brukes i digitalisering, arkivering, søkbarhet og automatisering av dokumenthåndtering. Tidlige OCR-systemer, utviklet på 1950- og 1960-tallet, var regelbaserte og begrenset til få fonter; moderne løsninger bruker maskinlæring og dype nevrale nettverk og støtter et bredt spekter av språk og skrifttyper.
En typisk arbeidsflyt består av: bildeinnhenting, forbehandling (for eksempel støyreduksjon, skråjustering, konvertering til gråtoner), segmentering av
Typer og applikasjoner: trykt tekstgjenkjenning (OCR) for trykte dokumenter, og håndskriftgjenkjenning (HWR) for manuskripter og skriftlige
Utfordringer inkluderer varierende skrifttyper og språk, komplekse layoutelementer som kolonner og tabeller, lav bildekvalitet og håndskriftens