tekstgjenkjenning - Infinite Lexicon - Infinite Lexicon

tekstgjenkjenning

Tekstgjenkjenning, ofte referert til som optisk tekstgjenkjenning (OCR), er prosessen med å konvertere bilder som inneholder tekst til maskinlesbar tekst. Den omfatter både trykt og håndskrevet tekst og brukes i digitalisering, arkivering, søkbarhet og automatisering av dokumenthåndtering. Tidlige OCR-systemer, utviklet på 1950- og 1960-tallet, var regelbaserte og begrenset til få fonter; moderne løsninger bruker maskinlæring og dype nevrale nettverk og støtter et bredt spekter av språk og skrifttyper.

En typisk arbeidsflyt består av: bildeinnhenting, forbehandling (for eksempel støyreduksjon, skråjustering, konvertering til gråtoner), segmentering av

Typer og applikasjoner: trykt tekstgjenkjenning (OCR) for trykte dokumenter, og håndskriftgjenkjenning (HWR) for manuskripter og skriftlige

Utfordringer inkluderer varierende skrifttyper og språk, komplekse layoutelementer som kolonner og tabeller, lav bildekvalitet og håndskriftens

klassifikatorer

sekvensmodeller,

post-prosessering

språkmodeller,

transformer-baserte

bilskiltgjenkjenning

i

trafikkapplikasjoner.

karakterfeilrate

uregelmessighet.

rettskrivingskontroller

språkteknologi,

dokumentstrømmen