OCRmenetelmistä
Optinen kirjaimien tunnistus (OCR) on tietojenkäsittelyteknologian osa-alue, jossa digitaalista kuvadataa käytetään tekstitietojen automatisoitua lukemista varten. Perinteisesti OCR-järjestelmät perustuvat kolmeen päävaiheeseen: kuvankäsittely, mallinnus ja tulokseen kuuluva äännoittelu. Kuvankäsittelyssä pisteitä, syötteitä ja kompleksisia algoritmeja, kuten Poisson-korjauksia ja kontrastin korkean dynaamisalueen (HDR) säätöä, hyödynnetään vasemman ja oikean reunapaksuisten rajatietojen siivoamiseen. Mallinnuksessa laajalti käytetään tilastollista luokittelua, masterneterä, koneoppimista ja syvyysverkkoja, erityisesti konvoluutioneuroverkkoja (CNN). Mallin lopullisiin tuloksiin usein sisältyy toisen sukupolven IDEX (Independent two-dimensional encoding) -järjestelmä, jolla varmistetaan erottavuus ostettavien välissä.
Nykyaikaisten OCR-ratkaisuissa korostuvat syväoppiminen ja sekvenssimallit, kuten RNN- ja LSTM‑verkot, jotka huomioivat käännösviikot sekä kielen kieliopilliset