OCRöversättning
OCRöversättning är processen att digitalt återge text ur skannade dokument eller bilder och sedan översätta den till ett annat språk. Den kombinerar optisk teckenigenkänning (OCR) som konverterar bildens tecken till maskinläsbar text och maskinöversättning (MT) som översätter texten till målspråket. Ofta integreras stegen i ett arbetsflöde där bildförbehandling, såsom binarisering, brusreducering och rotation, förbättrar igenkänningen, följt av layoutanalys och återuppbyggnad av dokumentets struktur i den översatta versionen.
Teknik och arbetsflöde varierar mellan lösningar, men vanligt är att de första stegen är bildförbättring och
Prestanda mäts ofta i OCR-precision, dvs. hur väl tecken och ord återges, samt i översättningskvalitet, ofta