Personaalarvutite riistvara ja arhitektuur
Automaatne teksti tuvastamine ja pilditöötlus (OCR)
Definitsioon. Optiliseks märgituvastuseks ehk OCR-ks (optical character recognition) nimetatakse
kirjutatud või prindidtud (trükitud) märkide ja tekstidokumentide automaatset sisselugemist
andmetöötlussüsteemi optiliste meetoditega ning nende muundamist arvutile mõistetavateks märkideks.
Skannerid ja tekstituvastussüsteemid koos võimaldavad masinakirja-, trükitud ja isegi käsitsi kirjutatud
tekstide lugmist ja muundamist
järeltöödeldud märkideks (näiteks
tähtedeks), ilma et tekste peaks vaevarikkalt
käsitsi töötlema.
Skanner muundab algdokumendil
analoogkujul oleva info punkthaaval
digitaalseteks impulssideks, mida arvuti on
suuteline töötlema. Seega on analoogandmeteks algdokumendi kõik pildipunktid, millel teoreetiliselt võib
olla lõpmata suur arv värvi- ja ka halltoonastmeid ning punktisuurusi. Skanneri optika ja elektroonika