Scänner
redigeeritav tekstifail.
Skaneerimise käigus saadakse trükisest või ka käsitsi kirjutatud tekstist digitaalne pilt,
pildifail. Pildifaili teatavasti tekstitöötlusvahenditega töödelda ei saa. Kuidas muuta
pildi kujul olev tekst töödeldavaks? Siin tulebki appi tekstituvastustarkvara. See tunneb
ära tähed ja numbrid, mis moodustavad skaneeritud kujutise (pildifaili), ning teisendab
iga tähemärgi kujutise nn ASCIIkoodiks (ASCII American Standard Code for
Information Interchange, Ameerika Informatsioonivahetuse Standardkood). Teksti pilt
teisendatakse seega tekstiks, mis salvestatakse tekstifailina, ning seda faili suudab
tekstitöötlusprogramm lugeda.
Tekstituvastustarkvara suudab tunda ära ka käsitsi kirjutatud tähed ja numbrid, kuid
tuvastustäpsus on loomulikult väiksem kui trükitud teksti puhul. Parematel
tekstituvastusprogrammidel on ka võime eri sümboleid ja tähemärke juurde õppida.