Eesmärk on muuta pildi kujul olev tekst töödeldavaks ning võimaldada tekstisisest otsingut. Tänu tekstituvastustehnoloogiale on võimalik paberdokumentidest, PDFfailidest ja pildistatud dokumentidest luua redigeeritav tekstifail. Skaneerimise käigus saadakse trükisest või ka käsitsi kirjutatud tekstist digitaalne pilt, pildifail. Pildifaili teatavasti tekstitöötlusvahenditega töödelda ei saa. Kuidas muuta pildi kujul olev tekst töödeldavaks? Siin tulebki appi tekstituvastustarkvara. See tunneb ära tähed ja numbrid, mis moodustavad skaneeritud kujutise (pildifaili), ning teisendab iga tähemärgi kujutise nn ASCIIkoodiks (ASCII American Standard Code for Information Interchange, Ameerika Informatsioonivahetuse Standardkood). Teksti pilt teisendatakse seega tekstiks, mis salvestatakse tekstifailina, ning seda faili suudab tekstitöötlusprogramm lugeda. Tekstituvastustarkvara suudab tunda ära ka käsitsi kirjutatud tähed ja numbrid, kuid
Tekstituvastus OCR ehk tekstituvastus (Optical Character Recognition) on tehnoloogia,mille abil digitaalsest pildifailist eraldatakse ekst.Serda võimalust sisaldab skänneri tarkvara,samuti mõned spetsiaalsed arvutiprogrammid.Eesmärk on muuta pildi kujul olev tekst töödeldavaks ning võimaldada tekstisisest otsingut. Tänu tekstituvastustehnoloogiale on võimalik paberdokumentidest,PDF-failidest ja pildistatud dokumentidest luua redigeeritav tekstifail. Tekstituvastustarkvara suudab tunda ära ka käsitsi kirjutatud tähed ja numbrid,kui trükitud teksti puhul. Tekstituvastus tarkvara nt ABBYY;OCCR.