Lühidalt arvutilingvistikast
võimalik luua masintõlkesüsteem, mis tõlgib edukalt HewlettPackardi printeri
manuaale, kuid mingi teise firma manuaalidega võib ta juba hätta jääda. Sellise süsteemi
loomist alustatakse muidugi kõigi HewlettPackardi printeri manuaalide korpuseks
koondamisega." (Arvutimaailm, 2002).
Probleemi on lahendatud nii, et korpuste maht on viidud sellel tasemele, et seda saab
kasutada erinevatel eesmärkidel. ,,Korpuslingvistikas räägitakse palju korpuse
representatiivsusest, mis tähendab seda, et korpuses peaksid olema esindatud kõik (või
valitud) tekstiklassid, mis antud kultuuris antud ajavahemikul olemas on ja korpuse
balansseeritusest." (Arvutimaailm, 2002).
Areng arvutileksikograafia sees on kulgenud arvutisse sisestatud sõnastikutekstidelt
leksikaalsete teadmusbaasideni. Arvutisõnastike maht sõltub sisuliselt sellest, milleks