Lühidalt arvutilingvistikast
manuaale, kuid mingi teise firma manuaalidega võib ta juba hätta jääda. Sellise süsteemi
loomist alustatakse muidugi kõigi HewlettPackardi printeri manuaalide korpuseks
koondamisega." (Arvutimaailm, 2002).
Probleemi on lahendatud nii, et korpuste maht on viidud sellel tasemele, et seda saab
kasutada erinevatel eesmärkidel. ,,Korpuslingvistikas räägitakse palju korpuse
representatiivsusest, mis tähendab seda, et korpuses peaksid olema esindatud kõik (või
valitud) tekstiklassid, mis antud kultuuris antud ajavahemikul olemas on ja korpuse
balansseeritusest." (Arvutimaailm, 2002).
Areng arvutileksikograafia sees on kulgenud arvutisse sisestatud sõnastikutekstidelt
leksikaalsete teadmusbaasideni. Arvutisõnastike maht sõltub sisuliselt sellest, milleks
seda kasutatakse õigekirjakontrolli puhul on oluline mahukas kuid ülesehituselt lihtne
sõnastik, masintõlke jaoks on aga vaja dünaamilist süsteemi. Suureks puuduseks on