Lühidalt arvutilingvistikast
Probleemi on lahendatud nii, et korpuste maht on viidud sellel tasemele, et seda saab
kasutada erinevatel eesmärkidel. ,,Korpuslingvistikas räägitakse palju korpuse
representatiivsusest, mis tähendab seda, et korpuses peaksid olema esindatud kõik (või
valitud) tekstiklassid, mis antud kultuuris antud ajavahemikul olemas on ja korpuse
balansseeritusest." (Arvutimaailm, 2002).
Areng arvutileksikograafia sees on kulgenud arvutisse sisestatud sõnastikutekstidelt
leksikaalsete teadmusbaasideni. Arvutisõnastike maht sõltub sisuliselt sellest, milleks
seda kasutatakse õigekirjakontrolli puhul on oluline mahukas kuid ülesehituselt lihtne
sõnastik, masintõlke jaoks on aga vaja dünaamilist süsteemi. Suureks puuduseks on
toodud põhjaliku ,,tänapäevase elektroonilise inglise Eesti ja Eesti inglise sõnastiku
puudumine." (Arvutimaailm, 2002).
,,Leksikaalse andmebaasi all mõistetakse arvutileksikoni, kus nii selles sisalduvad