Lühidalt arvutilingvistikast
suurimad jagunemised käivad kolme suurema linna Tallinna, Tartu ja Pärnu järgi ning
on seotud konkreetset piirkonda mõjutanud murdega/murretega. Teine suur allkeelte
rühm on registrid suhtlusviisid ja füüsilised tingimused. Korpuses on nii silmas silma
vestlused, telefonivestlused kui ka monoloogid.
Kõnekorpuste üks uurimismeetodeid on sõnasageduste võrdlus. Hennoste artiklis ,, Eesti
suulise kõne korpus ja mõnede allkeelte võrdluse katse. Arvutuslingvistikalt inimesele."
on väljatoodud mitme allkeele omavahelist võrdused: argikõne ja ajalehekeel, avaliku
kõne ja ilukirjanduskeel, kõne ja kiri, ametlik ja argine suuline kõne. Kokkuvõtvalt tehti
järgnevad järeldused:
5
Ajakirjanduskeeles on sagedasemad nimisõnad, 90ndate alguses kõneldi palju rahast.
Avaliku suulise kõne ja kirjakeele erinevused on samad mis eelneval. ,,Suulisele kõnele