Arvutilingvistika kordamisküsimused vastustega
5. Mis on ühestatud sõnatähendustega korpus?
Verbid, liikumislaused.
6. Mis on süntaktiliselt ühestatud korpus?
Korpus on ligi 500000-sõnaline, koosneb eesti ilukirjanduse, tõlkekirjanduse,
ajakirjanduse, seaduse ja suulise keele tekstidest. Osade tekstide märgendus on veel
ühtlustamta.
7. Mis on tasakaalus korpus?
Tasakaalus korpus on mõeldud selleks, et võrrelda omavahel kirjaliku keelekasutuse
kolme tähtsamat tekstiklassi: ilukirjanduse, ajakirjanduse ja teaduse keelt.
8. Missugustest osadest koosneb eesti keele segakorpus?
Siin korpuses on ainult terviktekstid, mitte 2000-sõnalised tekstikatked, millest suures
osas koosneb Eesti Kirjakeele Korpus 1890-1990 Kogume ainult kirjalikku keelt, suulise
kõne korpust koostab suulise kõne uurimisrühm.
Segakorpus koosneb:
· Eesti ilukirjandus 1990-
· «Postimees»
· «Eesti Ekspress»
· «Eesti Päevaleht»
· «Valgamaalane»