Keeleteadus konspekt 2018 sügis
Korpuste liigid:
kirjaliku keele korpus
suulise keele korpus
erikorpus mingit kindlat allkeelt esindav või spetsiaalselt märgendatud tekstikogu,
nt murdekorpus, vana kirjakeele korpus, diakrooniline korpus, jne.
paralleelkorpus sisaldab teksti ja selle tõlget (tõlkeid), see on tavaliselt joondatud ehk
paralleelistatud, st on näidatud, milline osa on millise osa tõlge. Kui on mitmekeelne korpus,
siis on tõlked panud vastavusse (mis on mille tõlge)
Korpusuuring on olemuslikult vaatluslik uurimus (observation). Ei saa muuta jälgid
järeldused
Semantiliste tunnuste märgendamine. Kelle intuitsioon kasutamine seda. Lubatakse enda
intuitsiooni põhjal järeldusi teha, kui on väga suured andmemahud mida suurte numbritega
teha.
Ideaalis on korpusuuring puhas kasutuspõhine lähenemine
Korpusuuringus materjali semantiline märgendamine otsustus on võrdlusprotsess oma
intuitsiooniga?