ARVUTILINGVISTIKA ALUSED. Kordamisküsimused. 1. Missugused korpused on loodud Tartu Ülikoolis? · Eesti kirjakeele korpus 1890-1990 · Morfoloogiliselt ühestatud korpus · Ühestatud sõnatähendustega korpus · Süntaktiliselt ühestatud korpus · Tasakaalus korpus (ajakirjandus+ilukirjandus+teadus) · Eesti keele koondkorpus · Inglise-eesti ja eesti-inglise paralleelkorpus · Vana kirjakeele korpus koostatakse Tartu Ülikooli vana kirjakeele uurimisrühmas · Eesti murrete korpust koostatakse Tartu Ülikooli eesti murrete ja sugulaskeelte arhiivis · Multext-Easti projekt George Orwelli «1984» · Eesti kõnekeele korpust haldab TÜ suulise kõne uurimisrühm 2. Mida võimaldab eesti kirjakeele korpuse kasutajaliides? Võimaldab otsida eesti keele korpusest sõnade konkordantse. 3
Korpus e tekstikogu, arvutiajastul polüfunktsionaalne elektroonilisel kujul olev tekstikogu, millesse kuuluvad tekstid on valitud eesmärgipäraselt, nii et nendest koosnev tervik annaks tõepärase pildi kogu keelest. Korpuste liigid: 1. kirjaliku keele korpus 2. suulise keele korpus 3. erikorpus mingit kindlat allkeelt esindav või spetsiaalselt märgendatud tekstikogu nt murdekorpus, vana kirjakeele korpus 4. paralleelkorpus sisaldab teksti ja selle tõlget. Tavaliselt on see osa märgistatud, mis on tõlge.
Tekst= nii kirjalik kui ka suuline Intrnetikeele korpused Plussid: Lihtne koguda Andmemahud tohutu suured Keelt saab siduda ajaga Pikalt saab jälgida Miinused: Tekstiliike on palju erinevaid Korpuste liigid: kirjaliku keele korpus suulise keele korpus erikorpus mingit kindlat allkeelt esindav või spetsiaalselt märgendatud tekstikogu, nt murdekorpus, vana kirjakeele korpus, diakrooniline korpus, jne. paralleelkorpus sisaldab teksti ja selle tõlget (tõlkeid), see on tavaliselt joondatud ehk paralleelistatud, st on näidatud, milline osa on millise osa tõlge. Kui on mitmekeelne korpus, siis on tõlked panud vastavusse (mis on mille tõlge) Korpusuuring on olemuslikult vaatluslik uurimus (observation). Ei saa muuta jälgid järeldused Semantiliste tunnuste märgendamine. Kelle intuitsioon kasutamine seda. Lubatakse enda
Sissejuhatus üldkeeleteadustesse Õpik F. Karlsson ''Üldkeeleteadus''- digilaenutus ebrary Mis on keel? Keele all mõeldakse inimese poolt kasutatavat loomulikku keelt, mis tavaliselt teostub keeleliselt ehk verbaalse suhtlsuse vormis. Keel on võimalik tänu inimese keelevõimele. *Keel on üks inimese kognitiivsetest võimetest, võrreldav kuulmise ja nägemisega. Iga teaduslik lähenemine tahab liigitada ja defineerida, keeleteaduslik ka. Keel kui uurimisobjekt ja selle süstematiseerimine. -Kommunikatsioonisüsteem -keeleteaduse uurimisobjekt Tähenduse, funktsiooni poolt keelt vaadates näeme keeles teistsuguseid jaotusi kui struktuuri poolt vaadates. Üldkeeleteadus (general linguistics) Keeledeadus ehk lingvistika. Viipekeel,, sümbolite keel, on siiski võime keelt edastada. See kuidas me keelt kasutame sõltub sellest mida kuuleme ja näeme. Keele allsüsteemid · Foneetika-hääldus, häälikud · Fonoloogia-silbid · Morfoloogia-käände lõp...
valitud eesmärgipäraselt, nii et nendest koosnev tervik annaks tõepärase pildi kogu keelest. Tekst = nii kirjalik kui ka suuline keel (kõne transkribeeritud kujul). Korpuste liigid: 1)kirjaliku keele korpus 2)suulise keele korpus 3)erikorpus mingit kindlat allkeelt esindav või spetsiaalselt märgendatud tekstikogu, nt murdekorpus, vana kirjakeele korpus, diakrooniline korpus, jne.4)Paralleelkorpus sisaldab teksti ja selle tõlget (tõlkeid), see on tavaliselt joondatud ehk paralleelistatud, st on näidatud, milline osa on millise osa tõlge. 96. Introspektsioon keeleteaduse meetodina Introspektsioon ehk sisevaatlus. Lingvist moodustab ise vajalikke näiteid, eeldusel, et ta oskab uuritavat keelt. 97. Empiiriline keeleuurimine kogemustel põhinev keeleuurimine 98. Kvantitatiivsed ja kvalitatiivsed meetodid
· Tekst = nii kirjalik kui ka suuline keel (küne transkribeeritud kujul). · Kprpuste kasutatavus: NT rate-kommentaaride korpus ISIKLIK. Korpuste liigid · Kriejliku keele korpused · Suulise keele koprused · Erikoprus mingite kindlat allkeelt esindav või spetsiaalselt märgendatud tekstikorpus nt: murdekoprus, vana kirjakeele korpus, diakrooniline korpus, õppijakeele korpus jne. · Paralleelkorpus sisaldab teksti ja selle tõlget (tõlkeid), see on tavaliselt joondatud ehk paralleelistatud, st on näidatud, milline osa on millise osa tõlge. Kust saame keelte uurimiseks materjali · BNC · Keeleveeb · TÜ keelekogud · VAKKUR · Murded · Konstanzi universaalide arhiiv Milleks meile vaja koprusi? · Eriti kvantitatiivsed uurimused kopruste abiga o Nt ,,võtma" o R: http://www.e-project.org