lugemisprojektor. automaatseade info sisestamiseks andmekandjalt; seade digiraamatute lugemiseks. 4. Lemma <7> MAT abiteoreem. <12> MAT abiteoreem; KEEL (arvutilingvistikas) sõna algvorm. 5. Letra <8> templett, surutäht Andmed puuduvad. vm surumärk (plastlehe küljest paberile surutav). 3. Võõrsõnade leksikonist ja ÕS 2013-st valitud sõnade definitsiooni võrdlus. Võõrsõnade leksikoni ÕS 2013 definitsioon definitsioon 1. Live [laiv] ingl.k
lekseemi teatavaile esinemiskujudele (tee ja way ehk tsai ja doroga vaste ainsuse nimetav, do/make ehk delatj/sdelatj vaste käskiv kõneviis). Põhimõisteid III Lekseem Lekseem on abstraktsioon, mis vastab inimese argiarusaamale sõnast, lekseem on justkui kokkukuuluvate sõnavormide kogum, üldistus konkreetsetest sõnavormidest. Eesti keele sõnavormid varvas, varba, varvastel kuuluvad samasse kogumisse ehk esindavad sama lekseemi. Arvutilingvistikas on kasutusel paralleelne termin lemma, st kõik sõnavormid taandatakse ühele lemmale. Erialases kirjanduses märgitakse lekseemi sageli suurtähelisena. Üks lekseem võib realiseeruda mitme eri graafilise vormina (inglise lekseem CAR näiteks nelja car, cars, car's, cars', eesti substantiiv auto aga mitme vormina?). Lekseemist võib grammatikareeglite abil moodustada mis tahes vajalikke vorme. Tekstis realiseerub lekseem alati mingi sõnavormina.
rahvaste kirjakeelte ajaloost". Toimetanud Jaak Peebo (1995) 27. Suulise kõne uurimine, TÜ suulise kõne korpus. Kvantitatiivne uurimine uuritakse mingit hulka, nt mingite sõnade esinemissagedust Kvalitatiivne uuring sõnade mikroanalüüs, uuritakse sõnade suhestumist. Analüüsib, miks on sõnades varieerumine/miks kasutatakse erisituatsioonides eri vorme. Suhtlussituatsiooni mõju suhtlusele. TÜ suulise kõne korpus kogutud al 1997, keelekorpus, kõnekorpus on arvutilingvistikas foneetiliseks kasutuseks mõeldud spetsiaalsed korpused, avatud korpus, s.t ei ole ette määratud, kui palju ja mis liiki tekste ta peaks sisaldama, pragmaatiline korpus. Võimaldab kvalitatiivseid ja kvantitatiivseid uuringuid. Suulise kõne uurimine käib läbi korpuste, mis transkribeeritakse. Mida aeg edasi, seda enam kasutatakse kvalitatiivset uuringut. Suhtlussituatsiooni arvestamine. Sõnade erinevad rollid suulises ja kirjalikus kõnes. 28
• Seem on seega universaalne, üldistav ja ühetähenduslik tähenduskomponent.
• Nt. naisteadlane:
ühendatud. Teisalt võivad sõnaväljad anda infot meie teadmiste struktuuri kohta, ilma et need samastuksid kognitiivse teadmiste struktuuriga. Arvutilingvistika jaoks on sõnaväljad olulised arvutileksikoni struktureerimisel (nt WordNet projekt alguse saanud inglise keelest (Princetoni ülikool), nüüd tehtud paljude Euroopa keelte kohta). Seob nimisõnad, verbid ja adjektiivid sünohulkadesse. Võrdlevad e komparatiivsed sõnaväljauuringud on olulised arvutilingvistikas automaattõlke jaoks, kuna toovad välja eri keelte sõnavara sarnasused ja erinevused. Traditsiooniliselt on sõnaväljadel olemas seos ka keelefilosoofia ja antropoloogiaga, sest sõnaväljad võimaldavad analüüsida maailmapilti. 23. Paronüümia. Paronüümid e sarnassõnad sõnad, mis sarnanevad nii häälikkuju (kirjapildi) kui ka tähenduse poolest. Need on derivatsiooni kaasnähtuseks. Kuna derivatsioon on eesti keeles üks produktiivsemaid
aastad-1990. aastad · Üksiktähelepanekud argikeele sõnavarast, hääldusest ja morfoloogiast · Slängi kogumine ja uurimine Süsteemne uurimine 1990. Aastatest. Suuline keel on omaette register, mis jaguneb alamregistriteks TÜ suulise eesti keele korpus · kogutud 1997. aastast · ca 360 tundi (= ca 2 miljonit sõna) · Transkribeeritud ca 1 500 000 sõna, täppis ca 700 000 sõna · keelekorpus (linguistic corpus) · NB kõnekorpused (speech corpora) on arvutilingvistikas foneetiliseks kasutuseks mõeldud korpused · avatud korpus, s.t ei ole ette määratud, kui palju ja mis liiki tekste ta peaks sisaldama · pragmaatiline korpus Kasutamine · Korpus jaguneb eri piirangutasemetega alaosadeks · uurijad saavad kasutada suuremat osa salvestusi teadus- ja õppe-eesmärkidel · Kasutajad peavad allkirjastama konfidentsiaalsuskohustuse · Otsingumootor sõnavormide leidmiseks 23
inimene + + 0 0 mees + + + + naine + + - + poiss + + + - tüdruk + + - - eesel + - 0 0 puder - - ? ? Eesel mitteinimene, kes pole täiskasvanu? Tabel paisub lõputult, komponente tuleb üha juurde. Arvutilingvistikas aitab masinal sõna tähendust määrata statistika põhjal, töötavad teatud veaga. 2. Prototüüpanalüüs: tähendused võivad mingis osas kattuda; tähendustel on keskmed, tüüpilised esindajad, prototüübid. Nt mõiste lind: tiivad, suled, nokk, munemine. Peale kindlate tunnuste on vaikimisi tunnuseid, mida saab vajadusel tühistada, nt lendab, laulab. Piirid võivad olla hägusad, paljud mõisted kirjeldatakse nii, et inimese jaoks olulised aspektid tulevad välja.
Slängi kogumine ja uurimine. · Süsteemne uurimine 1990.aastast: suuline keel on omaette register, mis jaguneb alamregistriteks. Meedium: otsesuhtlus, telefonisuhtlus, raadio/telesuhtlus, arvutisuhtlus. Argine ja avalik (sh ametlik suhtlus). Dialoog ja monoloog. Erineva murdetasutaga variandid, erineva sotsiaalse taustaga variandid TÜ suulise eesti keele korpus: kogutud 1997.aastast, transkribeeritud ca 1 700 000 sõna. Keelekorpused, kõnekorpused (on arvutilingvistikas foneetiliseks kasutuseks mõeldud korpused), avatud korpus (s.t ei ole ette määratud, kui palju ja mis liiki tekste ta peaks sisaldama), pragmaatiline korpus Liigenduste aluseks 3 keelekasutust mõjutavat parameetrirühma: suhtlejate sotsiaalne ja dialektiline taust (suhtlejate omadused, mis annavad kokku registrid), suhtlusvaldkonnad, mis on seotud kindlate situatsioonitüüpidega (teenindus, lobisemine jms), peaaegu ainult spontaanne dialoog/polüloog
Normi järgimine ei ole kohustuslik. Normi rikkumist vormistatakse normist erinevalt ja tajutakse. Keskne uuritav nähtus on suhtlustegevus. Kirjeldatakse, mida suhtlejad ütlevad ja teevad, välditakse psühholoogilisi, seletatavaid kirjeldusi. TÜ suulise eesti keele korpus: · Kogutud 1997.aastast · Ca 360 tundi (= ca 2 mln sõna) · Transkribeeritud ca 1,5 mln sõna, täppis ca 700 000 sõna · Kõnekorpused on arvutilingvistikas foneetiliseks kasutuseks mõeldud korpused · Avatud korpus, st ei ole ette nähtud, kui palju ja mis liiki tekste ta peaks sisaldama · Liigenduse aluseks 3 keelekasutust mõjutavat parameetriarühma: o Suhtlejate sotsiaalne ja dialektiline taust o Suhtluse omadused, mis annavad kokku registri o Suhtlusvaldkond, mis on seotud kindlate situatsioonitüüpidega. Kasutamine: · Korpus jaguneb eri piirangutasemetaga alaosadeks
"Heinrich Gösekeni grammatika ja sõnastik 350" (2010) 23. Suuline keel ja selle uurimine, TÜ suulise kõne korpus. Kvantitatiivne uurimine uuritakse mingit hulka, nt mingite sõnade esinemissagedust Kvalitatiivne uuring sõnade mikroanalüüs, uuritakse sõnade suhestumist. Analüüsib, miks on sõnades varieerumine/miks kasutatakse erisituatsioonides eri vorme. Suhtlussituatsiooni mõju suhtlusele. TÜ suulise kõne korpus kogutud al 1997, keelekorpus, kõnekorpus on arvutilingvistikas foneetiliseks kasutuseks mõeldud spetsiaalsed korpused, avatud korpus, s.t ei ole ette määratud, kui palju ja mis liiki tekste ta peaks sisaldama, pragmaatiline korpus. Võimaldab kvalitatiivseid ja kvantitatiivseid uuringuid. Suulise kõne uurimine käib läbi korpuste, mis transkribeeritakse. Mida aeg edasi, seda enam kasutatakse kvalitatiivset uuringut. Suhtlussituatsiooni arvestamine. Sõnade erinevad rollid suulises ja kirjalikus kõnes. 24