teduslikes uurimistöödes. Arvutilingvistika esimene suurem taksitus oli ja osaliselt ka on keeleressursside digitaliseerimine. Peamiseks probleemiks on situtatsioon kus tekst on loetava kas inimestele või programmidele. Üldjuhul kehtib see siiki suulise kõne kohta, kus eisneb palju variatsioone ja olustikust sõltuvaid nüansse. Digitaliseeriud keeleressursse kasutatakse nii uurimistöödes kui ka prkatiliste lahenduste loomisel. Viimasteks on laialdaselt kasutusel olevad veebisõnastikud, tesaurused, õigekirjakontrollid, masintõlked ja automaatne kõnetuvstus. Uurimistöödes kasutatakse keelekorpuseid ning nendes olevate allkeele võrdlusi, mille põhjal saab järeldusi teha keele muutumise, sõnasageduste või muu huvipakkuva kohta. Uurimismeetodid on tihti seotud ka muude abiteadustega nagu näiteks matemaatika, sotsioloogia ja psühholoogia. Keeletehnoloogilises arengus on tehtud mitmeid murranguid, tuleviku plaandisest oleks
koosvõime alal. Avaandmed, linkandmed, semantiline veeb. Semantilise koosvõime all mõistetakse tarkvarasüsteemide võimet teistelt infosüsteemidelt saadud andmeid adekvaatselt kasutada Eestis võib iseloomustada järgmiste olulisemate märksõnadega. Põhituum suutlikkus teiste süsteemidega regulaarselt andmeid vahetada. Luuakse ja kasutatakse süntaksi varasid (ühised andmevahetuse standardid) ning semantika varasid (valdkonnasõnastikud, tesaurused, klassifikaatorid, ontoloogiad, teenuste registrid jne) Open data(avaandmete) kasutamine. Avaandmed -veebis kõigile avalikult kasutamiseks antud masinloetavas formaadis andmed ilma kasutamis-, patentide- ja levitamispiiranguteta (üldjuhul tasuta). Liknandmed- eesmärk on luua veebis olevate andmete vahel seosed, mis võimaldavad neid paremini ühendada ja koos kasutada Semantiline veeb- püütakse anda informatsioonileveebis tähendust, et parendada nii arvutite-arvutite
a) motivatsioon väiksem ja b) L2 omandatakse läbi L1 prisma; on silmitsi suurema varieerumisega (palju rohkem erinevaid situatsioone ja teemasid); omab vähem aega; õpib tavaliselt "ebaloomulikus" olukorras ja omab harva "ema" Arvuti ja keel: Keeletehnoloogia: õigekirja- ja grammatikakontrollijad (spellerid), skänneriprogrammid, teksti ettelugejad (ja vastupidi (näit pimedatele)), automaatrefereerijad jms Arvuti keeleteadlasele abiks: keeleressursid: korpused, sõnastikud (tesaurused). Arvuti keelt mõistma: tehisintellekt 13. Keelte tüpoloogiline liigitus (morfoloogiline ja sõnajärje tüpoloogia). · Tüpoloogiline liigitus on liigitamine sõna muutuste järgi. · Morfoloogiline tüpoloogia: · isoleeriv sõnad ei muutu, pole käände- ega pöördelõppe, nt. vietnami (toonikeel); üks isoleeriv keel on inglise keel on the table (table ei muutu) · aglutineeriv sõna lõppudes ja algustes palju liiteid, nt
Täiskasvanud keeleõppija (võrreldes emakeelt õppiva lapsega) on neuroloogiliselt erinev, oskab lugeda ja kirjutada, oskab juba üht keelt, seega motivatsioon on väiksem ja L2 omandatakse läbi L1 prisma, on silmitsi suurema varieerumisega (palju rohkem erinevaid situatsioone ja teemasid), omab vähem aega, õpib tavaliselt ebaloomulikus olukorras ja omab harva ,,ema". Arvuti ja keel: - keeletehnoloogia, spellerid, teksti ettelugejad - arvuti keeleteadlasele abiks sõnastikud (tesaurused), korpused - arvuti keelt mõistma tehistintellekt Arvutilingvistika on lingvistika haru, mis kasutab arvutit inimkeele uurimise vahendina. Keeletehnoloogia on igasugused tehnoloogilised lahendused, mis on seotud keelega (spellerid, grammatikakontrollijad jne) 16) Maailma keeled. Indo-euroopa ja soome-ugri keelkond. Muid suuremaid keelkondi. 10
Täiskasvanud keeleõppija (võrreldes emakeelt õppiva lapsega) on neuroloogiliselt erinev, oskab lugeda ja kirjutada, oskab juba üht keelt, seega motivatsioon on väiksem ja L2 omandatakse läbi L1 prisma, on silmitsi suurema varieerumisega (palju rohkem erinevaid situatsioone ja teemasid), omab vähem aega, õpib tavaliselt ebaloomulikus olukorras ja omab harva ,,ema". Arvuti ja keel: - keeletehnoloogia, spellerid, teksti ettelugejad - arvuti keeleteadlasele abiks sõnastikud (tesaurused), korpused - arvuti keelt mõistma tehistintellekt Arvutilingvistika on lingvistika haru, mis kasutab arvutit inimkeele uurimise vahendina. Keeletehnoloogia on igasugused tehnoloogilised lahendused, mis on seotud keelega (spellerid, grammatikakontrollijad jne) 16) Maailma keeled. Indo-euroopa ja soome-ugri keelkond. Muid suuremaid keelkondi. Maailmas on erinevate arvamuste kohaselt 4000-7000 keelt, tõenäoliselt umbes 6000. INDOEUR OOPA KEELKON D GERMAANI
hinnangulise tõenäosuse järgi; kaardistada riskipiirkonnad ja organisatsiooni tegevuse turvaprobleemid; määrata kindlaks piirangute tasemed kõrgemast riskipiirkonnast madalamani; riskiandmete hindamise alusel kehtestada piirangute tasemed vastavate organisatsiooni toiminguid puudutavate dokumendiliikide kohta; seostada piirangud alusdokumentidega, nagu nt tegevuse liigitussüsteem või dokumentide kirjeldamiseks kasutatavad tesaurused. See võimaldab automaatselt seada eritingimusi või piiranguid dokumentide dokumendisüsteemi hõlmamisel ja registreerimisel. Juurdepääsuõiguste ja piirangute kehtestamise etapid: dokumenteeritava toimingu või tegevuse kindlakstegemine; struktuuriüksuse kindlakstegemine, mille juurde dokumendid kuuluvad; turvameetmete ja juurdepääsutingimuste kontrollimine, et teha kindlaks, kas toiming ja terve
juurdepääsetavuse (või nende põhjalikuma tundmaõppimise) meetodeid, mis on eelistatavalt mitmekeelsed ja võivad erineda struktuurilt, kuid peavad olema veebist kättesaadavad. Soodustada olemasolevate andmebaaside ja arhiivide kirjeldamist metaandmete abil. Tulemuste jagamine teiste sidusteenusena pakutavate (nii käimasolevate kui ka lõppenud) kultuuriprojektidega ning ühtekuuluvuse ja koostöö propageerimine, pakkudes veebiviiteid (andmepangad, tesaurused, lingikogumid) ühiselt teemavõrkude ja Interneti- väravate kaudu (vt 3.4.7). Koostöös osalemisel (s.o võrdsete partneritena, kes soovivad saavutada sama eesmärki) põhinev koordineeritus on sektorisisese võrgu loomise põhialus. Saidil peab olema aktiveeritud alajaotis, kus on toodud sise- ja välislingid samalaadsetele (s.o sama eesmärgiga loodud) ressurssidele. Seetõttu tuleb edendada eri riikide ühetaoliste institutsioonide koostööd.