MASINTÕLGE Masintõlge · Tekstide automaatne tõlkimine · Suudab tõlkida iseseisvalt · Tõlkimisprotsess parem, kiirem, säästlikum · Praegu täielikult automatiseeritud masintõlge puudub Piiratud masintõlge · Toortõlge arusaamine teksti tähendusest · Piiratud sisendi tõlge ette on antud ainevaldkond ja lähteteksti formaat N: TAUM-METEO ingl-prantsuse ilmateated · Eeltoimetatud tõlge lauseid lihtsustatakse N: EL dokumendid Statistiline masintõlge Sõnadele võib mitte leiduda vastet teises keeles Kuidas käsi käib? How is hand walking?(ingl k) Õige variant How are you? Kivi kotti! A rock into the bag. (ingl k)
paarikümne aastaga. Eesti keel ning keele- ja kultuurikeskkond vajavad arendamist, et eesti keel pääseks ligi tipptasemel haridusele, töökohtadele ja rikkale kultuurielule. Arendamise valdkonnad Keele arendamise valdkonnad: 1. Keeletehnoloogia – kõige lihtsamal tasemel tähendab see eestikeelse arvuti- ja mobiilitarkvara: eesti keele kõnelejad kasutaksid eestikeelseid programme ja, et arvutites ja kodutehnikas saaks kasutada hääljuhtimist 2. Masintõlge – eesti keelt mitte kõnelev inimene saaks aru eesti keelsest tekstist 3. Teadus- ja hariduskell – kõigis teadusvaldkondades oleks olemas eestikeelne terminoloogia ja õpikud 4. Maailma kultuuripärandi vahendamine – kirjanduse tõlkekeel 5. Keelekasutuse õiguslik reguleerimine – et tagada eestikeelse info kättesaadavus avalikus ruumis ja eesti keele kasutamise võimalused kõikjal Eestis 6
võimaldab eesti keelel edukalt toimida tänapäeva infotehnoloogilises valdkonnas, samuti keeletehnoloogia infrastruktuuri ajakohastamine. Millest koosneb (eesti) keele keeletehnoloogiline tugi? Keeletehnoloogiline tugi koosneb keeleressurssidest ja keeletarkvarast ning viimase rakendustest. Nimetage lõppkasutajale orienteeritud keeletehnoloogia valdkonnad Eestis. - Kõnesüntees - Kõnetuvastus - Inimene-masin dialoogsüsteemid - Grammatikakorrektor - Infootsingud - Masintõlge - Leksikograafi töökeskkond Nimetage keeletehnoloogia valdkonnad Eestis, mis on vajalikud lõppkasutajale suunatud rakenduste loomiseks. - Morfoloogiline analüüs ja süntees - Sõnamoodustuslik analüüs ja süntees - Süntaktiline analüüs ja süntees - Semantiline analüüs ja süntees - Kõneaktide tuvastaja Selgitage mõisteid: - Masintõlge - tõlkimisprotsess, mille puhul põhitöö viib läbi arvuti.
· äärmuslikud arengud pole välistatud · parim kaitse võimalikult suur kõnelejaskond ei tekita paarikümne aastaga · keele- ja kultuurikeskkond vajab arendamist et pääseks ligi tipptasemel haridusele töökohtadele rikkale kultuurielule Arendamise valdkonnad Keeletehnoloogia eestikeelne arvuti- ja mobiili- Teadus- tarkvara:programm, hääljuhtimine Masintõlge kirjanduse mitteoskaja kättesaadavus saab aru tõlge eesti k tekstist Keele Eesti keele kui Teadus- ja arendamise teise keele hariduskeel valdkonnad eesti k Õpetamine terminoloogia suhtluskeeleks
Kuidas õpitakse keelt, kuidas õpitavad keeled lokaliseeruvad ajas, lapse keeleline areng, kõnepatoloogiad PRAGMAATIKA uurib keele funktsioneerimist suhtluses, keelendid omandavad tähenduse suhtluses SEMIOOTKA uurib keelt kui märgisüsteemi: keelemärkide ehitus, suhe keelevälise tegelikkusega, märkide omavaheline seos Keeleteaduse harud ARVUTILINGVISTIKA suhteliselt uus haru: keele automaatanalüüs, kirjeldamine, morfoanalüsaator, masintõlge jms Keeleuurimine keele tasandite kaupa Grammatika: nii keeletasand, kui ka teadus , mis seda uurib, samuti... Foneetika: häälikud ja kõne tajumine Artikulatoorne foneetika: hääldus ja kõnetraktis toimuv Auditiivne foneetika:kõne kuulmine Akustiline foneetika: kõnelemisel tekkinud helilained Fonoloogia: häälikute süsteem Foneetika: selline ja selline häälik moodustub nii ja nii Fonoloogia: Keeles X on 8 vokaali, mis jagunevad nii ja nii
Postmodernistlik kultuurisituatsioon. Postmodernism - on kirjanduslik ja kunstiline vool ning arhitektuurisuund. Üldisemalt võib postmodernismi pidada globaalseks kultuuriliseks hoiakuks, mis järgneb modernismi hoiakule edenemise mõttes või lihtsalt ajalises tähenduses. Postmodernismi tunnused - ajaline korrastamatus, ajaloo ja fantaasia segu; fragmentaarsus; on kadunud usaldus terviklikkuse vastu; ideede lõtv seotus; paranoilisus; kindla teemaderingi eristamatus. Ihab Hassani modernismi ja postmodernismi eristus: Modernism Postmodernism Romantism / Sümbolism Pataphysics / dadaism Eesmärk Mängima Disain Võimalus Hierarhia Anarhia Meisterlikkuse / Logod Ammendumine / Silence Art Object / Lõpetatud tööd Protsess / Performance / Happening Loomine / Summeerimisnäidiku Decrea...
Keeletüpoloogia koht keeleteaduses see on meetod, mitte teooria, seepärast võib ta olla teooria-neutraalne. Püüab selgitada, millised on loomuliku keele piirid, mitte miks nad sellised on. Teooria-neutraalsusest hoolimata saab keeletüpoloogia paremini läbi funktsionaalsete keeleteooriatega kui formaalsete teooriatega. Keeletüpoloogia otsib funktsionaalseid seletusi. 5) Keeletehnoloogia loob keeletöötlustarkvara arvutitele. Keeletehnoloogiat saab rakendada: - masintõlge ühest keelest teise - telefonidialoog arvutiga - infoootsing eletroonilistest dokumentidest, sisukokkuvõtete tegemine - automaatne diktofon - tehiskõne süntees - kirjutaja abivahendid tekstitöötlusprogrammides 6) Arvutilingvistika loob teooriaid inimkeelte formaalseks kirjeldamiseks. 7) Viipekeel viipekeel on loomulik keel, mis on tekkinud suurte kurtide arvuga kogukondades loomulikul teel (koduviiped - pidzin - kreoolkeel), nt kurtide koolides.
absoluutsed universaalid- omadused, mis esinevad kõigil või peaaegu kõigil maailma keeltel adverb e. määrsõna adverbiaal e. määrus- verbi laiend, mis ei ole objekt ega predikatiiv afektiivne e. emotiivne tähendus- kui lisatähenduses sisalduv tugev emotsionaalne laeng, kutsutakse niimoodi afiks e. seotud morfeem afiksaaladverb e. abimäärsõna afrikaat- kui konsonandi hääldamisel õhuvool katkeb, kuid kulgla taasavanemisel tekib tugev vabanemismüra aglutineerivad keeled- neis on rohkesti muuteelemente, eriti sõnatüvele lisanduvaid järelliiteid. aktant e. kohustuslik nominaalne moodustaja Aktionsart- tegevuslaad aktsent- kasutatakse nii rõhu kui kõrguse kohta akustiline foneetika- kõnelemisel tekkivaid helilaineid uuriv foneetika allkeel- erinev keelekuju, nt. mingi eriala, rühma või isiku keel allofoon- foneemi variant allomorf- morfeemi variandid antonüümia- semantiline vastandussuhe antropoloogiline lingvistika- (Ameerika) strukturalismi ...
arvutis (Picasa) · programm kasutaja arvutis oleva info otsimiseks (Google Desktop) · pakutakse ka lahendust ettevõttesisese info haldamiseks (Google Desktop Search for Enterprise) · reklaamide lisamine kontekstipõhiselt justkui lisandväärtusena põhitekstile Näiteid tegevustest info vahendamisel · võimalus teha päringuid ka mobiili abil, kasutades selleks WAP-lehte või SmS- päringut · masintõlge enamlevinud keelte vahel · teksti konverteerimine ühest vormingust teise (.pdf ja .doc failide puhverdamine tekstina) · raamatute digiteerimise projekt Google Print, mis võimaldab ilmunud raamatutest teha tekstipõhiseid otsinguid. Google on arendamas uut pihuarvutite operatsioonisüsteemi nimega Android. Tegu on uudse tarkvaraga võrreldes Androidi põhikonkurentide Windows Mobili või Nokia Symbianiga. Google Android on vaba lähtekoodiga süsteem
jne, hääle kvaliteedi muutus, sisse- ja väljahingamised, pealerääkimine. 29. Arvutilingvistika (põhilised tegevussuunad, uurimiskeskused, olulisemad uurijad ja tööd). Põhilised tegevussuunad: formaalsed grammatikad, algoritmid ja programmid loomuliku keele analüüsiks ja töötlemiseks, keeleressursid; rakenduslik pool: õigekeelsus ja stiili kontroll, grammatikakorrektor, sisukokkuvõtja, infootsingusüsteem, inimkeelne dialoog arvutiga, suulise kõne süntees ja tuvastus, masintõlge jne Uurimiskeskused: TÜ arvutilingvistika uurimisrühm, TÜ keeletehnoloogia uurimisrühm, TTÜ foneetika ja kõnetehnoloogia labor, Eesti Keele Instituudi keeleteaduse ja tehnoloogia osakond Uurijad: Mart Remmel, Ülle Viks, Margit Langemets, Meelis Mihkla Tööd: TÜs loodud korpused, EKI korpus, TTÜ küberneetika instituudi eestikeelse kõne andmebaas 30. Koodivahetuse uurimine.
Süntaktiline analüüs ja süntees. Semantiline analüüs (ja süntees) jne. Keeleressursid: korpused, leksikonid, andmebaasid Rakenduslikum pool: rakendustarkvara näiteid. · õigekeelsuse ja stiili kontroll (nt speller) · grammatikakorrektor · sisukokkuvõtja · infootsisüsteemid · inimkeelne dialoog arvutigainimkeelne dialoog arvutiga · suulise kõne süntees (st tekst -> kõne) ja tuvastus (st kõne-> tekst) · masintõlge · tõlkija või keeleõppija abivahendid jne jne
· Liited ja sõnad: · -a: mata, jonna · -ka: inka · -noi: kehvnoi 25. Arvutilingvistika ja keeletehnoloogia (põhilised tegevussuunad, rakendused, uurimiskeskused). Põhilised tegevussuunad: formaalsed grammatikad, algoritmid ja programmid loomuliku keele analüüsiks ja töötlemiseks, keeleressursid; Rakendused:: õigekeelsus ja stiili kontroll, grammatikakorrektor, sisukokkuvõtja, infootsingusüsteem, inimkeelne dialoog arvutiga, suulise kõne süntees ja tuvastus, masintõlge, automaatne morfoloogiline analüüs, keelekorpused, leksikonid, andmebaasid Uurimiskeskused: TÜ arvutilingvistika uurimisrühm, TÜ keeletehnoloogia uurimisrühm, TTÜ foneetika ja kõnetehnoloogia labor, Eesti Keele Instituudi keeleteaduse ja tehnoloogia osakond
pealerääkimine. 25. Arvutilingvistika ja keeletehnoloogia (põhilised tegevussuunad, rakendused, uurimiskeskused). Põhilised tegevussuunad: formaalsed grammatikad, algoritmid ja programmid loomuliku keele analüüsiks ja töötlemiseks, keeleressursid; rakenduslik pool: õigekeelsus ja stiili kontroll, grammatikakorrektor, sisukokkuvõtja, infootsingusüsteem, inimkeelne dialoog arvutiga, suulise kõne süntees ja tuvastus, masintõlge jne Uurimiskeskused: TÜ arvutilingvistika uurimisrühm, TÜ keeletehnoloogia uurimisrühm, TTÜ foneetika ja kõnetehnoloogia labor, Eesti Keele Instituudi keeleteaduse ja tehnoloogia osakond Uurijad: Mart Remmel, Ülle Viks, Margit Langemets, Meelis Mihkla Tööd: TÜs loodud korpused, EKI korpus, TTÜ küberneetika instituudi eestikeelse kõne andmebaas 26. Eesti keele olukord ja arendamine kestlikkuse seisukohalt. Eesti keelt kõneleb umbes miljon inimest emakeelena
Kordamisküsimused. Keeleteaduse alused, 1. pool 1. Loomuliku inimkeele tunnusjooni. Kõik normaalse kognitiivse arenguga inimesed räägivad mingisugust loomulikku keelt, paljud räägivad mitmeid keeli. Vaegkuuljad kasutavad vastavalt viipekeelt. ,,Loomulik" tähendab siinkohal kolme asja. a)esiteks: keeled on tekkinud ja arenenud loomulikul teel sadade tuhandete aastate vältel ja nende vahendid, eelkõige sõnavara, on kujunenud väljendama just seda, mis konkreetses kultuurilises ja füüsilises keskkonnas on olnud vajalik. b)teiseks: inimlaps omandab emakeele ehk esimese keel loomupäraselt, ilma õpetamiseta.Piisab sellest, kui ta saab suhelda teiste inimestega. c)kolmandaks: kui esimene keel on omandatud, kasutavad inimesed seda sidevahendina igapäevastes olukordades ning ümbritseva maailma verbaalseks kujutamiseks. Sõnadel on palju tähendusi, nad on mitmetähenduslikud ehk polüseemsed. Kui räägitakse mingi isiku, eriala või rühma keelest...
tutvu lausearvutuse keskkonnaga: http://logik.phl.univie.ac.at/~chris/gateway/formular-uk-zentral.html Millistel muutuja väärtustel on lause (Av(B&A))v(-A&(Cv(B&-C))) väär? Panna tuleb results only, 0 on väär 1 on õige Tutvu ajalooga saidis kuni II maailmasõda: http://www.maxmon.com/history.htm Loe läbi jutt ja proovi andmetega mängida: http://math.hws.edu/TMCM/java/DataReps/index.html Kahend süsteemi arvu(101101001) ->kümnend süsteemiks. Nr sisse ja bianarile punkt, ja vaatan base ten integeri kümnendarvudest annab Ecki appletis juuresoleva graafilise kujutise, teen kujundi ja vaatan base integeri mis vastab kahendsüsteemi arvule 1110001 ASCII tabelis? Nr sisse ja punkt bianari, vaatan ...teksti Kümnendsüsteemi arv 33 on kahendsüsteemis? 33 kirjutan ja Base-ten integer, vaatan bianary Loe läbi jutud Atbashi ja Caesari šifri (Caesar cipher) kohta: http://www.wikipedia.org 2 Tutvu ajalooga kuni 1970ndad: http://www.islandnet.com/~...