- Sõnamoodustuslik analüüs ja süntees - Süntaktiline analüüs ja süntees - Semantiline analüüs ja süntees - Kõneaktide tuvastaja Selgitage mõisteid: - Masintõlge - tõlkimisprotsess, mille puhul põhitöö viib läbi arvuti. - Kõnetehnoloogia keele arendamiseks kasutatav tehnoloogia (programmid, andmed) - Infootsing - on toimingud, meetodid ja protseduurid talletatud andmetest informatsiooni saamiseks etteantud teemal. - Keeleressursid - elektroonilised andmekogud, mida kasutatakse keeletarkvara väljatöötamiseks. Mis on kõnesünteesi eesmärk? Eesmärgiks on kõrgekvaliteedilise eestikeelse tekst-kõne sünteesi prototüübi loomine, mida saab koos kõnetuvastusega rakendada inimene-masin-inimene suhtluses. Mis on kõnetuvastuse eesmärk? Eesmärgiks on kõnetuvastuse arendamiseks vajaliku töökeskkonna ja eesti keele spetsiifiliste kõnetuvastusmoodulite väljatöötamine.
Kirjalike tekstide esimesed sada sõna katavad 32-34 % tekstidest, suulise korpuse sõnad aga 46-476% ehk suulises kõnes saadakse hakkama väiksema arvu sõnadega. Argikõne ja ametliku suhtlust võrreldes toodi välja, et argivestlus on inimesekesksem, emotsionaalsem, kasutab lühivorme, ja ametlik kõne asja- ja inofkesksem, kasutab rohkem asesõnu, takerdumispartiklid, on infokesksem. 6 3. Eesti keele korpused, keeleressursid ja teised ,,Elektrooniliste sõnastike tegemisega on rohkem või vähem tegevuses TÜ, EKI, Festart, Filosoft jm uurimis ja kommertsasutused." (Arvutimaailm, 2002). Keeleressurssidega tegelemine nõuab nii materiaalseid kui ka inimressursse, kuid sellesse tasub investeerida. Keeletoodete areng on sõltuv sellest, kui hästi kättesaadavad ning mahukad on ressurssi elektroonilised sõnastikud, terminoloogiabaasid, teksti- ja kõnekorpused ning formaalsed grammatikad
oskab juba ühte keelt, seega a) motivatsioon väiksem ja b) L2 omandatakse läbi L1 prisma; on silmitsi suurema varieerumisega (palju rohkem erinevaid situatsioone ja teemasid); omab vähem aega; õpib tavaliselt "ebaloomulikus" olukorras ja omab harva "ema" Arvuti ja keel: Keeletehnoloogia: õigekirja- ja grammatikakontrollijad (spellerid), skänneriprogrammid, teksti ettelugejad (ja vastupidi (näit pimedatele)), automaatrefereerijad jms Arvuti keeleteadlasele abiks: keeleressursid: korpused, sõnastikud (tesaurused). Arvuti keelt mõistma: tehisintellekt 13. Keelte tüpoloogiline liigitus (morfoloogiline ja sõnajärje tüpoloogia). · Tüpoloogiline liigitus on liigitamine sõna muutuste järgi. · Morfoloogiline tüpoloogia: · isoleeriv sõnad ei muutu, pole käände- ega pöördelõppe, nt. vietnami (toonikeel); üks isoleeriv keel on inglise keel on the table (table ei muutu)
Suulises kõnes esineb valehääldusi, üneemide kasutamist, dialoogipartikleid jne, intonatsioonid, pausid, rõhk, tempo, naer/venitused jne, hääle kvaliteedi muutus, sisse- ja väljahingamised, pealerääkimine. 29. Arvutilingvistika (põhilised tegevussuunad, uurimiskeskused, olulisemad uurijad ja tööd). Põhilised tegevussuunad: formaalsed grammatikad, algoritmid ja programmid loomuliku keele analüüsiks ja töötlemiseks, keeleressursid; rakenduslik pool: õigekeelsus ja stiili kontroll, grammatikakorrektor, sisukokkuvõtja, infootsingusüsteem, inimkeelne dialoog arvutiga, suulise kõne süntees ja tuvastus, masintõlge jne Uurimiskeskused: TÜ arvutilingvistika uurimisrühm, TÜ keeletehnoloogia uurimisrühm, TTÜ foneetika ja kõnetehnoloogia labor, Eesti Keele Instituudi keeleteaduse ja tehnoloogia osakond Uurijad: Mart Remmel, Ülle Viks, Margit Langemets, Meelis Mihkla
· Uno Ilm. Kurjategijate släng. 1992 · Noorte släng 1992 25. Arvutilingvistika ja keeletehnoloogia (põhilised tegevussuunad, rakendused, uurimiskeskused). Arvutilingvistika tegeleb - Formaalsed grammatikad. Algoritmid ja programmid loomuliku keele analüüsiks ja töötlsemiseks. Nt Morfoloogiline analüüs ja sünteesMorfoloogiline analüüs ja süntees. Süntaktiline analüüs ja süntees. Semantiline analüüs (ja süntees) jne. Keeleressursid: korpused, leksikonid, andmebaasid Rakenduslikum pool: rakendustarkvara näiteid. · õigekeelsuse ja stiili kontroll (nt speller) · grammatikakorrektor · sisukokkuvõtja · infootsisüsteemid · inimkeelne dialoog arvutigainimkeelne dialoog arvutiga · suulise kõne süntees (st tekst -> kõne) ja tuvastus (st kõne-> tekst) · masintõlge · tõlkija või keeleõppija abivahendid jne jne
Instituudi keeleteaduse ja tehnoloogia osakond. Kõnetehnoloogiaga tegeletakse Eesti Keele Instituudis (kõnesüntees) ja TTÜ-s (kõnetuvastus) Millega tegeleb arvutilingvistika? Formaalsed grammatikad; algoritmid ja programmid loomuliku keele analüüsiks ja töötlemiseks, nt morfoloogiline analüüs ja süntees, süntaktiline analüüs ja süntees, semantiline analüüs ja süntees jne. keeleressursid: korpused, leksikonid, andmebaasid. Rakenduslikum pool: rakendustarkvara näited: õigekeelsuse ja stiili kontroll (nt speller), grammatikakorrektor, sisukokkuvõtja, infootsimissüteemid, inimkeelne dialoog arvutiga, tõlkija või keeleõppija abivahendid jne Õigekirjakorrektor ehk speller kontrollib, kas sõna leidub leksikonis kontekstile tähelepanu pööramata, grammatikakorrektor vaatab kogu lauset. Leiab (ideaaljuhul) sõnad, mille vorm ei sobi lausesse. Ühildumis-
Õpilassläng 1920/30 ja 1990. aastad · Tavaliselt peetud kiiresti muutuvaks, osa sõnavarast väga püsiv · Paks inimene: trulla, tünn · Rumal inimene: oh-oo, oh-oh · Liited ja sõnad: · -a: mata, jonna · -ka: inka · -noi: kehvnoi 25. Arvutilingvistika ja keeletehnoloogia (põhilised tegevussuunad, rakendused, uurimiskeskused). Põhilised tegevussuunad: formaalsed grammatikad, algoritmid ja programmid loomuliku keele analüüsiks ja töötlemiseks, keeleressursid; Rakendused:: õigekeelsus ja stiili kontroll, grammatikakorrektor, sisukokkuvõtja, infootsingusüsteem, inimkeelne dialoog arvutiga, suulise kõne süntees ja tuvastus, masintõlge, automaatne morfoloogiline analüüs, keelekorpused, leksikonid, andmebaasid Uurimiskeskused: TÜ arvutilingvistika uurimisrühm, TÜ keeletehnoloogia uurimisrühm, TTÜ foneetika ja kõnetehnoloogia labor, Eesti Keele Instituudi keeleteaduse ja tehnoloogia osakond
Suulises kõnes esineb valehääldusi, üneemide kasutamist, dialoogipartikleid jne, intonatsioonid, pausid, rõhk, tempo, naer/venitused jne, hääle kvaliteedi muutus, sisse- ja väljahingamised, pealerääkimine. 25. Arvutilingvistika ja keeletehnoloogia (põhilised tegevussuunad, rakendused, uurimiskeskused). Põhilised tegevussuunad: formaalsed grammatikad, algoritmid ja programmid loomuliku keele analüüsiks ja töötlemiseks, keeleressursid; rakenduslik pool: õigekeelsus ja stiili kontroll, grammatikakorrektor, sisukokkuvõtja, infootsingusüsteem, inimkeelne dialoog arvutiga, suulise kõne süntees ja tuvastus, masintõlge jne Uurimiskeskused: TÜ arvutilingvistika uurimisrühm, TÜ keeletehnoloogia uurimisrühm, TTÜ foneetika ja kõnetehnoloogia labor, Eesti Keele Instituudi keeleteaduse ja tehnoloogia osakond Uurijad: Mart Remmel, Ülle Viks, Margit Langemets, Meelis Mihkla