Üldkeel
Korpus ehk keelematerjalide kogu
Korpus on ligi 500000-sõnaline, koosneb eesti ilukirjanduse, tõlkekirjanduse, ajakirjanduse, seaduse ja suulise keele
tekstidest. Osade tekstide märgendus on veel ühtlustamata.
· Korpus on tehniliselt ühtlustatud ja märgendatud
· Praktilises elus nimetatakse korpuseks
igasuguseid elektroonilisi keelekogusid, mis on
teatud viisil korrastatud (ühtlustatud)
Märgendamiseks nimetatakse interpretatiivse info lisamist suulist või kirjalikku keelt
esindavasse keelekorpusesse
Korpus on tehniliselt ühtlustatud ja märgendatud
99. Tõlkeprogrammid
On uue meedia väljakutsed keeleuurimisele. Nt Google translator.
Tõlkeprogramme ja juba valmis tõlgitud programme ühendab see, et neil puudub paindlikkus. See tähendab, et
tõlkeprogrammid suudavad anda vastuseid ainult sõna kaupa ning operatsioonisüsteemides on käsitsi tõlgitud ja
staatilised vastavused keelte vahel. Et luua arusaadav tõlge kahe keele vahel, tuleb edasi kanda mitte iga üksiku sõna