Arvutilingvistika kordamisküsimused vastustega
Tooge igast
osast üks näide.
Andmebaas sisaldab verbist ja tema laienditest koosnevaid püsiühendeid. Täpsemalt:
andmebaasis on
· ühendverbid (nt üle hüppama, alla käima, juurde võtma);
· verbi ja noomeni püsivad ühendid, sh väljendverbid (lokku lööma, meelde
tuletama), tugiverbiühendid (tööd tegema, kõnet pidama) ja kollokatsioonid
(selgeks tegema, avaldust esitama).
· ahelverbid ehk finiitse verbi ühendid infiniidiga (sai pidama, pani ajama) on
andmebaasi kaasatud ebaregulaarselt.
14. Missuguseid allikaid kasutati ühendverbide andmebaasi loomisel?
Andmebaas koondab 5 inimkasutajale mõeldud sõnastiku andmeid, Filosofti tesauruse
materjale ja 20 miljonist sõnast koosnevast tekstikorpusest statistiliste meetoditega leitud
püsiühendeid (seda eksperimenti on lähemalt kirjeldatud artiklis Heiki-Jaan Kaalep,
Kadri Muischnek (2003). Püsiühendite leidmine suurtest tekstikorpustest. Eesti Keele