Mitmekeelne oskussuhtlus
toditega mõõdetakse keelendite kummalisust, st ainuomasust
vaatlusalusele teksti(liigi)le, lähtudes hüpoteesist, et kummalisus
korreleerub terminilisusega. Täiendavalt võidakse kasutada ka
lingvistilist infot, näiteks terminikandidaatide sõnaliigikuuluvust.
Ühesõnaliste terminite tuvastamine on suhteliselt lihtne, mitme-
sõnalisi leida on veidi keerulisem. Ka rikas morfoloogia, nagu
eesti keele puhul, raskendab ülesannet.
• Paralleelkorpusi ehk tekste ja nende tõlkeid sisaldavaid korpusi
saab joondada (align) teksti-, lause- või sõnatasemel. Automaat-
se joondamise täpsus suurematelt tekstiüksustelt väiksematele
liikudes muidugi väheneb, aga ka sõnataseme joondused on
juba üsna kasutuskõlbulikud. Kõigepealt annab see tulemuseks
automaatseid vastekandidaate, aga aitab ka polüseemse sõna
tähendusjaotuse leidmise juures (word sense induction), lähtudes