TÜ suulise eesti keele korpus · kogutud 1997. aastast · ca 360 tundi (= ca 2 miljonit sõna) · Transkribeeritud ca 1 500 000 sõna, täppis ca 700 000 sõna · keelekorpus (linguistic corpus) · NB kõnekorpused (speech corpora) on arvutilingvistikas foneetiliseks kasutuseks mõeldud korpused · avatud korpus, s.t ei ole ette määratud, kui palju ja mis liiki tekste ta peaks sisaldama · pragmaatiline korpus Kasutamine · Korpus jaguneb eri piirangutasemetega alaosadeks · uurijad saavad kasutada suuremat osa salvestusi teadus- ja õppe-eesmärkidel · Kasutajad peavad allkirjastama konfidentsiaalsuskohustuse · Otsingumootor sõnavormide leidmiseks 23.Suulise keelekasutuse erijooni ja -nähtusi võrreldes kirjalikuga. · Liited kas a e s; Pillekas, jota, kohve, õps · Pausid, venitamised, üneemid, parasiitsõnad noh, nagu, · Edasilükkamised, pausid, et-otsene kõne 24. Släng ja selle uurimine
t ei ole ette määratud, kui palju ja mis liiki tekste ta peaks sisaldama), pragmaatiline korpus Liigenduste aluseks 3 keelekasutust mõjutavat parameetrirühma: suhtlejate sotsiaalne ja dialektiline taust (suhtlejate omadused, mis annavad kokku registrid), suhtlusvaldkonnad, mis on seotud kindlate situatsioonitüüpidega (teenindus, lobisemine jms), peaaegu ainult spontaanne dialoog/polüloog Kasutamine: korpus jaguneb eri piirangutasemetega alaosadeks. Uurijad saavad kasutada suuremat osa salvestusi teadus- ja õppe-eesmärkidel. Kasutajad peavad allkirjastama konfidentsiaalsuskohustuse. Otsingumootor sõnavormide leidmiseks 24. Suulise keelekasutuse erijooni ja -nähtusi võrreldes kirjalikuga. 25. Arvutilingvistika ja keeletehnoloogia (põhilised tegevussuunad, rakendused, uurimiskeskused). arvutilingvistika (computational linguistics)- loomuliku keele automaattootlusega tegelev keeleteaduse ja informaatika piiriala