· Ca 360 tundi (= ca 2 mln sõna) · Transkribeeritud ca 1,5 mln sõna, täppis ca 700 000 sõna · Kõnekorpused on arvutilingvistikas foneetiliseks kasutuseks mõeldud korpused · Avatud korpus, st ei ole ette nähtud, kui palju ja mis liiki tekste ta peaks sisaldama · Liigenduse aluseks 3 keelekasutust mõjutavat parameetriarühma: o Suhtlejate sotsiaalne ja dialektiline taust o Suhtluse omadused, mis annavad kokku registri o Suhtlusvaldkond, mis on seotud kindlate situatsioonitüüpidega. Kasutamine: · Korpus jaguneb eri piirangutasemetaga alaosadeks · Uurijad saavad kasutada suuremat osa salvestusi teadus- ja õppe-eesmärkidel · Kasutajad peavad allkirjastama konfidentsiaalsuskohustuse · Otsingumootor sõnavormide leidmiseks. 23. Suulise keelekasutuse erijooni ja -nähtusi võrreldes kirjalikuga. · Süntaks: keskne erinevus suulise ja kirjaliku keele vahel
· (Mõnikord lisatakse zanrid, mõnikord teadlikud võtted kindlate tunnustega teksti saavutamiseks) · Füüsiline olukord, tingimused: aeg ja koht, suletud / avatud, eraterritoorium / neutraalne territoorium / institutsionaalne territoorium jms · Eesmärgid: suhtluses osalemine / info laias mõttes (involved / informational), konkreetsed retoorilised eemärgid (informeerimine, praktiline tegevus, veenmin, jutustamine jne). · Suhtlusvaldkond, teema, kõneaine: millest kõneldakse ja millises valdkonnas suhtlus toimub 2.1. Kohamurre ja dialektoloogia Keelegeograafia ehk dialektoloogia: · meetodite võrk murrete erinevuste uurimiseks · tekkis 19. sajandi lõpul, mil lingvistikas valitses võrdlev-ajalooline meetod. VA meetod väitis, et keel muutub rangelt häälikumuutuste reeglite alusel. · D sündis, et testida hüpoteesi häälikumuutuste regulaarsuse kohta