[ma] saisin saaks saass Murdekogud ja uurimiskeskused Murdekeele lauskogumine algas Andrus Saareste eestvõttel 1921. a üliõpilastest stipendiaatide abil. Wiedemanni sõnaraamatut järgiva sõnavarakogu kõrvale tekkis murdetekstide kogu, väärtuslik allikas mitmele teadusharule. Keeleteadlaste kõrval on teinud suure töö Emakeele Seltsi vabatahtlikud kirjasaatjad. 2006. aastaks oli kogutud 1 748 500 sedelit ja 139 450 lehekülge keeleandmeid. Kohanimesid on kogutud 700 000, isiku- ja loomanimesid 56 700 sedelit (lähemalt vt http://www.teaduskogud.org/materjalid). Eesti Keele Instituudi dialektoloogid (Aili Univere, Salme Tanning, Helmi Viires, Mari Must, Helmi Neetar, Mart Mäger jpt) on olnud murdeainese kogumise ja uurimise peamisi jõudusid kogu Nõukogude perioodi. Koostatud on
Esimene tõlkekeele korpus oli Bakeri enda juhtimisel Manchesteri ülikoolis koostatud Translational English Corpus9 . Selle baasilt on uuritud peamiselt tõlgitud ja algupärase keele erinevusi ning ka tõlkijate individuaalset stiili. Joensuu ülikoolis Anna Mauraneni juhtimisel koostatud Käännössu- omen korpus on samuti võimaldanud soome tõlkekeele mitmekülgset uurimist, nt Mauranen ja Jantunen 2005. Korpusuurimus võimaldab vaadelda ja analüüsida suurt hulka keeleandmeid ning on loomu poolest kvantitatiivne. Siiski peab meeles pidama, et vaid kvantitatiivsete andmete kättesaadavus ei põhjenda uurimuse tegemist (nt House 2008, Baker 2004). Arvandmed võiksid olla vaid alguspunkt ning tõeliselt oluliseks osutub pigem see, et uurija leiab, milliseid keeleaspekte uurida ning kuidas korpusest saadud andmeid tõlgendada (Baker 2004: 169). Tõlkekeel Suurem osa korpuspõhisest tõlketeadusest tegeleb tõlkelise keele ehk tõlkekeelega