Lühidalt arvutilingvistikast
loetav inimestele, teine maasinatele. Arusaadavalt on see aga suhteliselt tüütu.
Arvutitranskriptsiooni üheks näiteks on TEI, milles on välja töötanud komplekti juhiseid,
ning ideeliselt peaksid olema sellega võimelised töötama ükskõik millise eriala uurijad ja
tekst peaks olema arvuti poolt loetavasse vormid viidav sõltumata sellest, millise riistvara
või tarkvaraga on tegemist ja sõltumata keelesta. TEI suurima puudused on täpitähtede
puudumine ja vähene inimesekesksus. TEI-l on probleeme ka korraga rääkimis
juhtumitega.
Raskustest hoolimata on siiski suur osa ressurssidest digitaliseeritud. Tartu ülikooli juures
on tehtud eesti keele kõnekorpus, mida on täiendatud alates 1997. aastast. Suulise kõne
materjale on aga korjatud juba 1920ndatest. Eesti keele korpus on avatud korpus st et
seda arendatakse järjepidevalt. Mõeldud on koguda erinevat ,,tüüpi suulist kõnet, nii