Keeleuurimise meetodid kordamisküsimused
häälikutasandi segmenti, 472 460 silbitasandi segmenti ja 85 494 taktitasandi segmenti
Foneetilise korpuse koostamise eesmärgiks on koguda andmeid spontaanse kõne
foneetiliste joonte kohta, koguda materjali kõnetehnoloogidele ja uurida spontaanse
kõne erinevaid jooni
Suust suhu kutsega salvestamisele kutsutud keelejuhid võivad olla omavahel tuttavad,
et õhkkond vabam oleks. Vesteldakse vabalt valitud teemadel, argidialoogid on
spontaansed. Lindistatakse ka poolspontaanseid institutsionaalseid monolooge.
Lindistuste märgendamiseks ja segmentimiseks kasutatakse programmi Praat
Sõnatasandi esmane segmentatsioon saadakse automaatse kõnetuvastuse abil,
märgendus vaadatakse käsitsi üle. Häälikutasand segmenditakse käsitsi.
Morfoloogiline märgendus tehakse Filosofti analüsaatoriga, aga ei ühestata.
Korpusest saab otsida ühe sõna piires