Tekste on hea uurida, kuid neis ei esine kõike, mida vaja, sest tekstid on üldiselt narratiivi kujul. Emakeelset kõnelejat on hea uurida, kuid küsitlus ei pruugi loomulik olla. Tüpoloogia andmeid kogutakse valimi abil. Valimis peab olema palju erinevaid keeli, mis erineks geneetiliselt ja areaalselt, et välistada ajaloolist sõltuvust. Valim sõltub nähtusest ehk kui paljudes keeltes see esineb. Haruldase nähtuse uurimisel peab valik olema suhteliselt täielik (nt Greenberg uuris glotaalseid konsonante 150 teadaolevas keeles). Tavanähtuse puhul tekib probleem valikuga, kuigi ka 4050 keele uurimisega võib saada usutavaid tulemusi. Pilootuurimiseks on vaja 50100 keelt, mille avaldamisele järgneb lingvistilise üldsuse reaktsioon ja siis saab andmeid täiendada. Keelevalimi koostamiseks tuleb - võtta igast keelkonnast sama % keeli, mistõttu saavad suure keelte arvuga keelkonnad suure esindatuse
Sekundaarseid allikaid tuleks kontrollida, sest nad esindavad paremal juhul dokulekte (dokumenteeritud keelevariante. Emakeelne kõneleja – hea, kuid küsitlus ei ole loomulik situatsioon VALIM - Valik peaks sisaldama võimalikult erinevaid keeli a) geneetiliselt ja b) areaalselt, et välistada ajaloolist sõltuvust. - Kui uuritakse haruldast nähtust, siis peaks valik olema suhteliselt täielik. Nt Greenberg uuris glotaalseid konsonante ja tal oli 150 keelt, mis praktiliselt olidki kõik teadaolevad. - On suurepäraseid näiteid sellest, kuidas on saadud väga usutavaid tulemusi 40-50 keelega. - 50-100 keele kasutavat uurimust peetakse tänapäeval siiski ainult pilootuurimuseks - Praktikas: pärast pilootprojekti avaldamist reageerib lingvistiline üldsus ja andmeid on võimalik täiendada. Lahendused keeltevalimi koostamiseks: