Alati on parem uurida primaarset allikat, millel pole kellegi poolt varem töötlemata teooriaid või hüpoteese, sest sekundaarseid tuleb alati üle kontrollida. Tekste on hea uurida, kuid neis ei esine kõike, mida vaja, sest tekstid on üldiselt narratiivi kujul. Emakeelset kõnelejat on hea uurida, kuid küsitlus ei pruugi loomulik olla. Tüpoloogia andmeid kogutakse valimi abil. Valimis peab olema palju erinevaid keeli, mis erineks geneetiliselt ja areaalselt, et välistada ajaloolist sõltuvust. Valim sõltub nähtusest ehk kui paljudes keeltes see esineb. Haruldase nähtuse uurimisel peab valik olema suhteliselt täielik (nt Greenberg uuris glotaalseid konsonante 150 teadaolevas keeles). Tavanähtuse puhul tekib probleem valikuga, kuigi ka 4050 keele uurimisega võib saada usutavaid tulemusi. Pilootuurimiseks on vaja 50100 keelt, mille avaldamisele järgneb lingvistilise üldsuse reaktsioon ja siis saab andmeid täiendada.
Primaarne allikas alati parem kui sekundaarne, st kellegi poolt (mingi teooria või hüpoteesi alusel) töödeldud näited. Sekundaarseid allikaid tuleks kontrollida, sest nad esindavad paremal juhul dokulekte (dokumenteeritud keelevariante. Emakeelne kõneleja – hea, kuid küsitlus ei ole loomulik situatsioon VALIM - Valik peaks sisaldama võimalikult erinevaid keeli a) geneetiliselt ja b) areaalselt, et välistada ajaloolist sõltuvust. - Kui uuritakse haruldast nähtust, siis peaks valik olema suhteliselt täielik. Nt Greenberg uuris glotaalseid konsonante ja tal oli 150 keelt, mis praktiliselt olidki kõik teadaolevad. - On suurepäraseid näiteid sellest, kuidas on saadud väga usutavaid tulemusi 40-50 keelega. - 50-100 keele kasutavat uurimust peetakse tänapäeval siiski ainult pilootuurimuseks