2 ANVOA või regressioonanalüüs Kui meil sõltumatu muutuja koosneb kategooriatest, siis on parem kasutada ANOVA't. Kui sõltumatu muutuja on pidev tunnus, siis on parem kasutada regressiooni. ANOVA'ga hinnatakse gruppide keskmiste erinevust. Regressiooniga saab ennustada sõltuva muutuja väärtust prediktori (sõltumatu muutuja) väärtuste põhjal. Efekti suurus Efekti suurus on statistiline näitaja, mis võimaldab lisaks statistilisele olulisusele kirjeldada gruppidevahelisi erinevusi. Efekti suurust saab väljendada mitmete statistikutega; ilmselt levinuim on Cohen-i d. Kokkuleppeliselt tähistavad Cohen'i d väärtused väikest efekti väärtusel d = 0.2; keskmise suurusega efekti väärtus on d = 0.5; suure efekti väärtuse algus on d = 0.8.
02x(vanus)+331,58 Standardiseeritud võrrandis taandatakse vabaliige välja ning tõus märgitakse standardiseeritud kujul. Mitmene regressioon Paarisregressiooni puhul üks sõltumatu muutuja ehk prediktor, mitmese regressiooni puhul mitu prediktorit. Kasutusel endiselt determinatsiooni kordaja, kuid tähistatakse D, mis koosneb prediktorite r2-dest. Tulemused esitatakse standardiseeritud kujul, kuna iga prediktori kohta on eraldi vabaliige ning nende esitamine ei ole mõistlik. Eeldused: Seoste lineaarsus (saab joonena väljendada) Vaatluste sõltumatus Sõltumatud muutujad ehk prediktorid ei tohi omavahel olla väga tugevalt seotud (üle 0,8), vastasel juhul nimetatakse seda multikollineaarsuseks. Pidevad või binaarsed muutujad (kodeeritud 1 ja 0) Ei ole ekstreemseid juhtumeid Kõik relevantsed muutujad on mudelis
otseselt ära põhjuslikkuse suunda. Viimast lauset silmas pidades on oluline ära mainida, et regressiooni puhul on väga oluline see, kumb kahest muutujast kas, meie näites, X või Y on prediktor (ehk ennustav muutuja; ingl k predictor; sisuliselt sõltumatu muutuja) ning kumba muutujat ennustatakse (ingl k outcome variable; sisuliselt sõltuv muutuja). Regressioonianalüüsi tulemusena saadakse võrrand, mis kirjeldab iga prediktori osakaalu ennustatavas muutujas. Seesama võrrand on graafiliselt regressioonisirge võrrandiks, kus vabaliige kirjeldab y-teljega lõikumispunkti (intercept) ning sirge tõus (gradient) kirjeldab sirge paiknemist y- ja x-telje vahel (vt Fieldi õpikust lk 199). Sisuliselt üritab lineaarne regressioon läbi andmepunktide parve joonistada sirge, millest võimalikult palju väärtusi on sarnase kaugusega.