REGRESSIOONANALÜÜS Regressioonanalüüs võimaldab luua matemaatilise mudeli kirjeldamaks tunnuste vahelisi seoseid. Lineaarse regressiooni korral uuritakse sõltuvust kujul: Y = + x ja on vähimruutude meetodi abil määratavad parameetrid ehk regressioonikordajad. Tegelikult vaadeldud Yi on valemiga arvutatud väärtusest i võrra erinev: Kõige sagedamini on regressioonanalüüsis kasutamisel mitmene lineaarne mudel: · kus y on sõltuv tunnus; · x , x , ... x on argumenttunnused ehk sõltumatud tunnused; 1 2 K · a , a , a , ..., a on mudeli parameetrid. 0 1 2 K Parameetrite tõlgendus lineaarse mudeli korral: · a0 - vabaliige ehk konstantne liige, mis annab y väärtuse, kui kõigi sõltumatute tunnuste väärtused on nullid · a1 - x1 kordaja, näitab, kui palju suureneb y, kui x1 suureneb 1 võrra ja teised sõltumatud tunnused jäävad samaks
korrelatsioonikordaja r väärtuse, mis on 0,11. Sellest suuremad väärtused korrelatsioonimaatriksis loeti oluliseks. Nagu korrelatsioonimaatriksist näha on, siis kõige suurem seos on riigieksami ja keskkooli hinde vahel, samuti matemaatika testi ja riigieksami vahel. 1) Valime välja regressiooniobjektid, mis on: aasta, kood, matemaatika riigieksam, matemaatika test. Uuritav tunnus on matemaatika test. Argumenttunnused on aasta, riigieksami tulemus ja kood. Mudeli analüüs Alustame mudeli ja selle liikmete olulisuse hindamisest. Mudel on kahtlemata oluline (vt. Tabel 31), Significance F = 1,33E-09. Küll aga ei saa sama öelda iga liikme olulisuse kohta. P-value tunnusel sugu on 0,880688524 ja tunnusel hinne on 0,103210735. Seega eemaldame kõigepealt tunnuse sugu mudelist ning teeme järgmise regressioonianalüüsi (vt. Tabel 32) ning siis eemaldame ka tunnuse hinne mudelist ning
kui tema seos resultaatnähtusega. Punkti (a) alusel tuleks ilmselt edasisest analüüsist jätta välja tunnused Käitum ja Hoolsus, kuivõrd need (eriti Hoolsus) on küllalt tugevalt seotud ka teiste õppeainetega. Punkti (b) alusel jätame välja ka tunnuse Vene k, sest tema seos tunnusega Keskmine on märgatavalt nõrgem. Järgnevalt tuleks algandmete tabelis muuta tunnuste järjekorda nii, et regressioonanalüüsi kaasatavad argumenttunnused paikneksid järjestikustes tulpades. Seejärel valime töövahendi Tools/Data Analysis/Regression. Regression dialoogis märgime sõltuvaks muutujaks (y) tunnuse Keskmine ning sõltumatuteks muutujateks (x) uuringusse kaasatud argumenttunnuste piirkonnad