Teiseks viisin läbi korrelatsioonianalüüsi, korrelatsioonimaatriksi ning selle põhjal tegin hajuvusdiagramme. Korrelatsioonianalüüsis oletasin, et inimeste sissetulekul ja kehakaalu vahel on omavahel seos. Selgus, et seos oli olemas kuid pigem nõrk (korrelatsioonikordaja: 0,37). Võrdlesin ka kaalu ning pikkuse vahelist seost. Nende vaheline seos oli olulisemalt tugevam, nagu oli ka arvata (korrelatsioonikordaja: 0,65). Korrelatsioonimaatriksist selgus, et omavahel on seoses mitmed tegurid: kehakaal ja netosissetulek ning spordiklubi külastamine, netosissetulek ja sugu ning vanus, spordiklubi külastamine ja toitumine. Hajuvusdiagramme analüüsides võin öelda, et mida suurem on vanus seda suurem on netosissetulek. Ei saa väita, et see on fakt, kuid antud valimit analüüsides on nii. 6 KESKVÄÄRTUSTE VÕRDLEMINE JA TUNNUSTE ÜLDISTAMINE ÜLDKOGUMILE
olemasolu, tugevus, suund ning statistiline olulisus, korrelatsioonimaatriks (tabel 2.)
Valiku kriteeriumiks võeti iga muutuja ja ettevõtte kogumüügi vaheline korrelatsioon
Edasisel analüüsil määrati kindlaks näitajat, mis avaldavad piima tootmise
muutusele kõige suuremat mõju. Seose tugevust tuli hinnata korrelatsioonikordaja
absoluutväärtuse alusel. Mida suurem on kordaja absoluutväärtus, seda suurem on
kahe juhusliku suuruse vaheline lineaarne korrelatiivne seos.
Korrelatsioonimaatriksist näeb, et kõige suurem seos on uuritaval näitajal ( piima
toodang lehma kohta (ts) lehmapiima müügiga, looma kohta, seda nii kroonides kui
tsentnerites ning samuti on suurelt seotud piima toodang sööda kogusega looma
kohta. Korrelatsioonikoefitsient näitab tunnustevahelise seose tugevust, tunnuste
omavahelist sõltuvust. Korrelatsioonikoefitsient r on vahemikus [-1; 1].
Tunnustevaheline seos võib olla:
Tugev, kui r>0,7
Keskmine, kui 0,5
eksam/kool 0,058928 0,003537 0,443011 1 hinne 0,219691 -0,07819 0,201566 0,525030655 1 kood -0,0048 -0,4902 -0,11806 0,21501562 0,13834 1 Seejärel arvutame välja t kriitilise väärtuse, mille saime 1,97 ja leidsime korrelatsioonikordaja r väärtuse, mis on 0,11. Sellest suuremad väärtused korrelatsioonimaatriksis loeti oluliseks. Nagu korrelatsioonimaatriksist näha on, siis kõige suurem seos on riigieksami ja keskkooli hinde vahel, samuti matemaatika testi ja riigieksami vahel. 1) Valime välja regressiooniobjektid, mis on: aasta, kood, matemaatika riigieksam, matemaatika test. Uuritav tunnus on matemaatika test. Argumenttunnused on aasta, riigieksami tulemus ja kood. Mudeli analüüs Alustame mudeli ja selle liikmete olulisuse hindamisest. Mudel on kahtlemata oluline (vt. Tabel 31), Significance F = 1,33E-09