Võite ära märkida, et tahate joonist histogrammi kujul. Kui olete need sammud ära teinud, peaks teile ilmuma tabel. Selleks, et vastata küsimusele kas on tegemist normaaljaotusega või mitte peame esmalt välja nuputama, millist testi vaatame. Kolmogorov-Smirnov testi on mõttekas vaadata siis, kui valim on väga suur (tuhanded indiviidid), Shapiro- Wilk test on kohane väikese valimi puhul (u 50-2000 indiviidi). Meie andmestikus on 1350 inimest, seega võiks kasutada Shapiro-Wilk testi. Järgnevalt tuleb vaadata Sig.-i. Kui Sig on väiksem kui 0.05, siis ei ole andmed normaaljaotuslikud. Sageduste võrdlemine: (Analyze Descriptive Statistics ->Crosstabs). Lisaks on võimalik tellida statistik (Statistics -> Chi- Square), mis näitab kas nimetatud seos (risttabeli andmetel ilmnev koosesinemine) on statistiliselt oluline. Hi ruut on statistiliselt oluline, kui olulisuse tõenäosus tabelis on väiksem kui 0.05. II KT:
sõltuvateks muutujateks ruumiline mõtlemine ja sõnavara ning sõltumatuks muutujaks sugu) Plots-> Normality Plots with tests Võite ära märkida, et tahate joonist histogrammi kujul. Kui olete need sammud ära teinud, peaks teil tulema alljärgnev tabel: Tests of Normality Kolmogorov-Smirnova Shapiro-Wilk Sugu Statistic df Sig. Statistic df Sig. ruumiline mees ,093 608 ,000 ,974 608 ,000 naine ,071 742 ,000 ,985 742 ,000 Sõnavara mees ,091 608 ,000 ,988 608 ,000 naine ,071 742 ,000 ,989 742 ,000 a
tegemist on normaaljaotusega. Ülesanne 5: Kontrollige Tabel 3 andmete normaaljaotust statistikaprogrammiga "Past" nii numbriliselt (StatisticsNormality tests) kui ka graafiliselt tõenäosuspaberi (PlotNormal probability plot) abil. Statistikaprogrammile "Past" 50 liikmelise andmeveeru etteandmisel ja StatisticsNormality tests käskluse andmisel saame järgmised numbrilised tulemused: A N 50 Shapiro-Wilk W 0.9687 p(normal) 0.2053 Anderson-Darling A 0.3133 p(normal) 0.5365 p(Monte Carlo) 0.5613 Jarque-Bera JB 1.649 p(normal) 0.4384 p(Monte Carlo) 0.2955 Tulemustest näeme, et Jarque-Bera testi väärtuseks on 1,649, mis on Excel'is arvutatust (JB= 30,952) palju väiksem. Teame eelnevast, et normaaljaotuse olemasoluks peab
kolmandaks asümmeetria ja neljandaks järsakus. Esimest ja teist järku momendid (keskmine ja hajuvus) aitavad hinnata muutuja tüüpilist väärtust ja seda kui hästi see tüüpiline väärtus kõiki mõõdetud juhtumeid iseloomustab (ehk hajuvust keskmise ümber) Kolmandat ja neljandat järku momendid on abiks andmete normaaljaotuslikkuse hindamisel. Shapiro-Wilk test Uurib, kas andmestik erineb oluliselt normaaljaotusest. Kui olulisuse tõenäosus (p) on väiksem kui 0.05, siis testi kohaselt andmed ei ole normaaljaotuslikud. o Vaikimisi eeldame, et andmestikes muutuja jaotus ei erine oluliselt normaaljaotusest. S-W hindab, kas meil on piisavalt tõendeid, et see väide ümber lükata. Standardiseerimine Tulemuste z-skooridele viimine Valem:
values as variables. 3) JUHUSLIKU SUURUSE JAOTUSE UURIMINE Et välja selgitada, kas andmed pärinevad normaaljaotusega populatsioonist, saab läbi viia normaaljaotust uuriva testi. Käsklusrida: Analyze-> Descriptive Statistics-> Explore-> Plots-> Normality Plots with tests Tulemus: Tests of Normality Kolmogorov-Smirnova Shapiro-Wilk Sugu Statistic df Sig. Statistic df Sig. ruumiline mees ,093 608 ,000 ,974 608 ,000 naine ,071 742 ,000 ,985 742 ,000 Sõnavara mees ,091 608 ,000 ,988 608 ,000
0 Values > 10.0 may indicate a collinearity problem Korgharitud 1,006 DAasta_1 1,500 DAasta_2 1,505 DAasta_3 1,501 VIF(j) = 1/(1 - R(j)^2), where R(j) is the multiple correlation coefficient between variable j and the other independent variables Properties of matrix X'X: 1-norm = 115,11179 Determinant = 10938,745 Reciprocal condition number = 0,0015792541 Lisa 12. Jääkliikmete normaaljaotuse testid Test for normality of uhat8: Doornik-Hansen test = 0,071569, with p-value 0,964848 Shapiro-Wilk W = 0,988043, with p-value 0,823481 Lilliefors test = 0,0671075, with p-value ~= 0,71 Jarque-Bera test = 0,253417, with p-value 0,880991 Lisa 13. Jääkliikmete normaaljaotuse graafik Lisa 14. ANOVA tabel Analysis of Variance: Sum of squares df Mean square Regression 533570 4 133393 Residual 100692 55 1830,77 Total 634262 59 10750,2 R^2 = 533570 / 634262 = 0,841245