Erinevus keskmisest on 242801796,2. Ülemine piir Sagedus ÜlemineVarieerumine piir kogumis on 205,32% Sagedus Püstakuse kordaja näitab, et on nõgusam normaaljaotusest. 1021000 27 4604789,5986 46 Asümmeetria kordaja näitab, et on paremale poole kaldu. 3021000 10 13804789,599 Miinimum on 1340021 2 inimest. 5021000 3 23004789,599 0
populatsioon ja maksimaalne 90 732, Türgi. Seega on variatsiooniamplituud min=38 ja max= 90 732, mille vahel on vastused jaotunud. Standardhälve iseloomustab väärtuste hajuvust keskmiste ümber, mis antud vaatlusel on 273 22,51 ja variatsioonikoefitsent, mis võimaldab võrrelda erinevate tunnuste suhtelist varieeruvust, on 144% (27322,51/ 18 999). Asümmeetrianäitaja, mis näitab andmete jaotuvust on 1,72 ja ekstsess 1,59, mis näitab meile jaotuse erinevust normaaljaotusest. Kokkuvõte 2007. aastal oli igas Euroopa riigis vangis keskmiselt 18 999 inimest, kuid kuna vangide populatsioonide arv on riigiti väga erinev (min=38, max=90 732) on raske välja tuua keskmise näitajaga riiki. Lisad Lisa 1. Analüüsiks kasutatud andmetabel GEO/TIME 2007 Belgium 9950 Bulgaria 10792 Czech Republic 19110 Denmark 3646 Germany (until 73319 1990 former territory of the FRG) Estonia 3466
Standard Deviation - Standardhälve - iseloomustab tunnuse väärtuste hajumist. Sample Variance - Dispersioon - standardhälve ruudus e s2. Rohkem teoreetilise statistika abivahend. Kurtosis - Ekstsess e järsakuskordaja (e) - iseloomustab jaotuse kuju võrreldes normaaljaotusega. Kui e=0 , siis on tegemist normaaljaotusega; e>0, siis on jaotus kõrge tipuga; e<0, sel juhul jaotuvad vaatlused ühtlaselt kogu jaotuse ulatuses ja jaotus on platookujuline. Jaotuse märkimisväärsest erinevusest normaaljaotusest on mõtet rääkida siis, kui kordaja on absoluutväärtuselt 1-st suurem. Praks 4 Keskmise võrdlemine konstandiga. Kahe grupi dispersioonide ja keskmiste võrdlemine, F- ja t-test. kas maaülikooli esimese kursuse neidude keskmine pikkus erineb Eesti standardist (Eesti naiste keskmine pikkus on 168 cm)? Arvutage liidetav neidude keskmise pikkuse 95% usaldusintervalli leidmiseks (so pool usaldusintervalli laiust) ja tehke seda kahel viisil: a) funktsiooni CONFIDENCE.NORM abil
Asümmeetriakordaja on tõenäosusteoorias ja statistikas kasutatav mõõdik, mis näitab andmete tõenäosusjaotuse sümmeetrilisust. Asümmeetriakordaja võib olla positiivne (jaotuse pikem saba on paremal ja enamik andmetest on kontsentreeritud vasakul) või negatiivne või defineerimata. Sümmeetrilise jaotuse korral on asümmeetriakordaja 0 Ekstsess - liialdus; vahejuhtum. Stat järsakuskordaja, arv, mis kajastab juhusliku suuruse Xjaotuse erinevust normaaljaotusest. 16. Pidevad ja diskreetsed jaotused. Pidevad: 1) Normaaljaotus 2) X^2- jaotus 3) Empiiriline jaotus 4) Logaritmiline normaaljaotus 5) Gram-charlier normaaljaotus 6) Weibulli jaotusseadus 7) Eksponentjaotus 8) Gammajaotus 9) Beetajaotus 10) Studenti jaotus 11) F-jaotus Diskreetsed: 1) Binoomjaotus 2) Hüpergeomeetriline jaotus 3) Poissoni jaotus 4) Pascali jaotus 17. Mis on usaldusnivoo?
kolmandaks asümmeetria ja neljandaks järsakus. Esimest ja teist järku momendid (keskmine ja hajuvus) aitavad hinnata muutuja tüüpilist väärtust ja seda kui hästi see tüüpiline väärtus kõiki mõõdetud juhtumeid iseloomustab (ehk hajuvust keskmise ümber) Kolmandat ja neljandat järku momendid on abiks andmete normaaljaotuslikkuse hindamisel. Shapiro-Wilk test Uurib, kas andmestik erineb oluliselt normaaljaotusest. Kui olulisuse tõenäosus (p) on väiksem kui 0.05, siis testi kohaselt andmed ei ole normaaljaotuslikud. o Vaikimisi eeldame, et andmestikes muutuja jaotus ei erine oluliselt normaaljaotusest. S-W hindab, kas meil on piisavalt tõendeid, et see väide ümber lükata. Standardiseerimine Tulemuste z-skooridele viimine Valem: Peaks olema lähedane normaaljaotusele:
· Suure valimi (nsuurem50) korral kehtib: o Valimiprotsent on ligikaudu normaaljaotusega o Kahe valimiprotsendi pa ja pb vahe dp on ligikaudu normaaljaotusega o Kahe valimisprotsendi vahe standardviga on arvutatav valimi põhjal kui: · Paariviisiline võrdlus Wilcoxoni astakmärgitest o Kasutatakse samadel subjektidel tehtud mõõtmiste võrdlemiseks juhul, kui valimite jaotus erineb oluliselt normaaljaotusest. o Wilcoxoni märgitesti jaoks arvutatakse paariviisiliste mõõtmiste vahed ja järjestatakse need sõltumata märgist ehk järjestame vahede absoluutväärtused. o Teststatistik W+ on positiivsete vahede astakute summa. · T-test keskmiste võrdlemiseks, kui võrdlusalune tunnus on normaaljaotusega o T-test kahe grupi keskmiste võrdlemiseks o Ühe valimi t-test ühe grupi keskmise võrdlemiseks kindla väärtusega
5. Miinimum näitab väiksemat tunnuse väärtust, omab samasugust ühikut tunnusega. Paljudel näitajatel oli selle väärtuseks null, mis tähendas ettevõtete korrigeerimist (eemaldamist); 6. Maksimum näitab suuremat tunnuse väärtust. Enamik näitajate puhul oli maksimumi ja miinimumi vahe väga suur, 7. Asümmeetriakordaja iseloomustab tunnuse väärtuste esinemissageduse ebasümmeetrilisust. Mida rohkem erineb tunnuse väärtuste jaotumine normaaljaotusest, seda suurem on oma absoluutväärtuselt asümmeetriakordaja. 8. Teravatipulisuse kordaja annab hinnangu tunnuse väärtuste esinemissageduse kõvera tõusu ja langemise omapärale. 9. korrigeeritud variatsioonikordaja näitab kui normaalselt on antud andmed jaotatud. Korrigeeritud variatsioonikordaja näitab kui normaalselt on antud andmed jaotatud. Siinjuures on oluline lähtuda teadmisest, et:
Küsitleti 50 ostjat, valimi keskväärtuseks saadi 71,07 kr standardhälbega 29,42 kr. Funktsiooni CONFIDENCE abil leiame usaldusvahemiku laiuse 95% usaldatavuse jaoks. Vahemiku laius on 8,2. Vastus: 95% ostjatest kulutavad leiva- ja saiatoodete ostmise peale kuus ühe inimese kohta 71,1 ± 8,2 krooni ehk 95%-l on vastavad kulutused vahemikus 62,9 ÷ 79,3 krooni. 15 Väikeste valimite korral valimi keskväärtuste jaotus erineb normaaljaotusest ja tsentraalne piirteoreem ei kehti. Sellisel juhul kasutatakse kogumi keskväärtuse usalduspiiride määramisel t-jaotust ehk Studenti jaotust. Jaotuse võttis kasutusele inglise matemaatik William Seally Gosset (1876-1937) oma töös, mille ta avaldas Studenti varjunime all. MS Excelis leiab Studenti koefitsiendi funktsioon TINV, kus argument probability on vea tõenäosus ja deg_freedom vabadusastmete arv. NÄIDE 2
suurem usaldatavus = laiem usaldusvahemik (suurem määramatus). Usaldusvahemiku poollaiuse sõltumine – usaldatavust saame valida, valimi mahtu saab muuta, standardhälvet muuta ei saa Kattuvad ja mittekattuvad usaldusvahemikud - kui vahemikud ei kattu, siis saab väita, et esineb erinevus. Kui kattuvad, siis ei saa väita, et esineb erinevus. Usaldusvahemiku määramise täpsus: Suhteline viga E= Väikesed valimid t-jaotus - Väikeste valimite korral valimite keskväärtuste jaotus erineb normaaljaotusest. t-jaotuse kuju sõltub vabadusastmete arvust ν. Vabadusastmete arv on sõltumatute muutujate arv. Valimi standardhälbe leidmisel vabadusastmete arv v=n-1. Väikese valimi korral üldkogumi keskväärtuse usalduspiiride poollaius ∆x = tα /2(v)*(s/√n) Valimi mahu planeerimine - ∆X<=d ⇒ n>=(tα/2(v)*s0/d)^2 kus s0 proovivalimi standardhälve, kui soovime et usaldusvahemiku poolvahemik oleks väiksem kui d. Kaheväärtuselise tunnuse usalduspiirid –
H0 Jääkliikmed alluvad normaaljaotusele(p>a) H1 Jääkliikmed ei allu normaaljaotusele 60) Mis juhtub, kui jäägid ei allu normaaljaotusele? Kui muud eeldused on täidetud, siis OLS hinnangud on ikka parimad lineaarsed nihketa hinnangud Suurte valimite (n>100) korral teststatistikud alluvad ikka (asümptootiliselt) standardsetele jaotusseadustele => testimine annab õiged tulemused. (Suure valimi korral ei tekita jääkide jaotuse kõrvalekaldumine normaaljaotusest probleeme) Väikeste valimite korral teststatistikute jaotus võib erineda standardsest jaotusest, millest leitakse kriitilised väärtused ja olulisuse tõenäosus => testimise tulemused võivad olla valed. (Väikeste valimite puhul omab jääkide normaaljaotus tähtsust.) 61) Mis on erind? Sõltuva tunnuse suhtes suure jäägiga (jääkide diagramm) 62) Mis on omapärane vaatlus? Ühel või mitmel sõltumatul tunnusel ekstreemne väärtus (jääkide ja hajumisdiagramm)
Lõppude lõpuks on andmeanalüütik see, kes peaks sisuliselt lahti mõtestama tulemused. Nii asümmeetriakordaja kui ka järsakusastme väärtuse 0 korral loetakse andmestikku (ideaalselt) normaaljaotuslikuks; paraku on pisut ebarealistlik oodata käitumisteadustes säärast ideaalset jaotust. Seepärast on teadlased kokku leppinud, et kui asümmeetriakordaja ning järsakusaste jäävad -1 ja 1 vahele, võib sisuliselt rääkida normaaljaotusest. Sagedustabeli analüüs (Hii-ruut) Kahe kategoriaalse tunnuse analüüsimiseks saame kasutada Hii-ruut testi. SPSS'is näeksid andmed välja järgmised: Selle analüüsi tegemiseks SPSS'is järgige alltoodud käsklusi: Analyze Descriptives Crosstabs - Avanenud aknas üks muutuja lahtrisse ,,Rows" ja teine muutuja lahtrisse ,,Columns". - Statistics aknast saate valida Hii-ruut analüüsi, tehke linnuke Chi-square ette. Mida näitab väljundiaken (Output)?
pariisis) - Intelligentsuse mõõtühik - Suhteühik - Intelligentsuskvoot – IQ - Normvalim – sellest sõltub intelligentsuse mõõtmise täpsus; ideaalne normvalim hõlmab kõiki ühe maa, riigi või mingit keelt kõnelevaid inimesi; algab 1000st v suuremast arvust; sai alguse šotimaal - Mugavusvalim – laste võimekus mõõdetud normaalkoolis käivate laste põhjal mitte demograafia - Kõrvalekalded normaaljaotusest - Regressioon keskmise suunas – 2 pikka vanemat ei päranda pikkuse lapsele - Darwini auhind – teeninud inimkonda sellega et on elimineerinud oma geenid üldisest geenivaramust - Intelligentsuse kaudsed indikaatorid - Subjektiivselt hinnatud intelligentsus – küsid inimeselt endalt kui targaks ta ennast peab - koolihinded - Gruppide erinevused intelligentsuses - erinevused on looduslik paratamatus - meeste ja naiste võimekuse erinevused suht väiksed
Töötab ainult suure valimi korral. 60. Mis juhtub, kui jäägid ei allu normaaljaotusele? • Kui muud eeldused on täidetud, siis OLS hinnangud on ikka parimad lineaarsed nihketa hinnangud (BLUE, Best Linear Unbiased Estimator). • Suurte valimite (n>100) korral teststatistikud alluvad ikka (asümptootiliselt) standardsetele jaotusseadustele => testimine annab õiged tulemused. – Suure valimi korral ei tekita jääkide jaotuse kõrvalekaldumine normaaljaotusest probleeme. • Väikeste valimite korral teststatistikute jaotus võib erineda standardsest jaotusest, millest leitakse kriitilised väärtused ja olulisuse tõenäosus => testimise tulemused võivad olla valed. – Väikese valimi korral omab jääkide normaaljaotus tähtsust. 61. Mis on erind? Erind (outlier) on sõltuva tunnuse suhtes, suure jäägiga. ● Nendes vaatluspunktides on probleem mudeli kehtivusega. ● Avastamiseks uurida jääkide diagramme.