xi - x i =1 i =1 n n -1 Kui objekte on väga palju või tunnuse väärtused on pidevad või tunnus on antud sagedustabeliga, siis leitakse standardhälve valemist : ( ) ( ) k 2 k 2 = f i xi - x või väikese valimi korral =
Hajuvusmõõdud Tihti on vaja hinnata, kui palju andmed erinevad "tüüpilisest" väärtusest (ehk teisiti: kui palju andmed hajuvad). Enamasti vaadeldakse erinevust keskväärtusest. Saab tõestada, et tunnuse väärtused paiknevad kõige tihedamini keskväärtuse ümber. Kuidas hajuvust arvuliselt kirjeldada? Seda uurimegi. Vaatleme kahte erinevat valimit. Üks neist on esitatud sagedustabeliga, teine jaotustabeliga. Leiame kummagi valimi jaoks keskväärtuse, mediaani ja moodi. 1. valim: xi 7 8 9 10 11 12 13 fi 1 3 5 10 5 3 1 17 38 59 10 10 511 312 113 x 10 28 Me = 10 Mo = 10 2. valim:
Jaotustabel näitab tunnuse väärtuste suhtelist esinemissagedust (%). 13. Millal kasutatakse tulpdiagrammi, millal sektordiagrammi? Sektordiagrammi valime siis kui tahame näidata osakaalu tervikus (midagi on 100 %). Andmete võrdlemiseks või tendentside näitamiseks on sobiv tulpdiagramm. 14. Mis on tunnuse keskväärtus? Tunnuste väärtuste aritmeetiline keskmine. 15. Kuidas leitakse aritmeetiline keskmine a) Väikese mahuga variatsioonrea korral? b) Sagedustabeliga määratud andmete korral? c) Pideva tunnuse korral? 16. Mis on mediaan? Kuidas leitakse mediaan. a) Variatsioonreast? b) Sagedustabelist? c) Pideva tunnuse korral? Mediaan arv, millest suuremaid ja väiksemaid väärtusi on variatsioonreas ühepalju. 17. Mis on mood? Millal kasutatakse keskmisena moodi? Mood tunnuse kõige sagedamini esinev väärtus. Nominaaltunnuste korral (Nt rahvus, elukutse) leitakse keskmisena mood. 18
helehall andmeblokk ülaltoodud sagedustabelist. Teoreetilise (tunnuste sõltumatusele vastava ideaalse) sagedustabeli lahtrid täidetakse valemi järgi arvutatud suurustega. Lihtsaim on seda teha samal lehel Pivot Table'i väljastatud sagedustabeliga. Teoreetilise sagedustabeli ülemine vasakpoolne lahter täidetakse valemi =$E3*B$5/$E$5 väärtusega (siin E3 on lahter, kus paikneb empiirilise sagedustabeli esimese rea summa, B5 on lahter, kus paikneb empiirilise sagedustabeli esimese veeru summa ja E5 on lahter, kus paikneb empiirilise