Defineeri mõisted: Statistika Matemaatiline statistika Üldkogum. Näide. Üldkogu uurimisel on kaks võimalust: Valim. Kuidas on seotud üldkogu ja valim? Millised on nõuded valimile? Valimi moodustamise viisid. Statistiline rida. Variatsioonirida. Sagedustabel. Diagramm. Mood. Mediaan. Aritmeetiline keskmine. Variatsiooni ulatus. Hälve. Dispersioon. Standardhälve. Korrelatsiooniväli. Normaaljaotus. Statistika mõisted Andmete esitamine 1.Statistika - teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. 2.Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. 3
Ülesanne 1. Arvutada ühele suunale tehtud 50 lugemi sekundiosade põhjal mõõtmistulemuste asendi- ja hajuvuskarakteristikud. Koosta mõõtmistulemuste kohta histogramm. Vastavalt tööjuhendile koostame ette antud andmetest variatsioonirea kasutades selleks Excel’is olevat Sort funktsiooni. Järgnevalt leiame valimi aritmeetilise keskmise Average käsuga. Lisaks tuleb leida valimi mood, mediaan, dispersioon ja standardhälve kasutades selleks Excel’i funktsioone. Järgnevalt antud valimile vastavad mainitud suurused: 1. Aritmeetiline keskmine- 37,8 2. Valimi mood- 32,1 3. Valimi mediaan- 37,9 4. Valimi dispersioon- 9,7 5. Valimi standardhälve- 3,1 Lisaks tuleb leida valimile vastavad asendi-ja hajuvuskarakteristikud Excel’i töövahendiga Descriptive statistics, mis leiab automaatselt ka eespool olevad suurused, kuid Excel’i funktsioonide õppima
91.78 1.5599 0.1182 1.9247 0.066041 9 50.0596 26.0088 SUMMA: 29.1445 1 60 156.1786 58.7501 χ^2kr (0,05; 7) = 14.07 χ^2emp = Σ(ni-ni')^2/n'i = 58.75 χ^2emp > χ^2kr 58.75 > 14.07 Hüpotees ei kehti, tegemist ei ole normaaljaotusega 6. Konstrueerida samas teljestikus graafikud: 6.1 Empiirilise jaotuse histogramm punktis 4 leitud grupeeritud valimile 6.2 Hüpoteetilise normaaljaotuse histogramm kooskõlas punktiga 5 6.3 Hüpoteetilise normaaljaotuse tihedusfunktsiooni f(x) graafik 6.4 Parameetritega a=0 ja b=100 hüpoteetilise ristkülikjaotuse tihedusfunktsiooni f(x) graafik 6.5 Kahe ristkülikjaotuse parameetritega a = 0 ja b = 100 summeeritud tihedusfunktsiooni f(x) graafik Hüpoteetiline jaotusfunktsioon Empiiriline jaotusfunktsioon Hüpoteetilise normaaljaotuse tihedusfunktsioon
Nii saadud statistiliste tulemuste tõlgendamisel tuleb olla ettevaatlik (ei või näiteks väita, et keskmine hinne 4,0 on kaks korda parem kui 2,0). Üldkogum ja valim Üldkogum on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi. Valim on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Nõuded valimile: 1. Valimi maht peab olema küllalt suur. 2. igal üldkogumi indiviidil peab olema võrdne võimalus sattuda valimisse. Neid kaht nõuet rahuldavat valimit nimetatakse representatiivseks e. esindavaks. Variatsioonrida Fikseerides valimi ning vaadeldes (mõõtes) sellel mingit tunnust, saadakse andmed, mis moodustavad korrastamata statistilise rea. Kui saadud andmeid on võimalik järjestada, siis saadakse variatsioonrida
20 40 ülemine piir 60 45,85782358 80 100 Ühtlane (t) Intervalli keskmine xi pi*xi pi*xi^2 6,80 1,36 231,20 30,33 7,28 5 520,67 Valimile vast 47,17 11,32 13 348,17 73,40 14,68 26 937,80 7 96,33 11,56 27 840,33 6 5 4 3 (t) Chi-square 2
10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24 Kriitiline t-statistiku väärtus t0.95(24) = 1.711 Kuna t < , siis võtame hüpoteesi H0 vastu. 3.2. H0: 2 = 800; H1: 2 800 Kontrollimiseks kasutame 2-statistikut: Kriitilised väärtused: 20.05(24) = 13.848 20.95(24) = 36.415 Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 21-40, 41- 60, 61-80 ja 81-100 ning kontrollida 2- testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese. Intervalli Vahemi element tõenäosus intervalli nr k e pi* keskmine k ni xi 1 0-20 6 0,24 9,83 2 21-40 7 0,28 33,00
Dispersioon hälvete ruutude aritmeetiline keskmine. Standardhälve ruutjuur dispersioonist, iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on hajuvus. Üldkogum ehk populatsioon, selle all mõeldakse kõiki juhtumeid või situatsioone, mille kohta meie poolt püstitatud järeldused, oletused või prognoosid kehtivad. Valim väike objektide grupp, mis valitakse üldkogumist, et selle põhjal teha järeldus kogu üldkogumi kohta. Nõuded valimile peab olema küllalt arvukas, igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Usaldusvahemik väärtuste vahemik. Usaldusnivoo näitab tulemuse sattumise tõenäosust mingisse vahemikku. Olulisuse nivoo riskiprotsent, näitab kui suur statistiline viga on lubatud. Juhusliku suuruse normaaljaotus, selle graafik juhuslikud suurused, mille tõenäosust kirjeldavaks graafikuks on kellukesekujuline Gauss'i kõver.
= 0,10 t0,1; 24= 1,71 Dispersiooni usaldusvahemik: = 0,10 ja 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > 0,6. Hüpotees võetakse vastu. H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,2< 36,42. Hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40- 60, 60-80 ja 80-100 ning kontrollida 2 -testi järgi olulisuse nivool = 0.10 hüpoteesi, et põhikogumi jaotuseks on normaaljaotus vahemik tõenäosus 20 0,16 40 0,16 60 0,32 80 0,08 100 0,28 5. Konstrueerida samas teljestikus järgmised graafikud: 5.1 empiirilise jaotuse histogrammi graafik 5
Õpilane7 56 61 11 15 -4 α 0.1 Kuna t* 1.7291328 Õpilane8 83 85 6 4 2 siis Õpilane9 90 52 3 18 -15 Antud andmete põhjal ...H0... esimesele valimile vastava üldkogumi dispersioon on väiksem Õpilane10 60 82 9 6 3 teisele valimile vastava üldkogumi dispersiooniga. Õpilane11 85 42 5 19 -14 Õpilane12 43 59 16 17 -1 Õpilane13 36 66 18 11 7 Õpilane14 94 60 1 16 -15
" "Jälle kasutad sa sõnu, millest ma aru ei saa. Mis on valim ? " tuli eesti keele õpetajalt järgmine küsimus. Küsida poliitilist eelistust igalt inimeselt on mõttetu. Targem oleks välja valida teatud arv isikuid (mitte liiga palju ja mitte ka üks või kaks) ning neid küsitleda. Mõõtmiseks valitud üldkogumi osa nimetatakse valimiks. Andmeanalüüsi käigus on vaja teha otsustusi üldkogumi kohta, kusjuures info allikaks on valim. Millised nõuded valimile ? Ta peab olema 1) küllalt arvukas, 2) igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Valimeid võib moodustada mitmel viisil. Vaatleme järgnevalt kolme enamlevinud valimi moodustamise viisi. 1.2. Valimi moodustamine A. Juhuslik valim Valimisse kuuluvad objektid valitakse välja täiesti juhuslikult üldkogumi kõigi objektide hulgast. Kuidas valida juhuslikult ?
3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > -0,645. Seega hüpotees H0 võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees H0 vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 26,04 < 36,42. Hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40- 60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese. Intervalli Intervalli nr Vahemik Elemente Tõenäosus keskmine 1 0-20 5 0,2 6,8 2 20-40 6 0,24 30,3
Scor= 25,62 5. Kontrollida X2-testi jargi hüpoteesi, et põhikogumi jaotuseks on normaaljaotus kasutades punktis 4 leitud grupeeritud valimit ja võttes olulisuse niivoks a=0,05. Tabel 3 normaaljaotus järgi ; ; EMP=65,99 KR=12,59 Hüpotees ei kehti, kuna peab olema: EMP KR Tabel 4 jaotusfunktsiooni normaaljaotus: 6. Konstrueerida samas teljestikus graafikud 6.1 Empiirilise jaotuse histogramm punktis 4 grupeeritud valimile 6.2 Hupoteetilise normaaljaotuse gistogramm kooskolas punktiga 5 6.3 Hupoteetilise normaaljaotuse tihendusfunktsiooni f(x) graafik 6.4 Hupoteetilise ristkulikjaotuse tihedusfunktsiooni f(x) graafik 7. Konstrueerida samas teljestikus graafikud 7.1 Empiirilise jaotusfunktsiooni F(x) graafik 7.2 Parameetritega a=0 ja b=100 hupoteetilise ristkülikjaotuse jaotusfunktsiooni F(x) graafik 7.3 Hüpoteetilise normaaljaotuse jaotusfunktsiooni F(x) graafik kooskõlas punktiga 5. 8
1 Sy standardhälve S ja aritmeetilise keskmise standardhälve e. standardviga. Lisaks Sy veel kahekordne standardviga 2 . y = 0,76; S=0,87; Sy Vastavalt etteantud valimile on leitavad suurused järgmised: Sy = 0,22; 2 = 0,44. Nende põhjal saame vastavaid võrdusi kasutades hinnata süstemaatiliste vigade olemasolu. Võrdused on toodud järgnevalt: Asendades arvutatud tulemused võrdustesse oma kohtadele, siis näeme, et kehtib viimane võrdus. See tähendab, et valimi aritmeetiline keskmine on suurem kui kahekordne standardviga ning seega on süstemaatiliste vigade olemasolu
jagatise jaotusena. Kui n lõpm ja mlõpm normj. Hinnang peaks olema lähedane parameetri tegelikule väärtusele. Omadused: 1) mõjusus (valimi mahu kasvades hinnang koondub tõenäosuse järgi hinnatava parameetri tegelikuks väärtuseks) 2) nihutamatus (hinnangu keskv = hinnatava parameetri tegeliku väärtusega) 3) efektiivsus (hinnangu dispers. On minimaalnevõimalik) Hindamise meetodid: Momentide meetod- üldkogumile vastavad seosed jaotuse parameetrite ja arvkar. Vahel kantakse üle valimile ja vastavalt valimilt saadud arvk. Hinnangutele arvutatakse nende seoste järgi param. Hinnangud. Eelis: lihtne arvutus- mõjus hinnang, kuid ei pruugi olla nihutamata ja efektiivne. Suurima tõepära meetod leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise P. Eelis: efektiivsus! Vähimruutude meetod tavalisim, Eelis: lihtne arvutus, optimaalsus. Nullhüpotees kontrollitav väide
ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,7268. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 34,924< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese interval vahemi element tõenäos intervalli li nr k e us keskmine 1 0-20 9 0,36 9,55 2 20-40 4 0,16 30,75 3 40-60 2 0,08 49 4 60-80 5 0,2 69,8 5 80-100 5 0,2 94 4
3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,6449. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 D=2 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 26,0375< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese interval vahemi element tõenäos intervalli li nr k e us keskmine 1 0-20 5 0,2 6,8 2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,2 73,4 5 80-100 3 0,12 96,3 4
Hüpoteesi vastu võtmiseks peab tkr > t; 1,711 > -0,645, seega võtan nullhüpoteesi vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Xxxxx xxxxx xxxx Hüpoteesi H0 vastu võtmiseks peab jääma kahe kriitilise väärtuse vahele: 13,85 < 26,04 < 36,4. Võtan hüpoteesi vastu. 4. Leian valimile vastava empiirilise histogrammi võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100. Intervalli Vahemi Element Tõenäos Intervalli nr k e us keskmine 1 0-20 5 0,20 6,80 2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,20 73,40 5 80-100 3 0,12 96,33
Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > 1,28. Seega hüpotees H0 võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 ( ) ( ) Et hüpotees H0 vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 32,18 < 36,42. Hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80- 100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese. Intervalli nr elemente tõenäosus intervalli keskmine Vahemik k ni pi* xi 1 0-20 4 0,16 6,75
11 · Mittetõenäosuslik valimvaatlus 3.3.1 Mittetõenäosuslik valim · Ei ole võimalik arvutada iga valimiosa valimisse sattumise tõenäosust · Ei ole võimalik teha statistiliselt korrektseid järeldusi saadud valimi hinnangute kohta · Valimi moodustamise kulud on väiksemad ja valimi moodustamine on lihtsam · Meetod on mugav kasutada kuid sisaldab endas hinnangut valimile Mugavus: · Valimisse kuuluvad need objektid, mis olid valimvaatluse läbiviimise ajal kättesaadavad · Mõningatel juhtudel on selline valimi moodustamise meetod ainuvõimalik lähenemisviis Hinnangulisus: · Valimvaatlust läbiviiv inimene valib valimisse need objektid, mis tema arvates kõige paremini iseloomustavad uuritavat üldkogumit · Valimi kvaliteet sõltub inimesest, kes valimi moodustas
Kriitiline piirkond avaldub: 2 0,64<1,71 ja nullhüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H1: 2 800 ( N - 1) s 2 24 867,9 2 = = = 26, 04 2 800 Kriitilised piirkonnad leian tabelist. 2 ( f ) = 13,848 2 2 1- 2 ( f ) = 36, 415 13,848<26,04<36,415 ja nullhüpotees võetakse vastu. 4. Leian valimile vastava empiirilise histogrammi Intervalli nr Vahemik Elemente Tõenäosus Intervalli keskmine k ni pi* xi 1 0-20 5 0,2 6,80 2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,2 73,40
olulisuse nivooks = 0.10): 3.1. H0: = 50 alternatiiviga H1: 50 1 Et hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,911. Hüpotees H0 võetakse vastu. 3.2. H0: 2 = 800 alternatiiviga H2: 2 800 8 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,848 < 24,433 < 33,196. Hüpotees H0 võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40- 60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi jaotushüpoteese: Intervavalli Intervalli nr Vahemik Elemente Tõenäosus keskmine 1
3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,645. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 26,038< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese intervalli tõenäosu nr vahemik elemente s intervalli keskmine 1 0-20 5 0,2 6,80 3 2 20-40 6 0,24 0,33 4
3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 1,28. Hüpotees H0 võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees H0 vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 32,18< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese intervalli vahemik elemente tõenäosu intervalli keskmine nr s 1 0-20 4 0,16 6.75 2 20-40 5 0,2 29,6 3 40-60 1 0,04 40,0
Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (olulisuse nivoo = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 0,61. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,17< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese intervalli nr vahemik elemente intervalli keskmine 1 0-20 4 15,25 2 20-40 4 33 3 40-60 8 48,63 4 60-80 2 65,5 5 80-100 7 88,29 4.1 Põhikogumi jaotiseks on normaaljaotus
Keskväärtuse 90%-line usalduspiirkond on (47,38 ; 69,34) 3.Kontrollida järgmisi hüpoteese: (Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,1) alternatiiviga Studenti funtktsioon: t(0,1;24) = 1,711 Hüpotees vastab tõele, kuna ja 1,3 < 1,711 Võtan vastu H0 hüpoteesi. alternatiiviga 2 statistiku vasak kriitiline piir: 2 statistiku parem kriitiline piir: Kuna , siis on tingimus täidetud ning hüpotees kehtib. Võtan vastu H0 hüpoteesi. 4.Valimile vastav empiiriline histogramm võrdlaiade vahemikega Vahemi km ni Pi 0-20 4,00 0,16 20-40 5,00 0,20 40-60 1,00 0,04 60-80 7,00 0,28 80-100 8,00 0,32 25,00 1,00 Kontrollida 2 testi järgi olulisuse nivool = 0,1 järgmisi jaotushüpoteese: 4.1 Põhikogumi jaotuseks on normaaljaotus (parameetrid tuleb hinnata valimi järgi) intervall
1 H0: = 50 alternatiiviga H1: ,, 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 0,61. Hüpotees H0 võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees H0 vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,16< 36,42. Hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm vordlaiade vahemikega 020, 2040, 4060, 6080 ja 80100 ning kontrollida c2testi jargi olulisuse nivool a = 0.10 jargmisi jaotushupoteese: inter Vahe elem tõen intervalli valli mik ente äosu keskmine nr s 1 020 4 0,16 15,2
3. Küsimus Kontrollida järgmisi hüpoteese: Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,1 alternatiiviga 4 Studenti funtktsioon: t(0,1;24) = 1,711 Hüpotees vastab tõele, kuna ja 0,90 < 1,711 Võtan vastu H0 hüpoteesi. alternatiiviga 2 statistiku vasak kriitiline piir: 2 statistiku parem kriitiline piir: , siis on tingimus täidetud ning hüpotees kehtib. Võtan vastu H0 hüpoteesi. a.i. 4. Küsimus Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 Intervalli Vahemik Elemente Tõenäosus Intervalli nr keskmine 1 0-20 7 0.28 9.86 2 20-40 4 0.16 33.75 3 40-60 6 0.24 47.33 4 60-80 4 0.16 73.25
Hüpotees ütleb et tabeli t peab olema suurem kui arvutatud t, ehk ttabel > t, ja nii meil ongi, ehk 1,711 > 0,911. Seega on hüptees tõene. 3.2 H0: 2 = 800 alternatiiviga H1: 2 800 s 2 ( N - 1) x2 = 2 814,42 24 x2 = = 25,00 741,6 Hüpotees ütleb et arvutatud 2 peab jääma kahe kriitilise väärtuse vahele, ehk 2 a/2 < arvutatud 2< 2 1-a/2 ja nii meil ongi, ehk 13,85<25,00<36,42 - Seega on hüptees tõene. 4. Leida valimile vastav empiiriline histogramm ...võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida 2-testi järgi olulisuse nivool = 0.10 järgmisi jaotushüpoteese: vahemik ni pi xi 0-20 6 0,2 9,833 4 21-40 7 0,2 33 8 41-60 4 0,1 49,25 6 61-80 5 0,2 70 0 81-100 3 0,1 90 2
10): 3.1. H0 : μ = 50 alternatiiviga H1 : μ 50 09 Et hüpotees vastu võetaks, peab tkr > t; 1,7109 > 0,2892. Hüpotees H0 vastab tõele. 3.2. H0 : σ2 = 800 alternatiiviga H2 : σ2 800 84 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,8484 < 29,0575 < 36,4150 . Hüpotees H0 vastab tõele. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool α = 0,10 järgmisi jaotushüpoteese: Inte rvalli nr Vahe mik Ele mente Tõenäosus Inte rvavalli keskmine 1. 0 – 20 6 0,24 9,17 2
5, n -1) = ;49 = 47,0 2 0,05 KR 2 ,vasak 1 - ; n -1 = 1 - ;49 = 17,0 2 2 KR 2 ,vasak < EMP < KR , parem põhihüpotees ei kehti, H 1 : 2 2 2 800 , st 800 ei ole antud valimi korral tõene dispersioon. 4. Leida punktis 1 nõutud hinnangud grupeeritud valimile, gruppide arv k = 7, grupi samm h = Const. ( x - xmin ) 99 - 0 h = max k=7 h= 14 k 7 3 Tabel 2. intervall xi ni nixi nixi2 pi=ni/n 0 - 14 7 9 63 441 0,18 15 - 29 22 5 110 2420 0,1
usaldusvahemike arvutamisel. t-jaotus (Studenti jaotus) on kasutusel normaaljaotusega juhusliku suuruse keskvaartuse hinnangu jaoks usaldusvahemike arvutamisel. F-jaotus (Fisheri jaotus) on kasutusel kahe normaaljaotusega juhusliku suuruse dispersioonide hinnangute võrdlemisel osana mitmetes hüpoteeside kontrolli skeemides. Momentide meetod: Meetodi põhimote seisneb selles, et üldkogumile vastavad seosed jaotuse parameetrite ja arvkarakteristikute vahel kantakse üle valimile ja vastavalt valimist saadud arvkarakteristikute hinnangutele arvutatakse nende seoste järgi parameetrite hinnangud. Meetodi sammud on seega järgmised: 1) Leida üldkogumile vastava juhusliku suuruse jaotuse jaoks arvkarakteristikute avaldised/seosed sõltuvalt jaotuse parameetritest 2) Leida nendest seostest poordseosed, avaldades parameetrid arvkarakteristikute kaudu (st lahendada vastav võrrandisüsteem)
F-jaotus normaaljaotusele. Statistiliste hinnangute omadused: *hinnangu mõjusus: valimi mahu N kasvades hinnang koondub tõenäosuse järgi hinnatava parameetri tegelikuks väärtuseks. *hinnangu nihutamatus: hinnangu keskväärtus võrdub hinnatava parameetri tegeliku väärtusega *hinnangu efektiivsus: hinnangu dispersioon on minimaane võimalik. Momentide meetodi põhimõte seisneb selles, et üldkogumile vastavad seosed jaotuse parameetrite ja arvkarakteristikute vahel kantakse üle valimile ja vastavalt valimist saadud arvkarakteristikute hinnangutele arvutatakse nende seoste järgi parameetrite hinnangud. Meetodi sammud: *leida üldkogumile vastava juhusliku suuruse jaotuse jaos arvkarakteristikute avaldised/seosed sõltuvalt jaotuse parameetritest *leida nendest seostest pöördseosed, avaldades parameetrid arvkarakteristikute kaudu *arvutada valimi järgi arvkarakteristikute hinnangud *arvutada valimi arvkarakteristikute järgi parameetrite hinnangud, kasutades leitud
σ2 2 705,69∙ ( 25−1 ) χ= =21,17 800 2 χ 0,05 =36,42 2 χ 0,95 =13,84 Et hüpotees H0 vastu võetaks peab χ2 jääme kahe kriitilise väärtuse vahele: 13,85 < 20,25 < 36,42. Hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 2 60-80 ja 80-100 ning kontrollida χ - testi järgi olulisuse nivool α = 0,10 järgmisi hüpoteese. Intervalli Vahemiku Intervalli keskmine nr k d Elemente ni Tõenäosus pi ni
0 10 0,00059 ebatõenäoline a teststatistik z Kriitilised väärtused Olulisuse nivoo ja kahte liiki vead · Nullhüpotees lükatakse tagasi, kui valimile vastava teststatistiku empiirilise väärtuse esinemise tõenäosus Võtan H0 vastu Lükkan H0 tagasi on väiksem kui olulisuse nivoo H0 kehtib Otsus õige I liiki viga · Sagedasemad olulisuse nivood: 0,1; 0,05; 0,01
3.2 H 0 : σ =800 alternatiiviga H 0 : σ ≠ 800 s2 ( 2 28,532 χ = 2 N −1 = ) ∙ 24=24,42 χ2 statistiku vasak kriitiline piir: σ0 800 χ 21−∝/2=chiinv ( 0,95 ; 24 )=13,8 χ2 statistiku parem kriitiline piir: χ 2∝/2 =chiinv ( 0,05; 24 )=36,4 Kriitiline piirkond χ2 < 13,848 , χ2 > 36,415 H0 hüpotees vastuvõetud, sest 13,848 < 24,42 < 36,415 4. Valimile vastav empiiriline histogramm võrdlaiade vahemikega m nm pm 0-20 7 0,28 20-40 4 0,16 40-60 6 0,24 60-80 4 0,16
χ= =23,174 800 χ 20,05=36,415 χ 20,95=13,848 Hüpoteesi H0 vastu võtmiseks peab χ 2 jääma kahe kriitilise väärtuse vahele: χ 2α ( f ) χ 2 χ2 α (f ) 2 < < 1− 2 13,848 < 23,174 < 36,415. Võtan hüpoteesi vastu. 4. Leian valimile vastava empiirilise histogrammi võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100. Intervall Intervalli Vahemik Elemente Tõenäosus i nr keskmine
see jääb siis paremale poole nullist. Nüüd võtan selle, mis mul päriselt keskmiste vahe oli. Kus on erinevused väikese ja suure vahel tekib küsimus? Kõik baseerub normaaljaotuse proportsioonidele. SELLEST EI OLNU TEGELIKULT VAJA ARU SAADA Kui on erinevus valimi keskmiste puhul väga väike ei saa üldkogumi kohta midagi väga öelda. Suurte valimite puhul on t-testi kõver normaaljaotuskõvera sarnane, väikeste valimite korral on kõver lamedam. T kõver varieerub vastavalt valimile. Kuhu tõmmata piirid? – t-jaotuse täiendkvantiilid on selle jaoks vt konspekte. Df=n-1 Vabadusastmete arv on indikaator (Df). Paaride erinevuste jaotus. –keskmine, standardhälve, standardviga ja selle usalduspiirid. See on oluline järelduste tegemisel vt p7 lehel. Ehksiis eelnev jutt oli selleks, kui keegi magistritöös küsib, et mis on t-statistic siis tead. Antud juhul on ta t(16)=- 6.37 (sulgudes on vabadusastmete arv). Erinevust valimi keskmiste sõltuvalt t jaotusest
Statistiliste hinnangute omadused: hinnangu mõjusus: valimi mahu N kasvades hinnang koondub tõenäosuse järgi hinnatava parameetri tegelikuks väärtuseks. hinnangu nihutamatus: hinnangu keskväärtus võrdub hinnatava parameetri tegeliku väärtusega hinnangu efektiivsus: hinnangu dispersioon on minimaane võimalik. Momentide meetodi põhimõte seisneb selles, et üldkogumile vastavad seosed jaotuse parameetrite ja arvkarakteristikute vahel kantakse üle valimile ja vastavalt valimist saadud arvkarakteristikute hinnangutele arvutatakse nende seoste järgi parameetrite hinnangud. Meetodi sammud: leida üldkogumile vastava juhusliku suuruse jaotuse jaos arvkarakteristikute avaldised/seosed sõltuvalt jaotuse parameetritest leida nendest seostest pöördseosed, avaldades parameetrid arvkarakteristikute kaudu arvutada valimi järgi arvkarakteristikute hinnangud
võetud. 3.2 H0: σ2 = 800 alternatiiviga H2: σ2 800 s 2 ( N −1 ) 1073,2 ∙ (25−1 ) χ 2= = = 32,2 σ2 800 χ 20,05=36,42 χ 20,95=13,84 Et hüpotees vastu võetaks, peab χ2 jääma 13,8 ja 36,4 vahele. Seega hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm. Intervalli Intervall Tõenäos keskmine m ni us xi 0-20 7 0,28 8,7 20-40 5 0,2 31,6 40-60 5 0,2 45,6 60-80 1 0,04 62 80-100 7 0,28 90,9 Valimi histogramm
Kasutatakse usalduspiiride leidmisel, testimisel. Sellest leitakse kriitilised väärtused, olulisuse tõenäosus. 11) Hinnangu asümptootiline efektiivsus – Mõjus hinnang on asümptootiliselt efektiivne, kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. 12) Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiiriline ja kriitiline väärtus: H1 kui valimile vastava teststatistiku empiirilise väärtuse esinemise tõenäosus on väiksem kui olulisuse nivoo a. Kui empiiriline väärtus on kriitilisest suurem. 13) Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiirilisele väärtusele vastav olulisuse tõenäosus ja olulisuse nivoo: H1 kui olulisuse tõenäosus p-value < a olulisuse nivoo 14) Olulisuse nivoo ja kahte liiki vead: I liiki vea tõenäosuse ülempiir on olulisuse nivoo a
Monopoolne uuring – infovajaja enda või tema tellimusel tehtud uuring, mille tulemused on tema ainuomand. Mitme tellija uuring – mitme infovajaja tellitud uuring, mille tulemuste omandiõiguse sätestab leping. Võimalikeks variantideks on tulemuste ühisomand või omandiõigus vaid teatud osale uuringutulemustest. Tüüpiliseks mitme tellija uuringuks on omnibus-uuring, kus korduvkasutatavale valimile saavad oma infotaotluse (tavaliselt küsimuse) esitada kõik soovijad; samuti paneeluuringud. Sündikaatuuring ehk valimisuuring – uurija poolt tema enda initsiatiivil tehtav uuring, mille tulemusi võivad kõik maksevõimelised soovijad vabalt osta (ka nt baasuuring). Uuringuprotsessi etapid: Planeerimine - Strateegilised plaanid - Taktikalised plaanid - Andmebaasid 1
Andmete kogumine (kvalitatiivne) Intervjuu; Vaatlus; Visuaalsed materjalid, kirjalikud materjalid (pildid, videod, tekstid); Dokumendianalüüs (kirjad, autobiograafiad jms.) Andmete kogumine internetist (intervjuud, blogid, artiklid); Küsimustike koostamine kvantitatiivses uurimistöös Keda küsitlen? Inimeste küsitlemisel on eriti oluline see, keda me küsitleme ja mille jaoks me küsitleme. Teisisõnu tuleb suur tähelepanu pöörata valimile; Valim oleneb ka töö mahust ja küsitluste pikkusest; Ühte valimisse kuuluvad inimesed peavad vastama samadele kriteeriumitele (nt vanus, sugu, kogukond vm). Valim oleneb uurimistöö teemast. Milline peaks olema valim? Mida arvestan? 1. Põhikooliõpilaste lugemusharjumused 5. ja 6. klassis; 2. Lapsevanemate suhtumine ja hoiak laste koolist puudumisse; 3. Roppuste kasutamine teismeliste seas; 4
kas neis on mingi iva? Kuna valiidus on raske asi, siis kvalitatiivsete meetodite puhul klassikalised valiidsuse käsitlused ei sobi. Valiidsus tähendab siin kogu aeg selle uurimist, kas on sarnasusi ja erinevusi. Valiidsuse üle otsustatakse iga uurimuse puhul eraldi. *VALIIDSUS (väline usutavus) · Väline valiidsus (external validity) peegeldab tulemuste üldistatavust: kas saadud tulemusi saab üldistada laiemalt kui konkreetsele valimile või situatsioonile. Kas nendel inimestel, kellel oli kõrge skoor agressiivsuse skaalal, on agressiivsemad suhted kaastöötajatega kui nendel inimestel, kelle skoor oli madal? Loomulikus keskkonnas tehtud uurimuse väline valiidsus on enamasti suurem kui laboratoorsel uurimusel. Laboratoorse uurimuse puhul on kõrgem sisemine valiidsus kuna situatsiooni üle on suurem kontroll, saab uurija olla kindlam selles, mida uuritakse.
teststatistikut. ● Valimi andmete põhjal arvutatakse teststatistiku empiiriline väärtus – sõltuvalt sellest, mida kontrollitakse, on konkreetsed arvutusvalemid erinevad – z-test, t-test, F-test, χ 2 -test, …. ● Empiirilist väärtust võrreldakse vastava kriitilise väärtusega ja võetakse vastu otsus. Kriitilised väärtused ● Nullhüpotees lükatakse tagasi, kui valimile vastava teststatistiku empiirilise väärtuse esinemise tõenäosus on väiksem kui olulisuse nivoo α ● Sagedasemad olulisuse nivood: 0,1; 0,05; 0,01 ● Olulisuse nivoole vastav teststatistiku väärtus on kriitiline väärtus. ○ Näiteks kriitilised väärtused kahepoolse z-testi korral on -1,96 ja 1,96. Kriitilistest väärtustest kaugemal on kriitiline piirkond (viirutatud), kus kehtib sisukas hüpotees KOKKUVÕTVALT:
1. Küsimus: Suitsetamine on tervisele kahjulik. Pigem pole Täiesti nõus Pigem nõus Ükskõikne nõus Üldse pole nõus Väide:……………………………………………………………………… Pigem pole Täiesti nõus Pigem nõus Ükskõikne nõus Üldse pole nõus 4.2. KVALITATIIVUURINGUD Eelpool kvantitatiivuuringud on struktuursed, suunatud suuremale valimile ning kuuluvad kirjeldavate uuringute hulka. Nende uuringute tulemuseks on numbrid, mida on võimalik esitada graafiliselt ja töödelda statistiliselt. Kvalitatiivuuringus, aga kasutatakse mitte-struktuurseid küsimusi, millele pole vastusevariante ette antud, mis on lahtised. Valimid on oluliselt väiksemad. Kvalitatiivuuring on tutvumisuuringu üks vorme ja selle eesmärgiks on välja selgitada inimeste motiivid, põhjused, arvamused, suhtumised.
2 = 2 = -1 Dispersiooni mõõtühikuks on esialgse tunnuse ühiku ruut, mis aga muudab dispersiooni ühiku raskestimõistetavaks (kr2, %2, m6 jne), mistõttu praktikas kasutatakse rohkem standardhälvet (teisisõnu ruutkeskmist hälvet), mis on ruutjuur dispersioonist. Standardhälve väljendab keskmist kõrvalekallet aritmeetilise keskmise suhtes. Arvutusvalemid vastavalt valimile, üldkogumile ning sagedustabelina esitatud valimile: - 2 - 2 - 2 = = = -1 =STDEV(piirkond) =STDEVP(piirkond)
2009. aastast 9-5 Koolitusmaterja- (2); (3) 5 aastat; P; PR-büroo (koordinaator) Alatised saadetakse Alatisele valimile lid (jaosmaterjalid, valim jaos- Alatine valik pärast asjaajamisaas- (AV), registreerimislehed) materjalist D PDF ta lõppu DH-teenis- ülejäänud (H) **
•Kvaliteetne valim on kvaliteetse uurimistulemuse üks põhieeldusi. •Valim peab olema: a) tasakaalustatud (unbiased) b) esinduslik, st. peegeldama adekvaatselt üldkogumi proportsioone Valimi viga ja valimi-väline viga VVV tuleneb ebatäielikust valikuraamist, kodeerimisvigadest, mitte-vastajate suurest osakaalust, viletsast küsimustikust, asjatundmatust intervjueerijast jne. VV väljendub statistiliselt standardveana (standard error,SE) ja viitab tasakaalustamata valimile (biased sample). Mida väiksem on SE väärtus, seda kvaliteetsem uuring. Otsesed meetodid kvaliteedi tagamiseks •vastamismäär (response rate). Mitte alla 50% •Kuidas tagada nõutav vastamismäär? o järelküsitlused o kvalifitseeritud küsitlejad o hea küsimustik •kaalumine (weighting) oNäit. kui respondentide hulgas on 16-24 aastasi 2x vähem kui peaks olema vastavalt üldkogumile, tuleks anda selle grupi vastustele koefitsent 2 (2-ga läbi korrutada).
4. Kristiines on toidukaupade hinnad suhteliselt madalad võrreldes teiste kaubamajadega jne. Tulemuste analüüsil liidetakse saadud punktid iga vastaja kohta ja rohkem punkte saanud vastajad suhtuvad sellesse kaubamajja ilmselt soosivamalt. Vastavalt saadud punktide arvule on võimalik tarbijaid nende hoiakute järgi jagada kolme gruppi: soosivad, neutraalsed ja mittesoosivad. 3.2 Kvalitatiivuuringud Ülevaadeldud kvantitatiivuuringud on struktuursed, suunatud suuremale valimile ning kuuluvad kirjeldavate uuringute hulka. Nende uuringute tulemuseks on numbrid, mida on võimalik esitada graafiliselt ja töödelda statistiliselt. Kvalitatiivuuringus, vastupidiselt eelnevale, kasutatakse mitte-struktuurseid küsimusi, millele pole vastusevariante ette antud, mis on lahtised. Valimid on reeglina oluliselt väiksemad. Kvalitatiivuuring on tutvumisuuringu üks vorme ja selle eesmärgiks on välja selgitada inimeste motiivid, põhjused, arvamused, suhtumised. Vastajal
Samuti võib arvtunnusena vaadelda järjestustunnust, kuid siin tuleb tähelepanelik olla skaalapunktide omavahelise kauguse (mittevõrdse skaala) suhtes. Nominaaltunnuste (kvalitatiivtunnuste) alla kuuluvad mittearvulised tunnused, mille väärtusvariantide jaoks ei leidu sisulist järjestust. KVALITATIIVSED UURINGUD Peamised uuringumeetodid kvantitatiivuuringud ja kvalitatiivuuringute peamine erinevus seisneb selles, et kvantitatiivuuringud on struktuursed, suunatud suuremale valimile ning nad on kirjeldavad uuringud. Kvantitatiivsete uuringute tulemuseks on numbrid, mida on võimalik graafiliselt esitada või statistiliselt töödelda. Kvalitatiivuuringute eesmärgiks on süveneda probleemi olemusse (põhjuslikud uuringud) või genereerida ideid mingi probleemi lahendamiseks. Kvalitatiivuuringute peamised kasutusalad on järgmised: 1. Tausta- või tutvumisuuringu (exploratory research) läbiviimisel. 2. Uute ideede väljatöötamine. 3