Kuna valimi maht jääb alla 30, siis kasutan Studenti jaotust (OpenOffices vastab F^-1 TINV funktsioon) β=0.95 α = (1 + β) / 2 (number) a studenti jaotuse kvantiilide puhul k* = n – 1 (degree_freedom Leian p* = k/n (kus k on mittesuitsetavate arv ja n koguarv) Naistel vahemik (59.2% ; 95.4%) Meestel vahemik (49.3% ; 86.5%) Ülesanne 3 Kas võib arvata, et meeste ja naiste keskmine palk on võrdsed? Koostada hüpoteeside paar. Esitada teststatistik. Usaldusnivoo 0,95 juures leida kriitilised väärtused, kriitiline piirkond. Arvutada teststatistiku väärtus ja võtta vastus otsus. EX – meeste keskmine palk EY – naiste keskmine palk H0 – Meeste ja naiste keskmine palk on võrdsed – EX = EY H1 – Meeste ja naiste keskmised palgad ei ole võrdsed EX != EY Standardhälbed on tabelis tähistatud Δ ^2. Valimite suurused on vastavalt 28 -> mehed ja 22 -> naised. β = 0.95 -> α = 0.05
täielikult. Näiteks Kolmogorovi-Smirnovi testi alusel ei tohiks neid kumbagi 7 normaaljaotuseks lugeda. Seega uurisin mõjusid ka normaaljaotust mitte-eeldava Kruskali- Wallise testi alusel. Kruskali-Wallise testi alusel on immigrantide hinnangud erinevad olulisuse tõenäosusega alla 0,05 vanusgruppide lõikes (teststatistik 115 vabadusastmete 6 korral). Sugu on Kruskali- Wallise testi alusel eristav faktor olulisuse tõenäosusega 0,09 (teststatistik 3 vabadusastme 1 korral) ja haridustase olulisuse tõenäosusega 0,08 (teststatistik 8 vabadusastmete 4 korral). On huvitav, et sugu polnud nii tugev eristav faktor astakute võrdluse puhul, kui see oli keskmiste võrdluste puhul. Homoseksuaalide õiguste hinnang erineb olulisuse tõenäosusega alla 0,05 vanusgruppide
Dispersiooni hinnang Sagedustabeli puhul kasutame valemit: 1 N ^ 2 = s 2 = ( xi - µ^ ) 2 = N - 1 i =1 6 (9,833 - 44,28) 2 + 7 (33 - 44,28) 2 + 4 ( 49,25 - 44,28) 2 + 5 (70 - 44,28) 2 + 3 (90 - 44,28) 2 = 24 17687,5944 = 736,98 24 2 Normaaljaotus x Teststatistik k (n - n' ) 2 x2 = i ' i i =1 ni ni' = ni pi xi ui (ui) n'i n'i/n' ni ni-n'i (ni-n'i)2 ((ni-n'i)2)/n'i 9,83 -1,239 -0,3925 -34,25 -5,71 6,00 40,25 1619,76 -47,30 33,00 -0,406 -0,1951 -17,02 -2,43 7,00 24,02 577,10 -33,90
Normaaljaotuse puhul peaksid olema järsakuse kordaja (K) ja assümeetriakordaja (S) nullid. Antud valimi puhul on järsakuse kordaja -0,854 ning assümeetriakordaja -0,213. Nende tulemuste põhjal võib öelda, et tegemist ei ole normaaljaotusega. Kontrollime assümeetria- ja järsakuse kordajate abil lisaks JarqueBera testiga normaaljaotust. 5 2 Selleks tuleb leida teststatistik JB= 6( n 2 ( K-3) S+ 4 ) , kus n on valimi liikmete arv, S assümeetriakordaja ja K järsakuse kordaja. Pannes Descriptive Statistics abil arvutatud arvud valemis oma kohtadele saame, et JB= 30,952. Kontrollimaks, kas tegu on normaaljaotusega võrdleme teststatistikut statistiliste jaotusfunktsioonide kalkulaatorist 2
docstxt/129544194986833.txt
Viga võib olla kahte liiki: Kui otsustatakse 0-hüpotees tagasi lükata ja alternatiivne õigeks lugeda, toob see kaasa olemasoleva olukorra muutmise vajaduse ja koos sellega teatud ressursside kulutamise. Seepärast on 1.liiki viga halb viga. Fikseerime 1.liiki vea tegemise tõenäosuse ülemise piiri , mis on tavaliselt väike arv, kõige sagedamini 0,05 ja mida nim olulisuse nivooks. 8. Ühepoolne hüpotees (2 erinevat võimalust) üldkogumi keskmise kohta: teststatistik, kriteerium nullhüpoteesi tagasilükkamiseks olulisuse nivoo puhul ja eriti, kui =0,05. Nimetatud hüpoteeside praktiline kontrollimine a) H0: µµ0 H1: µ<µ0 x - µ0 Teststatistik: z= s n Kriteerium H0 tagasilükkamiseks olulisuse nivoo juures: lükata H0 tagasi ja lugeda
teststatistiku leidmine, nullhüpoteesi tagasilükkamise kriteerium iga hüpoteeside paari puhul. Hüpoteeside praktiline kontrollimine antud andmete korral. 4.Hüpoteeside kontroll.Ühe- ja kahepoolsed hüpoteesid osakaalu (tõenäosuse) kohta, suur valim: hüpoteeside püstitamine, teststatistiku leidmine, nullhüpoteesi tagasilükkamise kriteerium. Hüpoteeside praktiline kontrollimine antud andmete korral. Tõenäosusteooria Page 2 Teststatistik: 5.Hüpoteeside kontroll.Kahe üldkogumi keskmiste ja osakaalude võrdlemine, suured valimid. hüpoteeside püstitamine, teststatistiku leidmine, nullhüpoteesi tagasilükkamise kriteerium. Hüpoteeside praktiline kontrollimine antud andmete korral. 6. Hüpoteeside kontroll.Kahe üldkogumi keskmiste võrdlemine, väikesed valimid. Hüpoteeside praktiline kontrollimine antud andmete korral. 7.Lineaarne regressioon
Valimdispersioon 0,0906 VAR Valimstandardhälve 0,3010 STDEV 2) 90% usalduspiirid tegelikule keskväärtusele =0,5 [0,4981 , 0,5019] ja tegelikule dispersioonile 2=0,083 [0,0667 , 0,1068] Valimkeskmine ei sisaldu arvutatud usaldusvahemikus kuid valimdispersioon sisaldub. Keskväärtuse usaldusvahemiku leidmine: Dispersiooni usaldusvahemiku leidmine: Kasutatud valemeid TINV, CHIINV 3) =0,01 H0: =0,5 Ha: 0,5 Teststatistik: > Z=0,003 Kriitiline prk: Za/2=2,575 Kuna |Z|< Za/2 võime lugeda nullhüpoteesi kehtivaks. Samas on näha, et leitud valimkeskmine ei lange määratud piiridesse =0,01 juures. P=0,7912.
oleks suurim just nimelt selle valimi saamise P. Eelis: efektiivsus! Vähimruutude meetod tavalisim, Eelis: lihtne arvutus, optimaalsus. Nullhüpotees kontrollitav väide. Alternatiivne hüpotees- H0-i välistav alternat. väide. Esim. järku viga H0 on õige, peetakse valeks. Vea tõenäosus- alfa (olulisuse nivoo) 2. Järku viga H0 on vale, peetakse õigeks, vea tõenäosus on beeta. Teststatistik x kasut hüpoteesi kontrollimiseks. Lihthüpotees kui fikseerib üldkogumi jaotuse üheselt. Testi võimsus= 1-beeta Hüpoteeside kontroll: 1) Pearsoni x2-test: levinud jaotushüpoteeside kontrollimisel. Teststatistik iseloomustab erinevust hüpoteetilise ja empiirilise jaotuse vahel histogrammi vahemike vastavate hüpoteetilise ja empiirilise sageduse kaudu. 2) Kolmogrovi-Smirnovi test: kasutab erinevust hüpoteetilise ja empiirilise jaotusfunktsiooni vahel.
vastuolus kogutud andmetega, ka väljapakutud H0 võib ju õige olla, nullhüpoteesi ei saa kummutada, do not reject H0, failing to reject H0, ...) P-väärtus (olulisustõenäosus, p-value) - Eeldame, et kehtib nullhüpotees. Meie poolt nähtud statistiku väärtusega samasuure või veel ekstreemsema teststatistiku nägemise tõenäosust nullhüpoteesi kehtides kutsutakse p- väärtuseks (olulisustõenäosuseks). Teststatistik- mingi statistik, kes aitab otsustada, kas nullhüpotees peab paika või mitte Näide: H0: Kõik naised on lollid. H1: Kõik naised ei ole lollid (leidub naisi, kes pole lollid). Teststatistik: Mittelollide naiste arv valimis. Tõde Süüdi Pole süüdi KOHTU OTSUS Jim üles puua OK Suur viga
● Otsustamiseks kasutatakse juhuvalimit. ● Juhuvalimi keskväärtus on juhuslik suurus, st erineb arvust μ. ● Kuidas otsustada, kas – kogumi keskväärtus μ = μ0 kehtib nullhüpotees; – kogumi keskväärtus μ ≠ μ0 kehtib sisukas hüpotees? ● Ehk: kui palju võib juhuvalimi keskväärtus erineda nullhüpoteesiga püstitatud väärtusest, et võime öelda: nullhüpotees ei kehti? ● Vaja kriteeriumi! Statistiline kriteerium ja teststatistik ● Otsustamiseks vajaliku statistilise kriteeriumi leidmiseks kasutatakse teststatistikut. ● Valimi andmete põhjal arvutatakse teststatistiku empiiriline väärtus – sõltuvalt sellest, mida kontrollitakse, on konkreetsed arvutusvalemid erinevad – z-test, t-test, F-test, χ 2 -test, …. ● Empiirilist väärtust võrreldakse vastava kriitilise väärtusega ja võetakse vastu otsus. Kriitilised väärtused
t-testi parameetri empiiriline väärtus mittekehtiv nullhüpotees, I liiki viga, ii liiki viga, teststatistiku empiiriline väärtus olulisuse nivoo olulisuse nivoo vähendamine sisukas hüpotees, olulisuse nivoo, liiki vea, tõke analüüsimeetod hüpoteesi statistilisel kontrollimisel saadi olulisuse tõenäosuseks uuritava tunnuse jaotuse võrdlemisel normaaljaotusega Test 9 ühefaktoriline dispersioonanalüüs anova nullhüpoteesi dispersioonanalüüs, teststatistik, faktori poolt põhjustatud seletatud hajumine suurem, seletamata hajumine teststatistiku f väärtus toodud anova tabeli korral funktsioontunnus faktor korrelatsioonimaatriks negatiivne kovariatsioon, autokorrelatsioon, spearmani korrelatsioon summaarne dispersioon arvutusvalemis, kovariatsioon õige hajumisdiagramm hajumisdiagramm, tunnuste vaheline seos kõige tugevam korrelatsioonikordaja ja kovariatsioon hajumisdiagramm, esitatud seos
on lineaarne või Nende eelduste kehtimist tuleb kontrollida! mittelineaarne? Selleks on mitmesugused testid. Nullhüpotees ja sisukas hüpotees Statistiline kriteerium ja teststatistik · Nullhüpotees: miski võrdub millegagi (erinevus on null) kogumi keskväärtus = 0 kogumi A keskväärtus = kogumi B keskväärtus · Otsustamiseks vajaliku statistilise kriteeriumi mudeli parameeter = 0 leidmiseks kasutatakse teststatistikut. · Sisukas (alternatiivne) hüpotees: võrdus ei kehti
tunnuste suhtes. 48) White’i testi idee, nullhüpotees ja sisukas hüpotees (loeng 3) White’i test homoskedastiivsus Sõltuv tunnus= mudeli jääkliikmete ruudu ui2 Kui jääkliikmete dispersioon ei ole konstantne, siis see sõltub regressoritest x. Hinnatakse regressioonmudelit, kus sõltuvaks tunnuseks jääkliikmete dispersioon H0 uues mudelis on vaid konstant H1 heteroskedastiivsus ---> kui teststatistik TR2 väärtus > kriitiline (p < a) on tegemist heteroskedatiivsusega 49) Mida teha, kui heteroskedastiivsus esineb? Logaritmida tunnuseid Kontrollida mudeli spetsifikatsioon: kas õige kuju, kas oluline tunnus välja jäänud mudeli teisendamine ja uuesti hindamine. 50) Kohandatud standardvigade kasutamine Kui ei õnnestu eemaldada heteroskedastiivsust. EI KAOTA heteroskedastiivsust, vaid võtavad seda arvesse.
16 14 olulisuse nivoo 17 13 teststatistiku kriitiline väärtus 18 7 19 14 4. Parameetri empiirilise väärtuse võrdlemine kriitilisega 20 16 21 12 parameeter langeb kriitlisse piirkonda 22 9 23 28 24 16 Vastu võtta sisukas hüpotees, kuna teststatistik langeb kriitilisse piirkon 25 17 26 22 27 2 28 19 29 16 30 12 31 7 32 8 33 7 34 16 35 14 36 3 37 17 38 16 39 3 40 25 41 16 42 2 43 13 44 13 45 8 46 6 47 20 48 3 49 12 50 17 µ 10.7 µ > 10.7 rilise väärtuse leidmine
m 63 Vähi 846.09 m 91 Ülesanded 1. Tallinnas fikseeriti 100 päeva jooksul kiirabi väljakutsete sagedused. Saadi järgmised tulemused: Väljakutsete arv Sagedus 0 10 1 26 2 31 3 18 4 8 5 7 Mis jaotusega on teie meelest väljakutsete sagedus? Leidke selle jaotuse parameetr(te)le suurima tõepära (STP) hinnang. Konstrueerige teststatistik kontrollimiseks, kas empiiriline jaotus vastab teie poolt pakutud teoreetilisele tõenäosusele. Olulisusnivooks võtke 0.05. Lahendus Väljakutsete ~ (~ ni−ni)2 sagedus ni p´i ni arv i ~n
hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea tõenäosust tähistatakse ); teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks (võetakse vastu) (sellise vea tõenäosust tähistatakse ). Hüpoteeside kontrolli tavapärased sammud on järgmised: 1) Formuleeritakse kontrollitav hüpoteesipaar {H0, H1} ja valitakse teststatistik x. 2) Valitakse olulisuse nivoo . 3) Leitakse teststatistiku x kriitiline piirkond X1 . 4) Valimi järgi arvutatakse teststatistiku x väärtus. 5) Järelduse tegemine. Kui x väärtus satub kriitilisse piirkonda X1 , siis nullhüpotees H0 lükatakse tagasi, vastasel juhul H0 võetakse vastu. Pearsoni 2 test: 2- test on üks levinumaid teste jaotushüpoteeside kontrollimisel. Testis kasutatav
interval vahemi element tõenäos intervalli li nr k e us keskmine 1 0-20 9 0,36 9,55 2 20-40 4 0,16 30,75 3 40-60 2 0,08 49 4 60-80 5 0,2 69,8 5 80-100 5 0,2 94 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ni- k Xm ui ni (ui) pi ni' ni')^2/ni' - 1 20 0,70774 9 0,2389 0,2389 5,9725 1,5346599 - 0,2508714
2 χα vabadusastmete arvule χ kriitilised väärtused. Esmalt 2 =35,479, mille abil χ2 α hindame kas saadud S0 on suurem kui 1 ning 1− 2 = 10,283, mille järgi hindame kas saadud S0 on 1st väiksem. Praegusel juhul jääb teststatistik kriitiliste piiride sisse ning kaaluühiku standardhälve on statistilises mõttes võrdne a’priori valitud standardhälbega (δ=1). Kaaluühiku standardhälve on 1’le lähedal, seega ei ole alust arvata, et mõõtmistulemustes esineks jämedaid vigu. Leitud punkti E koordinaatide usaldusväärsuse hindamiseks leiame nende S i=S0 √ q x x , kus qx x standardhälbed Sx, Sy ja Sz
li nr k e us keskmine 1 0-20 5 0,2 6,8 2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,2 73,4 5 80-100 3 0,12 96,3 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ni- k Xm ui ni (ui) pi ni' ni')^2/ni' - 1 20 0,70774 9 0,2389 0,2 5,9725 1,5346599 - 0,2508714
Hüpoteesi kontrollimiseks kasutatakse mingit sobivat teststatistikut x. Vastavalt valimi järgi arvutatud x väärtusele leitakse, kas see väärtus langeb kriitilisse piirkonda või ei ning vastavalt nullhüpotees ka lükatakse tagasi või võetakse vastu. Esimest liiki vea tõenäosust alfa nim olulisuse nivooks, tõenäosust 1-beeta nim testi võimsuseks. Hüpoteeside kontrolli tavapärased sammud on järgmised: *formuleeritakse kontrollitav hüpoteesipar ja valitakse teststatistik x. *valitakse olulisuse nivoo alfa *leitakse teststatistiku x kriitiline piirkond *valimi järgi arvutatakse teststatistiku x väärtus *järelduste tegemine Pearsoni X2-test. Testis kasutatav teststatistik iseloomustab erinevust hüpoteetilise ja empiirilise jaotuse vahel histogrammi vahemikele vastavate hüpoteetilise ja empiirilise sageduse kaudu. Hüpoteesi kontroll koosneb tavaliselt järgmistest sammudest:
Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis ( ) (( ) ) (( ) ) (( ) ) (( ) ) (( ) ) (arvutatud Excelis ümardusi kasutamata) Teststatistik: ( ) [ ( ) ( )] [ ( ) ( )]
40 60 5 0,2 48,6 4. 60 80 4 0,16 73,25 5. 80 100 4 0,16 85 4.1. Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ui), k xm ni ui pi ni' tabelist 1 20 7 -0,852 0,1977 0,1977 4,943 0,856511 2 40 5 -0,165 0,4325 0,2348 5,870 0,128944 3 60 5 0,523 0,6985 0,2660 6,650 0,409398
3 40-60 6 0,24 7,17 7 4 60-80 5 0,2 3,40 9 5 80-100 3 0,12 6,33 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: kuna tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ni- k Xm ui ni (ui) pi ni' ni')^2/ni' - 0,0236863 1 20 0,88933 5 0,1867 0,1867 4,6675 95
Hüpoteesi kontrollimiseks kasutatakse mingit sobivat teststatistikut x. Vastavalt valimi järgi arvutatud x väärtusele leitakse, kas see väärtus langeb kriitilisse piirkonda või ei ning vastavalt nullhüpotees ka lükatakse tagasi või võetakse vastu. Esimest liiki vea tõenäosust nim olulisuse nivooks, tõenäosust 1- nim testi võimsuseks. Hüpoteeside kontrolli tavapärased sammud on järgmised: formuleeritakse kontrollitav hüpoteesipar ja valitakse teststatistik x. valitakse olulisuse nivoo alfa leitakse teststatistiku x kriitiline piirkond X1 valimi järgi arvutatakse teststatistiku x väärtus järelduste tegemine Pearsoni X2-test. Testis kasutatav teststatistik iseloomustab erinevust hüpoteetilise ja empiirilise jaotuse vahel histogrammi vahemikele vastavate hüpoteetilise ja empiirilise sageduse kaudu. Hüpoteesi kontroll koosneb tavaliselt järgmistest sammudest:
3 40-60 1 0,04 40,0 4 60-80 7 0,28 74,57 5 80-100 8 0,32 90,25 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis (arvutatud Excelis väärtuste ümardusi rakendamata) Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: k Xm ui ni (ui) pi ni' (ni-ni')2/ni' 1 20 -1,17 4 -0,379 -0,121 3,025 0,314 2 40 -0,56 5 -0,212 0,167 4,169 0,166 3 60 0,05 1 0,020 0,232 5,805 3,977
intervalli nr vahemik elemente intervalli keskmine 1 0-20 4 15,25 2 20-40 4 33 3 40-60 8 48,63 4 60-80 2 65,5 5 80-100 7 88,29 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ni- Xm n u fii pi ni' ni')^2/ni' 20 4 -1,2513 0,1056 0,1056 2,6400 0,7006 40 4 -0,4984 0,3085 0,2029 5,0725 0,2268 60 8 0,2545 0,5987 0,2902 7,2550 0,0765 80 2 1,0073 0,8438 0,2451 6,1275 2,7803
P(z > |zk|) = β 8.Statistilise testi põhimõtteline konstrueerimine a. normaalse aproksimatsiooni; b. t-testi; c. 2 -testi; d. Fisheri F-testi baasil. (Iga test on eri piletis, st. ühes piletis on üks neist 4 testist. Sobilik test tuleb ära tunda piletis toodud tekstist) ̅ a. Jaotuste valik on lai; n ≥ 30; ligikaudne. Teststatistik: = √ (0,1). Nullhüpotees: μ = μ0. Kahepoolne hüpotees: H1: μ ≠ μ0; kriitiline väärtus zk = ( ). |z| ≤ |zk| => H0 Vasakpoolne hüpotees: H1: μ < μ0; zk = Φ (0,5 – β). z ≥ -zk => H0 -1 Parempoolne hüpotees: H1: μ > μ0; zk = Φ-1(0,5 + β). z ≤ zk => H0 b. On täpne, n võib olla väike; χ ~ N(μ,σ). H0: μ ≠ μ0. H1: μ ≠ < > μ0.
Nullhüpotees H0: bj = 0 sõltub sissetulekust ja tunnitasust. Sisukas hüpotees H1: bj 0 Leibkonnad jagati demograafiliste tunnuste alusel gruppidesse ja leiti kõikide tunnuste keskmised igas grupis. Gruppe on 36 (so valimi maht). b^ j t-test, teststatistik tj Sõltuv tunnus se(b j ) HRS: Average hours worked during the year Sõltumatud tunnused Otsuse vastuvõtmine: WAGE: Average hourly wage ($)
p 0,4 0,35 Elemendi sattumise sagedus 0,3 vahemikku 0,25 0,2 0,15 0,1 0,05 0 0-20 20-40 40-60 60-80 80-100 m 4.1. Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: k xm ni ui Φ(ui ) pi ni ’ 1 20 6 -1,02 0,1539 0,15 3,85 1,20 2 40 3 -0,38 0,3520 0,20 4,95 0,77 3 60 3 0,26 0,6026 0,25 6,27 1,70 4 80 9 0,91 0,8486 0,25 6,15 1,32
P(z > |zk|) = β . Statistilise testi põhimõtteline konstrueerimine a. normaalse aproksimatsiooni; b. t-testi; c. -testi; 2 d. Fisheri F-testi baasil. (Iga test on eri piletis, st. ühes piletis on üks neist 4 testist. Sobilik test tuleb ära tunda piletis toodud tekstist) a. Jaotuste valik on lai; n ≥ 30; ligikaudne. Teststatistik: ´x −μ0 z= √ n ⩪ N (0,1) . Nullhüpotees: μ = μ0. σ Kahepoolne hüpotees: H1: μ ≠ μ0; kriitiline väärtus zk = 1−β Φ−1 ( ) 2 . |z| ≤ |zk| => H0 Vasakpoolne hüpotees: H1: μ < μ0; zk = Φ-1(0,5 – β). z ≥ -zk => H0
o Kahe valimisprotsendi vahe standardviga on arvutatav valimi põhjal kui: · Paariviisiline võrdlus Wilcoxoni astakmärgitest o Kasutatakse samadel subjektidel tehtud mõõtmiste võrdlemiseks juhul, kui valimite jaotus erineb oluliselt normaaljaotusest. o Wilcoxoni märgitesti jaoks arvutatakse paariviisiliste mõõtmiste vahed ja järjestatakse need sõltumata märgist ehk järjestame vahede absoluutväärtused. o Teststatistik W+ on positiivsete vahede astakute summa. · T-test keskmiste võrdlemiseks, kui võrdlusalune tunnus on normaaljaotusega o T-test kahe grupi keskmiste võrdlemiseks o Ühe valimi t-test ühe grupi keskmise võrdlemiseks kindla väärtusega o Paariviisiline t-test samal grupil tehtud mõõtmiste võrdlemiseks · Wilcoxoni test pidevate tunnuste jaotuste võrdlemiseks, kui tunnus ei ole normaaljaotusega.
5 Hüpoteeside testimine parameetrite jaoks Mudeli kirjeldusvõime üldjuhul a^ - a Kasutatakse t- testi, teststatistik t= 0 Kui mudeli parameetrid on statistiliselt olulised, tuleb a^ parameetri hinnang se( a ) hinnata ka mudeli kirjeldusvõimet. a0 nullhüpoteesile vastav parameetri väärtus se( a ) parameetri hinnangu standardviga (leitakse mudeli hindamisel) Kahepoolne Ühepoolne
65. Struktuursete muutuste testimine fiktiivse tunnuse abil: testi idee, nullhüpotees ja sisukas hüpotees. 66. QLR test struktuursete muutuste testimisel: testi idee, nullhüpotees ja sisukas hüpotees. QLR (Quandt likelihood ratio) testi korral leitakse Chow testi Fstatistiku väärtus järjest erinevate murdepunktide (break-points) jaoks. · Valitakse see murdepunkt, mille korral F- statistiku väärtus on kõige suurem. Teststatistik on maksimaalne F-statistiku väärtus. Test annab õiged tulemused siis, kui murdepunkt on piisavalt kaugel vaadeldava perioodi algusest või lõpust. · Tavaliselt võetakse mõlemalt poolt 15%, st F-statistik leitakse 70% potentsiaalsete murdepunktide jaoks. · Kui võrreldakse korraga mitmeid F-statistiku väärtusi, ei saa kriitilise väärtuse leidmiseks kasutada F-jaotust. 67. Rekursiivne hindamine, CUSUM ja CUSUMSQ testid, nullhüpotees ja sisukas hüpotees. 68
k 1 ∙ ∑ ( x i− x´ ) ∙ ni 2 2 σ^ =s = n−1 i=1 σ^ ( ( 8,7−45,8 )2 ∙5 ) + ( ( 31,6−45,8 )2 ∙6 ) +( ( 45,6−45,8 )2 ∙ 6 ) + ( ( 62−45,8 )2 ∙ 5 )+ ( ( 90,9−45,8 )2 ∙ 3 ) ¿ = 25−1 1047,6 Teststatistik: 2 k ( ni−n'i ) χ =∑ 2 i=1 n'i
a. faktortunnus nimiskaalas ja 3 või rohkem väärtust b. funktsioontunnus intervallskaalas c. faktortunnus järjestusskaalas ja 3 või rohkem väärtust d. funktsioontunnus intervallskaalas. 2. Milline on nullhüpotees dispersioonanalüüsi korral? Funktsioontunnuse keskväärtused on kõikides rühmades võrdsed. 3. Dispersioonanalüüs viidi läbi kahe erineva faktortunnuse A ja B korral ning leiti vastav teststatistik F. Faktori A korral F = 5,9 Faktori B korral F = 2,3 Kummal juhul on faktori poolt põhjustatud seletatud hajumine suurem, võrreldes seletamata hajumisega? A 4. Milline on teststatistiku F väärtus toodud ANOVA tabeli korral (kollases lahtris)? 6,48 5. Faktori A mõju uurimiseks viidi läbi dispersioonanalüüs. Kas faktori A mõju funktsioontunnusele on tõestatud Otsustamiseks kasuta olulise nivood 0,05. Ei, faktori mõju pole tõestatud. 6