EX – meeste keskmine palk EY – naiste keskmine palk H0 – Meeste ja naiste keskmine palk on võrdsed – EX = EY H1 – Meeste ja naiste keskmised palgad ei ole võrdsed EX != EY Standardhälbed on tabelis tähistatud Δ ^2. Valimite suurused on vastavalt 28 -> mehed ja 22 -> naised. β = 0.95 -> α = 0.05 Kuna vaatleme kahepoolset kriitilist piirkonda, siis F^-1 argumendiks on (1 – α)/2, mille väärtuseks on 1,96(Laplace'i tabeli järgi). Kuna teststatistik jääb kriitilisest piirkonnast välja, lükkame nullhüpoteesi tagasi. Naiste ja meeste keskmine palk ei ole võrdsed. Ülesanne 4 Kas võib arvata, et mehed kulutavad meelelahutusele rohkem raha kui naised? Koostada hüpoteeside paar, esitada teststatistik. Olulisuse nivool 0,1 juures leida kriitilised väärtused, kriitiline piirkond. Arvutada teststatistiku väärtus ja võtta vastu otsus. EX – meeste keskmine kulu meelelahutusele EY – naiste keskmine kulu meelelahutusele
Kodutöö aines „Võrdlev analüüs“ Virve Kass Sallivus on Eesti meedias leidnud palju kajastust, eriti erinevate Sotsiaalministeeriumi poolt tehtud kampaaniate, näiteks „Erinevus rikastab“ raames. Kuigi poliitilisel tasandil deklareeritakse kõigi inimeste võrdsust, siis reaalsuses on sallimatus inimeste seas siiani suur probleem. Kodutöös uurin, millest sõltub inimeste suhtumine homoseksuaalidesse ja immigratsiooni. Uurin kolme tausttunnuse mõju: soo, vanuse ja haridustaseme. Kasutan Euroopa Sotsiaaluuringu 2010. aasta andmeid Eesti kohta. Püstitan neli hüpoteesi: 1. Naised on sallivamad kui mehed. Hüpoteesi teoreetiliseks aluseks on teadmine, et naised on olnud pikka aega allasurutud ühiskonnas ja pidanud võitlema oma õiguste eest. Seega samastuvad nad suurema tõenäosusega praeguste vähemustega ja on nende suhtes sallivamad. 2. Vanusega sallivus väheneb. Vanema...
90,00 1,645 0,4505 39,31 13,10 3,00 -36,31 1318,19 33,54 X2 -27,72787048 statistik Vabadusastmete arv k = m 1 r = 5 1 1 = 2 X2kr (0,1;2) = 4,605 Kuna kriitiline teststatistik on suurem kui teststatistik, siis peab hüpotees paika. 4.2 põhikogumi jaotuseks on eksponentjaotus (mille parameeter tuleb hinnata valimi järgi) k xm ni F0(m) pi ni' ((ni-n'i)2)/n'i 1 20,00 6,00 0,29 0,29 7,25 0,215517241 2 40,00 7,00 0,50 0,21 5,15 0,664563107 3 60,00 4,00 0,64 0,15 3,65 0,033561644
Normaaljaotuse puhul peaksid olema järsakuse kordaja (K) ja assümeetriakordaja (S) nullid. Antud valimi puhul on järsakuse kordaja -0,854 ning assümeetriakordaja -0,213. Nende tulemuste põhjal võib öelda, et tegemist ei ole normaaljaotusega. Kontrollime assümeetria- ja järsakuse kordajate abil lisaks JarqueBera testiga normaaljaotust. 5 2 Selleks tuleb leida teststatistik JB= 6( n 2 ( K-3) S+ 4 ) , kus n on valimi liikmete arv, S assümeetriakordaja ja K järsakuse kordaja. Pannes Descriptive Statistics abil arvutatud arvud valemis oma kohtadele saame, et JB= 30,952. Kontrollimaks, kas tegu on normaaljaotusega võrdleme teststatistikut statistiliste jaotusfunktsioonide kalkulaatorist 2
docstxt/129544194986833.txt
Fikseerime 1.liiki vea tegemise tõenäosuse ülemise piiri , mis on tavaliselt väike arv, kõige sagedamini 0,05 ja mida nim olulisuse nivooks. 8. Ühepoolne hüpotees (2 erinevat võimalust) üldkogumi keskmise kohta: teststatistik, kriteerium nullhüpoteesi tagasilükkamiseks olulisuse nivoo puhul ja eriti, kui =0,05. Nimetatud hüpoteeside praktiline kontrollimine a) H0: µµ0 H1: µ<µ0 x - µ0 Teststatistik: z= s n Kriteerium H0 tagasilükkamiseks olulisuse nivoo juures: lükata H0 tagasi ja lugeda H1 kehtivaks, kui z < z, kus z=-1() b) H0: µµ0 H1: µ>µ0 x - µ0 Teststatistik z = s n Kriteerium H0 tagasilükkamiseks olulisuse nivoo juures: lükata H0 tagasi ja lugeda
teststatistiku leidmine, nullhüpoteesi tagasilükkamise kriteerium iga hüpoteeside paari puhul. Hüpoteeside praktiline kontrollimine antud andmete korral. 4.Hüpoteeside kontroll.Ühe- ja kahepoolsed hüpoteesid osakaalu (tõenäosuse) kohta, suur valim: hüpoteeside püstitamine, teststatistiku leidmine, nullhüpoteesi tagasilükkamise kriteerium. Hüpoteeside praktiline kontrollimine antud andmete korral. Tõenäosusteooria Page 2 Teststatistik: 5.Hüpoteeside kontroll.Kahe üldkogumi keskmiste ja osakaalude võrdlemine, suured valimid. hüpoteeside püstitamine, teststatistiku leidmine, nullhüpoteesi tagasilükkamise kriteerium. Hüpoteeside praktiline kontrollimine antud andmete korral. 6. Hüpoteeside kontroll.Kahe üldkogumi keskmiste võrdlemine, väikesed valimid. Hüpoteeside praktiline kontrollimine antud andmete korral. 7.Lineaarne regressioon
1) Üldkogumi keskmise µ hinnang on valimkeskmine: x tulu = 3 385,23 x kulu = 2 894,88 x palk = 5 937,23 , keskmiste saamiseks kasutatud valemit AVERAGE. 95% usaldusvahemik üldkogumi keskmisele: kus: n valimi maht valimstandardhälve Usaldusnivoo 0,95 puhul Tulu Kulu Palk (1842,85, 4927,61) (1700,49, 4089,27) (2877,88, 8996,58) Näiteks tulu puhul kasutatud valemit (AVERAGE(E2:E36) 1,96*(STDEV(E2:E36)/SQRT(COUNT(E2:E36)) , AVERAGE(E2:E36) + 1,96*(STDEV(E2:E36)/SQRT(COUNT(E2:E36)) NB! Kulu ning tulu puhul kasutatud samasid valemeid (vastavate andmetega). 2) Naiste arv antud valimis 10 (valem COUNTIF(C2:C36;2)), seega 10 2 ...
Nullhüpotees kontrollitav väide. Alternatiivne hüpotees- H0-i välistav alternat. väide. Esim. järku viga H0 on õige, peetakse valeks. Vea tõenäosus- alfa (olulisuse nivoo) 2. Järku viga H0 on vale, peetakse õigeks, vea tõenäosus on beeta. Teststatistik x kasut hüpoteesi kontrollimiseks. Lihthüpotees kui fikseerib üldkogumi jaotuse üheselt. Testi võimsus= 1-beeta Hüpoteeside kontroll: 1) Pearsoni x2-test: levinud jaotushüpoteeside kontrollimisel. Teststatistik iseloomustab erinevust hüpoteetilise ja empiirilise jaotuse vahel histogrammi vahemike vastavate hüpoteetilise ja empiirilise sageduse kaudu. 2) Kolmogrovi-Smirnovi test: kasutab erinevust hüpoteetilise ja empiirilise jaotusfunktsiooni vahel. Võrdlus: K-S tundlikum, ent keerukam rakendada. Pearson: väiksem tundlikkus vigade suhtes, väiksem arvutustöömaht. Regressiooni- ja disper.analüüs tegelevad võimaliku seose selgitamisega sisendi x ja väljundi y vahel.
1. Tõenäosus ja tema leidmise näiteid arvutusvalemite abil Sõltumatute katsete kordamisel saadavat suhtelise sageduse piirväärtust kutsutakse sündmuse A toimumise tõenäosuseks P (A) := lim mn n Sündmus, mille toimumise tõenäosus on 0 võib aset leida lim n1 =0 n n-1 Sündmus, mille toimumise tõenäosus on 1 ei pruugi alati toimuda lim =1 n n Tõenäosus, et toimuvad nii sündmused A kui ka B, P(A B), on leitav valemiga P(A B) = P(A|B) P(B) Kui A ja B on teineteisest sõltumatud: P(A|B)=P(A) ja P(A B) = P(A) P(B) Tõenäosus, et toimub kas sündmus A või sündmus B, P(A U B), on leitav valemig...
● Otsustamiseks kasutatakse juhuvalimit. ● Juhuvalimi keskväärtus on juhuslik suurus, st erineb arvust μ. ● Kuidas otsustada, kas – kogumi keskväärtus μ = μ0 kehtib nullhüpotees; – kogumi keskväärtus μ ≠ μ0 kehtib sisukas hüpotees? ● Ehk: kui palju võib juhuvalimi keskväärtus erineda nullhüpoteesiga püstitatud väärtusest, et võime öelda: nullhüpotees ei kehti? ● Vaja kriteeriumi! Statistiline kriteerium ja teststatistik ● Otsustamiseks vajaliku statistilise kriteeriumi leidmiseks kasutatakse teststatistikut. ● Valimi andmete põhjal arvutatakse teststatistiku empiiriline väärtus – sõltuvalt sellest, mida kontrollitakse, on konkreetsed arvutusvalemid erinevad – z-test, t-test, F-test, χ 2 -test, …. ● Empiirilist väärtust võrreldakse vastava kriitilise väärtusega ja võetakse vastu otsus. Kriitilised väärtused
t-testi parameetri empiiriline väärtus mittekehtiv nullhüpotees, I liiki viga, ii liiki viga, teststatistiku empiiriline väärtus olulisuse nivoo olulisuse nivoo vähendamine sisukas hüpotees, olulisuse nivoo, liiki vea, tõke analüüsimeetod hüpoteesi statistilisel kontrollimisel saadi olulisuse tõenäosuseks uuritava tunnuse jaotuse võrdlemisel normaaljaotusega Test 9 ühefaktoriline dispersioonanalüüs anova nullhüpoteesi dispersioonanalüüs, teststatistik, faktori poolt põhjustatud seletatud hajumine suurem, seletamata hajumine teststatistiku f väärtus toodud anova tabeli korral funktsioontunnus faktor korrelatsioonimaatriks negatiivne kovariatsioon, autokorrelatsioon, spearmani korrelatsioon summaarne dispersioon arvutusvalemis, kovariatsioon õige hajumisdiagramm hajumisdiagramm, tunnuste vaheline seos kõige tugevam korrelatsioonikordaja ja kovariatsioon hajumisdiagramm, esitatud seos
on lineaarne või Nende eelduste kehtimist tuleb kontrollida! mittelineaarne? Selleks on mitmesugused testid. Nullhüpotees ja sisukas hüpotees Statistiline kriteerium ja teststatistik · Nullhüpotees: miski võrdub millegagi (erinevus on null) kogumi keskväärtus = 0 kogumi A keskväärtus = kogumi B keskväärtus · Otsustamiseks vajaliku statistilise kriteeriumi mudeli parameeter = 0 leidmiseks kasutatakse teststatistikut. · Sisukas (alternatiivne) hüpotees: võrdus ei kehti
tunnuste suhtes. 48) White’i testi idee, nullhüpotees ja sisukas hüpotees (loeng 3) White’i test homoskedastiivsus Sõltuv tunnus= mudeli jääkliikmete ruudu ui2 Kui jääkliikmete dispersioon ei ole konstantne, siis see sõltub regressoritest x. Hinnatakse regressioonmudelit, kus sõltuvaks tunnuseks jääkliikmete dispersioon H0 uues mudelis on vaid konstant H1 heteroskedastiivsus ---> kui teststatistik TR2 väärtus > kriitiline (p < a) on tegemist heteroskedatiivsusega 49) Mida teha, kui heteroskedastiivsus esineb? Logaritmida tunnuseid Kontrollida mudeli spetsifikatsioon: kas õige kuju, kas oluline tunnus välja jäänud mudeli teisendamine ja uuesti hindamine. 50) Kohandatud standardvigade kasutamine Kui ei õnnestu eemaldada heteroskedastiivsust. EI KAOTA heteroskedastiivsust, vaid võtavad seda arvesse.
16 14 olulisuse nivoo 17 13 teststatistiku kriitiline väärtus 18 7 19 14 4. Parameetri empiirilise väärtuse võrdlemine kriitilisega 20 16 21 12 parameeter langeb kriitlisse piirkonda 22 9 23 28 24 16 Vastu võtta sisukas hüpotees, kuna teststatistik langeb kriitilisse piirkon 25 17 26 22 27 2 28 19 29 16 30 12 31 7 32 8 33 7 34 16 35 14 36 3 37 17 38 16 39 3 40 25 41 16 42 2 43 13 44 13 45 8 46 6 47 20 48 3 49 12 50 17 µ 10.7 µ > 10.7 rilise väärtuse leidmine
5 m 63 Vähi 846.09 m 91 Ülesanded 1. Tallinnas fikseeriti 100 päeva jooksul kiirabi väljakutsete sagedused. Saadi järgmised tulemused: Väljakutsete arv Sagedus 0 10 1 26 2 31 3 18 4 8 5 7 Mis jaotusega on teie meelest väljakutsete sagedus? Leidke selle jaotuse parameetr(te)le suurima tõepära (STP) hinnang. Konstrueerige teststatistik kontrollimiseks, kas empiiriline jaotus vastab teie poolt pakutud teoreetilisele tõenäosusele. Olulisusnivooks võtke 0.05. Lahendus Väljakutsete ~ (~ ni−ni)2 sagedus ni p´i ni arv i ~n
hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea tõenäosust tähistatakse ); teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks (võetakse vastu) (sellise vea tõenäosust tähistatakse ). Hüpoteeside kontrolli tavapärased sammud on järgmised: 1) Formuleeritakse kontrollitav hüpoteesipaar {H0, H1} ja valitakse teststatistik x. 2) Valitakse olulisuse nivoo . 3) Leitakse teststatistiku x kriitiline piirkond X1 . 4) Valimi järgi arvutatakse teststatistiku x väärtus. 5) Järelduse tegemine. Kui x väärtus satub kriitilisse piirkonda X1 , siis nullhüpotees H0 lükatakse tagasi, vastasel juhul H0 võetakse vastu. Pearsoni 2 test: 2- test on üks levinumaid teste jaotushüpoteeside kontrollimisel. Testis kasutatav
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 12 6 11 62 20 62 7 98 10 1 52 27 80 25 94 46 38 74 95 33 71 15 96 4 87 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=45, 04 Dispersioon: Excel: VAR Sx²=1164,123 Standardhälve: Sx=34,1193 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=38 Haare: R=97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: ...
2 χα vabadusastmete arvule χ kriitilised väärtused. Esmalt 2 =35,479, mille abil χ2 α hindame kas saadud S0 on suurem kui 1 ning 1− 2 = 10,283, mille järgi hindame kas saadud S0 on 1st väiksem. Praegusel juhul jääb teststatistik kriitiliste piiride sisse ning kaaluühiku standardhälve on statistilises mõttes võrdne a’priori valitud standardhälbega (δ=1). Kaaluühiku standardhälve on 1’le lähedal, seega ei ole alust arvata, et mõõtmistulemustes esineks jämedaid vigu. Leitud punkti E koordinaatide usaldusväärsuse hindamiseks leiame nende S i=S0 √ q x x , kus qx x standardhälbed Sx, Sy ja Sz
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 75 10 79 32 32 0 68 94 96 2 99 53 31 15 48 47 29 70 7 75 28 30 42 47 46 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=46,20 Dispersioon: Excel: VAR Sx²=867,9167 Standardhälve: Sx=29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 Haare: R=99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: ...
Hüpoteesi kontrollimiseks kasutatakse mingit sobivat teststatistikut x. Vastavalt valimi järgi arvutatud x väärtusele leitakse, kas see väärtus langeb kriitilisse piirkonda või ei ning vastavalt nullhüpotees ka lükatakse tagasi või võetakse vastu. Esimest liiki vea tõenäosust alfa nim olulisuse nivooks, tõenäosust 1-beeta nim testi võimsuseks. Hüpoteeside kontrolli tavapärased sammud on järgmised: *formuleeritakse kontrollitav hüpoteesipar ja valitakse teststatistik x. *valitakse olulisuse nivoo alfa *leitakse teststatistiku x kriitiline piirkond *valimi järgi arvutatakse teststatistiku x väärtus *järelduste tegemine Pearsoni X2-test. Testis kasutatav teststatistik iseloomustab erinevust hüpoteetilise ja empiirilise jaotuse vahel histogrammi vahemikele vastavate hüpoteetilise ja empiirilise sageduse kaudu. Hüpoteesi kontroll koosneb tavaliselt järgmistest sammudest:
Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis ( ) (( ) ) (( ) ) (( ) ) (( ) ) (( ) ) (arvutatud Excelis ümardusi kasutamata) Teststatistik: ( ) [ ( ) ( )] [ ( ) ( )]
40 60 5 0,2 48,6 4. 60 80 4 0,16 73,25 5. 80 100 4 0,16 85 4.1. Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ui), k xm ni ui pi ni' tabelist 1 20 7 -0,852 0,1977 0,1977 4,943 0,856511 2 40 5 -0,165 0,4325 0,2348 5,870 0,128944 3 60 5 0,523 0,6985 0,2660 6,650 0,409398
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 0 2 7 1 0 1 5 2 8 2 9 3 0 3 1 3 2 3 2 4 2 4 6 4 7 4 7 4 8 5 3 6 8 7 0 7 5 7 5 7 9 9 4 9 6 9 9 Valimi A mahuga N=25 variatsioonirida: 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 46,20 Dispersioon: Excel: VAR Sx² = 867,92 Standardhälve: Sx = 29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 46 Haare: R= 99 - 0 = 99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 Dispersiooni usaldusvahemik: ...
Hüpoteesi kontrollimiseks kasutatakse mingit sobivat teststatistikut x. Vastavalt valimi järgi arvutatud x väärtusele leitakse, kas see väärtus langeb kriitilisse piirkonda või ei ning vastavalt nullhüpotees ka lükatakse tagasi või võetakse vastu. Esimest liiki vea tõenäosust nim olulisuse nivooks, tõenäosust 1- nim testi võimsuseks. Hüpoteeside kontrolli tavapärased sammud on järgmised: formuleeritakse kontrollitav hüpoteesipar ja valitakse teststatistik x. valitakse olulisuse nivoo alfa leitakse teststatistiku x kriitiline piirkond X1 valimi järgi arvutatakse teststatistiku x väärtus järelduste tegemine Pearsoni X2-test. Testis kasutatav teststatistik iseloomustab erinevust hüpoteetilise ja empiirilise jaotuse vahel histogrammi vahemikele vastavate hüpoteetilise ja empiirilise sageduse kaudu. Hüpoteesi kontroll koosneb tavaliselt järgmistest sammudest:
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 22 96 91 75 74 75 25 79 12 38 95 10 71 0 79 24 86 91 96 5 40 85 69 82 39 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=58,36 Dispersioon: Excel: VAR Sx²=1072,74 Standardhälve: Excel: STDEV Sx=32,75 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=74 Haare: =96-0=96 R=96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik...
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 54 32 30 54 89 54 9 94 51 69 19 15 33 88 37 87 94 49 18 85 43 43 41 62 81 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=53,24 Dispersioon: Excel: VAR Sx²=705,69 Standardhälve: Sx=26,56 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=51 Haare: R=94-9=85 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli...
P(z > |zk|) = β 8.Statistilise testi põhimõtteline konstrueerimine a. normaalse aproksimatsiooni; b. t-testi; c. 2 -testi; d. Fisheri F-testi baasil. (Iga test on eri piletis, st. ühes piletis on üks neist 4 testist. Sobilik test tuleb ära tunda piletis toodud tekstist) ̅ a. Jaotuste valik on lai; n ≥ 30; ligikaudne. Teststatistik: = √ (0,1). Nullhüpotees: μ = μ0. Kahepoolne hüpotees: H1: μ ≠ μ0; kriitiline väärtus zk = ( ). |z| ≤ |zk| => H0 Vasakpoolne hüpotees: H1: μ < μ0; zk = Φ (0,5 – β). z ≥ -zk => H0 -1 Parempoolne hüpotees: H1: μ > μ0; zk = Φ-1(0,5 + β). z ≤ zk => H0 b. On täpne, n võib olla väike; χ ~ N(μ,σ). H0: μ ≠ μ0. H1: μ ≠ < > μ0.
Nullhüpotees H0: bj = 0 sõltub sissetulekust ja tunnitasust. Sisukas hüpotees H1: bj 0 Leibkonnad jagati demograafiliste tunnuste alusel gruppidesse ja leiti kõikide tunnuste keskmised igas grupis. Gruppe on 36 (so valimi maht). b^ j t-test, teststatistik tj Sõltuv tunnus se(b j ) HRS: Average hours worked during the year Sõltumatud tunnused Otsuse vastuvõtmine: WAGE: Average hourly wage ($)
p 0,4 0,35 Elemendi sattumise sagedus 0,3 vahemikku 0,25 0,2 0,15 0,1 0,05 0 0-20 20-40 40-60 60-80 80-100 m 4.1. Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: k xm ni ui Φ(ui ) pi ni ’ 1 20 6 -1,02 0,1539 0,15 3,85 1,20 2 40 3 -0,38 0,3520 0,20 4,95 0,77 3 60 3 0,26 0,6026 0,25 6,27 1,70 4 80 9 0,91 0,8486 0,25 6,15 1,32
P(z > |zk|) = β . Statistilise testi põhimõtteline konstrueerimine a. normaalse aproksimatsiooni; b. t-testi; c. -testi; 2 d. Fisheri F-testi baasil. (Iga test on eri piletis, st. ühes piletis on üks neist 4 testist. Sobilik test tuleb ära tunda piletis toodud tekstist) a. Jaotuste valik on lai; n ≥ 30; ligikaudne. Teststatistik: ´x −μ0 z= √ n ⩪ N (0,1) . Nullhüpotees: μ = μ0. σ Kahepoolne hüpotees: H1: μ ≠ μ0; kriitiline väärtus zk = 1−β Φ−1 ( ) 2 . |z| ≤ |zk| => H0 Vasakpoolne hüpotees: H1: μ < μ0; zk = Φ-1(0,5 – β). z ≥ -zk => H0
o Kahe valimisprotsendi vahe standardviga on arvutatav valimi põhjal kui: · Paariviisiline võrdlus Wilcoxoni astakmärgitest o Kasutatakse samadel subjektidel tehtud mõõtmiste võrdlemiseks juhul, kui valimite jaotus erineb oluliselt normaaljaotusest. o Wilcoxoni märgitesti jaoks arvutatakse paariviisiliste mõõtmiste vahed ja järjestatakse need sõltumata märgist ehk järjestame vahede absoluutväärtused. o Teststatistik W+ on positiivsete vahede astakute summa. · T-test keskmiste võrdlemiseks, kui võrdlusalune tunnus on normaaljaotusega o T-test kahe grupi keskmiste võrdlemiseks o Ühe valimi t-test ühe grupi keskmise võrdlemiseks kindla väärtusega o Paariviisiline t-test samal grupil tehtud mõõtmiste võrdlemiseks · Wilcoxoni test pidevate tunnuste jaotuste võrdlemiseks, kui tunnus ei ole normaaljaotusega.
5 Hüpoteeside testimine parameetrite jaoks Mudeli kirjeldusvõime üldjuhul a^ - a Kasutatakse t- testi, teststatistik t= 0 Kui mudeli parameetrid on statistiliselt olulised, tuleb a^ parameetri hinnang se( a ) hinnata ka mudeli kirjeldusvõimet. a0 nullhüpoteesile vastav parameetri väärtus se( a ) parameetri hinnangu standardviga (leitakse mudeli hindamisel) Kahepoolne Ühepoolne
65. Struktuursete muutuste testimine fiktiivse tunnuse abil: testi idee, nullhüpotees ja sisukas hüpotees. 66. QLR test struktuursete muutuste testimisel: testi idee, nullhüpotees ja sisukas hüpotees. QLR (Quandt likelihood ratio) testi korral leitakse Chow testi Fstatistiku väärtus järjest erinevate murdepunktide (break-points) jaoks. · Valitakse see murdepunkt, mille korral F- statistiku väärtus on kõige suurem. Teststatistik on maksimaalne F-statistiku väärtus. Test annab õiged tulemused siis, kui murdepunkt on piisavalt kaugel vaadeldava perioodi algusest või lõpust. · Tavaliselt võetakse mõlemalt poolt 15%, st F-statistik leitakse 70% potentsiaalsete murdepunktide jaoks. · Kui võrreldakse korraga mitmeid F-statistiku väärtusi, ei saa kriitilise väärtuse leidmiseks kasutada F-jaotust. 67. Rekursiivne hindamine, CUSUM ja CUSUMSQ testid, nullhüpotees ja sisukas hüpotees. 68
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Valim mahuga N = 25 jrk ni xi ni * xi ni * 2088, 1 1 2 2 2089,25 49 1909, 2 1 4 4 1910,42 69 1656, 3 1 7 7 1657,17 49 1576, 4 1 8 8 1576,75 09 1497, 5 1 9 9 1498,34 69 1204, 6 1 13 13 1204,67 09 882,0 7 1 18 18 882,59 9 561,6 8 1 ...
a. faktortunnus nimiskaalas ja 3 või rohkem väärtust b. funktsioontunnus intervallskaalas c. faktortunnus järjestusskaalas ja 3 või rohkem väärtust d. funktsioontunnus intervallskaalas. 2. Milline on nullhüpotees dispersioonanalüüsi korral? Funktsioontunnuse keskväärtused on kõikides rühmades võrdsed. 3. Dispersioonanalüüs viidi läbi kahe erineva faktortunnuse A ja B korral ning leiti vastav teststatistik F. Faktori A korral F = 5,9 Faktori B korral F = 2,3 Kummal juhul on faktori poolt põhjustatud seletatud hajumine suurem, võrreldes seletamata hajumisega? A 4. Milline on teststatistiku F väärtus toodud ANOVA tabeli korral (kollases lahtris)? 6,48 5. Faktori A mõju uurimiseks viidi läbi dispersioonanalüüs. Kas faktori A mõju funktsioontunnusele on tõestatud Otsustamiseks kasuta olulise nivood 0,05. Ei, faktori mõju pole tõestatud. 6