Asümptootilist jaotust kasutatakse parameetrite hinnangute standardvigade leidmisel. 11. Hinnangu asümptootiline efektiivsus. Mõjusat hinnangut nimetatakse asümptootiliselt efektiivseks (asymptotically efficient), kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. 12. Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiiriline ja kriitiline väärtus Nullhüpotees: miski võrdub millegagi (erinevus on null) kogumi keskväärtus µ = µ0 kogumi A keskväärtus = kogumi B keskväärtus mudeli parameeter = 0 · Sisukas (alternatiivne) hüpotees: võrdus ei kehti. · Otsustamiseks kasutatakse juhuvalimit. · Juhuvalimi keskväärtus on juhuslik suurus, st erineb arvust µ Otsustamiseks vajaliku statistilise kriteeriumi leidmiseks kasutatakse teststatistikut.
· 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks). · Hüpoteeside kontrollimine: nullhüpotees, sisukas hüpotees, Listra, E. Ökonomeetria. Aegread. kriitiline väärtus, olulisuse tõenäosus. Sauga, A. Statistika õpik majanduseriala üliõpilastele. · Kovariatsioon cov(x,y) ja korrelatsioonikordaja r (x,y) TTÜ Kirjastus, Tallinn, 2017. (Statistika kordamiseks) · Regressioon. Kordamiseks võib kasutada õpikut Sauga, A.
P ( 572, 0 < 2 < 1504, 2 ) = 0,90 3. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10, kontrollin järgmisi hüpoteese: 3.1 H0: = 50 alternatiiviga H1: 50 x-µ 46, 2 - 50 t= N = 25 = 0, 64 s 29, 46 tkr = 1, 71 - leitud tabelist. t > t1- ( f ) Kriitiline piirkond avaldub: 2 0,64<1,71 ja nullhüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H1: 2 800 ( N - 1) s 2 24 867,9 2 = = = 26, 04 2 800 Kriitilised piirkonnad leian tabelist. 2 ( f ) = 13,848 2 2 1- 2 ( f ) = 36, 415 13,848<26,04<36,415 ja nullhüpotees võetakse vastu. 4. Leian valimile vastava empiirilise histogrammi
väärtused, väiksematele X väärtustele vastavad suuremad Y väärtused) 16) Korrelatsioonikordaja selle arvutusvalem ja omadused: Korrelatsioonikordaja absoluutväärtus näitab lineaarse seose tugevust ja märk näitab seose suunda: positiivne või negatiivne. Omadused – Absoluutväärtuse maksimaalne suurus 1 Valem – r_xy=xy/(x*y) 17) Hüpoteesi kontrollimine korrelatsioonikordaja olulisuse kohta: nullhüpotees ja sisukas hüpotees: 18) Regressioonanalüüs ja regressioonmudeli komponendid: Uurib suuruste vahelist sõltuvust ja võimalusi selle funktsionaalseks kirjeldamiseks etteantud valemi põhjal. Regressioonanalüüsi käigus leitakse deterministlik komponent --> leitakse vastava matemaatilise funktsiooni parameetrite hinnangud. Komponendid – y= deterministlik komponent + juhuslik komponent, y = ax + b +u; Tinglik keskväärtus on deterministlik komponent y=E[Y X] + u
Iseseisev töö nr. 2. Hüpoteeside testimine. Iseseisva töö eesmärgiks on tutvuda programmiga “Stats” selle Help faili abil ning kontrollida praktikumitunnis püstitatud hüpoteese. Ülesanne 1: Valguskaugusmõõturit kalibreeriti baasjoonel pikkusega 100,020 m. Kalibreerimisel mõõdeti baasjoont 10 korda. a) Püstitage hüpoteesid? Nullhüpotees: mõõtmisel saadud joonepikkus võrdub etaloni pikkusega. Alternatiivne hüpotees: mõõtmistel saadud joonepikkus ja etaloni pikkus erinevad. Hüpoteeside kontrollimiseks selle ülesande puhul kasutame t-teststatistikut. See kontrollib valimi keskmisel põhinevat hüpoteesi kasutades selleks algandmetena valimi keskmist, standardhälvet, mõõtmiste arvu, usaldusnivood ja üldkogumi keskmist (hetkel kalibraatori pikkus). Usaldusnivoo tuleb võtta 0.025, sest tegemist "kahe sabaga".
11. Hinnangu asümptootiline efektiivsus. Mõjusat hinnangut nimetatakse asümptootiliselt efektiivseks (asymptotically efficient), kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. Näiteks mõningad suurima tõepära meetodil leitud hinnangud. 12. Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiiriline ja kriitiline väärtus. ● Nullhüpotees: miski võrdub millegagi (erinevus on null) – kogumi keskväärtus μ = μ0 – kogumi A keskväärtus = kogumi B keskväärtus – mudeli parameeter β = 0 ● Sisukas (alternatiivne) hüpotees: võrdus ei kehti ● Otsustamiseks kasutatakse juhuvalimit. ● Juhuvalimi keskväärtus on juhuslik suurus, st erineb arvust μ. ● Kuidas otsustada, kas – kogumi keskväärtus μ = μ0 kehtib nullhüpotees;
Kui on midagi vaja arvutada, annab Märt mingi tabeli arvudega :D s x ± t ;2/ df =n-1 - usaldusintervalli leidmise valem n Populatsioonis: - keskväärtus, -standardhälve, 2-dispersioon Valimis; s- standardhälve Usaldusintervalli arvutamine: 4 6. Hüpoteeside statistiline testimine Nullhüpotees (H0) hüpotees mida oleme meie (või ühiskond või uuringu sihtauditoorium näiteks teadlaskond) nõus vaikimisi õigeks pidama. Võimalikke stiilinäiteid: 1) üldrelatiivsusteooria kehtib; 2) Märt Möls ei ole mõrvar; 3) Inimese silmade värvi määrav pärilik informatsioon on peidus inimese DNAs Alternatiivne hüpotees (H1 või HA) nullhüpoteesi eitus.
olukorda (nominaalskaalal, järjeskaalal, intevallskaalal).........................................................4 3Kahe tunnuse analüüs. Sageduste risttabel. Hii-ruut-test........................................................4 3.1Risttabelis üks lahter esile toodud (värviga). Kuidas interpreteerida (rea / veeru / üldprotsent) 3 küsimust.......................................................................................................... 4 3.2Formuleerida hii-ruut-testi nullhüpotees. Teha otsustus näite põhjal. (Lisatingimusi pole vaja arvestada)....................................................................................................................... 4 4Keskmiste võrdlus.................................................................................................................... 5 4.1F-test. Hüpoteeside formuleerimine varieeruvuse kohta. Otsustuse tegemine..................5 4.2t-test. Hüpoteeside formuleerimine keskmiste kohta
Testi läbiviija peab valima, kum 12 38 42 13 41 37 keskväärtus dispersioon vaatluste arv pearsoni korrelatsioonikoefitsient nullhüpotees vabadusastmete arv parameetri empiiriline väärtus olulisuse tõenäosus, kui ühepoolne hüpotees parameetri kriitiline väärtus, kui ühepoolne hüpotees olulisuse tõenäosus, kui kahepoolne hüpotees parameetri kriitiline väärtus, kui kahepoolne hüpotees
Statistiliste hüpoteeside kontrollimise metoodika. Statistiliseks hüpoteesiks nimetatakse teatud teineteist välistavate väidete paari üldkogumi(te) või tema. Statistilisteks hüpoteesideks võivad olla näiteks oletused: · jaotusseaduse tüübi kohta; · kahe jaotuse parameetrite võrdsusest või olulisest erinevusest; · juhuslike suuruste vahelise lineaarse seose olemasolust või puudumisest. Alternatiivsete hüpoteeside paar · H0 nullhüpotees, mis tavaliselt väljendab uurijat mittehuvitavat juhtu (üldkogumi vastamine teatud standardile). Nullhüpoteesi ei ole võimalik tõestada. Selle vastuvõtmine tähendab, et kui uurija tahab mingit erinevust, mõju või seose olemasolu tõestada, siis tuleb tal mõõtmisi jätkata. · H1 sisukas e. alternatiivne e. konkureeriv hüpotees, mida uurija soovib tõestada (tavaliselt mingi erinevuse, mõju või seose olemasolu). Üks kahest hüpoteesist peab kindlasti kehtima.
Vea komponendid – valikuviga - põhjustatud valimi kasutamisest, loendiviga - põhjustatud ebakorrektsest loendist, kaoviga - mingil põhjusel ei saada andmeid kõigi valimisse sattunud objektide kohta., objektide asendamise viga, mõõtmisviga – mõõtmisvahendi viga, mõõtmisolukorra viga, intervjueerija viga, töötlusviga - Tekivad andmete kodeerimisel, sisestamisel, analüüsimisel 7. STATISTILISTE HÜPOTEESIDE KONTROLL Kriitiline piirkond - nullhüpotees on ümber lükatud. Kui K langeb kriitilisse piirkonda kehtib sisukas hüpotees. Kui K ei lange kriitilisse piirkonda kehtib nullhüpotees Nullhüpotees: kogumi keskväärtus μ võrdub mingi arvuga μ0. H0: μ = μ0 Sisukas hüpotees: kogumi keskväärtus μ ei võrdu arvuga μ0. H1: μ ≠ μ0 Keskväärtuse testimine suurte valimite korral – testimiseks Z-test. Valem: Mida suurem on valimi standardhälve s , seda väiksem on z, st seda "kergemini" tuleb vastuseks nullhüpotees
· Alternatiivhüpoteesi nimetatakse ka sisukaks hüpoteesiks. · Alternatiivhüpoteesis sõnastatakse tavaliselt see, mida tahetakse tõestada. · Nullhüpoteesiga väidetakse teatavas mõttes vastupidist alternatiivhüpoteesile. · Hüpoteesid sõnastatakse nii, et üks neist peab alati kehtima. Statistilisi hüpoteese analüüsitakse hüpoteeside kontrollimise teel, kasutades valimit. Kontrollimisel on kaks võimalikku tulemust: · Nullhüpotees kummutatakse ja võetakse vastu alternatiivhüpotees, millega alternatiivhüpotees ongi tõestatud, sest leidus vähemalt üks valim, mille korral nullhüpotees ei pea paika. · Nullhüpoteesi ei saa kummutada ja alternatiivhüpoteesi vastu võtta, mistõttu jäädakse nullhüpoteesi väite juurde, kusjuures ei saa öelda, et sellega oleks nullhüpotees tõestatud. Seega: alternatiiv- ja nullhüpotees pole samaväärsed. Tõestada saab ainult sisukat ehk
studenti jaotus mediaani usalduspiiride leidmisel kasutatakse binoomjaotust, loend on ülekaetud ankeetküsitluse läbiviimisel, mõõtmisvahendi viga Test nr 8 sisukas hüpotees, järeldus peale parameetri empiirilise väärtuse võrdlust kriitilisega z-testi parameetri kriitiline väärtus t-testi parameetri empiiriline väärtus sisukas hüpotees, sõltuv valim, sõltumatu valim empriiline väärtus, kriitiline, nullhüpotees, sisukas hüpotees t-testi parameetri empiiriline väärtus mittekehtiv nullhüpotees, I liiki viga, ii liiki viga, teststatistiku empiiriline väärtus olulisuse nivoo olulisuse nivoo vähendamine sisukas hüpotees, olulisuse nivoo, liiki vea, tõke analüüsimeetod hüpoteesi statistilisel kontrollimisel saadi olulisuse tõenäosuseks uuritava tunnuse jaotuse võrdlemisel normaaljaotusega Test 9 ühefaktoriline dispersioonanalüüs anova
4) Pascali jaotus 17. Mis on usaldusnivoo? Usaldusnivoo näitab tulemuse sattumise tõenäosust mingisse vahemikku. 18. Mis on usalduspiirid? usalduspiirid, usaldusvahemiku alumine ja ülemine otspunkt. Usalduspiirkond on valimi põhjal arvutatud piirkond, millesse hinnatava parameetri tegelik väärtus kuulub teatava tõenäosusega. Selle tõenäosuse väikseimat lubatavat väärtust, milleks tavaliselt valitakse 0,99 või 0,95, nimetatakse usaldusnivooks. 19. Mis on nullhüpotees? Nullhüpotees, mis tavaliselt väljendab uurijat mittehuvitavat juhtu. Nullhüpoteesi ei ole võimalik tõestada. Selle vastuvõtmine tähendab, et kui uurija tahab mingit erinevust, mõju või seose olemasolu tõestada, tuleb tal mõõtmisi jätkata. 20. Mis on sisukas hüpotees? Sisukad hüpotees mida uurija soovib tõestada (tavaliselt mingi erinevuse, mõju või seose olemasolu). 21. Mida tähendab esimest liiki viga?
või alternatiivse hüpoteesi kasuks. Seejuures võib esindeda kaht liiki vigu: *esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks H1 *teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks Hüpoteesi kontrollimiseks kasutatakse mingit sobivat teststatistikut x. Vastavalt valimi järgi arvutatud x väärtusele leitakse, kas see väärtus langeb kriitilisse piirkonda või ei ning vastavalt nullhüpotees ka lükatakse tagasi või võetakse vastu. Esimest liiki vea tõenäosust alfa nim olulisuse nivooks, tõenäosust 1-beeta nim testi võimsuseks. Hüpoteeside kontrolli tavapärased sammud on järgmised: *formuleeritakse kontrollitav hüpoteesipar ja valitakse teststatistik x. *valitakse olulisuse nivoo alfa *leitakse teststatistiku x kriitiline piirkond *valimi järgi arvutatakse teststatistiku x väärtus *järelduste tegemine Pearsoni X2-test
hüpoteesi kasuks. Seejuures võib esindeda kaht liiki vigu: esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks H1 teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks Hüpoteesi kontrollimiseks kasutatakse mingit sobivat teststatistikut x. Vastavalt valimi järgi arvutatud x väärtusele leitakse, kas see väärtus langeb kriitilisse piirkonda või ei ning vastavalt nullhüpotees ka lükatakse tagasi või võetakse vastu. Esimest liiki vea tõenäosust nim olulisuse nivooks, tõenäosust 1- nim testi võimsuseks. Hüpoteeside kontrolli tavapärased sammud on järgmised: formuleeritakse kontrollitav hüpoteesipar ja valitakse teststatistik x. valitakse olulisuse nivoo alfa leitakse teststatistiku x kriitiline piirkond X1 valimi järgi arvutatakse teststatistiku x väärtus järelduste tegemine Pearsoni X2-test
5 100 3 1,000 0,125 3,128 0,005 Xxxxx xxxxx xxxx Summa: 1,00 25 0,096 vabadusastmete arv f = k h 1 = 5 2 1 = 2. ( h = 2, kuna normaaljaotusel on kaks parameetrit ja ) Et nullhüpotees vastu võetaks peab . Seega võin nullhüpoteesi vastu võtta ning järeldada, et üldkogumi jaotuseks on normaaljaotus. 4.2 Põhikogumi jaotuseks on eksponentjaotus, mille parameeter on . Eksponentjaotuse parameeter: Vahemi Katsed k F0(m) ni pi ni' xm 1 20 0,351 5 0,351 8,784 1,630
15. Mis on standardhälve, standardviga, asümmeetriakordaja, ekstsess, dispersioon? 16. Pidevad ja diskreetsed jaotused. 17. Mis on usaldusnivoo? usaldusnivoo - see on tõenäosus, millega üldkogumi väärtus paikneb teatud vahemikus. Tavaliselt võetakse usaldusnivooks 0,95 (ehk 95%), kus siis olulisuse nivooks on 0,05 (ehk 5%). 18. Mis on usalduspiirid? Usalduspiir- jaotuse baasil valemist . Kuna t-jaotus on lamedam, on rohkem kui aasta tagasi funktsiooniga CONFIDENCE. 19. Mis on nullhüpotees? H0 nullhüpotees, mis tavaliselt väljendab uurijat mittehuvitavat juhtu (üldkogumi vastamine teatud standardile).Nullhüpoteesi ei ole võimalik tõestada. 20. Mis on sisukas hüpotees? H1 sisukas e. alternatiivne e. konkureeriv hüpotees, mida uurija soovib tõestada ( tavaliselt mingi erinevuse, mõju või seose olemasolu). 21. Mida tähendab esimest liiki viga? Esimest liiki vead on sageli ohtlikud vead, mille tegemist tuleks võimalikult vältida
dispers.mehed ] =115045342,20 Y2 [val.dispers.naised ] = 2840081,16
n[ meeste.arv] = 25 m[ naiste.arv ] =10
Siit saame =1,80
Kus:
Kasutame sümmeetrilist kriitilist hulka, ning kriitilise hul ga määrame
tingimusest (kr ) = 0,5 - kr =1,96 ning p = 0.07
2
Kuna
13. Elektronklupp ja tavalise klupi mõõtmistulemuste võrdlemine Tabel 6. Elektronklupi ja tavalise klupi mõõtetulemuste võrdlemine Kesk. tava 19,80909091 Kesk.elek. 19,72727273 P-väärtus 0,009990419 Jah või ei Ei 14. Katselapid feromonpüünisega Uuriti kas feromonpüünisest on kasu või mitte. P-väärtus on 1 ja selgus et feromoonpüünisest ei olnud erilist kasu. 15. Hüpoteesid H0 ehk nullhüpotees on väide, et valimid on ühesuguse keskväärtusega üldkogumitest. H1 ehk sisukas hüpotees on väide, et valimid on erinevate keskväärtustega üldkogumitest. 16. Esimest liiki viga Esimest liiki veaks nimetatakse, kui võetakse vastu sisukas hüpotees, aga tegelikult on õige nullhüpotees. Tavaliselt antakse ette 1. liiki vea tõenäosuseks 0,05. 17. Olulisuse nivoo Oluselisusse nivooks nimetatakse, esimest liiki vea tegemise suurim lubatav tõenäosus 18. Olulisuse tõenäosus
nullhüpoteesile Sellisel juhul t= = H0: a=0 se( a ) se( a ) Kahepoolne hüpotees Nullhüpotees H0: a =0 Ökonomeetriapakettides leitakse t ja p väärtused just Sisukas hüpotees H1: a 0 selle juhu jaoks. Kriitiline piirkond (vastu | t |> t 2 ( ) Teistel juhtudel tuleb teha
HA: S2 2 suurem dispersioon F- statistiku leiame F= väiksem dispersioon kaudu. Kuna tasandusaruannetes olevad dispersioonid on vaba tasanduse puhul 0,0841 ja seotud tasanduse puhul 0,09. F- statistiku väärtuseks saame 1,07. Statistilisest kalkulaatorist saame vastavalt vabadusastmete arvudele (v=380 ja v=377) Fkriitiline = 1,18. Nullhüpoteesi ümberlükkamise kriteeriumiks on F> Fkriitiline. Praegusel juhul jääb nullhüpotees kehtima ning kahe tasanduse kaaluühiku dispersioonid on statistiliselt võrdsed. Seotud tasanduse andmete põhjal koostame mõõdetud joonepikkuste hälvete ja mõõdetud nurkade hälvete histogrammid (Joonis 1, Joonis 2). Mõlemad histogrammid iseloomustavad nomraaljaotust. Enamus tulemusi koondub keskmise tulemuse lähedusse ning kaugel asetsevate tulemuste osakaal on võrdlemisi väike. Joonis 1. Joonepikkuste hälvete histogramm Joonis 2. Nurgamõõtmiste hälvete histogramm
f korrutis dispersiooni hinnanguga, aga jagatuna 2/2(f)-ga. 3. Eeldades, et kogum on normaaljaotusega ja et =0,10, kontrollisin hüpoteesi H 0: =50. Selleks arvutasin t-statistiku, jagades keskväärtuse hinnangu ja antud keskväärtuse vahe standardhälbe hinnanguga ja korrutades saadu ruutjuurega valimi mahust. Tabelist võtsin kriitilise kvantiili t1-/2(f), f=N-1, ja kuna t tkr, võetakse nullhüpotees 16 vastu. Kontrollimaks hüpoteesi H0: 2=800, leidsin 2-statistiku, korrutades f dispersiooni hinnanguga ja jagades saadu antud dispersiooniga. Tabelist võtsin kriitilised kvantiilid 2/2(f) ja 21-/2(f) ning kuna 2/2(f) 2 21-/2(f), siis võetakse nullhüpotees vastu. 4. Kontrollimaks Pearsoni 2-testi järgi olulisuse nivool = 0,10, et kogumi jaotuseks on
4 2,8 0,7 -0,28 -2,46 0,0784 6,0516 0,6888
5 2,2 0,4 -0,88 -2,76 0,7744 7,6176 2,4288
keskväärtuse
d 3,08 3,16 kokku: 18,636
Korrelatsioonitegur r = 0,86080 (excelis arvutatud)
d= r2
Determinatsioonitegur d= 0,7410
f = N-1=5-2=3
tkr=t0,975(3)=3,1824
Nullhüpoteesi vastu võtmiseks peab |t|< tkr , Seega nullhüpotees võetakse vastu.
Z0,95=1,645
Nullhüpoteesi vastu võtmiseks peab |z0|
6.1 empiirilise jaotusfunktsiooni graafik 6.2 parameetritega a = 0, b = 100 ühtlase jaotuse jaotusfunktsiooni graafik 7. Kontrollida Kolmogorovi-Smirnovi testi abil hüpoteesi, et põhikogumi jaotuseks on fikseeritud parameetritega a = 0, b = 100 ühtlane jaotus (võttes = 0,10, st teststatistiku DN , kriitiliseks väärtuseks on Dkr = 0,238) F0 ühtlase jaotuse jaotusfunktsioon x(i) punktis 1 moodustatud variatsioonirida Kuna DN < Dkr, siis võtame nullhüpotees vastu 8. Kontrollida moodustatud rühmade homogeensushüpoteesi: H0: 1=2=3=4=5, kasutades dispersioonanalüüsi metoodikat ja võttes olulisuse nivooks = 0,05 ir 1 2 3 4 5 1.-5. 77 2 39 37 14 33,8 661,36 476,99 6.-10. 18 45 33 31 39 33,2 81,76 503,55 11.-15
eksperimentaalsed andmed teoreetiliselt arvutatud oodatavatega sobivad? Hii ruut meetod, t-test 3. Mis eesmärgil geneetilistes uuringutes kasutatakse hii - ruut testi? Valem arvutamiseks? Testi väljund ja selle piirväärtus, mille alusel tehakse otsus kehtiva hüpoteesi kohta? Kasutatakse, et võrrelda geneetilise ristamise vaadeldavaid (tegelikke) tulemusi geneetilisest suhtest oodatavate tulemustega. H0 nullhüpotees: tunnused on sõltumatud H1 alternatiivhüpotees: tunnused on sõltuvad p < 0,05 H1 hüpotees on tõestatud p > 0,05 H0 hüpotees on tõestatud 4. Mis iseloomustab autosoom dominantset pärandumistüüpi? 5. Mis iseloomustab autosoom retsessiivset pärandumistüüpi? Geneetilise haiguse avaldumiseks peab inimesel olema mõlemas geenis muutus. Inimene päris oma vanematelt ühe muutusega geeni ja teise
21.-25. 62 96 84 24 47 62,6 826,8 Summa: 228,8 5932,4 Rühmade keskväärtused: Rühmade dispersioonid: Üldkeskmine: Üldine rühmasisene dispersioon: Rühmadevaheline dispersioon: F-statistik kui rühmadevahelise ja rühmadesisese dispersiooni suhe: Nullhüpoteesi vastu võtmiseks peab . Seega võetakse nullhüpotees vastu. Keskväärtused on hüpoteesi põhjal homogeensed. Keili Kajava Osa B 9. keskmine x 2,2 2,7 4,8 0,9 4,1 2,94 y 7,1 9,8 10,2 2,1 11,1 8,06 9.1 9.2 Usaldusvahemiku leidmine: Keili Kajava Hinnangu b0 usaldusvahemik: Hinnangu b1 usaldusvahemik: 9.3 Kuna , siis seda mudeli liiget võib lugeda mitteoluliseks
Korrelogramm. Statsionaarsuse määramine. Joonisel 1 on esitatud tarkvarapaketis EViews kasutatav korrelogramm , mille korral esitatakse autokorrelatsiooni-(AC) ja osaautokorrelatsioonikordajad (PAC) nii arvuliselt kui graafiliselt tärnidega. Joonis 1 USA agregeeritud tarbimise (1966-2007, kvartaalsed andmed) esimeste diferentside korrelogramm. Stohhastilise protsessi kirjeldamiseks kindlasti on vaja teha, kas mingi k Ta osutub, et juhul kui nullhüpotees kehtiks, siis mõlemad statistikud on asümptootiliselt Seega, kui statistik on suurem tabelis antud kriitilisest väärtusest, siis lükkame nulli tagasi. Väikeste valimite jaoks on Q- statistiku kasutamine praktikas eelistatavam, kuna testi võimsus on Box-Pierce testi omast suurem. Tarkvarapaketi EViews korrelogrammil on Ljung-Boxi testi statistik ning testi olulisuse tõenäosus. Kui olulisuse tõenäosus m-ndas reas on väiksem kui etteantud olulisuse nivoo (mis tavaliselt on kas 0.05
kehtivad (false negative) Hüpoteeside testimine ehk keskmiste võrdlemine: Vaja vastata küsimustele: (1) kas rühmad (või valimid ja nende jaotused) on nii sarnased, et võime öelda, et nad kuuluvad samasse üldkogumisse või (2) on nad nii erinevad, et esindavad kahte erinevat üldkogumit? (Nt. Kas naissoost üliõpilased saavad sõnavaratestis paremaid tulemusi kui meessoost üliõpilased?) Hüpoteesi kontrollimine: püstitada nullhüpotees (nt erinevust ei ole) ning alternatiivne e. sisuline hüpotees (erinevus on) defineerida testimise protseduur, sealhulgas olulisuse nivoo (psühholoogias 95%) otsustada, millist keskmiste erinevuste testi kasutada arvutada teststatistikud ja nendega seotud olulisuse tõenäosused arvutada efekti suuruse näitajad teha järeldus, kas andmed on kooskõlas nullhüpoteesiga või mitte Nullhüpotees ja alternatiivne hüpotees:
Hinnanguvahemikku nimetatakse ka usaldusvahemikuks ehk usalduspiirkonnaks. Selle otspunkte usalduspiirideks. NB! Kuna üldkogumi parameeter on JS, siis usalduspiire võib vaadelda kui parameetri hinnangu vastavaid kvantiile. 46. Usaldus- ja olulisuse nivoo. Otsustuse, hüpoteesi tõenäosus olulisuse nivoo; tähis . Hinnangu täpsust etteantud olulisuse nivool iseloomustab usalduspiirkonna laius. 47. Statistiline hüpotees, nullhüpotees, alternatiivne hüpotees, ühe-ja kahepoolne hüpotees. Üldkogumi kohta esitatud tõenäosuslik oletus on statistiline hüpotees. Nullhüpotees (tähistatakse H0 ) on väide, mis kinnitab üldkogumi vastavust teatavale standardile. See on juhus, millel ei ole uurijat huvitavat sisu. Näiteks väide selle kohta, et veekogus elavad punased ja sinised kalad ei erine üksteisest oma keskmise kaalu (või pikkuse jne) poolest.
21.-25. 62 96 84 24 47 62,6 826,8 Summa: 228,8 5932,4 Rühmade keskväärtused: Rühmade dispersioonid: Üldkeskmine: Üldine rühmasisene dispersioon: Rühmadevaheline dispersioon: 10 Keili Kajava F-statistik kui rühmadevahelise ja rühmadesisese dispersiooni suhe: Nullhüpoteesi vastu võtmiseks peab . Seega võetakse nullhüpotees vastu. Keskväärtused on hüpoteesi põhjal homogeensed. 11 Keili Kajava Osa B 9. keskmine x 2,2 2,7 4,8 0,9 4,1 2,94 y 7,1 9,8 10,2 2,1 11,1 8,06 9.1 9.2 Usaldusvahemiku leidmine: 12 Keili Kajava Hinnangu b0 usaldusvahemik: Hinnangu b1 usaldusvahemik: 9.3
· Vea komponendid: valikuviga, loendiviga, kaoviga, objektide asendamise viga, mõõtmisviga, töötlusviga. · Usaldatavus: 1 sigma = 68,27 %; 1,96 sigma (standartne) = 95%; 2 sigma = 95,45%; 3 sigma = 99,73 %. Usaldatavus 100% tähendab vahemikku( lõpmatus... + lõpmatus). HÜPOTEESID · Hüpotees - oletus. Statistiline hüpotees oletus on tehtud üldkogumi koguse kohta ja tegu on arvväärtusega. Nullhüpotees - hüpotees mis määrab üldkogumile võimalikult lihtsa struktuuri, sisuks üldkogumi vastavus standardile. Saame kontrollida trendi seost. Seose juures võimalikult lihtne struktuur ehk seos puudub (pole seost, pole probleemi). Nt. trendi pole, faktori mõju puudub. Alternatiivne hüpotees vaidleb nullhüpoteesile vastu. Kontrollstatistik on väljavõtustatistik, mille alusel tehakse otsus nullhüpoteesi kohta.
Mudeli statistilise olulisuse kontrollimiseks kasutatakse F - testi Loomaliha loomaliha.gdt nõudlusfunktsioon qli 79,3 0, 540 pli 0,195 psi ui H0 kõik seletavate tunnuste kordajad on nullid, b2=b3=... =bk =0 H1 vähemalt üks kordaja b2, b3 ...., bk on nullist erinev Nullhüpotees: Y on määratud oma keskväärtusega: Sisukas hüpotees yi b1 ui y ui F- statistiku empiirilist väärtust võrreldakse F jaotuse kriitilise väärtusega (või empiirilisele väärtusele vastavat olulisuse tõenäosust p võrreldakse olulisuse nivooga ). p=0,000291 < 0,05 Kui empiiriline väärtus ületab kriitilise (p<), võetakse vastu sisukas
4) Arvutada valimi arvkarakteristikute järgi parameetrite hinnangud, kasutades leitud pöördseoseid. Suurima tõepära meetod: Meetodi aluseks on põhimõte leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise tõenäosus. Vähimruutude meetod: Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel (nt regressioonanalüüsis). Nullhüpotees- kontrollitav väide Alternatiivhüpotees- nullhüpoteesi välistav alternatiivne väide Statistiline hüpotees tekib tavaliselt mingi vaadeldava juhusliku suuruse kohta käiva väite (oletuse, hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea tõenäosust tähistatakse ); teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks (võetakse vastu) (sellise vea
Selleks, et kasutada matemaatilise statistika metoodikat erinevatest valdkondadest pärinevate hüpoteeside kontrollimiseks, tuleb vastav hüpotees tõlkida statistika keelde ehk sõnastada vastav statistiline hüpotees. Statistilised hüpoteesid esitatakse üksteist välistavate väidete paaridena, seega alati saab neist kehtima jääda vaid üks. Sisukaks hüpoteesiks (tähis H1) on väide, mida soovime tõestada, nullhüpotees (tähis H0) on sisukale hüpoteesile vastupidine väide. Peab meeles pidama, et nullhüpoteesi ei saa kunagi tõestada, kui sisukas hüpotees jääb tõestamata (vastu võtmata), siis peame jääma nullhüpoteesi juurde (kuid ei loe seda tõestatuks). Hüpoteeside kontrollimisel ehk otsuse vastuvõtmisel võime teha vea, kuna valim on juhuslik ning valimi tulemus vaid hinnanguline. Otsustamisel tekkivad võimalused võime kokku võtta järgnevalt:
mõne parameetri (näiteks keskmise) kohta, kusjuures seda oletust kontrollitakse valimi põhjal. Antud juhul võiks kontrollida oletust, et LR ja TÜR kasutajate keskmised hinnangud on erinevad ka üldkogumil (mitte ainult valimil, mida nägime eelnevalt) ehk kas LR ja TÜR kasutajate hinnangute erinevus ei ole 0. 2. Alternatiivhüpotees ehk sisukas hüpotees (sõnastatakse see, mida tahetakse tõestada): sportlane on dopingut tarvitanud, tema veres on teatud ainet üle lubatava piiri. Nullhüpotees (vastupidine eelmisele, sisaldab kõiki ülejäänud variante): sportlane ei ole dopingut tarvitanud. 10) Olulisuse tõenäosus- Hüpoteeside kontrollimise käigus arvutatakse välja ka olulisuse tõenäosus – tõenäosus teha esimest liiki viga Olulisuse nivoo- Statistiline hüpoteesipaari kontrolli protseduur on üles ehitatud nii, et olulisemaks peetakse esimest liiki vea vältimist
Vahel kantakse üle valimile ja vastavalt valimilt saadud arvk. Hinnangutele arvutatakse nende seoste järgi param. Hinnangud. Eelis: lihtne arvutus- mõjus hinnang, kuid ei pruugi olla nihutamata ja efektiivne. Suurima tõepära meetod leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise P. Eelis: efektiivsus! Vähimruutude meetod tavalisim, Eelis: lihtne arvutus, optimaalsus. Nullhüpotees kontrollitav väide. Alternatiivne hüpotees- H0-i välistav alternat. väide. Esim. järku viga H0 on õige, peetakse valeks. Vea tõenäosus- alfa (olulisuse nivoo) 2. Järku viga H0 on vale, peetakse õigeks, vea tõenäosus on beeta. Teststatistik x kasut hüpoteesi kontrollimiseks. Lihthüpotees kui fikseerib üldkogumi jaotuse üheselt. Testi võimsus= 1-beeta Hüpoteeside kontroll: 1) Pearsoni x2-test: levinud jaotushüpoteeside kontrollimisel. Teststatistik iseloomustab
Valimvaatluse korral valitud usaltatavus avaldab mõju moodustavva valimi suurusele Usalduspiiride laius sõltub väärtuste varieerumisest Väljavõtukogumi suurus ei tohi sõltuda üldkogumi keskmisest väärtusest Vahemikhinnangu andmisel usalduspiiris on suurema valitud usaltatavuse puhul laiemad Hüpoteeside kontrollimisel: On võimalik I tüüpi vea tekkimine kui lükatakse tagasi nullhüpotees Kui kasutada otsuste langetamisel väiksemat valimit, siis vea tekkimise võimalus suureneb Valimi suurus mõjutab hüpoteesi kontrollimisel tehtavad otsust Hüpoteesi kontrollimisel viga saab tekkida: kuna anname hinnangu valimi põhjal ja valim on moodustatud juhuväljavõtu teel Statistilite hüpoteeside kontrollimisel: võrreldakse empiirilistel andmetel leitud statistikut kontrollstatistikuga Normaalselt jaotuvad kogumis: ei ükski;
ajalise või sisulise erinevusega (nt arvamus andmeanalüüsist enne kursust ja pärast kursust). Sisuline erinevus nt palun hind oma ilma ja palun hinda oma elu või määra oma stressitase ja määra oma väsimust. Sõltumatu korral võtame mehed naised ja küsime nende stressi (ehk üks muutuja ja kaks gruppi). Praegu on meil sõltuvate valimitega tegu. Esimene samm –pannakse paika olukorrad. Olukorrad väljendatakse läbi hüpoteeside –Hnull –nullhüpotees ja H1 –sisukas hüpotees (tavaliselt) H0 võetakse vaikimisi kehtivaks, et üldkogumi keskmised ei ole üldse erinevad. µi== µe Ütleme, et alati üks võrdub teisega H1 - µi ei võrdu µe µ - ülkogum Alati kui me midagi mõõdame, siis me võime eksida ja seda eksimist nimetatakse olulisuse nivooks, mille väärtus on kokku lepitud. On olemas 0,05, 0,01 ja 0,001. Selle määra valid sa ise. See sõltub natuke millises teadusvaldkonnas sa töötad
liiga ebatäpne ja ei omaks väärtust. Samavõrd tahetakse vältida valimit, mis on liiga suur, sest see raiskaks väärtuslikke ressursse. Seetõttu on valimimahtude täpne määramine tähtis, kuid võib olla üsna keeruline ja vajada mitmetel juhtudel statistikute abi (valimi mahu kalkulaator). HÜPOTEESID Hüpotees on üldkogumi kohta tehtud oletus. · sisukas hüpotees (H1): oletus kehtib · nullhüpotees (H0): oletus ei kehti Nullhüpoteesi ei tõestata, vaid selle juurde jäädakse, kuna nullhüpotees on teoreetiline abivahend, mis tegelikkuses niikuinii ei kehti. Hüpoteesi võib sõnastada: · võrdlushüpoteesina (võrreldakse tunnuseid) · seosehüpoteesina (seostatakse uuritavaid tunnuseid) Põhimõisted hüpoteeside testimisel: · Olulisustõenäosus (p-value) on eksimuse tõenäosus sisuka hüpoteesi eelistamisel.
tatud Kahjustatud 22 25 47 Hukkunud 19 32 51 Hukkunud 23 28 51 Kokku 110 130 240 Kokku 110 130 240 Kas feromoonpüünis aitas oluliselt kaasa taimede kasvamaminekule? Esitage ka teoreetilised sagedused. 18) Mis on hüpoteesid H0 ja H1? H0-nullhüpotees-väljendab uurijat mittehuvitavat juhtu, seda ei ole võimalik tõe 19) Mis on 1. liiki viga? Tekib siis, kui võetakse vastu sisukas hüpotees, aga tegelikult on õige nullhüpo 20) Kui suur antakse ette tavaliselt 1. liiki vea tõenäosus? 0.05 21) Mis on olulisuse nivoo? Esimest liiki vea tegemise suurim lubatud tõenäosus 22) Mis on olulisuse tõenäosus
eksponentjaotuse jaotustihedus ja sellele vastava hüpoteetiline histogrammi graafik ning ühtlase jaotuse jaotustihedus ja sellele vastava hüpoteetiline histogrammi graafik. Ülesandes 6 on toodud empiirilise ja ühtlase jaotuse jaotusfunktsiooni graafikud. Ülesandes 7 on kontrollitud, kas põhikogumi jaotuseks on ühtlane jaotus fikseeritud parameetritega a = 0 ja b = 100, kuid sel juhul on kasutatud Kolmogorovi-Smirnovi testi. Nullhüpotees võeti vastu ning põhikogumi jaotuseks on ühtlane jaotus fikseeritud parameetritega. Ülesandes 8 on kontrollitud rühmade homogeensushüpoteesi. Selleks on kasutatud dispersioonanalüüsi metoodikat. Nullhüpotees võeti vastu ning moodustatud rühmade keskväärtused on homogeensed, mis tähendab, et nende nivoode efektid on võrdsed. Ülesandes 9 on valimit A käsitletud aegreana. Esitatud on aegrea graafik ja
Hukkunud 19 32 51 23,375 27,63 51 Kokku 110 130 240 P-väärtus Kas feromoonpüünis aitas oluliselt kaasa taimede kasvamaminekule? Jah või ei Esitage ka teoreetilised sagedused. 18) Mis on hüpoteesid H0 ja H1? H0 nullhüpotees, mis tavaliselt väl H1 sisukas e. alternatiivne e. konk 19) Mis on 1. liiki viga? Esimest liiki viga tekib siis, kui võeta 20) Kui suur antakse ette tavaliselt 1. liiki vea tõenäosus? 0,1; 0,05; 0,01 21) Mis on olulisuse nivoo? Esimest liiki vead on sageli ohtlikud
6.Olulisustõenäosus, olulisusnivoo, I ja II liiki viga Olulisustõenäosuseks nimetatakse antud valimi põhjal saadud riski teha I liiki viga (p-value) Olulisusnivooks nimetatakse maksimaalset lubatud tõenäosust teha I liiki viga (β) maksimaalne lubatav I liiki vea tõenäosus (tavaliselt α = 0,05; 0,01; 0,001), nö valulävi. I liiki viga: P(H1 tõestatud | H0 on õige) tekib siis, kui võetakse vastu sisukas hüpotees, aga tegelikult on õige nullhüpotees. II liiki viga: P(H0 juurde jääda | H1 on õige) tekib siis, kui jäädakse nullhüpoteesi juurde, kuid õige oleks sisukas hüpotees. I liiki viga võib olla oluliselt väiksem kui II liiki viga 7.Normaalne aproksimatsioon kui tsentraalse piirteoreemi rakendus Tsentraalset piirteoreemi kasutatakse normaalse aproksimatsiooni juures teststatistiku z leidmiseks. X1, X2, …, Xn s.s.j; ̅ = ∑ ; ( )= ; ( )=
u Terved 65,1 76,9 1 4 2 Kahjus- 21,5 25,5 4 tatud 7 Hukkunu 23,4 27,6 5 d 1 Kokku 110 130 2 4 0 18) H0 -nullhüpotees väljendab uurijat mittehuvitavat juhtu. Nullhüpoteesi pole võimalik tõestada ning kui uurija tahab mingisugust erinevust tõestada siis tuleb tal uurimist jätkata H1-sisukas hüpotees, mida uurija soovis tõestada. Hüpoteeside kontrollimisel püütakse tõestada sisukas hüpotees nullhüpoteesi kummutamise teel. 19) 1. liiki viga tekib siis, kui võetakse vastu sisukas hüpotees aga tegelikult on tegemist nullhüpoteesiga
7. Hüpoteeside kontroll: null- ja alternatiivne hüpotees, 1. ja 2. liiki viga, olulisuse nivoo. Hüpoteeside kontrolli etapid: 1) määratakse kindlaks otsuse langetamiseks vajalik statistik ja arvutatakse selle väärtus olemasoleva valimi põhjal. 2) otsustatakse olulisuse nivoo suurus 3) sõltuvalt valitud olulisuse nivoost määratakse kriitiline piirkond 4) kui statistiku väärtus kuulub kriitilisse piirkonda, lükatakse nullhüpotees tagasi 5) kui statistiku väärtus ei kuulu kriitilisse piirkonda, loetakse nullhüpotees õigeks Üks kahest lausest peab kehtima: H0: µµ0 H1: µ<µ0 Lauset H0: µµ0 nim 0-hüpoteesiks ja lauset H1: µ<µ0 alternatiivseks ehk sisukaks hüpoteesiks. (µ-mingi üldkogumi keskväärtus; µ0-mingi fikseeritud arv). Valimi põhjal tuleb otsustada, kas 0-hüpotees tagasi lükata või vastu võtta. Kuna
,,sõnade tüüp" on kõikidel katseisikutel sama, faktor ,,sugu" jaotab katseisikud kahte gruppi. Normaaljaotuse kontroll - Enne parameetrilise testi tegemist tuleks kontrollida muutujate normaaljaotust - SPSS'is on selleks kaks testi: Shapiro Wilki test (väiksemate valimite puhul, kuni 2000) ja Kolmogorov Smirnov (n > 2000) - Analyze -> Descriptive Statistics - > Explore -> Plots - Kui p > .05 siis on normaaljaotusega (st nullhüpotees on normaaljaotusega) - NB! kui asümmeetriakordaja (ingl. k. skewness) ja ekstsess (ingl. k. kurtosis) on vahemikus -1 kuni 1, siis võib pidada andmeid normaaljaotusele vastavaks ANOVA vs T-test - Esimest liiki viga tekib siis, kui võetakse vastu alternatiivne hüpotees, aga tegelikult on õige nullhüpotees (raske viga; näidatakse erinevuse või seose olemasolu, mida tegelikult pole).
Sisukas hüpotees on Meeste ja naiste töökiirused on erinevad. Kas tegemist on sõltuvate või sõltumatute valimitega? Sõltumatud valimid. 5. Hüpoteesi statistilisel kontrollimisel saadi vastava statistiku empiiriliseks väärtuseks -2,3 ja kriitilisteks väärtuseks -1,5 ja 1,5. Milline on järeldus? Kehtib sisukas hüpotees 6. Kuidas muutub valimi mahu suurenemisel t-testi parameetri empiiriline väärtus? suureneb 7. Kumba liiki veaga on tegemist, kui võetakse vastu mittekehtiv nullhüpotees? 2 liiki viga 8. Hüpoteesi statistilisel kontrollimisel saadi teststatistiku empiiriliseks väärtuseks -2,3. Milline on järeldus? Otsustamiseks pole piisavalt andmeid 9. Millest sõltub olulisuse nivoo? analüüsi läbiviija valikust 10. Olulisuse nivoo vähendamine vähendab I liiki vea tõenäosust, suurendab II liiki vea tõenäosust 11. Hüpoteesi statistilisel kontrollimisel saadi, et olulisuse tõenäosus on 0,037. Millise olulisuse nivoo korral tuleb lugeda õigeks sisukas
a - t kr^ y < a^ < a + t kr^ y 0,523 + ( 2,78 0,022) = 0,584 - 0,92 - ( 2,78 0,41) = -2,06 0,462 < b^ < 0,584 - 0,92 + ( 2,78 0,41) = 0,22 - 2,06 < a^ < 0,22 10.3 Mudelite liikmete olulisus. Paarregressiooni jaoks kontrollitakse tavaliselt ainult b olulisust. Eeldatakse, et hälve regressioonist järgib normaaljaotust. Nullhüpotees H0: b=0 H1:b0 b 0,523 t EMP (b) = ^ x 2 i = 2,875 6164,8 =24,2 t EMP (b) = 24,8 t kr (0,05;3) = 2,78 tEMP>tkr kehtib H1: b0 (b on oluline) 10.4 Mudeli adekvaatsus s R2 d =1 - s2 s R2 = ( yi - y^ i ) 2 = ei2 = 11,5 s 2 = ( y - y ) 2 = yi2 = 1700,8 11,5 d =1 - = 0,99 1700,8
uuritavat muutujat, aga pole ise ühegi uuritava muutuja poolt mõjutatud (jõutreening); 2) sõltuv muutuja - muutuja, mis on uurija hüpoteesi järgi mingi teise uuritava muutuja poolt mõjutatud, aga ise ühtegi teist uuritavat muutujat ei mõjuta (kaugushüppe tulemus). 3) Segavad muutujad - sekkuvad sõltumatu ja sõltuva muutuja vahekorda. Kõrvalmõjud, häired, müra. Alluvad statistilisele kontrollile. 21) Mis on nullhüpotees? Kuidas toimub selle kontrollimine? 5 Mõisteid: Loogika – mõttekäik, mis sulle tundub õige Vabadus – valesid seisukohti maha raputades muutud vabamaks. Mida rohkem tead, seda vabam oled. Teadmiste otsimine on inimesele omane. Oskus valikuid teha teadmistele tuginedes. Moraalne valik – valik, kus enamusel on hea olla Filosoofia - teadmiste armastus