Usalduspiirkonna leidmine p(a) S= 0 ã- ã+ a p(a) juhusliku suuruse a tihedusfunktsioon. Usalduspiirkonna (ã , ã + ) leidmiseks tuleb: 1. Arvutada valimi põhjal punkthinnang ã; 2. Ette anda usaldusnivoo (näiteks 95%; 99%); 3. Leida seosest P(|ã a| < ) = suurus , mis määrabki usalduspiirkonna. Normaaljaotuse keskväärtuse usalduspiirkond suure valimi korral Eeldame, et valimi maht on küllalt suur (n > 30) või standardhälve on eelnevalt teada (näiteks mõõteriista täpsus on teada). Olgu X ~ N(m, ). Leiame keskväärtuse punkthinnangu aritmeetilise keskmise abil: 1n x = xi n i =1 Normaaljaotusega juhusliku suuruse X antud vahemikku sattumise tõenäosuse võime leida Laplace'i funktsiooni abil:
Binoomjaotuse lähendamine normaaljaotusega ja Punktihinnangud Keskväärtuse hinnanguks on Dispersiooni hinnanguks on Standardhälbe hinnanguks on Normaaljaotuse keskväärtuse usalduspiirkond Kui on teada või n on suur, siis Juhusliku sündmuse tõenäosuse usalduspiirkond. Valimi mahu määramine ja ,
n(keskmine) 493 Järeldus: Keskmise ettenihke f=0,26 mm korral on lõiketemperatuur kõikide võimalike kiiruste vahemikus ligikaudu 250 kraadi. Lõiketemperatuur ei sõltu lõikekiirusest v peaaegu üldse. Keskmise lõikekiiruse korral v=110m/min kehtib seos mida suurem ettenihe, seda kõrgem lõiketemperatuur. Lõiketemperatuur muutub vahemikus 240 kraadi kuni 260 kraadi. Kusjuures mõlema graafilise seose korral on sõltuvuse usalduspiirkond kõige suurem graafiku algosas (väikese lõikekiiruse või väikese ettenihke juures).
2. Leida keskväärtuse ja dispersiooni usaldusvahemikud. Eeldan, et üldkogum on normaaljaotusega ning võtan olulisuse nivooks = 0,10 Olulisuse nivoo ehk tõenäosus, et tegelik väärtus satub väljapoole usaldusvahemikku on 0,1. Seega usaldustõenäosus p = 1 = 1 0,1 = 0,9 ehk 90% k = n-1 = 24 näitab vabaduse astmeid. Dispersiooni usaldusvahemikud: leian - jaotuse täiendkvantiilid. Seda teen kasutades Exceli funktsiooni: Dispersiooni 90%-line usalduspiirkond on (679 ; 1791) Keskväärtuse usaldusvahemik: Keskväärtuse 90%-line usalduspiirkond on (47,38 ; 69,34) 3.Kontrollida järgmisi hüpoteese: (Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,1) alternatiiviga Studenti funtktsioon: t(0,1;24) = 1,711 Hüpotees vastab tõele, kuna ja 1,3 < 1,711 Võtan vastu H0 hüpoteesi. alternatiiviga 2 statistiku vasak kriitiline piir: 2 statistiku parem kriitiline piir:
R = 86 2. Küsimus Leida keskväärtuse ja dispersiooni usaldusvahemikud Eeldan, et üldkogum on normaaljaotusega ning võtan olulisuse nivooks = 0,10 Olulisuse nivoo ehk tõenäosus, et tegelik väärtus satub väljapoole usaldusvahemikku on 0,1. Seega usaldustõenäosus p = 1 = 1 0,1 = 0,9 ehk 90% k = n-1 = 24 näitab vabaduse astmeid. Dispersiooni usaldusvahemikud: leian - jaotuse täiendkvantiilid. Seda teen kasutades Exceli funktsiooni: Dispersiooni 90%-line usalduspiirkond on (536,45 ; 1410,64) Keskväärtuse usaldusvahemik: Keskväärtuse 90%-line usalduspiirkond on (35,08 ; 54,60) 3. Küsimus Kontrollida järgmisi hüpoteese: Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,1 alternatiiviga 4 Studenti funtktsioon: t(0,1;24) = 1,711 Hüpotees vastab tõele, kuna ja 0,90 < 1,711 Võtan vastu H0 hüpoteesi. alternatiiviga 2 statistiku vasak kriitiline piir: 2 statistiku parem kriitiline piir:
5) Gram-charlier normaaljaotus 6) Weibulli jaotusseadus 7) Eksponentjaotus 8) Gammajaotus 9) Beetajaotus 10) Studenti jaotus 11) F-jaotus Diskreetsed: 1) Binoomjaotus 2) Hüpergeomeetriline jaotus 3) Poissoni jaotus 4) Pascali jaotus 17. Mis on usaldusnivoo? Usaldusnivoo näitab tulemuse sattumise tõenäosust mingisse vahemikku. 18. Mis on usalduspiirid? usalduspiirid, usaldusvahemiku alumine ja ülemine otspunkt. Usalduspiirkond on valimi põhjal arvutatud piirkond, millesse hinnatava parameetri tegelik väärtus kuulub teatava tõenäosusega. Selle tõenäosuse väikseimat lubatavat väärtust, milleks tavaliselt valitakse 0,99 või 0,95, nimetatakse usaldusnivooks. 19. Mis on nullhüpotees? Nullhüpotees, mis tavaliselt väljendab uurijat mittehuvitavat juhtu. Nullhüpoteesi ei ole võimalik tõestada. Selle vastuvõtmine tähendab, et kui uurija
Seega usaldustõenäosus p = 1 – α = 1 – 0,1 = 0,9 ehk 90% Vabadusastmete arv k = n-1 = 24 2.1 Keskväärtuse usaldusvahemikud: t 0,95 ( 24 )=t ∝ ( k )=1,7109 1− 2 s 28,53 ∆ μ= ∙ t 0,95 ( 24 )= ∙1,7109=9,76 √N √25 x alumine=´x −μ=44,84−9,76=35,08 x ülemine= x´ + μ=44,84 +9,76=54,6 Keskväärtuse 90%-line usalduspiirkond on (35,08 ; 54,6) P (35,08< μ <54,6 )=0,90 2.2 Dispersiooni usaldusvahemikud: Leian χ 2 - jaotuse täiendkvantiilid. ( 1− p ) χ 2 ( 2 ) ; n−1 → chiinv ( 0,05 ; 24 )=36,415 χ2 ( ( 1+2 p ) ; n−1) → chiinv ( 0,95 ; 24) =13,848 k ∙ σ^ 2 24 ∙ 814,056 σ 2alumine = = =536,52 36,415
dt Laplace'i funktsiooni omadused: 1) (0)=0 2) ()=0,5 3) (-X)=- (X).(paarisfun) 7. Normaaljaotuse keskväärtuse usalduspiirkonna leidmine. Studenti jaotus. k= n-1 ; - Usaldusnivoo k=n-1 (vabadusastme ARV) -dispersiooni usalduspiirkond 8. Juhusliku sündmuse tõenäosuse usalduspiirkonna leidmine. Juhuslik sündmus on sündmus, mis antud katse korral võib toimuda või mitte toimud m p* =
P-kvartiil arv, mis jaotab järjestatud statistilise rea osadeks suhteliste mahtudega p ja 1- p, kus p on murdarv vahemikus 0...1. (mediaan, kvatriilid, detsiilid jne.). Kvartiilid koos mediaaniga jaotavad variatsioonirea neljaks võrdsel arvul liikmeid sisaldavaks osaks, kusjuures väikeseim (p = 0,25) kannab nimetust alumine kvartiil ja suurim (p = 0,75) kannab nime ülemine kvartiil. Detsiilid jaotavad rea kümneks võrdsel arvul liikmeid sisaldavaks osaks. Normaaljaotuse keskväärtuse usalduspiirkond Kuidas hinnata üldkogumi keskväärtust µ , kui on teada valimi keskväärtus x ja dispersioon s. Kui valim on suur (>30) kasutame valemit P( x -µ <) =1 -. s s lb = ( x - t , x + t ) =1 - n n 1-alpha on usaldusnivoo Näide: Juhuslik suurus X on normaaljaotusega. Kümnel sõltumatul katsel saadi järgmised suuruse X väärtused:
341186 0.09120037 9 1.7011309 9. Prognoosime muutuja Y väärtust, kui 9.1 Prognoosi punkthinnang: y^ p a b x p 5767.47145 1.34118603 10000 9.1.2 Järeldus: 10000 abielludele vastab 19180 sündinud last. 9.2 Prognoosi punkthinnangu standardhälve: 1 ( x p x )2 1 (10000 7623.1 su se 1 1401.57997 6 1 n xi2 n x 2 30 1979529261 30 7 9.3 Prognoosi vastav 90%-line usalduspiirkond: t (k ; ) 1.70 alpha = k= alumine y^ p y^ p su t (k , ) 247180.956 7 1441.14480 7 1,70 y^ palumine y^ p su t (k , ) 247180.956 7 1441.14480 7 1,70 9.4 Järeldus: 90%lise tõenäosusega järgib 10000 abiellude 16727 kuni 21631 sündi. 10. Protseduur Regression SUMMARY OUTPUT Regression Statistics Multiple R 0.940941045
Empiirilised arvkarakteristikud on teatud määral juhuslikud, kuid kõik empiirilised karakteristikud koonduvad tõenäosuse järgi katsete arvu tõkestamatul suurenemisel juhusliku suuruse vastavateks karakteristikuteks. Seega, küllalt suure katsete arvu puhul võib lugeda empiirilised karakteristikud ligikaudselt võrdseteks arvkarakteristikutega. 17. Usaldusintervall, usaldustõenäosus ja kooskõlakriteeriumid (Pearsoni ja Kolmogorovi kriteeriumid). Usalduspiirkond: Juhusliku suuruse arvkarakteristikute hinnangud on ise ka juhuslikud suurused. Mida väiksem on on valimi maht (vaatluste arv n), seda ebatäpsemad hinnangud saadakse. Empiiriliste arvkarakteristikute täpsuse iseoomustamiseks määratakse lisaks arvkarakteristiku hinnangule valitud tõenäosusele vastav usalduspiirkond. Olgu arvkarakteristiku hinnang tähistatud a*. Andes ette mingi tõenäosuse (usaldustõenäosus), nt =0,95, leitakse võimaliku vea suurus , mille puhul on täidetud
y = -0,92 + 0,523 x Ymin=1 => Y^min=0,1 10 Ymax=50 => Y^max=84,8 Ykesk=25,2 1 2 S yi = 2 2 + X i n X i 2 2 S y min = 1,55 2 S y max = 1,43 1 S ykesk = 2 = 0,48 2 n Usalduspiirkond: Y^I +/- Syi2t(k;) t(k;)=2,776 xmin=> 0,1+/-4,30 xmax==> 48,8+/-3,97 xkesk=25,2+/-1,33 Osa D juhuslike suuruste modelleerimine 11 11. Monte-Carlo meetod F(x)=ri Xi=(i=1....12) ri-6 Z1 = Scor * xi+ x 0,91 0,49 0,91 0,45 0,23 0,68 0,74 0,92 0,76 0,86 0,46 0,16 7,57 7,57 Xi=(i=1....12) ri-6=1,57 Z1=27,68 * 1,57+52,12= 95,57 0,69 0,07 0,49 0,41 0,38 0,87 0,63 0,79 0,19 0,76 0,35 0,58
dispersiooni korrutisega 4 kasutatakse dispersioonde suhet Hüpoteeside kontrollimisel: 1 H0 on alati tõene 2 kahepoolse testi korral on usaldatavus alati 95% 3 ühepoolse testi korral on usaldatavus alati 95% 4 hinnang antakse valimi põhjal 5 hinnang antakse üldkogumi põhjal Keskmise piiresindusvea korral: 1 piiresindusviga on max lubatud viga 2 mida suurm on usaldatavus, seda suurem on piiresindusviga 3 usalduspiirkond on seda laiem, midasuurem on usaldatavus Keskmine esindusviga on oma sisult: 1 Vahe ühe juhuslikult moodustatud valimi keskmise taseme ja üldise keskväärtuse vahe 2 kõikide n-liikmeliste valimite aritm. Keskmine tase 3 väljavõtukeskmiste standardhälve Piiresindusviga on oma sisult: kõikde n-liikmeliste valimte artm. keskmiste keskmine vahe ühe juhuslikult moodustatud valimi ja keskmise taseme ja üldkogumi keskväärtuste vahel väljavõtukeskmiste kvartiilhälve
NB! Selleks, et valimi uurimise alusel teha tõepäraseid järeldusi üldkogumi kohta, peab valimi moodustamisel üldkogumi igal elemendil olema võrdne võimalus (tõenäosus) valimisse sattuda. Valim peab olema esindav ehk representatiivne. Valimi alusel üldkogumi karakteristikute kohta tehtavad järeldused on tõenäosuslikud (enamasti kasutatakse 95% ja 99% protsendilisi tõenäosusi) 45. Punkt- ja vahemikhinnang (usalduspiirkond, usalduspiirid). Üldkogumi mingi parameetri (näiteks keskväärtuse) punkthinnang on valimi põhjal arvutatud vastava parameetri (näiteks aritmeetilise keskmise) väärtus. NB! Kuna ühest üldkogumist võib moodustada palju erinevaid valimeid, siis iga valim annab meid huvitavale üldkogumi parameetrile erineva punkthinnangu. Niisuguseid punktihinnanguid võib vaadelda omakorda kui teatud JS, millel on oma jaotus.
4. kasutatakse dispersioonde suhet Hüpoteeside kontrollimisel: 1. H0 on alati tõene 2. kahepoolse testi korral on usaldatavus alati 95% 3. ühepoolse testi korral on usaldatavus alati 95% 4. hinnang antakse valimi põhjal 5. hinnang antakse üldkogumi põhjal Keskmise piiresindusvea korral: 1. piiresindusviga on max lubatud viga 2. mida suurm on usaldatavus, seda suurem on piiresindusviga ??? 3. usalduspiirkond on seda laiem, midasuurem on usaldatavus Keskmine esindusviga on oma sisult: 1. Vahe ühe juhuslikult moodustatud valimi keskmise taseme ja üldise keskväärtuse vahe 2. kõikide n-liikmeliste valimite aritm. Keskmine tase 3. väljavõtukeskmiste standardhälve Piiresindusviga on oma sisult: 1. kõikde n-liikmeliste valimte artm. keskmiste keskmine 2. vahe ühe juhuslikult moodustatud valimi ja keskmise taseme ja üldkogumi keskväärtuste vahel 3
· Olulisustõenäosus (p-value) on eksimuse tõenäosus sisuka hüpoteesi eelistamisel. · Olulisuse nivoo () ehk riskitase ehk riskiprotsent ehk riski kriitiline tase ehk uurija seatud tõke esimest liiki vea tõenäosusele ehk tase, mille juures saab veel sisuka hüpoteesi vastu võtta. · Usaldusnivoo on tõese otsuse tõenäosus ( = 1 ). Eksimuse vastandsündmus on tõene otsus. · Usaldusintervall ehk usalduspiirkond ehk usaldusvahemik sisaldab etteantud tõenäosusega parameetri tegelikku väärtust. Paarikaupa esitatud hüpoteesid peavad teineteist välistama ja üks neist peab kindlasti kehtima. KOGUMITE VÕRDLEMINE Kaks kogumit: · sõltuvad valimid · sõltumatud valimid Kogumeid tuleb võrrelda, et oleks teada, kas muutunud tingimused mõjutavad tunnuse jaotust üldkogumis. Test, mida tunnuse keskväärtuste võrdlemisel kasutada, sõltub katse korraldusest,
1. põhieesmärgiks on leide kogumi kirjeldamiseks dispersioon ja standardhälve 2. H0 tagasilükkamisekspeab olema Femp suhe negatiivne 3. dispersioonide liitmise lause järgi peab ülddispersioon võrduma rühmade sisese ja rühmade vahelise dispersiooni korrutisega 4. kasutatakse dispersioonde suhet Keskmise piiresindusvea korral: 1. piiresindusviga on max lubatud viga 2. mida suurm on usaldatavus, seda suurem on piiresindusviga ??? 3. usalduspiirkond on seda laiem, midasuurem on usaldatavus 1.) Kui palju oleks muutunud müüdud kaupade käive kui hinnad ei oleks muutunud? Kaup Esimene periood käive Teine periood käive hind kogus Hind kogus A 8 EEK 450 3600 10 EEK 430 4300
olemasolu korral vähimruutude meetod ja ka sellel meetodil põhinevad arvutiprogrammid lihtsalt ei tööta.Peaaegu täielik multikollineaarsus-Kahe sõltumatu muutuja korral on nende vahelise sõltuvuse korrelatsioonikordaja väga suur r >0,9. Mudeli parameetrite hinnangud muutuvad väga ebastabiilseks.Regressioonikordajate varieeruvus(standarthälve) on väga suur, siis on ka suur vahemik (regressioonikordajate usalduspiirkond), kus asub regressioonikordaja tegelik väärtus ning seda raskem on tagasi lükata nullhüpoteese sisuliselt vägagai oluliste regressioonikordajate kohta.Võib tekkida olukord, kus determinatsioonikordaja R2 on suur ning regressioonivõrrandi kui terviku olulisust kontrolliv F-test loeb võrrandi täiesti usaldusväärseks, kuid ükski regressioonikordaja t-testi järgi ei ole usaldusväärne. Arvandmetest multikollineaarsust kõrvaldada ei õnnestu.