( ) n n RSS ( a^ , b^) = ui2 = yi - ax ^ i - b^ min lineaarsete hinnangute seas; i =1 i =1 · lineaarsed vaatluste yi suhtes. Tuleb leida kahe muutuja funktsiooni RSS ( a^ , b^ ) miinimumkoht. KUI kehtivad klassikalise lineaarse mudeli eeldused. Matemaatilisest analüüsist: I järku osatuletised peavad võrduma nulliga. Vastavaid eeldusi ja nende testimist vaatame järgmistes
loomaliha.gdt Mudel 2, toome sisse ka sealiha hinna ps Loomaliha ja sealiha hind on omavahel seotud qli 79, 3 0,540 pli 0,195 psi ui Kui mudelis ainult loomaliha hind pl Kui oli ainult loomaliha hind pl NB! Loomaliha kordaja on qli 85, 2 0, 466 pli ui erinev! qli 85, 2 0, 466 pli ui Siin avaldub kaudselt ka sealiha hinna mõju. Kui sealiha hinda mudelis pole, saame
selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. 12. Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiiriline ja kriitiline väärtus Nullhüpotees: miski võrdub millegagi (erinevus on null) kogumi keskväärtus µ = µ0 kogumi A keskväärtus = kogumi B keskväärtus mudeli parameeter = 0 · Sisukas (alternatiivne) hüpotees: võrdus ei kehti. · Otsustamiseks kasutatakse juhuvalimit. · Juhuvalimi keskväärtus on juhuslik suurus, st erineb arvust µ Otsustamiseks vajaliku statistilise kriteeriumi leidmiseks kasutatakse teststatistikut. · Valimi andmete põhjal arvutatakse teststatistiku empiiriline väärtus sõltuvalt sellest, mida kontrollitakse, on konkreetsed arvutusvalemid erinevad z-test, t-test, F-test, 2 -test, ....
kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. Näiteks mõningad suurima tõepära meetodil leitud hinnangud. 12. Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiiriline ja kriitiline väärtus. ● Nullhüpotees: miski võrdub millegagi (erinevus on null) – kogumi keskväärtus μ = μ0 – kogumi A keskväärtus = kogumi B keskväärtus – mudeli parameeter β = 0 ● Sisukas (alternatiivne) hüpotees: võrdus ei kehti ● Otsustamiseks kasutatakse juhuvalimit. ● Juhuvalimi keskväärtus on juhuslik suurus, st erineb arvust μ. ● Kuidas otsustada, kas – kogumi keskväärtus μ = μ0 kehtib nullhüpotees; – kogumi keskväärtus μ ≠ μ0 kehtib sisukas hüpotees? ● Ehk: kui palju võib juhuvalimi keskväärtus erineda nullhüpoteesiga püstitatud
majanduskeskkond. Need on peamised tegurid, mille põhjal inimene, otsides töökohta, kujundab teatavad eeldused palga suurusele. Üldisemas plaanis mõjutavad elanike palgataset mitmed demograafilised tegurid. Käesolevas töös on vaatluse alla võetud osa võimalikest teguritest, mis rahvastiku palgataset mõjutada võivad ning mis on ka statistikaameti kodulehelt kättesaadavad. Ühe tegurina mõjutab palgataset kindlasti haridus, eeldades, et kõrgem haridus garanteerib ka kõrgema palga. Tegelikus elus võib muidugi olla, et madalama haridustasemega inimesed töötavad kõrgetel positsioonidel ning kõrgharidusega inimesed lihttöölistena – seda kas siis juhuse läbi või struktuurse tööpuuduse tõttu. Käesolevas töös lähtume siiski toodud eeldusest, et parem haridus viitab kõrgemale palgatasemele. Haridustaseme iseloomustamiseks on ühe sõltumatu muutujana käesolevas töös vaatluse alla
väärtused, väiksematele X väärtustele vastavad suuremad Y väärtused) 16) Korrelatsioonikordaja selle arvutusvalem ja omadused: Korrelatsioonikordaja absoluutväärtus näitab lineaarse seose tugevust ja märk näitab seose suunda: positiivne või negatiivne. Omadused – Absoluutväärtuse maksimaalne suurus 1 Valem – r_xy=xy/(x*y) 17) Hüpoteesi kontrollimine korrelatsioonikordaja olulisuse kohta: nullhüpotees ja sisukas hüpotees: 18) Regressioonanalüüs ja regressioonmudeli komponendid: Uurib suuruste vahelist sõltuvust ja võimalusi selle funktsionaalseks kirjeldamiseks etteantud valemi põhjal. Regressioonanalüüsi käigus leitakse deterministlik komponent --> leitakse vastava matemaatilise funktsiooni parameetrite hinnangud. Komponendid – y= deterministlik komponent + juhuslik komponent, y = ax + b +u; Tinglik keskväärtus on deterministlik komponent y=E[Y X] + u
Ökonomeetria mõisted 1. Autokorrelatsioon ja heteroskedastatiivsus võivad mudelis olla kahel põhjusel: 1) mudeli spetsifikatsioon on vale. Mudelist on välja jäetud mõned olulised muutujad ja/või mudeli funktsionaalne kuju on vale. Mudel tuleb ümber vaadata. 2) Tavalise vähimruutude meetodi rakendamise protseduur võib anda standardhälvete nihkega hinnangud. Tuleb kasutada uusi lähenemisi mudeli parameetrite hindamiseks. Autokorrelatsiooni testitakse aegridade puhul.
(Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0,1) 3.1 H 0 : μ=50 alternatiiviga H 1 : μ ≠ 50 t statistik = |√N ´ s || 25 28,53 | ( x −μ0 ) = √ ( 44,84−50 ) =|−0,9043|≈|−0,90| Studenti funtktsioon: t(0,1;24) = 1,7109 Hüpotees vastab tõele, kuna |t|>t 1−∝ /2 (f ) ja |−0,90| < 1,7109 H0 hüpotees vastu võetud. 2 2 3.2 H 0 : σ =800 alternatiiviga H 0 : σ ≠ 800 s2 ( 2 28,532 χ = 2 N −1 = ) ∙ 24=24,42 χ2 statistiku vasak kriitiline piir: σ0 800 χ 21−∝/2=chiinv ( 0,95 ; 24 )=13,8 χ2 statistiku parem kriitiline piir: χ 2∝/2 =chiinv ( 0,05; 24 )=36,4 Kriitiline piirkond χ2 < 13,848 , χ2 > 36,415
10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja on arvutatavad Excel'i CHIIVN funktsiooniga ning on vastavalt: 33,196 ja 13,848 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1. H0: = 50 alternatiiviga H1: 50 1 Et hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,911. Hüpotees H0 võetakse vastu. 3.2. H0: 2 = 800 alternatiiviga H2: 2 800 8 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,848 < 24,433 < 33,196. Hüpotees H0 võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40- 60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi
3. Lihtne regressioon, regressioonivõrrandi põhikuju. Determineeritud regressioonivõrrand. Lineaarse regressiooni korral kirjeldatakse seost uuritavate muutujate väärtuste vahel sirge abil võrrandiga Y = a0+a1X Eesmärgiks on leida punktiparvega antud X ja Y vahelist seost iseloomustava parima sirge võrrand Lineaarse kahe muutujaga determineeritud regressioonimudeli korral eeldatakse, et juhusliku suuruse Y tingliku keskväärtuse ja sõltumatu muutuja X vahel on seos E(YX ) = 0+ 1X Determineeritud regressioonivõrrand kirjeldab seost endogeense ehk sõltuva muutuja Y keskväärtuse ja eksogeensete ehk sõltumatute muutujate Xi vahel. Võrrandi vasakul pool on tinglikud keskväärtused, mis ei sõltu juhusest 4. Stohhastiline regressioonivõrrand. Juhuslik komponent (regressioonijääk). Visualiseerimine (joonis). Stohhastiline regressioonivõrrand sisaldab juhuslikku liiget i
9 Seeriate arv : ( , ) Pikima seeria pikkus : ( , ) Käänupunkte : ( , ) 10 Korrelatsioonitegur: ( 0,94 ) t-statistik : t = 0,44 Järeldus: tagasi lukata Determinatsioonitegur: ( 0,89 ) z-statistik : z = 2,46 Järeldus:tagasi lukata 11 11.1 1,36 -3,25 Regressioonimudel: 11.2, 11.3 0,48 olulisus: oluline 1,58 olulisus: pole oluline 11.4 F-statistik: F = 4,01 Järeldus: võetakse vastu 11.5 Väljundi usaldusvahemiku poollaiused : : 1,876 : 1,614 Osa A Valim A mahuga N=25 variatsioonirida:
1 0-20 5 0,2 6,80 2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,2 73,40 5 80-100 3 0,12 96,33 KOKKU 25 1 Kontrollin -testi järgi olulisuse nivool = 0,10 järgmisi jaotushüpoteese: 2 4.1 põhikogumi jaotuseks on normaaljaotus. Keskväärtuse hinnang: 1 k µ^ = x = ni xi = 46, 2 n i =1 Dispersiooni hinnang: 1 k ^ = s 2 = ( xi - x) 2 ni = 854,88 n - 1 i =1 Teststatistiku arvutamise valemid: k (nm - nm~ ) 2 2 =
5 100 2,005 3 0,9772 0,0775 1,9375 0,5827 kokku 25 24,43 2,1543 χ 2=2,1543 χ 2 vabadusastmete arv k = m – 1 – r = 5 – 1 – 2 = 2. (r = 2, sest normaaljaotusel on kaks parameetrit) 2 χ kr ( 0,10 ; 2 )=4,605 Et hüpotees vastu võetaks peab χ²kr > χ², antud juhul 4,605 >2,1543, seega hüpoteesi võib vastu võtta ning järeldada, et tegemist on normaaljaotusega. 4.2 Põhikogumi jaotuseks on ühtlane jaotus fikseeritud parameetritega a = 0, b = 100. 2 k ( ni−n'i ) χ =∑ 2 i=1 n'i n'i=n∙ [( ) ( x m −a b−a x −a − m−1
10). Keskväärtuse usaldusvahemik: α = 0,10 t0,1; 24 = 1,7109 (Studenti tabelist) Dispersiooni usaldusvahemik: α = 0,10 ja on vastavalt: 13,8484 ja 36,4150 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10): 3.1. H0 : μ = 50 alternatiiviga H1 : μ 50 09 Et hüpotees vastu võetaks, peab tkr > t; 1,7109 > 0,2892. Hüpotees H0 vastab tõele. 3.2. H0 : σ2 = 800 alternatiiviga H2 : σ2 800 84 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,8484 < 29,0575 < 36,4150 . Hüpotees H0 vastab tõele. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60,
= P(707,6 ¿ σ <¿ 1866,4) =0,9 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). 3.1 H0: μ = 50 alternatiiviga H1: μ 50 x´ −μ 45,8−50 t= √N t= √ 25=−0,6 t kr=1,71 1 s 32,8 Et hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,6. Hüpotees on vastu võetud. 3.2 H0: σ2 = 800 alternatiiviga H2: σ2 800 s 2 ( N −1 ) 1073,2 ∙ (25−1 ) χ 2= = = 32,2 σ2 800 χ 20,05=36,42 χ 20,95=13,84
Statistiline modelleerimine – kokkuvõte Muutujad: Sõltuvad muutujad (dependent, outcome variables) – muutujad, mis on uurimise keskmes, millele uurija arvab, et teised muutujad mõju avaldavad. Nö katseisikust sõltuv muutuja. Sõltumatud muutujad (independent, predictor variables) – muutujad, mille kohta uurija arvab, et neil võiks olla mõju uuritavatele muutujatele. Statistilise analüüsi keskmes on uurida, kuidas teatud tunnused koos muutuvad. Kui on vaja muutujat iseloomustada, on kaks põhilist viisi, kuidas seda teha: o Milline on selle muutuja tüüpiline väärtus? o Kui hästi iseloomustab see tüüpiline väärtus kõiki mõõdetud juhtumeid? Ehk
9 Seeriate arv : ( 8,2 ) Pikima seeria pikkus : ( 7,9 ) Käänupunkte : ( 11, 35) 10 Korrelatsioonitegur: ( 0,75 ) t-statistik : t = 0,86 Järeldus: tagasi lukata Determinatsioonitegur: ( 0,56 ) z-statistik : z = 1,37 Järeldus:tagasi lukata 11 11.1 6,3 - 1.40 Regressioonimudel: 11.2, 11.3 1,101 olulisus: oluline 3,65 olulisus: oluline 11.4 F-statistik: F = 0,386 Järeldus: võetakse vastu 11.5 Väljundi usaldusvahemiku poollaiused : : : : Rakendusstatistika arvutusgraafiline töö nr. 1 OSA A 1. Küsimus On antud valim A mahuga N = 25 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1
4150 23 635.04 24 163.84 Dispersiooni usaldusvahemikud 25 1075.84 alumine 638.36 ülemine 1678.61 H0:μ 50 Kriitiline piirkond ǀtǀ > 1,7109 t-statistik 0.2892 H0 hüpotees vastab tõele, kuna ǀ0,2892ǀ < 1,7109 H0:σ2 800 Kriitiline piirkond 13,8484 < χ2 < 36,4150 hii-statistik 29.0575 H0 hüpotees vastab tõele, kuna 13,8484 < 29,0575 < 36,4150 xi 4. 1 2 2 14 17 19 21 22 39 45 48 52 62 70 71 73 4.1. k 74 1 75 2 77 3 79 4 79 5 81 Kokku 81
xxxx Summa: 1,00 25 0,096 vabadusastmete arv f = k h 1 = 5 2 1 = 2. ( h = 2, kuna normaaljaotusel on kaks parameetrit ja ) Et nullhüpotees vastu võetaks peab . Seega võin nullhüpoteesi vastu võtta ning järeldada, et üldkogumi jaotuseks on normaaljaotus. 4.2 Põhikogumi jaotuseks on eksponentjaotus, mille parameeter on . Eksponentjaotuse parameeter: Vahemi Katsed k F0(m) ni pi ni' xm 1 20 0,351 5 0,351 8,784 1,630 2 40 0,579 6 0,228 5,698 0,016 3 60 0,727 6 0,148 3,696 1,437
3.2 H0: 2 = 800 alternatiiviga H1: 2 800 s 2 ( N - 1) x2 = 2 814,42 24 x2 = = 25,00 741,6 Hüpotees ütleb et arvutatud 2 peab jääma kahe kriitilise väärtuse vahele, ehk 2 a/2 < arvutatud 2< 2 1-a/2 ja nii meil ongi, ehk 13,85<25,00<36,42 - Seega on hüptees tõene. 4. Leida valimile vastav empiiriline histogramm ...võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida 2-testi järgi olulisuse nivool = 0.10 järgmisi jaotushüpoteese: vahemik ni pi xi 0-20 6 0,2 9,833 4 21-40 7 0,2 33 8 41-60 4 0,1 49,25 6 61-80 5 0,2 70 0 81-100 3 0,1 90 2 Kus xi on vahemiku keskmine väärtus (vahemiku elemendid jagatud sagedus) 4.1 põhikogumi jaotuseks on normaaljaotus ..
= 0,10 t0,1; 24= 1,711 (Studenti tabelist) (Arvutatud excelis väärtuste ümardusi rakendamata) Usaldusvahemiku poollaius: 11,2 Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 1,28. Hüpotees H0 võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees H0 vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 32,18< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese
3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24 Kriitiline t-statistiku väärtus t0.95(24) = 1.711 Kuna t < , siis võtame hüpoteesi H0 vastu. 3.2. H0: 2 = 800; H1: 2 800 Kontrollimiseks kasutame 2-statistikut: Kriitilised väärtused: 20.05(24) = 13.848 20.95(24) = 36.415 Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 21-40, 41- 60, 61-80 ja 81-100 ning kontrollida 2- testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese. Intervalli Vahemi element tõenäosus intervalli nr k e pi* keskmine k ni xi
Me=51 Haare: R=94-9=85 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (olulisuse nivoo = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 0,61. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,17< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese intervalli nr vahemik elemente intervalli keskmine
2 s2 ( y ) N x i 2 s ( b0 ) = =2,5 V x i=1 N t 0,975 ( 6 )=2,45 b j=t 0,975 ( 6 ) s ( b j ) b 0=3,9, b1 =1,2 11.3 H 0 : 2ad= 2 ( y ) , H 1 : 2ad > 2 ( y ) ^y i=b 0+ b1 x i N 1 2 s = ad N -d j=1 ( y i- ^y i )2=5,5 Joonis 5. Regressioonimudel 30 25 Katsepunktid y=3,96x+1,94 Usaldusvahemiku alampiir 20 y 15 10 Usaldusvahemiku ülempiir 5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 x s 2ad F= 2 =2,5 s ( y)
Tõeline keskväärtus on tähisega µ. ̅̅̅ 𝑥𝑘 − 𝜇 𝑡𝑒𝑚𝑝 = ∗ √𝑛 = 0.461 𝑆𝑐 𝑇𝑎𝑏𝑒𝑙𝑖𝑠𝑡: 𝑡𝑘𝑟 (𝑡95 ; 60) = 2.000 0.461 < 2.000 Hüpotees kehtib 3.2 H0: teor2 = 800 alternatiiviga H1: teor2 800, (kahepoolne kriitiline väärtus) (𝑛 − 1) ∙ 𝑆𝑐 2 𝜒2 = 2 = 50.021 𝜎𝑡𝑒𝑜𝑟 χ^2vasak (60;0,05) = 43.19 χ^2parem (60;0,95) = 79.08 χ^2vasak < χ^2 < χ^2parem 43.19 < 50.021 < 79.08 Hüpotees kehtib 4
P ( 465,10<σ 2<1223 )=0 , 90 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0,10) 3.1 H0: μ = 50 alternatiiviga H1: μ 50 x´ −μ t= √N s 53,24−50 t= √25=0,61 26,56 t kr=1,71 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > -0,641. Seega hüpotees H0 võetakse vastu. 3.2 H0: σ2 = 800 alternatiiviga H2: σ2 800 2 s ( N −1 ) 2 χ= σ2 2 705,69∙ ( 25−1 ) χ= =21,17 800 2 χ 0,05 =36,42
4.2 0,017 - statistik: 31,46 Järeldus:lükatakse tagasi 4.3 - statistik: 6 Järeldus:lükatakse tagasi 7 statistik: 0,29 Järeldus: lükatakse tagasi 8 F- statistik: F= 0,404 Järeldus: võetakse vastu 9 9.1 2,73 2,08 Regressioonimudel: 9.2, 9.3 3,89 olulisus: pole oluline 1,16 olulisus: on oluline 9.4 F-statistik: F=1,64 Järeldus: võetakse vastu 9.5 Väljundi usaldusvahemiku poollaiused : :: : Rakendusstatistika arvutusgraafiline töö nr. 1 OSA A 1. On antud valim A mahuga N = 25 Abistavad tehted on koondatud tabelisse jrk ni xi ni * xi ni
1. PRAKTIKUM 1) JÄRJESTAMINE NOOREMAST VANIMANI Parmeklõps Sort Ascending/Descending -> Kasvavas/Kahanevas järjestuses Data Sort cases Sort Ascending/Sort Descending (tuleb valida muutujad ka) 2) VARIABLE VIEW 3) KIRJELDAVAD ANDMED Leiame vanusele antud hinnangute keskmise, moodi, mediaani, maksimaalse ning minimaalse hinnangu. + HISTOGRAMM Käsklusrida: Analyze - Descriptive statistics Frequencies. Muutujatekasti liigutage muutuja. Statistics -Mean, Mode, Median, Minimum, Maximum. Charts - Histograms 2. PRAKTIKUM 1) UUE MUUTUJA ARVUTAMINE Tihtipeale tuleb andmete töötlemise jooksul tekitada uusi muutujaid eelmiste muutujate põhjal. Käesolevas praktikumis tutvume uue muutuja arvutamise põhitõdedega. Etteruttavalt võib öelda, et me arvutame saadavaloleva andmestiku põhjal uueks muutujaks kehamassiindeksi (BMI body mass index). Käsklusrida:
lubatud muutumisvahemiku sees kõik juhusliku suuruse väärtused on tekke mõttes samaväärsed. Jaotuse parameetriteks on juhusliku suuruse muutumisintervalli alumine piir a ja ülemine piir b. Eksponentjaotus (pidev) kirjeldab mingi sündmuse toimumisaja jaotust eeldusel, et sündmuse tekkimise jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane
Samuti on eesmärgiks leida tegurid, mis nende kulutuste mahtu võisid muuta ja hinnata nende mõju. Lähtuvalt projekti eesmärgiks on püstitatud järgmised uurimisküsimused: 1. Kas inimeste kulutused riietele ja jalanõudele sõltuvad riigi SKP-st inimese kohta? 2. Kas inimeste kulutused riietele ja jalanõudele sõltuvad kaalutud hindade tasemest? 3. Kas inimeste kulutused riietele ja jalanõudele sõltuvad töötuse määrast riigis? Projekti esimene hüpotees väidab, et mida suurem on SKP inimese kohta, seda suuremad on inimeste kulutused riietele ja jalanõudele. Teiseks hüpoteesiks on kaalutud hindade positiivne mõju riiete ja jalanõude tarbimisele, see tähendab, et mida madalamad on kaalutud hinnad, seda rohkem tarbitakse. Kolmandaks arvasid autorid, et töötuse määr vähendab kulutusi riietele ja jalanõudele. Seda sellepärast, et kui pole töökohta, siis on palju väiksem võimalus endale riideid ja jalanõusid osta.
[( ) ( x m - ´x s x - x´ - m-1 s )] n'i=N [ ( ui ) - ( ui-1 ) ] ' ni=N p i t=(Xm- ´x )/sx x2 = 44,486 x2kr= 9,488 (tabelist) 2 2 Et hüpotees vastu võetmiseks peab kr > . Seega hüpoteesi vastu ei võeta ning saan järeldada, et üldkogumi jaotus ei ole normaaljaotus. 6. Konstrueerime samas teljestikus nõutud graafikud Empiiriline jaotus Vahemi pi(ni/n ni k ) 0-14 9 0,150 15-29 7 0,117 1 30-44 3 0,217 1 45-59 3 0,217 60-74 6 0,100 75-89 5 0,083 90-104 7 0,117
Smirnov (n > 2000) - Analyze -> Descriptive Statistics - > Explore -> Plots - Kui p > .05 siis on normaaljaotusega (st nullhüpotees on normaaljaotusega) - NB! kui asümmeetriakordaja (ingl. k. skewness) ja ekstsess (ingl. k. kurtosis) on vahemikus -1 kuni 1, siis võib pidada andmeid normaaljaotusele vastavaks ANOVA vs T-test - Esimest liiki viga tekib siis, kui võetakse vastu alternatiivne hüpotees, aga tegelikult on õige nullhüpotees (raske viga; näidatakse erinevuse või seose olemasolu, mida tegelikult pole). - Teist liiki viga tekib siis, kui jäädakse nullhüpoteesi juurde, ehkki tegelikult on õige alternatiivne hüpotees. See on kergem viga, mis tihti tähendab, et alternatiivse hüpoteesi tõestamiseks tuleb andmeid juurde koguda. - - Iga kord kui teete t-testi on I tüüpi vea tõenäosus 5 % (olulisusnivoo 0.05)
' ' x @ x @ x ' x 3 ehk ' x 6&3 ' x 3 ; x 3 x@x@x x3 ( x 4)2 ' (x @ x @ x @ x ) (x @ x @ x @ x ) ' x 8 ehk ( x 4 )2 ' x 4 @ 2'x 8 (xy)4 ' (xy) (xy) (xy) (xy) ' x @ y @ x @ y @ x @ y @ x @ y' x 4 y 4 Avaldises 5x2 on x muutuja 5 kordaja ehk koefitsient. Avaldist 5x2 nimetatakse üksliikmeks. Üksliige sisaldab kordajat ja üht või mitut muutujat. Näiteks 23 x 105 x 2 y 5 25 x 3 y z Üksliikmete liitmisel ja lahutamisel saame hulkliikme ehk polünoomi Näiteks 4x3 + 5x2 - 2x + 10; 15x4 - 3x2 + 2x - 3; x4 +1. Polünoomiks ehk hulkliikmeks nimetatakse järgmist avaldist an x n % an&1 x n&1 % ... % a1x % a0