Leidsid 33 sarnast õppematerjali, mis on seotud failiga "ÜLEVAADE TÕENÄOSUSTEOORIA PÕHIMÕISTETEST". Need materjalid aitavad sul teemat sügavamalt mõista.
hüpotees, valim, normaaljaotus, keskväärtus, statistik, nullhüpotees, korrelatsioon, arvkarakteristik, ruutu, elementaarsündmus, jaotusfunktsioon, sõltuvus, usaldusvahemik, kvantiil, jaotustihedus, hajuvus, vektor, sisend, diskreetne, lõpmatus, standardhälve, histogramm, ruutude, teststatistik, seeria, jaotusfunktsiooni, juhuslikud, regressioonSeega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud
pöördseoseid. Suurima tõepära meetod: Meetodi aluseks on põhimõte leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise tõenäosus. Vähimruutude meetod: Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel (nt regressioonanalüüsis). Nullhüpotees- kontrollitav väide Alternatiivhüpotees- nullhüpoteesi välistav alternatiivne väide Statistiline hüpotees tekib tavaliselt mingi vaadeldava juhusliku suuruse kohta käiva väite (oletuse, hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea tõenäosust tähistatakse ); teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks (võetakse vastu) (sellise vea tõenäosust tähistatakse ). Hüpoteeside kontrolli tavapärased sammud on järgmised:
Pidev suurus - väärtused täidavad mingi vahemiku täielikult ära Jaotusseadus - Diskreetse juhusliku suuruse X jaotusseaduseks nimetatakse vastavust suuruse kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest
3) Normaal- olulisim, ka Gaussi jaotus, seotud keskse piirteoreemiga: suvalise ühtmoodi jaotunud sõltumatute juh.su. summa v keskv jaotus läheneb liidetavate arvu kasvades norm.jaotusele. aspektid: 1)pole vaja suurt liidet. Arvu 2) lubatav mõningane vastastikune sõltuvus 3)normjaotusega liidetavate summa on normajaotus ERIJUHT: keskv=0, standrdh= 1, normeeritud normjaotus. ,,k-sigma reegel" näitab, kui suur on juh.su. P normajaotuse korral sattuda piirkonda keskväärtus + - k standardhälvet. 4)Lognormaalne: kui juh.su. logaritm on jaotunud normaaljaotuse kohaselt. Kui Y on norm.jaotuse järgi, siis X=exp Y on lognormaalse järgi. Juh. Vektor vektor, mille komponentideks juh.su. Olulised aspektid:komponentide arv ja vastastikune sõltuvus ning jaotusseadus Diskr 2-komp vektor jaotus antakse 2mõõtmelise jaotustabelina v valemina Pidev x ja y funktsioon, saab esitada jaotusfunkts v tihedus Marginaaljaotus 1 komp jaotus nö eraldi vaadatuna
p(zk)= p(xi) p(yj). Sõltuvate juhuslike suuruste puhul peab arvestama tinglikke tõenäosusi. 28. Mis on juhusliku suuruse mood? Diskreetse juhusliku suuruse moodiks nimetame juhusliku suuruse kõige suurema p ( xmo ) =max p(x i) tõenäosusega esinevat väärtust.Seega väärtus xmo on mood, kui x i. Vastavalt kas on üks või mitu moodi, on unimodaalne või multimodaalne. 29. Mis on juhusliku suuruse keskväärtus? Diskreetse juhusliku suuruse keskväärtuseks EX nimetatakse matemaatilist ootust ehk EX= ∑ x i p (x i) ooteväärtuseks ehk arvu x ∈X i 30. Keskväärtuse omadused. Ec=c; E(cX)=cEX; E(X+Y)=EX+EY; E(X-Y)=EX-EY; sõltumatute juhuslike suuruste korral ka E(XY)=EXEY 31. Mis on dispersioon? Diskreetse juhusliku suuruse dispersiooniks DX nimetatakse hälbe ruudu keskväärtust keskväärtuse suhtes ehk arvu DX=E(X-EX)2
Majandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
Tunnused: 1)0 <= F(x) <=1 2)F(x)kasvab;3)F(+lõpmatus)=1 Juhuslik suurus võib alluda binoomjaotusele, Poissoni jaotusele. Pidev juhuslik suurus omandab iga väärtuse tõenäosusega 0. Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon = ( | ( ) = ) = ( = ); pi ≥ 0; ∑pi=1 Omavahelised seosed: Ω X P R [0;1] D 9. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust DEF:kindlat suurust EX = ∫ ( ) nim juhusliku suuruse X keskväärtuseks. Seega juhusliku suuruse X keskväärtus EX kui kindel suurus on arv. Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
standardvead ei ole korrektsed ja seega ei ole korrektsed ka parameetrite hinnangute usaldusvahemikud. Fkriteeriumi hinnang ei pruugi olla õige; c) mudel võib viia uurija valedele järeldustele, kui tegemist on statistiliste hüpoteeside kontrollimisega. Kasutatakse graafilist analüüsi. Juhuslik liige ehk jääkliige ui on juhuslik suurus, mille keskväärtus ehk matemaatiline ootus on võrdne nulliga. E (ui) = 0. Kui juhuslike liikmete dispersioon pole konstantne ning tema jaotus oleneb Xst, on tegemist heteroskedestatiivsusega. Parki test kui sõltumatute muutujate ln(Xi) vastava regressioonikordaja hinnang a1 on statistiliselt olulisel määral erinev nullist, siis esialgses mudelis on heteroskedestatiivsus. 11
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
Juhusliku suuruse X väärtused x1 x2 ... xn
Väärtuste ilmumise tõenäosused f(x1) f(x2) ... f(xn) f (x ) = 1
i
Diskreetse juhusliku suuruse jaotusfunktsioon F(x)=P(X
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
Enne katse toimumist on tundmata. Üldjuhul tähistatakse X. Diskreetne juhuslik suurus on juhuslik suurus, mille väärtuste hulk on lõplik või loenduv. Praktiliselt vaatleme ainult selliseid DJS, mille võimalikud väärtused on 0, 1, 2, ... või alamhulk eelnevast. DJS jaotusseadus on eeskiri, mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X). kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima väärtuse vahel dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2= standardhälve - Standardhälve on ruutjuur dispersioonist 7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
2 Vahemikku sattumise tõenäosus 0.15 0.1 0.05 0 0-20 21-40 41-60 61-80 81-100 Valimi vahemikud Normaaljaotus x ¿0=0, x¿1 =20, x ¿2=40, x ¿3=60, x ¿4=80, x ¿5=100 ´x =45 s=34 ¿ ¿ xm -´x ¿ ¿ ¿ ¿ ¿ ¿ t m= t 0=- , t 1=-0,75, t 2 =-0,15,t 3=0,44, t 4=1,02, t 5 =+ s 0 ( t ¿0 )=1-1=0, 0 ( t ¿1 )=1-0,77=0,23, 0 ( t ¿2 ) =1-0,56=0,44, 0 ( t ¿3 )=0,67, 0 ( t ¿4 ) =0,85, 0 ( t ¿5 )=1 ~ p m= 0 ( t ¿m ) -0 ( t ¿m-1 ) ~ p1=0,23, ~
Tõenäosus, et
juhuslik suurus satub vahemikku x...x+x:
p(x < X < x+x) = F(x+x) F(x).
Jagame selle tõenäosuse vahemiku pikkusega x ja ja lähendame x nullile. Jaotusfunktsiooni tuletist
nimetatakse jaotustiheduseks ja tähistatakse f(x). Juhusliku suuruse mingisse vahemikku sattumise
tõenäosus leitakse f(x) abil nii:
p( < X < ) = f(x)dx
Juhuslikue suuruste arvkarakteristikud:
Asendikarakteristikud : matemaatiline ootus ehk keskväärtus
diskreetsel suurusel: mx=E[X] = M[X] = i=1nxipi
pideval suurusel : E[X] = -x*f(x)dx
Keskväärtus ja mood ;
Mediaan juhusliku suuruse mediaan on tema väärtus Me, mille puhul p(X
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1 8 8 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24 Kriitiline t-statistiku väärtus t0.95(24) = 1.711 Kuna t < , siis võtame hüpoteesi H0 vastu. 3.2. H0: 2 = 800; H1: 2 800 Kontrollimiseks kasutame 2-statistikut: Kriitilised väärtused: 20.05(24) = 13.848 20.95(24) = 36.415 Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 21-40, 41- 60, 61-80 ja 81-100 ning kontrollida 2- testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese. Intervalli Vahemi element tõenäosus intervalli nr k e pi* keskmine k ni xi
· Mõõteskaalad, keskmised (aritmeetiline, mediaan, mood), · Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks)
P ( 572, 0 < 2 < 1504, 2 ) = 0,90 3. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10, kontrollin järgmisi hüpoteese: 3.1 H0: = 50 alternatiiviga H1: 50 x-µ 46, 2 - 50 t= N = 25 = 0, 64 s 29, 46 tkr = 1, 71 - leitud tabelist. t > t1- ( f ) Kriitiline piirkond avaldub: 2 0,64<1,71 ja nullhüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H1: 2 800 ( N - 1) s 2 24 867,9 2 = = = 26, 04 2 800 Kriitilised piirkonnad leian tabelist. 2 ( f ) = 13,848 2 2 1- 2 ( f ) = 36, 415 13,848<26,04<36,415 ja nullhüpotees võetakse vastu. 4. Leian valimile vastava empiirilise histogrammi
Xi; A∈ F. Juhusliku suuruse X jaotuseks nimetatakse funktsiooni D: R → [0;1] selliselt, et D(X(A)) = P(A) Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon pi=P ( ω| X ( ω ) =xi ) =P( X =x i) ; pi ≥ 0; ∑pi = 1 Omavahelised seosed: Ω X P [0; R 1] D 8. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c E(c) = cP(X=c) = c d. Keskväärtus on adiktiivne. Olgu juhuslikud suurused X ja Y, siis
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Andmete kood: 248199 Osa A 1. Keskväärtus Dispersioon Standardhälve Mediaan Haare 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks leian usaldus- vahemikud. Keskväärtuse usaldusvahemik on arvutatud MS Exceli TINV-funktsiooniga: Dispersiooni usaldusvahemik ja on arvutatud MS Exceli CHIINV-funktsiooniga 3. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks kontrollin hüpoteese 3.1 alternatiiviga
R= 99 - 0 = 99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 Dispersiooni usaldusvahemik: = 0,10 ja (leidsin need Exceli CHIINV funktsiooni abil) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,645. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 26,038< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese intervalli tõenäosu
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 69 10 76 79 84 41 15 87 44 49 38 16 58 7 24 19 82 1 40 38 35 87 51 1 69 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 44,80 Dispersioon: Excel: VAR Sx² = 814,417 Standardhälve: Excel: STDEV Sx = 28,538 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral
f(x) = lim P(xXx+x) / x; F(x) = f(x) dx x0 f(x) 0; f ( x ) dx 1 7. Binomiaalne jaotus. PXn =m= Cmn pmqn-m , kus P( F) = 1- p = q ja m = 0, 1, ...., n Sündmuste järgnevus ei= A F A F A, tagasipanekuga skeem 8. Hüpergeomeetriline jaotus PN,M n, m = CmM Cn-mN-M / CnN. Tagasipanekuta skeem 9. Poisson jaotus Pt(X=x) = (axe-a) / x! = fP(x,a) 10. Ühtlane (ristkülik) jaotus f(x) = 1/(b-a)}, kui a x b 11. Normaaljaotus. Normeeritud normaaljaotus 1 1 e x a ; a 0; 1 2 / 2 2 2 f ( x) ( x) ex /2 2 2 12. Eksponentsiaalne jaotus. (Töö)kindlusfunktsioon f(x) =e-x kui x 0. R(t) = e-t 13. Gammajaotus. Beetajaotus. Logaritmiline jaotus
juhusliku suuruse kõikvõimalikud väärtused ja nende omandamise tõenäosused. 14. Juhusliku suuruse keskväärtuse ja dispersiooni omadused. Juhusliku suuruse keskväärtuseks (matemaatiliseks ootuseks) nimetatakse arvu, mis on määratud eeskirjaga Keskväärtuse omadused: Olgu a ja b suvalised konstandid, siis E(aX+b)= aEX+b. Olgu X ja Y suvalised juhuslikud suurused, siis E(X+Y) = EX+EY. Dispersioon on juhusliku suuruse keskväärtuse suhtes arvutatud hälbe ruudu keskväärtus. See on arv, mis kirjeldab juhusliku suuruse hajutatust tema keskväärtuse suhtes. Dispersiooni omadused: Konstandi dispersioon on null. D(aX + b) = a2DX 15. Binoom-, Poissoni-, ühtlase- ja normaaljaotuse keskväärtused ja dispersioonid. Katsetes esineb kahesuse element, kus tulemuseks on soodsatest sündmustest moodustuv diskreetne tõenäosusjaotus, mida nim binoomjaotuseks . Keskväärtus ja dispersioon
Xxxxx xxxxx xxxx MHT 0031 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. 1) Keskväärtus =46,20 2)Dispersioon =867,92 3)Standardhäve =29,46 4)Mediaan Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 5)Haare
Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1 Jaotusfunktsiooni abil on raske otsustada juhusliku suuruse käitumise üle mingi punkti ümbruses. Seetõttu kasutatakse lisaks jaotusfunktsioonile ka sellest tuletatud tihedusfunktsiooni. 2 4. Populatsioon ja valim, standardviga Populatsioon on kõigi objektide, isendite, esemete, nähtuste või seisundite kogum, mille kohta soovitakse järeldusi teha Populatsiooni neid objekte, mida on vaadeldud või uurimiseks välja valitud, kutsutakse valimiks Valimit, kus uuritava tunnuse jaotus on samasugune kui populatsioonis, nimetatakse esindavaks valimiks Standardhälve- ruutjuur dispersioonist (dispersioon pt.2)
4. Konstrueerime valimi histogrammi Vahemikud: 0-20, 20-40, 40-60, 60-80, 80-100 (konstrueerides võtan nii, et ülemine piir kuulub vahemikku, aga alumine mitte) m nm pm 0-20 6 0,24 20-40 5 0,2 40-60 8 0,32 60-80 4 0,16 80-100 2 0,08 Nüüd kontrollime kolme hüpoteesi põhikogumi jaotuse kohta Pearsoni 2 - testi abil; usaldusnivooks kasutame = 0.10 4.1 H0: põhikogumi jaotus on normaaljaotus (parameetrid ja peab hindama valimi põhjal); H1: põhikogumi jaotus ei ole normaaljaotus. Kuna jaotuse parameetrid on juba hinnatud punktis 1 (oletades et tegu on normaaljaotusega), siis saame kohe määrata intervalidesse sattumise teoreetilised tõenäosused. t F(x) (x) 20 -0,93 0,18 0,18 40 -0,16 0,44 0,26 60 0,61 0,73 0,29 80 1,38 0,92 0,19 100 2,15 0,98 0,07
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
= 0,10 t0,1; 24= 1,711 (Studenti tabelist) (Arvutatud excelis väärtuste ümardusi rakendamata) Usaldusvahemiku poollaius: 11,2 Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 1,28. Hüpotees H0 võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees H0 vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 32,18< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese