Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Tõenäosusteooria ja statistika". Need materjalid aitavad sul teemat sügavamalt mõista.
valim, hüpotees, tudeng, tudengi, nullhüpotees, tudengid, populatsioon, lollid, jaotusfunktsioon, standardhälve, usaldusintervall, statistik, keskväärtus, omandab, poissoni, märt, testimine, teststatistik, tudengite, perekonnaseis, plot, binom, binoomjaotus, tihedusfunktsioon, jaotusfunktsiooni, standardviga, valimiks, ruutjuur, normaaljaotusMajandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi Assümeetria - Asümmeetria on jaotuskõvera maksimumi kõrvalekaldumine sümmeetriateljest. Kui jaotuskõvera maksimum (mood) on sümmeetriateljest (mediaan) paremal pool, on tegemist on negatiivse ehk vasakkaldelise asümmeetriaga. Kui maksimum on sümmeetriateljest vasakul, on tegemist positiivse ehk paremkaldelise asümmeetriaga
Statistika teooria I 1. Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare. Esitada definitsioonid ja osata antud andmeväärtuste puhul neid mõisteid rakendada N x + x 2 + ... + x N xi Aritmeetiline keskmine: µ = 1 = i =1 N N N-üldkogumi maht Aritmeetilise keskmise erijuht on kaalutud keskmine:
statistiline), mtteklassikalised(subjektiivne,intersubjektiivne) Juhuslikuks suuruseks nim suurust, mis järjekordse katse tulemusel omandab mingi mittennustatava väärtuse mingist võimalikust väärtuste hulgast. Diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik Pidev juhuslik suurus: võimelike väärtuste hulk on kontiinum Jaotusfunktsioon on tõenäosus, et juhusliku suuruse väärtus ei ületa funktsiooni argumenti. Jaotusfunktsioon peab rahuldama järgmisi tingimusi: monotoonsus (kui b>a, siis F(b)>F(a), normeeritus (x-lõpmatus korrral lim F(x)=0, xlõpmatus lim F(x)=1) Jaotustihedus on jaotusfunktsiooni tuletis. Arvkarakteristikud kujutavad endast mingeid jaotusseaduse järgi leitavad funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud,
.
Juhuslikuk suurus- suurust, mis järjekordse katse tulemusel omandab mingi mitteennustatava väärtus
mingist võimalikust väärtuste hulgast.
Juhusliku suuruse põhiliigid:
diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik või loenduv (nt variantide nr'id)
pidev juhuslik suurus: võimalike väärtuste hulk on pidev (nt mõõtetulemused pidevalt skaalalt)
Juhusliku suuruse omadused määrab (täielikult) tema jaotusseadus:
jaotusfunktsioon - tõenäosus, et juhuslik suurus väärtus ei ületa funktsiooni argumenti x: F(x) = P (X
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
Seda võib anda tabeline, funktsioonina, diagrammina või muul sarnasel viisil, mis määrab ära vastavuse juhusliku suuruse väärtuse ja selle omandamise tõenäosuse. 24. Kuidas on diskreetse juhusliku suuruse jaotus seotud sündmuse tõenäosusega? Diskreetse juhusliku suuruse jaotus määrab ära juhusliku suuruse ja selle omandamise tõenäosuse ning seega ka teatud sündmuste tõenäosuse saab jaotusest lihtsalt leida. 25. Mis on jaotusfunktsioon? Sõnasta korrektne definitsioon. Jaotusfunktsiooniks nimetatakse funktsiooni F(x), mis näitab tõenäosust, kus juhuslik F ( x i )=P ( X ≤ xi ) = ∑ p( x j) suurus on väiksem või võrdne x-i väärtusest. x ≤x j i 26. Kuidas leitakse diskreetsete juhuslike suuruste summa X+Y ja tema jaotus. Kahe määratud(on antud jaotus) juhusliku suuruse summaks X+Y loeme juhuslikku
objekti kohta mingi tõenäosuslik mudel, sh hinnates mudeli arvparameetreid ja kontrollides erinevaid hüpoteese objekti mudeli kohta. Mediaani hinnang: - kasvavalt järjestatud valimi keskelement (kui valimi maht on paaritu arv) - kasvavalt järjestatud valimi keskelementide poolsumma (kui valimi maht on paarisarv) Haare: valimi suurima ja vähima elemendi vahe Statistika põhiteoreem: Empiiriline jaotusfunktsioon FN(x) on teoreetilise (üldkogumi) jaotusfunktsiooni F(x) nihutamata ja mõjus hinnang. Histogramm: Histogramm on enimkasutatav (üldkogumi) jaotustiheduse hinnang. Histogrammi kasutatakse ettekujutuse saamiseks üldkogumi jaotusseadusest ning ta kujutab endast tulpdiagrammi, mille tulpade kõrgused näitavad vastavasse vahemikku sattumise sagedust. 2-jaotus on kasutusel normaaljaotusega juhusliku suuruse dispersiooni hinnangu jaoks usaldusvahemike arvutamisel.
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
)∫ = ∫ ( )= |+ ∫ = √2 D(X) = E(X ) – E (X) = σ + μ – μ2 = σ2 2 2 2 2 22. Olgu meil juhuslik suurus X normaaljaotusega. Olgu meil konstandid a b. Kuidas leida tõenäosust P ( a X b) ? P(a b) = F(b) F(a). Et juhusliku suuruse X jaotusfunktsioon F(x) defineeritakse kui tõenäosus, siis 0 ( ) 1 on tõene, kuna ( < )= ä (( < ) + ( )) = = ( < )+ ( < ) ( ) ( < )= ( < ) ( < )= ( ) ( ) => => { ( < ) ( < ) => ( )
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
väärtused, väiksematele X väärtustele vastavad suuremad Y väärtused) 16) Korrelatsioonikordaja selle arvutusvalem ja omadused: Korrelatsioonikordaja absoluutväärtus näitab lineaarse seose tugevust ja märk näitab seose suunda: positiivne või negatiivne. Omadused – Absoluutväärtuse maksimaalne suurus 1 Valem – r_xy=xy/(x*y) 17) Hüpoteesi kontrollimine korrelatsioonikordaja olulisuse kohta: nullhüpotees ja sisukas hüpotees: 18) Regressioonanalüüs ja regressioonmudeli komponendid: Uurib suuruste vahelist sõltuvust ja võimalusi selle funktsionaalseks kirjeldamiseks etteantud valemi põhjal. Regressioonanalüüsi käigus leitakse deterministlik komponent --> leitakse vastava matemaatilise funktsiooni parameetrite hinnangud. Komponendid – y= deterministlik komponent + juhuslik komponent, y = ax + b +u; Tinglik keskväärtus on deterministlik komponent y=E[Y X] + u
· 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks). · Hüpoteeside kontrollimine: nullhüpotees, sisukas hüpotees, Listra, E. Ökonomeetria. Aegread. kriitiline väärtus, olulisuse tõenäosus. Sauga, A. Statistika õpik majanduseriala üliõpilastele. · Kovariatsioon cov(x,y) ja korrelatsioonikordaja r (x,y) TTÜ Kirjastus, Tallinn, 2017. (Statistika kordamiseks) · Regressioon. Kordamiseks võib kasutada õpikut Sauga, A.
Määramisviisid: A)klassikalised (kombinatoorne, geomeetriline, statistiline) B) mitteklassikalised (subjektiivne/intersubjektiivne, kuuluvusfunkts väärtus..) Juh. Su suurus, mis järjekordse katse tulemusel omandab mingi mitteennustatava väärtuse mingist võimalikust väärtuste hulgast. Liigid: diskreetne ( võimalike väärtuste hulk lõplik/loenduv, , tingimused: mittenegatiivsus, normeeritus) ja pidev (kontiinum) Jaotusseadus- määrab täielikult juh. Su. Omadused (2 kuju: jaotusfunktsioon ja jaotustihedus) Jaotusfunkts- def tõenäosusena, et juh. Su. Väärtus ei ületa funkts argumenti x. Tingimused: monotoonsus, normeeritud. Jaotustih- jaotusfunkts tuletis Arvkarakteristikud- jaotusseaduse järgi leitavad funktsionaalid, millega opereerimine lihtsam (infokadu) Keskväärtus enimkasut, iseloom.juh.su. jaotuse keskkoha/tsentri asukohta Dispersioon ja standardhälve enimkasut hajuvuse iseloomust, seotud, standardhdispersiooni ruutjuur Kvantiilid- juh.su
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
maht ja k mudeli parameetrite arv) ja olulisuse nivool a2, siis saab vastu võtta sisuka (alternatiivse hüpoteesi) H1, mille kohaselt parameetri hinnang erineb statistiliselt oluliselt nullist (või cst). Kui hüpoteesi H1 vastu võtta ei saa (jäädakse 0hüpoteesi juurde), siis etteantud olulisuse nivool puudub statistiliselt oluline seos muutujate Y ja X vahel . 38. Standardhälve so ruutjuur dispersioonist. Mida suurem on standardhälve, seda suurem on tunnuse kui juhusliku suuruse hajuvus. Seda suurem on tunnuse erinevus keskväärtusest. 39. Statistilistel seostel baseeruv modelleerimine, hõlmab üldiselt üksikule lähenemist. Lähenemine kehtib aegridade jaoks. Teooriat ei püüta ümber lükata, vaid analüüsitakse teooria ja andmete kooskõla. 40. Tjaotus, lk 2728. Üks kasutatavamaid jaotusi
Aritmeetiline 1) Rühmitamata andmed 2) i =1 Rühmitatud andmed x 1 k 1 n x = f x , kus n = k f i , k rühmade arv, x -klassi esindaja n i =1 i i i x = x i=1 n i =1 i (keskpunkt), 43. Juhusliku suuruse hajuvuse mõõte (dispersioon, standardhälve, variatsiooniulatus, variatsioonikordaja). DispersioonDX = E( X - EX )2 Standardhälve = DX [ - sigma] Mõõtmistulemuste jaoks kasutame tähiseid s2 ja s: 1) Rühmitamata 2) Rühmitatud n 1 2 1 k 2 2 s = 2s = f ( x - x) ( xi - x) n - 1 i i
Tuleb püstitada uurimisküsimused: mida ja kelle käest tahan teada saada; millistele küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2
mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud
valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X).
kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle
tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima
väärtuse vahel
dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2=
standardhälve - Standardhälve on ruutjuur dispersioonist
7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
x vastavusse tõenäosuse, et Xx. Tähistame F-ga
F(x )=P(Xx ) tõenäosus, et JS kuulub paljude väärtuste korral
0 0
teatavasse piirkonda P(a
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
d.ii. Levimus ajaperioodil võtab arvesse juhud, mis on olemas vaadeldava ajaperioodi alguses, ja samuti juhud, mis lisanduvad vaadeldava ajaperioodi jooksul. e. Haigestumus = TEKKESAGEDUS. näitab uute juhtude tekkimist populatsioonis kindlaksmääratud ajaperioodil (uute leeprahaigete arv Malawis, kes reg ajavahemikul 01.01-31.12.96) e.i. Levimus ja haigestumus vajavad, et oleks määratletud: juht, populatsioon, ajaraamistik:ajahetk(levimuse korral) ja ajaperiood(haigestumuse korral) e.ii. Haigestumusrisk uute juhtude osakaal, mis tek esialgselt tulemivabas (mittejuhtudest koosnevas) populatsioonis kindlaksmääratud ajavahemiku jooksul. Nt populatsioonis x diagnoositi 6 uut insuliinisõltuva diabeedi juhtu 100000 in kohta vahemikus 1.01-31.12.97. Loendab uusi haigusjuhte populatsioonis kindla
31. Tõenäosusteooria ja matemaatiline statistika kui teineteise pöördteadused. Demonstreerida seda ühe näite abil matemaatiline statistika Jaotused Andmed tõenäosusteooria …. II osa Matemaatiline statistika 1. Klassikalise statistika eeldused. Nende eelduste rikutus Klassikalise statistika eeldused: a. Üldkogum on lõpmatu ja valim on selle lõplik alamhulk; |u| = n – valimi maht b. Valimisse kaasamine on sõltumatu, st valik on tagasipanekuga. Igal valimi elemendil on valimisse kaasamise tõenäosus 1/n. c. Parameetrilisuse eeldus. Valimi elemendil Xi = F(Θ); Θ = (Θ1, Θ2, …, Θk). Jaotus on teada. Meie ülesanne on hinnata parameetreid Θj; j=1,2,…,k. 2. Statistiku definitsioon. Hinnangu nihketus ja mõjusus
Ordinary Least Squares hindamismeetodid Valim ( xi , yi ) i = 1,..., n Silutud väärtused y^ i = ax ^ i + b^ · Vähimruutude meetod: Silutud väärtuste y^ i erinevus vaatlusandmetest yi on hälbed ehk jäägid kõige tuntum;
väärtused (üle 2) Praks 3- Kirjeldav statistika. Arvkarakteristikute leidmine funktsioonide ja protseduuri Descriptive Statistics abil. Usalduspiirid (protseduur Descriptive Statistics) Vaatluste arv- f- Statistical- Count Keskmine väärtus - =AVERAGE(Alguskoordinaat:Lõppkoordinaat) Mediaan - =MEDIAN(Alguskoordinaat:Lõppkoordinaat) Standardhälve - = STDEV.S (Alguskoordinaat:Lõppkoordinaat) Minimaalne väärtus - =MIN(Alguskoordinaat:Lõppkoordinaat) Maksimaalne väärtus - =MAX(Alguskoordinaat:Lõppkoordinaat) Standardviga =Sthälve/SQRT(vaatluste arv) Lisage andmetabelisse kehamassi veeru järele tühi veerg, kirjutage esimesse lahtrisse tunnuse nimeks 'KMI' (kehamassiindeks) ja arvutage selle väärtused kõigile tudengitele valemiga KMI = Kehamass, kg / (Pikkus, m)2.
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24 Kriitiline t-statistiku väärtus t0.95(24) = 1.711 Kuna t < , siis võtame hüpoteesi H0 vastu. 3.2. H0: 2 = 800; H1: 2 800 Kontrollimiseks kasutame 2-statistikut: Kriitilised väärtused: 20.05(24) = 13.848 20.95(24) = 36.415 Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 21-40, 41- 60, 61-80 ja 81-100 ning kontrollida 2- testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese. Intervalli Vahemi element tõenäosus intervalli nr k e pi* keskmine k ni xi
Binoomjaotus: DJS jaotus, mille korral jaotustabel defineeritakse valemiga (Bernoulli valem) P ( X = k ) = C nk p k (1 - p ) n-k , k=0,1,...,n. Juhuslik suurus X on sündmuse A toimumiste arv n sõltumatul katsel, kui sündmuse toimumise tõenäosus igal katsel on p. Sündmuse mittetoimumise tõenäosus igal katsel on siis q=1-p. Binoomjaotusega on näiteks praakdetailide arv korduval võtmisel, läbipõlevate pirnide arv. Keskväärtus: EX=np, dispersioon DX=npq, standardhälve npq Poisson'i jaotus: DJS jaotus, mille korral jaotustabel defineeritakse valemiga k - P( X = k ) = e , k=0,1,... k! Sarnaselt binoomjaotusele juhuslik suurus tekib n katsel toimuvast k sündmusest, lisaks n ja p0. Näiteks kirjavigade arv masinakirjutajal/sekretäril. Rikete arv seadmes. Tööõnnetuste arv. Keskväärtus: EX= , dispersioon DX= . Poissoni piirteoreem: kui katste arv n ja p0 nii, et np= , siis koondub k -
kaalutud aritmeetiline keskmine, mediaan keskmise hinnaga, keskmine hind, arvukogumis, geomeetriline keskmine, harmooniline, aritmeetline mood, mediaan, harmooniline, aritmeetiline aritmeetiline, geomeetriline, harmooniline, mediaan Test 3 asümmeetriakordaja, püstakus, järku keskmoment, algmoment, tingmoment 1. 50 2. 65 3. 65 4. 90 5. 40 6. 70 kvartiilihaare, variatsiooniamplituud 3. 30 4. 10 5. 55,6 intervallskaala, standardhälve, püstakus kordaja, ekstsess järjestusskaala, mood, kvartiilhaare, standardhälbe valem, standardhälve tsebõsovi võrratus, variatsioonikoefitsient indeksid, kvantitatiivne, kvalitatiivne, alusindeks, lihtindeks, individuaalindeks ühismõõdustamine agregeerimine, ahelindeks alusindeks alusindeks ahelindeks ahelindeks teguriindeks, hindade muutumisest põhjustatud käibe muutus indeksanalüüs muutuva struktuuri indeks, püsiva struktuuri indeks
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Valim mahuga N = 25 jrk ni xi ni * xi ni * 2088, 1 1 2 2 2089,25 49 1909, 2 1 4 4 1910,42 69 1656, 3 1 7 7 1657,17 49 1576, 4 1 8 8 1576,75 09
0.01 Normaaljaotuse Jaotustihedus histogramm Normaaljaotuse jaotustihedus 0.01 0.01 0 Ühtlase jaotuse jaotustihedus 0 0 Valimi vahemikud 7 6. 6.1 Empiiriline jaotusfunktsioon xmin=1 xmax=98 { 0, x < x min F N ( x )= i , x i x < x i+1 N 1, x x max 6.2 Ühtlase jaotuse jaotusfunktsioon a=0 b=100 { 0, x b 8 Joonis 3. Jaotusfunktsioonid 1
R= 99 - 0 = 99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 Dispersiooni usaldusvahemik: = 0,10 ja (leidsin need Exceli CHIINV funktsiooni abil) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,645. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 26,038< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese intervalli tõenäosu
2kr = 20,90(4) = 7,779 Kuna 2 < 2kr, siis võtame hüpoteesi H0 vastu. 5. Graafikud tõin välja punktis 4. 6. Empiirilise jaotusfunktsiooni F(x) ja üthlase jaotusfunktsiooni graafikud 7. Kontrollida Kolmogorovi-Smirnovi testi abil hüpoteesi, et põhikogumi jaotuseks on fikseeritud parameetritega a = 0, b = 100 ühtlane jaotus (võttes = 0,10, st testi statistiku DN kriitiliseks väärtuseks on Dkr = 0,238). Arvutame DN järgmise valemi abil: F0 ühtlase jaotuse jaotusfunktsioon x(i) punktis 1 moodustatud variatsioonirida DN = 0,2 Kuna DN < Dkr, siis võtame nullhüpoteesi vastu 8. Moodustada valimist kolm alamvalimit/osa, igaüks mahuga neli arvu (võttes osaks/rühmaks 1.-4.arvu, 11.-14.arvu ja 21.-24.arvu). Kontrollida nii moodustatud rühmade keskväärtuste homogeensushüpoteesi H0: 1 = 2 = 3 (kasutades dispersioonanaluusi metoodikat ja vottes olulisuse nivooks = 0,05).