Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Rakendusstatistika arvestustöö lühikokkovõte". Need materjalid aitavad sul teemat sügavamalt mõista.
valim, disper, hüpotees, ting, normaal, keskväärtus, sõltuvus, jaotusfunktsioon, jaotustihedus, hajuvuse, kvantiilkstsess, liidetavate, vektor, vastandsündmus, tinglik, standardhälve, asümmeetriarijuht, tõenäosuslik, kovariatsioon, korrelatsioon, jaotusfunktsiooni, histogramm, teststatistik, pearson, lähtepunkt, tehted, ühisosa, mõõduksstatistiline), mtteklassikalised(subjektiivne,intersubjektiivne) Juhuslikuks suuruseks nim suurust, mis järjekordse katse tulemusel omandab mingi mittennustatava väärtuse mingist võimalikust väärtuste hulgast. Diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik Pidev juhuslik suurus: võimelike väärtuste hulk on kontiinum Jaotusfunktsioon on tõenäosus, et juhusliku suuruse väärtus ei ületa funktsiooni argumenti. Jaotusfunktsioon peab rahuldama järgmisi tingimusi: monotoonsus (kui b>a, siis F(b)>F(a), normeeritus (x-lõpmatus korrral lim F(x)=0, xlõpmatus lim F(x)=1) Jaotustihedus on jaotusfunktsiooni tuletis. Arvkarakteristikud kujutavad endast mingeid jaotusseaduse järgi leitavad funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud,
.
Juhuslikuk suurus- suurust, mis järjekordse katse tulemusel omandab mingi mitteennustatava väärtus
mingist võimalikust väärtuste hulgast.
Juhusliku suuruse põhiliigid:
diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik või loenduv (nt variantide nr'id)
pidev juhuslik suurus: võimalike väärtuste hulk on pidev (nt mõõtetulemused pidevalt skaalalt)
Juhusliku suuruse omadused määrab (täielikult) tema jaotusseadus:
jaotusfunktsioon - tõenäosus, et juhuslik suurus väärtus ei ületa funktsiooni argumenti x: F(x) = P (X
objekti kohta mingi tõenäosuslik mudel, sh hinnates mudeli arvparameetreid ja kontrollides erinevaid hüpoteese objekti mudeli kohta. Mediaani hinnang: - kasvavalt järjestatud valimi keskelement (kui valimi maht on paaritu arv) - kasvavalt järjestatud valimi keskelementide poolsumma (kui valimi maht on paarisarv) Haare: valimi suurima ja vähima elemendi vahe Statistika põhiteoreem: Empiiriline jaotusfunktsioon FN(x) on teoreetilise (üldkogumi) jaotusfunktsiooni F(x) nihutamata ja mõjus hinnang. Histogramm: Histogramm on enimkasutatav (üldkogumi) jaotustiheduse hinnang. Histogrammi kasutatakse ettekujutuse saamiseks üldkogumi jaotusseadusest ning ta kujutab endast tulpdiagrammi, mille tulpade kõrgused näitavad vastavasse vahemikku sattumise sagedust. 2-jaotus on kasutusel normaaljaotusega juhusliku suuruse dispersiooni hinnangu jaoks usaldusvahemike arvutamisel.
Pidev suurus - väärtused täidavad mingi vahemiku täielikult ära Jaotusseadus - Diskreetse juhusliku suuruse X jaotusseaduseks nimetatakse vastavust suuruse kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest
· Mõõteskaalad, keskmised (aritmeetiline, mediaan, mood), · Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks)
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
Majandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
Enne katse toimumist on tundmata. Üldjuhul tähistatakse X. Diskreetne juhuslik suurus on juhuslik suurus, mille väärtuste hulk on lõplik või loenduv. Praktiliselt vaatleme ainult selliseid DJS, mille võimalikud väärtused on 0, 1, 2, ... või alamhulk eelnevast. DJS jaotusseadus on eeskiri, mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X). kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima väärtuse vahel dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2= standardhälve - Standardhälve on ruutjuur dispersioonist 7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
Seda võib anda tabeline, funktsioonina, diagrammina või muul sarnasel viisil, mis määrab ära vastavuse juhusliku suuruse väärtuse ja selle omandamise tõenäosuse. 24. Kuidas on diskreetse juhusliku suuruse jaotus seotud sündmuse tõenäosusega? Diskreetse juhusliku suuruse jaotus määrab ära juhusliku suuruse ja selle omandamise tõenäosuse ning seega ka teatud sündmuste tõenäosuse saab jaotusest lihtsalt leida. 25. Mis on jaotusfunktsioon? Sõnasta korrektne definitsioon. Jaotusfunktsiooniks nimetatakse funktsiooni F(x), mis näitab tõenäosust, kus juhuslik F ( x i )=P ( X ≤ xi ) = ∑ p( x j) suurus on väiksem või võrdne x-i väärtusest. x ≤x j i 26. Kuidas leitakse diskreetsete juhuslike suuruste summa X+Y ja tema jaotus. Kahe määratud(on antud jaotus) juhusliku suuruse summaks X+Y loeme juhuslikku
mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang Hinnangu nihe võrdub parameetri hinnangu keskväärtuse ning parameetri tegeliku väärtuse vahega. Iseloomustab süstemaatilist viga. Nihketa hinnang – Parameetri hinnang on nihketa kui hinnangu keskväärtus võrdub parameetri tegeliku väärtusega. 8) Hinnangu efektiivsus, efektiivne hinnang: Hinnangu efektiivsus – Parameetri nihketa hinnang, kus dispersioon on väiksem on efektiivseim. Kasutatakse hinnangute võrdlemisel. Efektiivne hinnang – nihketa vähima dispersiooniga hinnang kõigi nihketa hinnangute seas. Iseloomustab hinnangute hajuvust. 9) Mõjus hinnang- Hinnang on mõjus, kui ta koondub tõenäosuse järgi parameetri tegelikuks väärtuseks
3) P(x1 X < x2) = F(x2) - F(x1)
Omadusest 1: F(x2) = P(X
Kui autok. Esineb, tuleb mudel ümber vaadata, tuleb muuta spetsifikatsiooni. 2. Asümptootilised hinnangud kui juhuslike vigade normaaljaotuse eeldus ei ole täidetud, siis usalduspiirid on asümptootilised. Nad on täpsed siis, kui valimi maht on lõpmatu; lõpliku valimi mahu korral usalduspiirid on ligikaudsed. 3. Determinatsioonikordaja (D=R²) väljendab regressioonimudeli poolt kirjeldatud hajuvuse suhet (ESS explained sum of squares) modelleeritava näitaja (endogeense muutuja) koguhajuvusse (TSS total sum of squares). 4. Dispersioon iseloomustab juhusliku suuruse Xi erinevust keskväärtusest, seega iseloomustab tunnuse hajuvust. Valimi dispersiooni kui üldkogumi dispersiooni hinnangu tähiseks on tavaliselt Sruut, üldkogumi dispersiooni tähiseks ruut (kasutatakse teisi tähiseid
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1 8 8 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
Tingimuslik tõenäosus. Bayes'i valem 0 P(A) 1; P(AB) = P(A) + P(B), AB= või U. Tingimuslik tõenäosus tõenäosus sündmusele A kui toimus sündmus B - P(A/B) = P(AB) / P(B) 2. Sündmus ja vastandsündmus. Sõltuvad ja mittesõltuvad sündmused. Sündmuste väli P(A/B) = P(A), P(AB) = P(A)P(B) 3. Sündmuste algebralised operatsioonid. Sündmuste summa ja korrutis. C = F D> C =F D> F> 4. Juhuslik suurus X = X(e) 5. Jaotusseadus ja selle esitamine. Jaotusfunktsioon F(x) ja tema põhiomadused. Väärtus x ja tema tõenäosus p. F(x) juhuslikule suurusele X on tõenäosus, et X võtab väärtuse vähem kui antud arvul x. F(x) = P(Xx). P(x´ X x´´) = F(x´´) - F(x´); 0 F(x) 1; F(x1) F(x2) 6. Tõenäosuse tihedusfunktsioon f(x) ja tema põhiomadused. f(x) = lim P(xXx+x) / x; F(x) = f(x) dx x0 f(x) 0; f ( x ) dx 1 7. Binomiaalne jaotus.
Tunnused: 1)0 <= F(x) <=1 2)F(x)kasvab;3)F(+lõpmatus)=1 Juhuslik suurus võib alluda binoomjaotusele, Poissoni jaotusele. Pidev juhuslik suurus omandab iga väärtuse tõenäosusega 0. Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon = ( | ( ) = ) = ( = ); pi ≥ 0; ∑pi=1 Omavahelised seosed: Ω X P R [0;1] D 9. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust DEF:kindlat suurust EX = ∫ ( ) nim juhusliku suuruse X keskväärtuseks. Seega juhusliku suuruse X keskväärtus EX kui kindel suurus on arv. Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c
rühmitades võimalikud väärtused klassidesse. Näiteks kaalukategooriad maadlusvõistlustel. Tulemuste statistilise töötlemisvõimaluste laiendamise huvides kasutatakse ka ordinaalskaala kodeerimist arvuliseks (kvantitatiivseks) tunnuseks (näiteks keskmise hinde leidmiseks). Nii saadud statistiliste tulemuste tõlgendamisel tuleb olla ettevaatlik (ei või näiteks väita, et keskmine hinne 4,0 on kaks korda parem kui 2,0). Üldkogum ja valim Üldkogum on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi. Valim on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Nõuded valimile: 1. Valimi maht peab olema küllalt suur. 2. igal üldkogumi indiviidil peab olema võrdne võimalus sattuda valimisse. Neid kaht nõuet rahuldavat valimit nimetatakse representatiivseks e. esindavaks.
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 69 10 76 79 84 41 15 87 44 49 38 16 58 7 24 19 82 1 40 38 35 87 51 1 69 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 44,80 Dispersioon: Excel: VAR Sx² = 814,417 Standardhälve: Excel: STDEV Sx = 28,538 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral
Tunnikontrollis: Kui juhuslik suurus X on binoomjaotusega X~B(n; p), siis tema tõenäosusfunktsioon avaldub kujul P(X=x)= Cxn px (1-p)n-x astmes x (X=x)= Poissoni jaotus: P e- x! a ma seda kasutada küll ei oska xd - keskmine õnnetuste arv muidu 3. Jaotus- ja tihedusfunktsioon Siin olid Märdil ainult erinevad funktsioonid ja 0 teksti. Jaotusfunktsioon on juhusliku suuruse universaalne iseloomustaja, mis kirjeldab võimalike väärtuste tõenäosuste jaotust. Jaotustabel x 0 1 3 P(X=x) 0,8 0,1 0,1 Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1
indeksanalüüs muutuva struktuuri indeks, püsiva struktuuri indeks muutuva struktuuri indeks, struktuurinihete, püsiva struktuuri tinglik hind, struktuurinihete indeks tööviljakus fisheri indeks, laspeyres indeks, paasche indeks test 5 vastandsündmuse tõenäosus sõltumatud statistiline tõenäosus, klassikaline tõenäosus, täielik süsteem teoreetiline tõenäosus, tinglik tõenäosus välistavad juhuslik suurus, jaotusfunktsioon pidev juhuslik suurus, jaotusseadus, jaotusfunktsioon keskväärtus diskreetne juhuslik suurus, dispersioon, integraal, mediaan, ülemine rada 19. 15, binoomjaotus, parameetrid, parameeter Test 6 pidev, diskreetne, poissoni jaotus, jaotusseadus jaotusseadus, eksponentjaotus normaaljaotus, normaaljaotus normaaljaotus negatiivne väärtus poissoni jaotus Test 7 kogum, klastervalik, kihtvalik, lihtne juhuvalik, süstemaatiline valik
juhusliku suuruse võimalikud väärtused ja nende tõenäosused pi=P(X=xi).
Tõenäosusfunktsiooni võib esitada valemina, tabelina, arvupaaridena või graafikuna.
Def: Juhusliku suuruse jaotusfunktsiooniks nimetame funktsiooni, mis seab väärtusele
x vastavusse tõenäosuse, et X
R= 99 - 0 = 99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 Dispersiooni usaldusvahemik: = 0,10 ja (leidsin need Exceli CHIINV funktsiooni abil) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,645. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 26,038< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese intervalli tõenäosu
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
5 9,19 y^ | x = 2, 4469 1,12 = 2, 73 P((7, 06 - 2, 73) < µ y ( x) < (7,06 + 2, 73)) = 1 - 0, 05 P(4,33 < µ y ( x) < 9, 79) = 0,95 11.6 Regressioonimudeli graafik koos katsepunktidega KOKKUVÕTE Rakendusstatistika arvestusharjutuses AGT-1 leidsin erinevaid valimit iseloomustavaid parameetreid, kontrollisin hüpoteese ja esitasin mitmeid graafikuid. Osa A Ülesandes 1 on toodud põhilised valimit A iseloomutavad arvkarakteristikud: keskväärtus 46,2, dispersioon 867,9, standardhälve 29,46. Samuti on välja toodud mediaan 46 (valimi keskelement) ja haare 99 (valimi suurima ja vähima elemendi vahe). Ülesandes 2 on leitud keskväärtuse ja dispersiooni usaldusvahemikud, ehk piirkonnad, kus normaaljaotuse puhul paiknevad keskväärtus ja dispersioon 90% juhtudest. Keskväärtus asub vahemikus 35,91<<56,49 ja dispersioon vahemikus 572,0<2<1504,2.
Sündmus A ei ilmne kui esineb sündmus A. Sündmus A on sõltumatu sündmusest B kui tema tingimuslik on võrdne mittetingimusliku tõenäosusega. 3. Sündmuste algebralised operatsioonid. Sündmuste summa ja korrutis Summa: Sündmus C, mis ilmneb igal juhul kui ilmneb vähemalt üks sündmustest A või B. C = A B, Korrutis: On sündmus C, mis ilmneb juhul kui ilmnevad mõlemad sündmused A ja B. C = A B , A 4. Juhusliku suuruse mõiste X = X(e) 5. Jaotusseadus ja selle esitamine. Jaotusfunktsioon F(x) ja tema põhiomadused 6. Tõenäosuse tihedusfunktsioon f(x) ja tema põhiomadused jaotuse tõenäosuste tihedus: f(x) = lim P(x X < x+x)/ x omadused: 1. f(x) 0 on positiivne arv. 2. 3. Eksisteerib kasvõi üks väärtus (x, x+x), millele kehtib P(x X < x+x) = F(x) = f()dx - ksii). 7. Binomiaalne jaotus 1. JS nimetatakse binomiaalselt jaotuvaks (ka Bernoulli jaotus) parameetritega n ja m, kui ta võtab võimalikud väärtused 0, 1, ...., n tõenäosusega P(n, m) valemiga
0-20 0,23 0,23/20=0,011 5,7 21-40 0,21 0,21/20=0,011 5,3 41-60 0,23 0,23/20=0,011 5,7 61-80 0,18 0,18/20=0,0088 4,4 81-100 0,15 0,15/20=0,0077 3,9 6 5.3 Ühtlase jaotuse jaotustihedus ja histogramm a=0 b=100 { 1 f ( x )= b-a , a x b 0, x <0, x> b Vahemik Vahemikku sattumise Empiiriline tihedus, Väärtusi ~ pm ~ p m /h vahemikus, tõenäosus, ~
90,00 1,645 0,4505 39,31 13,10 3,00 -36,31 1318,19 33,54 X2 -27,72787048 statistik Vabadusastmete arv k = m 1 r = 5 1 1 = 2 X2kr (0,1;2) = 4,605 Kuna kriitiline teststatistik on suurem kui teststatistik, siis peab hüpotees paika. 4.2 põhikogumi jaotuseks on eksponentjaotus (mille parameeter tuleb hinnata valimi järgi) k xm ni F0(m) pi ni' ((ni-n'i)2)/n'i 1 20,00 6,00 0,29 0,29 7,25 0,215517241 2 40,00 7,00 0,50 0,21 5,15 0,664563107 3 60,00 4,00 0,64 0,15 3,65 0,033561644
Me=51 Haare: R=94-9=85 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (olulisuse nivoo = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 0,61. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,17< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese intervalli nr vahemik elemente intervalli keskmine
ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,6449. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 D=2 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 26,0375< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese interval vahemi element tõenäos intervalli li nr k e us keskmine
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,7268. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 34,924< 36,42. Hüpotees võetakse vastu. 4.Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40-60, 60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese interval vahemi element tõenäos intervalli li nr k e us keskmine