leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,4 3,2 6,4 4,2 7,1 5,5 4,9 Lahenduse kontrollelemendid 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 51 Haare: 2 Keskväärtuse usaldusvahemik: (9,09 ; 44,15) Dispersiooni usaldusvahemik: (464,93 ; 1223,02) 3. 3.1 t-statistik: t= 0,61 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 53,24 25,68 - statistik: Järeldus: lükatakse tagasi 4.2 0,019 - statistik:22,39 Järeldus:lükatakse tagasi 4.3 - statistik: 4,8 Järeldus:lükatakse tagasi
72 1.710882 σ 868.7933 13.84843 s 29.4753 7 36.41503 M 44 Haare 90 8 2 Δμ 10.08575 Alumine piir 39.63425 9 Ülemine piir 59.80575 σ al piir 572.5944 σ ül piir 1505.661 3 10 t-statistik 0.047497 X -statistik 2 26.0638 N(μ,σ) X2-statistik U(0,100) X2-statistik DN-statistik 0.13 F-statistik 0.142 Seerijate arv 7 Pikima seeria pikkus 4 Käänupunktid 9 Korrelatsioonitegur 0.973 t-statistik Determinatsioonitegur 0.946 z-statistik 6.331 11 4.400 b0
Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: Me = 41 Haare: 2 Keskväärtuse usaldusvahemik: (35,08 ; 54,60) Dispersiooni usaldusvahemik: (536,45 ; 1410,64) 3. 3.1 t-statistik: t=0,90 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 44,84 27,97 - statistik: Järeldus: peab paika 4.2 0,022 - statistik:14,98 Järeldus:lükatakse tagasi 4.3 U (0,100) - statistik: 1,4 Järeldus:lükatakse tagasi
02 -3.22 1.04 10.37 3.9 5.2 1.08 1.28 1.17 1.64 3.3 2 0.48 -1.92 0.23 3.69 Keskmine 2.82 3.92 1.61 11.19 Kokku 8.03 55.95 r= 0.76 d= 0.57 Korreelimatuse kontroll t- ja z-statistiku abil: t-statistik: 2,1318 z-statistik: 1,6449 t = 0.8563 z = -0.6047 t < t-statistik = H1 z < z-statistik = H1 Mõlema statistiku järgi ei saa H0 tagasi lükata ning X ja Y korrelatsioon tuleb lugeda mitteol (xi-x)(yi-y) xi∙yi 11.1. y = b0 + b1x 4.07 1.62 8.25 41.58 Vx = 8.03 3.28 1.26 b1 = 2
leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 1,3 0,2 0,7 4,2 3,6 2,6 1,9 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 74 Haare: 2 Keskväärtuse usaldusvahemik: (47,38 ; 69,34) Dispersiooni usaldusvahemik: (679 ; 1791) 3. 3.1 t-statistik: t=1,3 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 58 30,5 - statistik: Järeldus: lükatakse tagasi 4.2 0,017 - statistik: 31,46 Järeldus:lükatakse tagasi 4.3 - statistik: 6 Järeldus:lükatakse tagasi
8976 17.4688 4 2.8 8.9 -0.18 -2.16 0.0324 4.6656 0.3888 5 2.2 6.8 -0.78 -4.26 0.6084 18.1476 3.3228 2.22045E- 7.1054E Summa 14.9 55.3 15 -15 9.188 109.772 29.906 xk 2.98 11.06 Korrelatsioonitegur: 0,9416 Determinatsioonitegur: 0, 8867 t-statistik: 0.54887119 z-statistik: 1.82906558 Tabelist võetud (tõenäosus - 0.975): t-statistik; 3.1824 z-statistik: 1.9602 Kuna mõlema puhul on tabeli statistik suurem, siis on tulemus vastuvõetav ning hüpoteesid vastu võetud. 11. Leida ühefaktoriline lineaarne regressioonimudel y = b0 + b1x ja analüüsida selle täpsust (olulisuse nivool α = 0,05) 11.1 leida mudeli parameetrite hinnangud b0 ja b1.
Rakendusstatistika arvestusharjutus AGT-1 Osa A 1. Arvkarakteristikud Keskväärtus N µ = xi pi µ = 44,8 i =1 (Kasutades Exceli funktsiooni AVERAGE) Dispersioon N 2 = ( xi - µ ) 2 p i 2 = 814,4 i =1 (Kasutades Exceli funktsiooni VAR.P lisaks kontrollisin Excelis vahetulemusi kasutades) Standardhälve = 2 = 814,4 = 28,54 Mediaan Me = 41 Variatsioonirea keskmine arv (juhul kui on tegemist paarituarvutlise valimiga) või kahe keskmise elemendi poolsumma (kui on tegemist paarisarvulise valimiga) (Lisaks saadav kasutades Exceli funktsiooni MEDIAN) Haare Valimi suurima ning väikseima elemendi vahe R = x max - x min R= 97 - 0 = 97 2. Jaotuse analüüs Võtan olulisuse nivooks = 0,10 ning eeldan normaaljaotust. Keskväärtuse usaldusvahemik 1) Keskväärtuse ja standardhälbe hinnangud: 1 N 1 N µ^ = xi = xi...
Sisukord 1. Aegrea karakteristikud .............................................................................................. 2. Korrelogramm. Statsionaarsuse määramine............................................................... 3. Statsionaarsuse ja mittestatsionaarsuse mõjutamine statistikale................................ 4. Statsionaarsuse ja mittestatsionaarsuse aegreadede statistika saamiseks näited........ Aegrea karakteristikud Kui meil on juba antud vaid üks realisatsiooni protsess - aegrida, siis ei ole meil võimalik täpselt aru saada stohhastilise protsessi karakteristikuid. Kuid me saame vaadelda aegrea keskmist väärtust, standardviga ning k-järku autokorrelatsioonikordajad statsionaarse juhuslikku protsessi keskväärtusse, dispersiooni ja autokorrelatsiooni funktsiooni hinnangutena. Kui aegread sisaldavad arengutendentsi, trendi, siis need karakteristikud on kindlasti suhteliselt väheinformatiivsed aegrea...
3 1,7 2,5 -1,18 -4,32 1,3924 18,6624 5,0976 4 3,8 9,4 0,92 2,58 0,8464 6,6564 2,3736 5 3,2 5,1 0,32 -1,72 0,1024 2,9584 -0,5504 keskväärtus ed 2,88 6,82 Läbi keskväärtuste leiame Korrelatsiooniteguri : 0,927071 t-statistik : 4,283259 Determinatsioonitegur: 0,85946 z-statistik : 2,31526 11. Leida ühefaktoriline lineaarne regressioonimudel y = b0 + b1 x ja analüüsida selle täpsust (võttes vastavates testides jm arvutustes olulisuse nivooks = 0.05) xi 0,8 4,9 1,7 3,8 3,2 yi 2,7 14,4 2,5 9,4 5,1 10.1 Leida parameetrite hinnangud b0 ja b1 Kasutame järgmisi valemeid: x = 2,88 Vx = 10,75 = 6,82 b1 = 2,87
1. Rahvatervis- teadus ja kunst haiguste ennetamiseks, eluea Ekspositsioon kokkupuude teguriga, mis võib mõjutada inimese Tundlikkus=P(T+/H+) valenegatiivne=P(T-/H+) spetsiifilisus= pikendamiseks ning vaimse ja füüsilise tervise edendamiseks ja terviseseisundit. Risk- inimest või keskkonda iseloomustav tegur, mille P(T-/H-) valepositiivne= P(T+/H-) Valenegatiivne=1-tundlikkus tugevdamiseks ühiskonna organiseeritud jõupingutuste kaudu/ teadus olemasolul haiguse esinemise tõenäosus rahvastikurühmas on Valepositiivne= 1-spetsiifilisus ja praktika, mida viiakse ellu kas kogu rahvastiku või selle teatud suurenenud. Riskirahvastik rahvastiku osa, kellel võib haigus välja Tundlikkus= Spetsiifilisus= PPV= NPV= rühmadele suunatud tervist mõjutavate sekkumiste kaudu. kujuneda . ...
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 69 10 76 79 84 41 15 87 44 49 38 16 58 7 24 19 82 1 40 38 35 87 51 1 69 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 44,80 Dispersioon: Excel: VAR Sx² = 814,417 Standardhälve: Excel: STDEV Sx = 28,538 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me = 41 Haare: ...
44,84 Keskväärtus 44,84 ül4 1 Dispersioon 814,056666667 814,05667 intervalli nr. 1 Mediaan 38 28,531678 1 7 Haare 86 2 10 t-statistik -0,9043112513 3 15 50 4 16 5 19 1,7108820799 24 35 Histogr 38 0,4780363352 38 0,4168338365 8 41 1,7108820799 7 6 41 36,4150285018
Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Tuleb püstitada uurimisküsimused: mida ja kelle käest tahan teada saada; millistele küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin ke...
Kvant met 40% EKSAM 25% KT 25% 10% Kirjandus: SAMM, Tooding L-M jne Uurimisprobleemi püstitamine (sots)teaduses: Probleemi leidmine ja teema sõnastamine Probleemipüstituse põhjendus Kuidas ma saan aru, et see on selline probleem, mida tasub uurida? Selle praktiline tähtsus, seos teiste valdkondadega, takistavad tegurid selle uurimisel Täpsustamine Millist osa ma sellest probleemist uurida tahan? Alamülesanded v teemad Kas ja mida varasemast teada on? Teooriad, varasemad uurimused Operatsionaliseerimine Kuidas defineerida Kuidas mõõta, uurida Analüüsimeetodi valik Sotsiaalsete probleemide konstrueerimine Sots.teaduses on uurija oma uurimisobjekti (ühiskonna) osa ja mõjutab seda enda tegevusega Statistika kui relv (sots)poliitikas Numbrilised väited sots elu kohta (n-ö objektiivsed) Sots probleemide tõlgendus, põhjendus Sots probleem: kas see on olemas v on...
5 72.9316
110 3727 210.5048
asisene dispersioon
ine dispersioon
üpoteesi vastu võtmiseks peab F
n1 n2 Toodud valemis n1 on esimese valimi maht ja k1 väärtuse sagedus esimeses valimis ning n2 on teise valimi maht ja k2 väärtuse sagedus teises valimis. Lisa 1. Kriteeriumid sisuka hüpoteeside kontrollimiseks Kontrollitav hüpoteesipaar T-statistik Kahepoolne hüpotees Ühepoolsed hüpoteesid x -c H 0 : µ = µ0 H 0 : µ µ0 H 0 : µ µ0 T = n s H 1 : µ µ0 H 1 : µ > µ0 H1 : µ < µ0
0 1 2134,44 Keskväärtus 46,20 2 1 1953,64 Dispersioon 867,92 7 1 1536,64 Standardhälve 29,46 10 1 1310,44 Mediaan 46 15 1 973,44 Haare 99 28 1 331,24 t-statistik 29 1 295,84 30 1 262,44 31 1 231,04 t,alfa,n-1 1,7108820799 32 2 201,64 32 2 201,64 ÜL 2 42 1 17,64 Usaldusvahemikkude arvutamine: 46 1 0,04 47 2 0,64 36,415028502 36,4150285018
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 54 32 30 54 89 54 9 94 51 69 19 15 33 88 37 87 94 49 18 85 43 43 41 62 81 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=53,24 Dispersioon: Excel: VAR Sx²=705,69 Standardhälve: Sx=26,56 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=51 Haare: R=94-9=85 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli...
46,2 Keskväärtus 46,2 ül4 99 Dispersioon 867,9167 intervalli nr vahemik 32 Mediaan 38 1 0-20 10 Haare 99 2 20-40 96 t-statistik -0,644942 3 40-60 2 50 4 60-80 79 5 80-100 46 1,7108820799 31 29,46043 68 46 7 Histog 47 0,4780363352 6 28 0,4168338365
KORDAMINE ÖKONOMEETRIA KONTROLLTÖÖKS 2013 sügissemester kasutatud 2017. aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on ...
Andmeanalüüs 1)Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Eelnevad: Uurimusprobleem, uurimusmeetodi valik (kvantitatiivne, kombineeritud, kvalitatiivne), valimi koostamine, andmestiku loomine. Järgnevad: Andmete analüüsimine ja tulemuste esitamine. Millised on alternatiivid kvantitatiivsetele meetoditele. kombineeritud, kvalitatiivne 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Võimalikult lühike, viisakalt sõnastatud, lihtsa grammatikaga, sisaldab infot ühe teema kohta, sama tähendusega kõigi jaoks, sobival spetsiifilisuse tasemel Ankeedi struktuur, sissejuhatus, miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed, tänud juba ette, lihtsamad küsimused, avaküsimused, keerulised ja põhiküsimused. Sotsiaal-demograafilline osa, lõpusõna ja tänud. Küsimuste tüübid: Avatud ( vastaja vastab oma sõnadega) Su...
Iseseisev töö nr. 2. Hüpoteeside testimine. Iseseisva töö eesmärgiks on tutvuda programmiga “Stats” selle Help faili abil ning kontrollida praktikumitunnis püstitatud hüpoteese. Ülesanne 1: Valguskaugusmõõturit kalibreeriti baasjoonel pikkusega 100,020 m. Kalibreerimisel mõõdeti baasjoont 10 korda. a) Püstitage hüpoteesid? Nullhüpotees: mõõtmisel saadud joonepikkus võrdub etaloni pikkusega. Alternatiivne hüpotees: mõõtmistel saadud joonepikkus ja etaloni pikkus erinevad. Hüpoteeside kontrollimiseks selle ülesande puhul kasutame t-teststatistikut. See kontrollib valimi keskmisel põhinevat hüpoteesi kasutades selleks algandmetena valimi keskmist, standardhälvet, mõõtmiste arvu, usaldusnivood ja üldkogumi keskmist (hetkel kalibraatori pikkus). Usaldusnivoo tuleb võtta 0.025, sest tegemist "kahe sabaga". Programmi sisestatud suurused ja neile vastavad tulemused on näidatud järgneval joonisel (Joonis 1). Tulemused tulid samad, mis...
3,9 5,2 1,08 1,28 1,17 1,64 1,38 20,28 3,3 2 0,48 -1,92 0,23 3,69 -0,92 6,6 Keskmine: 2,82 3,92 1,61 11,19 Korrelatsioonitegur r = 0,76 Determinatsioonotegur d = r2 = 0,57 Korrelimatuse kontroll t- ja z-statistiku abil: t-statistik: Tp = 2,1318 t=r (N −2)/(1−r)2 = 0,8563 < 2,1318 = H1 Z-statistik: Zp = 1,6449 z = 0,5(N-3)ln((1+r)/(1-r) = -0,6047 < 1,6449 = H1 Mõlema statistiku järgi ei saa Ho tagasi lükata ning X ja Y korrelatsioon tuleb lugeda mitteoluliseks. 11. Leida ühefaktoriline lineaarne regressioonimudel y = b 0 + b1 x ja analüüsida selle täpsust (võttes vastavates testides jm arvutustes olulisuse nivooks α = 0.05) 11.1 . Leida mudeli paramaatrite hinnangud b0 ja b1
1 ÜLEVAADE TÕENÄOSUSTEOORIA PÕHIMÕISTETEST Juhuslik sündmus - midagi mis mingi katse tulemusel võib toimuda. Katse - mingi tingimuste kompleksi realiseerumist (mingit toimingut). Lähtepunktiks katsega seotud sündmustel on elementaarsündmuste ruum , mis koosneb elementaarsündmustest (mis on üksteist välistavad sündmused, iga katse korral toimub tingimata üks). Tingimused elementaarsündmuste ruumile on: 1) vastastikune välistatus: korraga toimub vaid üks elementaarsündmus: ij = Ø (ij), 2) täielikkus: alati mingi elementaarsündmus toimub: i = . nt. Kaardi valik 52'sest kaardipakist Juhuslike sündmustega seonduvad põhimõisted: Vastastikku välistuvad sündmused: mis ei sisalda samu elementaarsündmusi (nt A: ruutu kaart, B: ärtu kaart) Vastastikku mittevälistuvad sündmused: mis sisaldavad samu elementaarsündmusi (nt A : ruutu kaart, B: piltkaart) Sündmuste sisalduvus: kui ...
Ökonomeetria KT kordamisküsimused 1. Ökonomeetrilise mudeli komponendid. ● Modelleeritavad näitajad: endogeenselt (sisemiselt) määratud ehk sõltuvad muutujad (Y). Väärtused määratakse mudeli siseselt ● Modelleeritavat nähtust mõjutavad näitajad: eksogeenselt (väliselt) määratud ehk sõltumatud, seletavad muutujad (X). Väärtused määratakse mudeli väliselt. ● Statistiliste meetoditega hinnatavad mudeli parameetrid (b). ● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame vali...
Statistika on teadus, mis uurib andmete kogumist, töötlemist, analüüsi ja järelduste tegemist. Üldistav statistika: andmete põhjal järelduste tegemine üldisemale grupile. Pakub meetodeid vea hindamiseks (vea me teeme nagunii). Kirjeldav statistika: kirjeldab neid andmeid, mida mõõtsime. Tehakse järeldusi, aga ainult nende andmete kohta, mida kogusime. Üldkogumi all mõeldakse kõiki juhtumeid või objekte, mille kohta meie poolt püstitatud järeldused, oletused kehtivad. Mõõtmiseks valitud (uuringusse kaasatud) üldkogumi osa nimetatakse valimiks. Valimi tingimused: Juhuslik – kõigil üldkogu liikmeil on võrdne võimalus sattuda valimisse. Esinduslik – samad proportsioonid, mis on üldkogus, peavad olema ka valimis. Piisavalt arvukas. Tunnused- nimi, järjestus, intervall, binaarne. Võtmeküsimused: Kas väärtused on järjestatavad? Kas skaalavahemikud on võrdsed? Nimitunnused nimi, sugu, perek. seis, elukoht, maakond. Väärtused ei ole üheselt järj...
Summa 15,2 59,9 9,75 113,01 30,83 129,01 Keskmin e 3,04 11,98 1,95 22,6 Korrelatsiooniteguri leidmiseks kasutasin Exceli funktsiooni CORREL ja sain väärtuseks r = 0,93 Determinatsioonitegur d=r2 = 0,86 Korreleerimatuse kontroll t- ja z-statistiku abil: T-statistik: t=r∗ √( N −2) 1−r 2 √ ( 5−2 ) = 0,93∗ 1−0,86 =4,31 |t| < t1-α/2 (f) t0,975 (3)=3,1824 4,31 > 3,1824 H0 tagasi lükatud ja korreleeritud Z0-statistik: 1+r 1+0,93
just 40 tundi) või erineb nende keskmine töötatud tundide arv olulisel määral 40 tunnist. 1)Eeldused on täidetud 2) H0: on 40 H1: ei ole 40 Leidsime tabelis andmete abil t-statistiku väärtuse,mis on 4.15. Uurime nüüd t-jaotuse tabelist kriitilist väärtust. Selleks peame teadma vabadusastmete arvu, mis on df=n-1 ning olulisusnivood 0,05. Vaatame kahepoolsehüpoteesi rida, vabadusastmete arv on 74 ning seega on kriitiline väärtus ligi 2. T-statistik on sellest suurem, järelikult saame vastu võtta alternatiivhüpoteesi.(95% kindlusega saame väita, et noorte töötundide arv nädalas ei ole 40) Null- ja alt. hüpoteeside piirkonnad.Testitav väärtus jääb 95% usalduspiiridest välja. Mis tekitab suuremaid usalduspiire? Väike valim ja suur hajuvus. 2) Kahe sõltumatu valimi t-test 1) Eeldused testi läbiviimiseks: 1. uuritav tunnus on arvuline 2
45.04 Keskväärtus 45 ül4 1 Dispersioon 1167.833 1164.123 intervalli 4 Mediaan 38 1 6 Haare 97 2 7 t-statistik -0.706614 3 10 μ 50 4 11 5 12 1.7108820667 15 20 25 0.4780363352 10 H 27 0.4168338365 9 33 1.710882 8 38 36.41503 7 46 13.84843 52 1164.123 6
45,04 Keskväärtus 45 ül4 1 Dispersioon 1167,833 1164,123 intervalli nr vahemik 4 Mediaan 38 1 0-20 6 Haare 97 2 20-40 7 t-statistik -0,706614 3 40-60 10 50 4 60-80 11 5 80-100 12 1,7108820799 15 20 10 Histogra 25 0,4780363352 9 27 0,4168338365 8 33 1,710882 7 38 36,41503 6
Õppejõu kontaktandmed · Statistika ja ökonomeetria dotsent Ako Sauga ÖKONOMEETRIA · E-post [email protected] · Koduleht www.sauga.pri.ee TES0040 Bakalaureuseõpe TAAB 31, 32, 33, 51, 52 · Ruum SOC-480 MEM5220 Magistriõpe, TARM12 · Vastuvõtuajad (vajalik eelnev registreerimine õppejõu kodulehel): Ako Sauga Paaritu nädal N 19:00 20:00 Paarisnädal E 16:00 17:00 Loengukava Kellele see kursus on mõeldud? Bakalaureuseõppe TAAB 2....
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 22 96 91 75 74 75 25 79 12 38 95 10 71 0 79 24 86 91 96 5 40 85 69 82 39 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=58,36 Dispersioon: Excel: VAR Sx²=1072,74 Standardhälve: Excel: STDEV Sx=32,75 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=74 Haare: =96-0=96 R=96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik...
Juhuslik sündmus on midagi, mis mingi katse tulemusel võib toimuda. Katse on mingi tingimuste kompleksi realiseerumine. Elementaarsündmused on mingid üksteist välistavad sündmused, millest iga katse korral üks tingimata toimub. Juhuslikud sündmused: *vastastikku välistuvad sündmused- ei sisalda samu elementaarsündmusi *vastastikku mittevälistuvad sündmused- sisaldavad samu elementaarsündmusi *sündmuste sisalduvus- kui toimub A, toimub ka B *vastansündmus- kõik elementaarsündmused, mis ei sisaldu sündmuses Tõenäosus iseloomustab sündmuse esinemissagedust katsetes. Tõenäousese määramisviisid: klassikalised(kombinatoorne, geomeetriline, statistiline), mtteklassikalised(subjektiivne,intersubjektiivne) Juhuslikuks suuruseks nim suurust, mis järjekordse katse tulemusel omandab mingi mittennustatava väärtuse mingist võimalikust väärtuste hulgast. Diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik Pidev juhuslik suur...
Rakendusstatistika arvestusharjutus. Osa A. N=25 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus Dispersioon Standardhälve Mediaan Me=49 Haare 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,71 Dispersiooni usaldusvahemik: = 0,10 ja 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > 0,6. Hüpotees võetakse vastu. H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,2< 36,42. Hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40- 60, 60-80 ja 80-100 ning kontrollida 2 -testi järgi ...
1) Ökonomeetrilise mudeli komponendid: Endogeensed muutujad - sõltuvad muutujad, väärtused mudeli siseselt Y Eksogeensed muutujad – sõltumatud muutujad, modelleeritavat nähtust mõjutavad X Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogum...
Keili Kajava Rakendusstatistika arvutusgraafiline töö 2010 Keili Kajava Osa A 1. Keskväärtus: Dispersioon: Standardhälve: Mediaani leidmiseks rivistan arvud tabelis kasvavasse järjekorda ja leian sealt valimi keskel oleva väärtuse ehk tabeli algusest või lõpust 13.-nda arvu (sest valimi maht on 25). Me=44 Haare: R=99-2=97 2. Keskväärtuse usaldusvahemiku leidmine (leitud t-jaotuse tabelist) Dispersiooni usaldusvahemiku leidmine (tuleb jaotuse tabelist) (tuleb jaotuse tabelist) Keili Kajava 3. 3.1 Kuna |t| < t0,95(24) (|-0,648| < 1,711), siis võib järeldada, et põhikogumi keskväärtus saab olla 25 valimi alusel. Seega H0 hüpotees vastu võetud. 3.2 Kuna 2 jääb ja vahele (13,85 < 32,1 < 36,4), siis hü...
Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Uurimisprobleem, kust probleem tuleb, teooria, praktiline probleem, varasemad uurimused Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimal...
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul. Diskreetnearvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv. 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnusmittearvuline tunnus, mille väärtused on järjestatavad (Kraf...
OSA A 1. Leian 1.1 keskväärtuse 1 N µ^ = x = xi = 46, 2 N i =1 Excel: AVERAGE 1.2 dispersiooni 1 N ^ 2 = s 2 = ( xi - x )2 = 867,9 N - 1 i =1 Excel: VAR 1.3 standardhälbe sx = sx2 = 29, 46 Excel: STDEV 1.4 mediaani Me = 46 Excel: MEDIAN 1.5 haarde R = xmax - xmin = 99 - 0 = 99 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10, leian 2.1 keskväärtuse usaldusvahemikud P ( x - µ < µ < x + µ ) = p s 29, 46 µ = t1- ( f ) = 1, 7109 = 10, 29 2 N 24 Student'i teguri leidsin tabelist. P (46, 2 - 10, 29 < µ < ...
2 24 71 1-/2 (f) 36,415 25 55 Dispersiooni usaldusvah. alumine ülemine 443,8457 1167,146158 H0: 50 t-statistik -1,1329 H0:2 800 hii-statistik 20,2033 Katse i 1 2 3 4 1 71 43 56 17 2 53 51 80 36 3 11 12 5 71 588,0625 14,0625 85,5625 885,0625
Gretl - Gnu Regression, Econometrics and Time Series Library Gretl on avatud koodil põhinev vabavara, mida võib legaalselt installeerida oma kodusesse arvutisse või sülearvutisse. Programmi koduleht http://gretl.sourceforge.net/ TÖÖ PROGRAMMIGA Gretl Käivitada programm – avaneb menüü 1. Andmete importimine – File → Open data → Import → nimi.xlsx. Selleks et oleks võimalik andmetabelit Gretl-isse importida tuleb tabel eelnevalt sobivale kujule viia: a) kontrollida, et Exceli tabeli esimeses reas oleksid muutujate nimed (ei peaks sisaldama täpitähti) ning teisest reast alates andmed. sulgeda Exceli fail; b) avada programm Gretl; c) valida File/Open data/Import/Excel d) otsida Exceli fail (muuta Files of type) e) valida, mitmendast veerust ja reast importimist alustatakse f) näidatakse töölehtede , muutujate ja vaatlustulemus...
1. Epidemioloogia on rahvastervishoiu, kliinilise meditsiini ja statistika ühisosa. Käsitleb haiguste ja terviseseisundite levikut inimpopulatsioonis. a. Uurib tervisega/haigusega seotud seisundite ja sündmuste esinemist ja mõjureid rahvastikurühmades. b. Uurib uurimistulemuste rakendamist tervisega/haigusega seotud probleemide lahendamisel rahvastikurühmades. c. Ühesõnaga viib läbi igasuguseid uuringuid, et saada aimu erinevate tegurite mõjust jne d. Saame ise uurida ja uuringuid tõlgendada tänu epidemioloogiale. e. Klassikaline epi tegeles ajalooliselt nakkushaiguste uurimisega rahvastikud. f. Moodne epi uurib nii nakkushaigusi kui ka mittenakkushaiguslikke haigusi ja tervist rahvastikurühma tasandil. g. John Snow oletas, et joogivesi on sobiv haiguse edasikandja inimeselt inimesele (koolera). h. James Lind merendushügieeni a...
Teemad · Mitmene lineaarne regressioonmudel Mitmese lineaarse regressioonmudeli parameetrite hindamine Parameetrite tõlgendus Standardiseeritud kordajad Mitmene regressioonmudel I ANOVA tabel F-test ja mudeli statistilise olulisuse kontroll Korrigeeritud determinats...
Pooled Variance 162,255 Ühendatud valimi dispersioon Hypothesized Mean 0 Oletatav keskmiste erinevus Difference df 11 Vabadusastmete arv t Stat 0.305 t-statistik P(T<=t) one-tail 0.381 Olulisuse tõenäosus ühepoolse hüpoteesi korral t-statistiku kriitiline (tabeli) väärtus etteantud t Critical one-tail 1.796 olulisuse nivoo ja ühepoolse hüpoteesi korral P(T<=t) two-tail 0
Keili Kajava Rakendusstatistika arvutusgraafiline töö 2010 Keili Kajava Osa A 1. Keskväärtus: Dispersioon: Standardhälve: Mediaani leidmiseks rivistan arvud tabelis kasvavasse järjekorda ja leian sealt valimi keskel oleva väärtuse ehk tabeli algusest või lõpust 13.-nda arvu (sest valimi maht on 25). Me=44 Haare: R=99-2=97 2. Keskväärtuse usaldusvahemiku leidmine 1 Keili Kajava (leitud t-jaotuse tabelist) Dispersiooni usaldusvahemiku leidmine (tuleb jaotuse tabelist) (tuleb jaotuse tabelist) 3. 3.1 Kuna |t| < t0,95(24) (|-0,648| < 1,711), siis võib järeldada, et põhikogumi keskväärtus ...
Osa A Variatsioonrida: N=25 1 4 6 7 1 1 1 1 2 2 2 3 3 4 5 6 6 7 7 8 8 9 9 9 98 0 1 2 5 1 5 7 3 8 6 2 2 2 1 4 1 7 4 5 6 N 1 1. ´x = N x i=45 i=1 N 1 s 2= N-1 i=1 ( xi -´x )2=1170 s= s2=34 Mediaan: variatsioonrea 13. element 38 x max-x min =97 Haare: 2. =0,10 t 0,95 ( 24 )=1,71 t 0,95 ( 24 ) s = =12 N Keskväärtuse alumine piir: ´x - =33 Ülemine piir: ´x + 57 20,05 (24)=13,85 ...
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Keskväärtus =46,20 Dispersioon =867,91 Standardhäve =29,46 Mediaan Me=46 Haare R = xmax xmin = 99 0 = 99 2. Keskväärtuse usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 on arvutatav Exceli TINV funktsiooniga: 1,711 Dispersiooni usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja on arvutatav Exceli CHIINV funktsiooniga, ning on vastavalt: 36,415 ja 13,843 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > -0,645. Seega hüpotees ...
Osa A Andmed: 7 2 3 3 1 1 4 3 3 3 6 5 6 1 2 9 7 5 7 8 5 2 4 1 8 7 9 7 4 8 5 3 1 9 3 5 9 5 8 4 6 1 3 0 7 6 9 1. Valimi parameetrite hindamine. Kasutan järgmisi valemeid: Keskväärtus: 44,28 Dispersioon: 772,46 Standardhälve: 27,79 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestust: 1; 2; 5; 14; 18; 19; 25; 27; 31; 33; 37; 39; 39; 45; 46; 50; 56; 63; 65; 71; 74; 77; 83; 89; 98 Mediaan: 39 Haare: 98 1 = 97 2. Leian keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0.10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0.95(24) = 1.711 = 9.51 Keskväärtuse usaldusvahemik arvutatakse valemiga: P(34,77 < < 53,79) = 90% Dispersiooni usaldusvahemiku leidmiseks kasutatakse 2-statistikut f = N 1 =...
N N (variatsioonrida) Keskväärtus Dispersioon Standardhälve 12 1 45.12 1165.026667 34.1324869687 6 4 11 6 ÜL 4 62 7 Vahemikud Tõenäosus/laius 21 10 0-20 0.016 62 11 21-40 0.01 7 12 41-60 0.004 98 15 61-80 0.008 10 21 81-100 0.012 1 25 52 27 Normaaljaotus 27 33 Vahemikud Tõenäosus/laius 81 38...
Vahemikhinnangud Usaldusnivoo ja usalduspiirkond Punkthinnangud on juhuslikud suurused, sest nad muutuvad ühelt valimilt teisele ülemineku korral. Samuti pole punkthinnangu korral võimalik leida hinnangu täpsust. Vahemikhinnangu puhul määratakse antud valimi jaoks vahemik, millesse otsitav parameeter etteantud tõenäosusega kuulub. Tõenäosust, millega peavad kehtima tehtud otsustused, nimetatakse usaldusnivooks ja tähistatakse sümboliga . Parameetri a sümmeetriliseks usalduspiirkonnaks vastavalt usaldusnivoole nimetatakse juhuslikku vahemikku (ã , ã + ), mis katab hinnatava parameetri a tõenäosusega : P(|ã a| < ) = Arv > 0 iseloomustab hinnangu täpsust. Usalduspiirkonna leidmine p(a) S= 0 ã- ã+ a p(a) juhusliku suuruse a tihedusfunktsioon. Usalduspiirkonna (ã , ã + ) leidmiseks tuleb: 1....