Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Tuleb püstitada uurimisküsimused: mida ja kelle käest tahan teada saada; millistele küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin ke...
ÜLESANNE 1 keskväärtus 12 Variandi Kumulatii esinemise vne inimeste arv tõenäosu tõenäosu Tõenäosu m s P(x=m) s P(xm) s P(x>m) 12 #NAME? #NAME? #NAME? Vastus: tõenäosus, et järgmise minuti jooksul helistab rohkem kui 12 inimest on ~0,424. t on ~0,424. 2 Läbimüük, Tootmisvarud, tuh. kr tuh. kr 192,78 9,400 197,51 9,550 SUMMARY OUTPUT 197,53 9,590 199,48 9,720 Regression Statistics 207,48 10,030 Multiple R 0,9312647 212,50 10,240 R Square 0,867254 200,22 9,820 Adjus...
Test 1 mood, mediaan, aritmeetiline keskmine, asendikeskmine, mahukeskmine aritmeetiline keskmine, mood aritmeetiline keskmine, mood, mediaan, detsiilid detsiil, kvartiil lihtne harmooniline keskmine, kaalutud aritmeetiline keskmine, kaalutud harmooniline keskmine, lihtne aritmeetiline keskmine, mood, järjestusskaala kaalutud aritmeetiline keskmine, mediaan keskmise hinnaga, keskmine hind, arvukogumis, geomeetriline keskmine, harmooniline, aritmeetline mood, mediaan, harmooniline, aritmeetiline aritmeetiline, geomeetriline, harmooniline, mediaan Test 3 asümmeetriakordaja, püstakus, järku keskmoment, algmoment, tingmoment 1. 50 2. 65 3. 65 4. 90 5. 40 6. 70 kvartiilihaare, variatsiooniamplituud 3. 30 4. 10 5. 55,6 intervallskaala, standardhälve, püstakus kordaja, ekstsess järjestusskaala, mood, kvartiilhaare, standardhälbe valem, standardhälve tsebõsovi võrratus, variatsioonikoefit...
Õppejõu kontaktandmed · Statistika ja ökonomeetria dotsent Ako Sauga ÖKONOMEETRIA · E-post [email protected] · Koduleht www.sauga.pri.ee TES0040 Bakalaureuseõpe TAAB 31, 32, 33, 51, 52 · Ruum SOC-480 MEM5220 Magistriõpe, TARM12 · Vastuvõtuajad (vajalik eelnev registreerimine õppejõu kodulehel): Ako Sauga Paaritu nädal N 19:00 20:00 Paarisnädal E 16:00 17:00 Loengukava Kellele see kursus on mõeldud? Bakalaureuseõppe TAAB 2....
Xxxxx xxxxx xxxx MHT 0031 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. 1) Keskväärtus =46,20 2)Dispersioon =867,92 3)Standardhäve =29,46 4)Mediaan Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 5)Haare R = xmax xmin = 99 0 = 99 2. Leian keskväärtuse usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja o...
Isik Parem käsi Vasak käsi 1 63 65 Oletatakse, et parema käe nimetissõrmega ja vasaku käe nimetissõrmeg 2 68 63 erinev. Hüpoteesi kontrollimiseks kasutatakse 13st isikust moodustatakse 3 49 42 nad jõuavad teha määratud aja jooksul. Kontrollida olulisuse nivool 5%, kas koputamise kiirus on parema ja vasak 4 51 31 5 54 57 6 32 33 7 43 38 8 48 37 9 55 49 Kui Exceli menüüsse Tools on lisatud nalüüsivahendite komplekt Data An 10 50 51 läbiviimiseks sõltuvate valimite korral kasutada vahendit t-test: Paired Tw Array1 on ühe valimi a...
Ökonomeetria KT kordamisküsimused 1. Ökonomeetrilise mudeli komponendid. ● Modelleeritavad näitajad: endogeenselt (sisemiselt) määratud ehk sõltuvad muutujad (Y). Väärtused määratakse mudeli siseselt ● Modelleeritavat nähtust mõjutavad näitajad: eksogeenselt (väliselt) määratud ehk sõltumatud, seletavad muutujad (X). Väärtused määratakse mudeli väliselt. ● Statistiliste meetoditega hinnatavad mudeli parameetrid (b). ● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame vali...
Kvant met 40% EKSAM 25% KT 25% 10% Kirjandus: SAMM, Tooding L-M jne Uurimisprobleemi püstitamine (sots)teaduses: Probleemi leidmine ja teema sõnastamine Probleemipüstituse põhjendus Kuidas ma saan aru, et see on selline probleem, mida tasub uurida? Selle praktiline tähtsus, seos teiste valdkondadega, takistavad tegurid selle uurimisel Täpsustamine Millist osa ma sellest probleemist uurida tahan? Alamülesanded v teemad Kas ja mida varasemast teada on? Teooriad, varasemad uurimused Operatsionaliseerimine Kuidas defineerida Kuidas mõõta, uurida Analüüsimeetodi valik Sotsiaalsete probleemide konstrueerimine Sots.teaduses on uurija oma uurimisobjekti (ühiskonna) osa ja mõjutab seda enda tegevusega Statistika kui relv (sots)poliitikas Numbrilised väited sots elu kohta (n-ö objektiivsed) Sots probleemide tõlgendus, põhjendus Sots probleem: kas see on olemas v on...
KORDAMINE ÖKONOMEETRIA KONTROLLTÖÖKS 2013 sügissemester kasutatud 2017. aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on ...
1. Tõenäosus ja tema leidmise näiteid arvutusvalemite abil Sõltumatute katsete kordamisel saadavat suhtelise sageduse piirväärtust kutsutakse sündmuse A toimumise tõenäosuseks P (A) := lim mn n Sündmus, mille toimumise tõenäosus on 0 võib aset leida lim n1 =0 n n-1 Sündmus, mille toimumise tõenäosus on 1 ei pruugi alati toimuda lim =1 n n Tõenäosus, et toimuvad nii sündmused A kui ka B, P(A B), on leitav valemiga P(A B) = P(A|B) P(B) Kui A ja B on teineteisest sõltumatud: P(A|B)=P(A) ja P(A B) = P(A) P(B) Tõenäosus, et toimub kas sündmus A või sündmus B, P(A U B), on leitav valemig...
Hüpoteeside koltrollimine 1. Oletus, väide 2. Sobiv hüpoteeside paar (millised tunnused on vaja võrrelda) 3. Olulise tõenäosus (p) 4. Järeldus (p>0,05 H0, p<0,05 H1) 5. Lõppvastus (sama, mis oli küsitud hüpoteesis) T-test sobivad valemid 1. T-test H0: keskmised võrdsed H1: keskmised erinevad 2. F-test sõltumatud valemid H0: dispersioonid võrdsed H1: dispersioonid erinevad P>a H0, P<0,05 H1 Võrdsete disp mittevõrdsete disp t-test t-test 3. Olulisuse tõenäosus 4. Lõppvastus (p<0,05 H0) Vormistus nii nagu iseseisvates töös Ülesanne Eesmärk Tunnusetüüp 1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, ...
1) Ökonomeetrilise mudeli komponendid: Endogeensed muutujad - sõltuvad muutujad, väärtused mudeli siseselt Y Eksogeensed muutujad – sõltumatud muutujad, modelleeritavat nähtust mõjutavad X Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogum...
Õpilaste matemaatika ja füüsika kontrolltööde hinded on järgmised: Mate- Füüsika maatika 5 4 2 4 4 5 3 4 2 4 4 5 4 5 5 4 5 5 4 5 2 3 4 5 3 4 4 4 4 4 4 4 3 5 2 5 3 5 2 3 2 2 4 5 2 3 4 5 4 4 Õpilaste matemaatika ja füüsika kontrolltööde hinded NB! Kleebi väärtused töölehelt Andmed on järgmised: Mate- Füüsika maatika 5 4 2 4 4 5 3 4 2 4 4 5 4 5 5 4 5 5 4 5 2 3 4 5 3 4 4 4 4 4 4 4 3 5 2 ...
Andmeanalüüs MS Exceli abil Andmeanalüüs MS Exceli abil Järgnev õpetus püüab võimalikult 'puust ja punaselt' ette näidata elementaarse andmeanalüüsi teostamise võimalused MS Excelis. Samas ei ole see materjal mõeldud matemaatilise statistika konspektiks, vastavad teadmised/materjalid eeldatakse kasutajal enesel olemas olevat. Seetõttu pole ka eriti tegeletud konkreetsete näidetega ega tulemuste tõlgendamisega. See konspekt ei ole Andres Kiviste 1998 aastal ilmunud vihiku "Matemaatilise statistika algteadmisi ja rakenduslikke näiteid MS Exceli keskkonnas" ümbertrükk. ...
Juhuslik sündmus on midagi, mis mingi katse tulemusel võib toimuda. Katse on mingi tingimuste kompleksi realiseerumine. Elementaarsündmused on mingid üksteist välistavad sündmused, millest iga katse korral üks tingimata toimub. Juhuslikud sündmused: *vastastikku välistuvad sündmused- ei sisalda samu elementaarsündmusi *vastastikku mittevälistuvad sündmused- sisaldavad samu elementaarsündmusi *sündmuste sisalduvus- kui toimub A, toimub ka B *vastansündmus- kõik elementaarsündmused, mis ei sisaldu sündmuses Tõenäosus iseloomustab sündmuse esinemissagedust katsetes. Tõenäousese määramisviisid: klassikalised(kombinatoorne, geomeetriline, statistiline), mtteklassikalised(subjektiivne,intersubjektiivne) Juhuslikuks suuruseks nim suurust, mis järjekordse katse tulemusel omandab mingi mittennustatava väärtuse mingist võimalikust väärtuste hulgast. Diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik Pidev juhuslik suur...
Statistika teooria I 1. Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare. Esitada definitsioonid ja osata antud andmeväärtuste puhul neid mõisteid rakendada N x + x 2 + ... + x N xi Aritmeetiline keskmine: µ = 1 = i =1 N N N-üldkogumi maht Aritmeetilise keskmise erijuht on kaalutud keskmine: N N N µ = 1 µ1 + 2 µ 2 + ... + m µ m N N N µ1, µ2,..., µm on m-rühma keskmised N1 N 2 N , ,..., m on nn kaalud N N N Mediaan: Kui N on paaritu, siis on mediaan järjestatud statistilise rea (variatsioonirea) keskm...
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Keskväärtus =46,20 Dispersioon =867,91 Standardhäve =29,46 Mediaan Me=46 Haare R = xmax xmin = 99 0 = 99 2. Keskväärtuse usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 on arvutatav Exceli TINV funktsiooniga: 1,711 Dispersiooni usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja on arvutatav Exceli CHIINV funktsiooniga, ning on vastavalt: 36,415 ja 13,843 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > -0,645. Seega hüpotees ...
Ökonomeetria mõisted 1. Autokorrelatsioon ja heteroskedastatiivsus võivad mudelis olla kahel põhjusel: 1) mudeli spetsifikatsioon on vale. Mudelist on välja jäetud mõned olulised muutujad ja/või mudeli funktsionaalne kuju on vale. Mudel tuleb ümber vaadata. 2) Tavalise vähimruutude meetodi rakendamise protseduur võib anda standardhälvete nihkega hinnangud. Tuleb kasutada uusi lähenemisi mudeli parameetrite hindamiseks. Autokorrelatsiooni testitakse aegridade puhul. Kui juhuslikud vead korreleeruvad omavahel, siis on olemas autokorrelatsioon. Kui autok. Esineb, tuleb mudel ümber vaadata, tuleb muuta spetsifikatsiooni. 2. Asümptootilised hinnangud kui juhuslike vigade normaaljaotuse eeldus ei ole täidetud, siis usalduspiirid on asümptootilised. Nad on täpsed siis, kui valimi maht on lõpmatu; lõpliku valimi mahu korral usal...
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1 8 8 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: ...
1 ÜLEVAADE TÕENÄOSUSTEOORIA PÕHIMÕISTETEST Juhuslik sündmus - midagi mis mingi katse tulemusel võib toimuda. Katse - mingi tingimuste kompleksi realiseerumist (mingit toimingut). Lähtepunktiks katsega seotud sündmustel on elementaarsündmuste ruum , mis koosneb elementaarsündmustest (mis on üksteist välistavad sündmused, iga katse korral toimub tingimata üks). Tingimused elementaarsündmuste ruumile on: 1) vastastikune välistatus: korraga toimub vaid üks elementaarsündmus: ij = Ø (ij), 2) täielikkus: alati mingi elementaarsündmus toimub: i = . nt. Kaardi valik 52'sest kaardipakist Juhuslike sündmustega seonduvad põhimõisted: Vastastikku välistuvad sündmused: mis ei sisalda samu elementaarsündmusi (nt A: ruutu kaart, B: ärtu kaart) Vastastikku mittevälistuvad sündmused: mis sisaldavad samu elementaarsündmusi (nt A : ruutu kaart, B: piltkaart) Sündmuste sisalduvus: kui ...
Rakendusstatistika arvestusharjutus. Osa A. N=25 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus Dispersioon Standardhälve Mediaan Me=49 Haare 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,71 Dispersiooni usaldusvahemik: = 0,10 ja 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > 0,6. Hüpotees võetakse vastu. H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,2< 36,42. Hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 20-40, 40- 60, 60-80 ja 80-100 ning kontrollida 2 -testi järgi ...
EESTI MAAÜLIKOOL Metsandus- ja maaehitusinstituut osakond NIMI PRT 815 ANDMETÖÖTLUSE ALUSED KODUTÖÖ NR. 5 Juhendaja: lektor Tartu AASTA Sisukord Sisukord.............................................................................................................................2 Sissejuhatus....................................................................................................................... 3 2. Diameetri usalduspiirid..................................................................................................4 3. Mitut puud tuleks mõõta?..............................................................................................4 3.1 Mitut puud tuleks mõõta et saada keskväärtuse hinnang veaga 0,3 cm..................4 3.2 Mitut puud tuleks mõõta, et saada keskväärtuse hinnang veaga 1%.....
Sisukord 1. Aegrea karakteristikud .............................................................................................. 2. Korrelogramm. Statsionaarsuse määramine............................................................... 3. Statsionaarsuse ja mittestatsionaarsuse mõjutamine statistikale................................ 4. Statsionaarsuse ja mittestatsionaarsuse aegreadede statistika saamiseks näited........ Aegrea karakteristikud Kui meil on juba antud vaid üks realisatsiooni protsess - aegrida, siis ei ole meil võimalik täpselt aru saada stohhastilise protsessi karakteristikuid. Kuid me saame vaadelda aegrea keskmist väärtust, standardviga ning k-järku autokorrelatsioonikordajad statsionaarse juhuslikku protsessi keskväärtusse, dispersiooni ja autokorrelatsiooni funktsiooni hinnangutena. Kui aegread sisaldavad arengutendentsi, trendi, siis need karakteristikud on kindlasti suhteliselt väheinformatiivsed aegrea...
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 0 2 7 1 0 1 5 2 8 2 9 3 0 3 1 3 2 3 2 4 2 4 6 4 7 4 7 4 8 5 3 6 8 7 0 7 5 7 5 7 9 9 4 9 6 9 9 Valimi A mahuga N=25 variatsioonirida: 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 46,20 Dispersioon: Excel: VAR Sx² = 867,92 Standardhälve: Sx = 29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 46 Haare: R= 99 - 0 = 99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 Dispersiooni usaldusvahemik: ...
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 3 9 7 4 7 7 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: 3.2.2011 Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 91 96 79 95 10 39 69 38 40 5 0 96 24 22 75 79 82 86 91 74 75 25 12 71 85 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 2,8 2,2 4,0 1,1 5,1 yi 6,9 6,1 9,8 7,2 15,3 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 1,3 0,2 0,7 4,2 3,6 2,6 1,...
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet). Nominaaltunnus mittearvuline tunnus, mille väärtused pole järjestatavad. 6. Juhuslik suurus ehk juhuslik muutuja suurus või muutuja, mille väärtus enne mõõtmist või katset ei ole teada. 7. Kuidas on defineeritud jaotusfunktsioon? Jaotusfunktsiooni sk...
OSA A 1. Hindame valimi parameetreid Hindamiseks kasutame järgmised valemid: Keskväärtus: 44,12 Dispersioon: 673,44 Standardhälve: 25,95 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestuse: Mediaan: 51 Haare: 92-4= 88 2. Leiame keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0,10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0,95(24) = 1,7109 = 8,88 (poollaius) P(35,24 < < 53) = 0,9 Dispersiooni jaoks kasutame 2-statistikut f = N 1 = 24 20.95(24) = 36,415 20.05(24) = 13,848 P (443,9 < 2 < 1167,15) = 0,9 3. Kontrollime hüpoteese keksväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0,10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: t = 1,1329 f = N 1 = 24 Kriitiline t-statistiku väärtus t0,95(24) = 1,711 Kuna t < tkr, sii...
Osa A Andmed: 7 2 3 3 1 1 4 3 3 3 6 5 6 1 2 9 7 5 7 8 5 2 4 1 8 7 9 7 4 8 5 3 1 9 3 5 9 5 8 4 6 1 3 0 7 6 9 1. Valimi parameetrite hindamine. Kasutan järgmisi valemeid: Keskväärtus: 44,28 Dispersioon: 772,46 Standardhälve: 27,79 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestust: 1; 2; 5; 14; 18; 19; 25; 27; 31; 33; 37; 39; 39; 45; 46; 50; 56; 63; 65; 71; 74; 77; 83; 89; 98 Mediaan: 39 Haare: 98 1 = 97 2. Leian keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0.10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0.95(24) = 1.711 = 9.51 Keskväärtuse usaldusvahemik arvutatakse valemiga: P(34,77 < < 53,79) = 90% Dispersiooni usaldusvahemiku leidmiseks kasutatakse 2-statistikut f = N 1 =...
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 54 32 30 54 89 54 9 94 51 69 19 15 33 88 37 87 94 49 18 85 43 43 41 62 81 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=53,24 Dispersioon: Excel: VAR Sx²=705,69 Standardhälve: Sx=26,56 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=51 Haare: R=94-9=85 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli...
Sündide arv aastate kaupa, kui palju oli poisse ja tüdrukuid. Objektid: aastad Üldkogum: aastad 1945-2009 Valim:iga kolmas aasta Tunnused: X-Poisid, Y-Tüdrukud Tunnuse X Tunnuse Y Aastad Poisid Tüdrukud variatsioonirida variatsioonirida 1947 11646 11075 6283 5884 1950 10440 9839 6531 6101 1953 10435 9711 6942 6567 1956 10107 9553 7176 6816 1959 10297 9641 8100 7675 1962 10419 9540 9260 8778 1965 9650 9259 9650 9259 1968 10184 9598 10107 9540 1971 11432 10686 ...
Ülesanne 1 On arvutatud kahe erineva tudengite grupi keskmine testi punktisumma ning standardh Esimeses grupis oli 57 tudengit ning keskmine tulemus 50 punkti standardhälbega 10,3 teises grupis oli 30 tudengit ning keskmine tulemus oli 45 punkti standardhälbega 12,5 Kas on alust väitel, et õppejõud hindas esimest gruppi kõrgemate punktidega kui teist g H: µµ I ja II grupi keskmised punktisummad ei erine oluliselt, õppejõud hindas g H: µ>µ I ja II grupi punktisummad erinevad, õppejõud hindas I gruppi kõrgemate n= 57 n= 30 µ= 50 µ= 45 = 10.3 = 12.5 sqrt n= 7.55 sqrt n= 5.48 SE=/sqrt n SE= 1.36 SE= 2.28 SE*=sqrt SE^2+SE^2 temp=(µ-µ)/SE* SE*= 7.07 temp= ...
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul. Diskreetnearvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv. 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnusmittearvuline tunnus, mille väärtused on järjestatavad (Kraf...
1. MÕÕTMINE Mõõtmine on objektide võrdlemine - Korraga saab võrrelda ainult kaht objekti omavahel. Kui objekte palju, valitakse välja üks (etalon) ning teisi võrreldakse sellega. Otsene mõõtmine ja kaudne mõõtmine – otseste mõõtmiste kaudu Nimi- ehk nominaalskaala – objektide eristamiseks – sugu, rahvus, huvid, kaubakood, ettevõtte registrinumber Järjestusskaala – võimaldab objekte järjestada mingi tunnuse alusel – nt ettevõtted: väikesed, keskmised, suured – küsitlus: "poolt", pigem poolt kui vastu", "pigem vastu kui poolt", "vastu" – intervallid skaalajaotuste vahel pole võrdsed Intervallskaala – skaalajaotuste intervallid on võrdsed Vahemikskaala – nullpunkti asukoht kokkuleppeline – ajaskaala, Celsiuse skaala temperatuuri mõõtmiseks – võib leida vahesid, ei tohi leida suhteid Suhteskaala – nullpunkt fikseeritud absoluutselt – objekti pikkus, kaal, töötajate arv, käive, mingi tegev...
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Andmete kood: 248199 Osa A 1. Keskväärtus Dispersioon Standardhälve Mediaan Haare 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks leian usaldus- vahemikud. Keskväärtuse usaldusvahemik on arvutatud MS Exceli TINV-funktsiooniga: Dispersiooni usaldusvahemik ja on arvutatud MS Exceli CHIINV-funktsiooniga 3. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks kontrollin hüpoteese 3.1 alternatiiviga Et hüpotees vastu võetaks peab seega hüpotees võetakse vastu. 3.2 alternatiiviga Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4. Valimi empiiriline histogramm võrdlaiade...
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 12 6 11 62 20 62 7 98 10 1 52 27 80 25 94 46 38 74 95 33 71 15 96 4 87 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=45, 04 Dispersioon: Excel: VAR Sx²=1164,123 Standardhälve: Sx=34,1193 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=38 Haare: R=97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: ...
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 75 10 79 32 32 0 68 94 96 2 99 53 31 15 48 47 29 70 7 75 28 30 42 47 46 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=46,20 Dispersioon: Excel: VAR Sx²=867,9167 Standardhälve: Sx=29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 Haare: R=99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: ...
1. Epidemioloogia on rahvastervishoiu, kliinilise meditsiini ja statistika ühisosa. Käsitleb haiguste ja terviseseisundite levikut inimpopulatsioonis. a. Uurib tervisega/haigusega seotud seisundite ja sündmuste esinemist ja mõjureid rahvastikurühmades. b. Uurib uurimistulemuste rakendamist tervisega/haigusega seotud probleemide lahendamisel rahvastikurühmades. c. Ühesõnaga viib läbi igasuguseid uuringuid, et saada aimu erinevate tegurite mõjust jne d. Saame ise uurida ja uuringuid tõlgendada tänu epidemioloogiale. e. Klassikaline epi tegeles ajalooliselt nakkushaiguste uurimisega rahvastikud. f. Moodne epi uurib nii nakkushaigusi kui ka mittenakkushaiguslikke haigusi ja tervist rahvastikurühma tasandil. g. John Snow oletas, et joogivesi on sobiv haiguse edasikandja inimeselt inimesele (koolera). h. James Lind merendushügieeni a...
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 69 10 76 79 84 41 15 87 44 49 38 16 58 7 24 19 82 1 40 38 35 87 51 1 69 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 44,80 Dispersioon: Excel: VAR Sx² = 814,417 Standardhälve: Excel: STDEV Sx = 28,538 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me = 41 Haare: ...
Sissejuhatus - Test 1 1. Järjesta skaalad informatiivsuse järgi, alustades kõige vähem informatiivsemast a. kõige vähem informatiivsem nimiskaala b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? ...
Andmeanalüüs 1)Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Eelnevad: Uurimusprobleem, uurimusmeetodi valik (kvantitatiivne, kombineeritud, kvalitatiivne), valimi koostamine, andmestiku loomine. Järgnevad: Andmete analüüsimine ja tulemuste esitamine. Millised on alternatiivid kvantitatiivsetele meetoditele. kombineeritud, kvalitatiivne 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Võimalikult lühike, viisakalt sõnastatud, lihtsa grammatikaga, sisaldab infot ühe teema kohta, sama tähendusega kõigi jaoks, sobival spetsiifilisuse tasemel Ankeedi struktuur, sissejuhatus, miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed, tänud juba ette, lihtsamad küsimused, avaküsimused, keerulised ja põhiküsimused. Sotsiaal-demograafilline osa, lõpusõna ja tänud. Küsimuste tüübid: Avatud ( vastaja vastab oma sõnadega) Su...
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 22 96 91 75 74 75 25 79 12 38 95 10 71 0 79 24 86 91 96 5 40 85 69 82 39 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=58,36 Dispersioon: Excel: VAR Sx²=1072,74 Standardhälve: Excel: STDEV Sx=32,75 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=74 Haare: =96-0=96 R=96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik...
Loenguplaan · Seos kahe tunnuse vahel kovariatsioon korrelatsioon Harilik lineaarne · Harilik lineaarne regressioonmudel Vähimruutude meetod parameetrite hinnangute leidmiseks regressioonmudel ...
Rakendusstatistika arvestusharjutus AGT-1 (Andmete kood: 38 42 36) OSA A 1. Leida keskväärtuse, dispersiooni, standarthälbe, mediaani ja haarde hinnangud Keskväärtus N 1 ´x = N ∑ xi i=1 ´x =53,24 Dispersioon N 1 s x 2= ∑ N−1 i=1 ( x i−´x )2 s x 2 =705,69 Standardhäve s x =√ s x 2 s x =26,56 Mediaan Me=51 Haare R = xmax – xmin = 94 – 9 = 85 2. Keskväärtuse μ usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: sx s ( P ´x −t α , N−1 ∙ √N ) < μ< ´x +t α ,...
Osa A 2 i xi ( x i−´x ) 1 1 1921,946 2 1 1921,946 3 7 1431,866 4 10 1213,826 5 15 890,4256 6 16 831,7456 7 19 667,7056 8 24 434,3056 9 35 96,8256 10 38 46,7856 11 38 46,7856 12 41 14,7456 13 41 14,7456 14 44 0,7056 15 49 17,3056 16 51 37,9456 17 58 173,1856 18 69 583,7056 19 69 583,7056 20 76 970,9456 21 79 1166,906 22 82 1380,866 23 84 1533,506 24 87 1777,466 25 87 1777,466 ∑ 1121 19537,36 1. Selle valimi: ∑ xi ni = Keskväärtus: μ= n ∑ xi pi=44,84 N 1 1 Hinnang: ^μ= x´ = N ∑ x i= 25 ∙ 1121=44,8 ...
Ülesande 1 lahendus Keskmine tellimuste arv 15 mminuti jooksul µ 7 Keskmine tellimuste arv 5 minuti jooksul 2.33 m P(x=m) Tõenäosus, et 5 min jookusl 0 0.097 ei ole ühtegi tellimust Töötajate Arenduskulud Firma Käive (mln $) arv (tuh) (mln $) Abbott Laboratories 10012 50.24 1072 Alza 326 1.44 20 American Home Products Corp 13376 64.71 1354 Bristol Myers Squibb 13767 49.14 1199 Carter Wallace Inc 662 3.61 26 Genentech Inc. 857 2.84 503 IVAX Corp. 1259 7.89 64 Johnson & Johnson ...
Rakendusstatistika arvutusgraafilise AGT-1 andmed ja lahenduse kontrollelemendid MHT/2013 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: 21.11.2013 Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs, aegrida ) 37 54 94 32 19 33 69 51 89 43 18 88 9 30 62 41 81 54 49 54 15 94 85 43 87 Andmed-B: valimid B1 ja B2 ( korrelatsioon, regressioonimudeli leidmine ja analüüs) xi 1,1 2,8 2,2 5,1 3,7 yi 7,2 8.9 6,8 19,3 13,1 Valim B1: Paarisvalim (xi, yi) regressioonimudeli le...
Jrk.nr. X1 X2 X3 X4 X5 X6 X7 X8 2 M 35 A 1 EPÜ A 17 359 12 M 28 V 0 EPÜ M 7 309 23 M 48 A 1 TTÜ SL 35 289 24 M 28 A 1 TLÜ SL 12 289 25 M 26 V 0 TLÜ A 3 214 26 M 37 A 2 TLÜ L 15 319 27 M 30 A 2 TÜ M 12 349 32 M 28 V 0 EPÜ A 5 279 ...
Andmed mingi tunnus või omadus. Tunnus omadus, nt keskmine pikkus, kummas paralleelklassis läks matemaatika eksamitöö paremini jne. Arvuline tunnus väärtuseks on arvud, nt pikkus, palk, hinne jne. Mittearvuline tunnus väärtuseks ei ole arvud, nt sugu, rahvus, haridus, juuste värv. Järjestustunnus tunnus, mille väärtusi saab sisu põhjal järjestada, nt matemaatika kt hinne, skaala küsitluses. Nominaaltunnus tunnus, millel on rohkem kui kaks erinevat väärtust, kuid ei leidu ühtegi sisulist järjestust, mis haaraks kõik tunnuse väärtused, nt rahvus, silmade värv. Binaarne tunnus ainult kaks teineteist välistavat tunnust, nt sugu. Pidev tunnus võib omandada kõiki reaalarvulisi väärtusi mingist piirkonnast, nt kaal, kasv, aeg, temperatuur. Diskreetne tunnus - tunnus võib omandada vaid üksteisest eraldatud väärtusi, väärtused saadakse tavaliselt loendamise teel, nt elanike arv majas, õpilaste arv klassis vms. Statistiline rida ...
Ökonomeetria-BA. Harjutusülesande koos lahendustega Koostanud: Tiiu Paas Ülesanne 1. Analüüsime regressioonimudelit Yi 800 0.93 X i 50 Di 0.01Di X i uˆ i , i 1,2,..,100 , (t ) (22.54) (2.34) (0.56) R 2 0.82, F 15.342 ( p 0.001) kus Y – küsitletu tarbimine eurodes, X – küsitletu sissetulek eurodesning D – küsitletu sugu (D = 1, kui mees ning D = 0, kui naine); t – statistiku kriitiliseks väärtuseks on t 0.025,96 1.99 . Vastake järgmistele küsimustele ning põhjendage vastuseid a) kas mudel on statistiliselt oluline olulisuse nivool 0.05; mida saate öelda mudeli kirjeldatuse taseme kohta. b) millised muutujad on statistilised olulised olulisuse nivool 0.05; c) Leida muut...
Soo defineerimine: Variable view - soolahtrist Values... - 1=mees, 2=naine - data view - ülevalt view - value labels ette linnuke Kasvavas järjekorras järjestamine: Teed lahtri aktiivseks mida järjestada soovid - ülevalt Data - Sort cases - valid mida soovid sortida - linnuke ascending lahtri ees kindlalt ja OK Mingi väärtuse minimaalse ja maksimaalse väärtuse leidmine, standardhälve, keskmine: Analyze - descriptive statistics - descriptives/frequencies (kui vaja ekstsessi, histogrammi kellukat jn) - valid mille puhul tahad uurida - Options - valid milliseid väärtusi leida tahad ja ok, vastused ilmuvad OutPuti aknasse. Charts all on võimalik kasutada histogrammi joonistamise võimalust. Joonisel olev küsimärk käib osutatud linnukese kohta. Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel. Küsimärk on juurde tehtud, et uurida, kas sellise tabeli koostamine on vajalik. Uue muutuja arvutamine: Transform -...