Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Statistiline modelleerimine teooria kokkuvõte 2020". Need materjalid aitavad sul teemat sügavamalt mõista.
muutuja, statis, valim, normaaljaotus, anova, regressioon, korrelatsioon, faktoranalüüs, hajuvus, statistik, hüpotees, komponent, jasp, varieeruvuse, faktorit, üldkogum, mean, regression, logaritm, dependent, standardiseeritud, usalduspiir, square, peakomponentide, asümmeetria, standardhälve, andmestik, nullhüpotees, vastutav, variable, šanss1. PRAKTIKUM 1) JÄRJESTAMINE NOOREMAST VANIMANI Parmeklõps Sort Ascending/Descending -> Kasvavas/Kahanevas järjestuses Data Sort cases Sort Ascending/Sort Descending (tuleb valida muutujad ka) 2) VARIABLE VIEW 3) KIRJELDAVAD ANDMED Leiame vanusele antud hinnangute keskmise, moodi, mediaani, maksimaalse ning minimaalse hinnangu. + HISTOGRAMM Käsklusrida: Analyze - Descriptive statistics Frequencies. Muutujatekasti liigutage muutuja. Statistics -Mean, Mode, Median, Minimum, Maximum. Charts - Histograms 2. PRAKTIKUM 1) UUE MUUTUJA ARVUTAMINE Tihtipeale tuleb andmete töötlemise jooksul tekitada uusi muutujaid eelmiste muutujate põhjal. Käesolevas praktikumis tutvume uue muutuja arvutamise põhitõdedega. Etteruttavalt võib öelda, et me arvutame saadavaloleva andmestiku põhjal uueks muutujaks kehamassiindeksi (BMI body mass index). Käsklusrida:
......................... 3 Andmeanalüüs SPSS'is........................................................................................... 4 Kirjeldav statistika............................................................................................... 4 Kuidas testida normaaljaotust?........................................................................... 4 Sagedustabeli analüüs (Hii-ruut).........................................................................5 Ühesuunaline ANOVA........................................................................................... 5 Faktoriaalne ANOVA............................................................................................. 6 Korduvmõõtmsite ANOVA (Repeated measures ANOVA).....................................6 Kurskall-Wallise test (e. mitteparameetriline ANOVA)..........................................7 T-test sõltumatute gruppidega.......................................................................
jn) - valid mille puhul tahad uurida - Options - valid milliseid väärtusi leida tahad ja ok, vastused ilmuvad OutPuti aknasse. Charts all on võimalik kasutada histogrammi joonistamise võimalust. Joonisel olev küsimärk käib osutatud linnukese kohta. Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel. Küsimärk on juurde tehtud, et uurida, kas sellise tabeli koostamine on vajalik. Uue muutuja arvutamine: Transform - Compute variable - kirjutad uue lahtri nimetuse (tühikuid ei kasuta) - liidad mida vaja liita (võrdusmärki pole vaja) Kehamassiindeks=Kaal kg'des jagadtud pikkus cm'tes ruudus (Pikkus x Pikkus) Andmete eraldamine: Data - select cases - If condition is satisfied ette linnuke - klikid If...-le - valid nt ainult meeste tulemuste saamiseks vasakult Sugu, siis = ja 1 (sest 1=mees ja tahan ainult meeste tulemusi) ja continue.
Heteroskedastiivsuse test........................................................................................29 Lisa 11. Multikollineaarsuse test...........................................................................................30 Lisa 12. Jääkliikmete normaaljaotuse testid.........................................................................31 Lisa 13. Jääkliikmete normaaljaotuse graafik.......................................................................32 Lisa 14. ANOVA tabel...........................................................................................................33 Lisa 15. Mudeli jääkliikmete kirjeldavad statistikud............................................................34 Lisa 16. Lõpliku mudeli regressioonikoefitsientide koovariatsiooni maatriks.....................35 Lisa 17. Mudeli stabiilsuse test (Chow test).........................................................................36 SISSEJUHATUS
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
Yes) h) avaneb Gretli-i menüü aken koos muutujate nimedega: Excel 2. Lineaarse mudeli parameetrite hindamine vähimruutude meetodil (Model -> Ordinary Least Squares) Põhimenüü ribalt valida menüü - Model. Avanevast rippmenüüst valida Ordinary Least Squares. Seejärel tuleb aknas "gretl: specify model" olemasolevate muutujate hulgast valida sõltuv muutuja Y (Dependent variable) ja üks või mitu sõltumatut muutujat X (Independent variables). Vajutada OK. 3. NÄIDE piima kogutoodangut kirjeldava regressioonimudeli konstrueerimisest Otsime mudelit kujul: Y-PKT_ha = a0 +a1TASU + a2SOOT + a3HP + a4PMYYK + a5 TOETUS + a6 KHIND Y_PKT_ha – piima kogutoodang ha kohta, kg TASU - töötasu 1 kg piima tootmiseks, senti SOOT – söödakulu 1 kg piima tootmiseks, senti HP – mullaviljakus, maa hindepunkt pallides
(dependent variable). teatud suurusi v. tingimusi hoitakse muutumatutena - neid nimetatakse kontrollitavateks muutujateks (control variable). Uurimisprojekti läbiviimine koosneb enamasti järgmistest etappidest: a) idee tekkimine (aluseks vaatlused ja tähelepanekud elust; ekspertide hinnangud ja soovitused; ajakirjad); b) testitatava hüpoteesi sõnastamine - see sisaldab kahe v. enama muutuja vahelise teoreetilise suhte lühikirjelduse, samuti muutujate mõõtmisviisi kirjelduse (nimetamise). (näit. Kas õppimine on efektiivsem üksinda v. väikeses grupis? Tuleks lisada, kuidas me õppimise efektiivsust mõõdame!) c) kirjanduse ülevaate koostamine; d) piloot-uuring (pilot study), et leida ja täpsustada sobivad uurimisprotseduurid; samuti sobivad sõltumatu muutuja tasemed; e) lõplik uurimiskava koostamine; f) andmete kogumine; g) andmete statistiline töötlemine;
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
teatud väitega nõustumise astme (nt täiesti nõus, pigem nõus, ei ole nõus). Summeeritud hinnangute skaala ehk Likerti skaala – hoiakute mõõtmisel kasutatav skaala, mis koosneb väidetest, millest igaüht hinnatakse positiivselt ja negatiivselt orienteeritud mitmepunktilisel (kõige sagedamini 5-punktilisel) skaalal; saadud hinnangud summeeritakse 4. Andmete kirjeldamise viisid: jaotus; tsentraalse tendentsi karakteristikud; variatiivsus; korrelatsioon Normaaljaotus - Praktiline väärtus on normaaljaotuskõvera eri piirkondade protsentuaalse suuruse ja standardhälbe ühikute vahelisel seose teadmisel. Kujutame histogrammina ehk tulpdiagrammina. Normaaljaotus on väga paljudele psühhol. omadustele iseloomulik. Tsenteraalse tendentsi karakteristikud: Näitab skooride keskmist suurust erinevatel viisidel. Need on mood, mediaan ja aritmeetiline keskmine. Mood - kõige sagedasem väärtus
vaid tabeli või diagrammina. Teoreetilised jaotused - Teatud teoreetilistest printsiipidest tuletatud jaotusseadus on teoreetiline jaotus. Diskreetse juhusliku suuruse korral: valem tõenäosuste leidmiseks. Pideva juhusliku suuruse korral: valem jaotustiheduse leidmiseks. Tuntakse üle 100 erineva teoreetilise jaotuse. Diskreetsed jaotused: ühtlane jaotus, Bernoulli jaotus, Binoomjaotus, Poissoni jaotus. Pidevad jaotused: ühtlane ehk ristkülikjaotus, eksponentjaotus, normaaljaotus, t-jaotus, F-jaotus, χ 2-jaotus(hii-ruut jaotus) 1. Juhusliku suuruse iseloomu ja empiirilise jaotuse järgi leitakse sobiv teoreetiline jaotus. 2. Vaatlusandmete põhjal leitakse teoreetilise jaotuse parameetrid. 3. Teoreetilist jaotust kasutatakse tõenäosuste arvutamisel. Seda, kas valitud teoreetiline jaotus sobib, saab testida jaotuse sobivuse χ 2 testiga. Binoomjaotus - Binoomjaotusega on tegemist, kui • katse tulemus võib olla positiivne või negatiivne;
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
4. Dispersioon iseloomustab juhusliku suuruse Xi erinevust keskväärtusest, seega iseloomustab tunnuse hajuvust. Valimi dispersiooni kui üldkogumi dispersiooni hinnangu tähiseks on tavaliselt Sruut, üldkogumi dispersiooni tähiseks ruut (kasutatakse teisi tähiseid ka: var, D(X)). Seega, mida suurem on Xi väärtus võrreldes keskväärtusega, (aritmeetilise keskmisega) seda suurem on hajuvus e dispersiooni. 5. Dispersiooni meetod 6. Diskreetne arvuline tunnus omab vaid täisarvulist väärtust, n laste arv perekonnas, eesti elanike arv. 7. DurbinWatsoni test. Kasut 1. järku autokorrelatsiooni avastamiseks. Kasut.tingimused: reg.mudel sisaldab vabaliiget. Mudel ei sisalda sõltuva muutuja viitajaga liikmeid (nt Yt1, Yt2) 8. Fiktiivne muutuja (dummy) iseloomustavaid binaarseid muutujaid. Binaarne muutuja
A32_1 pane tah nt P nagu pööratud Edasi Kustuta ära vana A32_1 Kirjuta väärtused Millised vead olid : sisestusviga, skaala ebaloogiline, grupeerimine, palju oli missing. Teisendused on ka veebis olemas –mine vaata. 12.02.03 Võtame kaks intervalltunnust T1 : rahulolu ilmaga T2: rahulolu eluga Loo uus fail: Võta variable view: Pane nimed ja komakohad nulli: Valime skaala 1-5, kus 1 ei ole rahul ja 5 on väga rahul. Võta data view ja sisesta sinna vastuseid, mida valim on andnud: Valimisse tuli 17 objekti. Enne üldistamist antakse ülevaade, kes meil seal andmestikus on ehk räägime valimist, sest see on kõige alus. Meil on kaks tunnus –sagedustabeleid oleks halb teha. Arvutame keskväärtuse, standardhälbe ja võrdleks läbi selle. N=17 Võta alaize ja descripive statistics Kui öeldakse keskväärtus, siis mõeldakse aritmeetilist väärtust ja see on MEAN ehk MIlma puhul tuleb kindlasti standardhälve suurem, sest see sõltub vastuste
82, F 15.342 ( p 0.001) kus Y – küsitletu tarbimine eurodes, X – küsitletu sissetulek eurodesning D – küsitletu sugu (D = 1, kui mees ning D = 0, kui naine); t – statistiku kriitiliseks väärtuseks on t 0.025,96 1.99 . Vastake järgmistele küsimustele ning põhjendage vastuseid a) kas mudel on statistiliselt oluline olulisuse nivool 0.05; mida saate öelda mudeli kirjeldatuse taseme kohta. b) millised muutujad on statistilised olulised olulisuse nivool 0.05; c) Leida muutuja X ees oleva kordaja 95% usalduspiirid. Lahendus. a) Mudel on statistiliselt oluline olulisuse nivoo 0.05 korral, kuna F-testi olulisuse tõenäosus p 0.001 on väiksem kui 0.05. Mudeli sõltumatud muutujad kirjeldavad ära 82% tarbimise varieeruvusest. b) Kuna muutujate X ja D t-statistikute absoluutväärtused on suuremad kui kriitiline väärtus ( 22.54 1.99; 2.34 1.99) , siis statistiliselt olulised muutujad mudelis on muutuja X ja muutuja D
Loenguplaan · Seos kahe tunnuse vahel kovariatsioon korrelatsioon Harilik lineaarne · Harilik lineaarne regressioonmudel Vähimruutude meetod parameetrite hinnangute leidmiseks regressioonmudel
Determinatsioonikordaja näitab argumendi X võimet kirjeldada uuritava suuruse Y hajuvust. 20. Mida näitab otsustusmuutuja kordaja (tõus) lineaarses ühe otsustusmuutujaga regressioonvõrrandis? Lineaarne seos on määratud kahe parameetriga: D (regressioonsirge tõus) kirjeldab juhusliku suuruse Y keskväärtuse muutumise kiirust suuruse X mõjul; E on regressioonsirge algordinaat. Ideaalse mitmese regressioonanalüüsi korral on otsustusmuutujad sõltumatud, igaüks kirjeldab sõltuva muutuja hajuvusest üht kindlat osa. Otsustusmuutuja kordaja näitab otsustusmuutuja mõju juhusliku suuruse Y keskväärtusele, kui teised muutujad jäävad samaks. Näiteks: Y=13,07x1+82,28, kus Y on läbimüük ja x1 on reklaam. Kui reklaami näitamine kasvab 1 võrra, siis läbimüük kasvab 13,07 võrra. 21. Kuidas tõlgendada otsustusmuutujate kordajaid mitme otsustusmuutujaga regressioonvõrrandis? Näiteks: Y=8,23x1+0,29x2+86,25, Y on läbimüük, x1 on reklaam ja x2 on õhutemperatuur
vähemalt viis korda rohkem. Kvantitatiivne andmeanalüüs: · Statistilised andmetöötlusprogrammid, näiteks SPSS · Atribuudid o sõltumatu atribuut - manipuleeritav atribuut o sõltuv atribuut - see, mida mõõdetakse · Eeldused (normaaljaotus) · Andmeanalüüsid o Parameetrilised testid (peavad vastama eeldustele) o Testid muutujate vaheliste seoste leidmiseks (pideva atribuudi keskväärtuste võrdlemine) Korrelatsioon - seose tugevus kahe pideva atribuudi vahel Regressioon - millisel määral sõltumatud atribuudid mõjutavad sõltuvat atribuuti, mängitakse läbi erinevad kombinatsioonid Faktoranalüüs - lubab vähendada atribuutide arvu vähemaks hulgaks faktoriteks o Testid gruppide vaheliste erinevuste leidmiseks T-test ANOVA - kahe või enama grupi omavaheline võrdlus
26. SUMMARY OUTPUT rinevust regressioonijoonest. Regression Statistics Multiple R 0.733264 atud varieerumine. R Square 0.537676 Adjusted R Sq 0.511991 Standard Erro 0.721537 Observations 20 ANOVA df SS MS F Significance F Regression 1 10.89841 10.89841 20.9337 0.000235 use ja tema prognoositud väärtuste R v esidual 18 9.371086 0.520616 Total 19 20.2695 atavalt nullist erinevad, sest memde olulisuse tõenäosused on peaaegu nullid.
Mitmese lineaarse regressioonmudeli parameetrite hindamine Parameetrite tõlgendus Standardiseeritud kordajad Mitmene regressioonmudel I ANOVA tabel F-test ja mudeli statistilise olulisuse kontroll Korrigeeritud determinatsioonikordaja Parameetrite statistilise olulisuse kontroll
Sõltumatud valimid – erinevad objektid, sama tunnus. (Nt meeste ja naiste üldine rahulolu, kus mehed ja naised on 2 erinevat gruppi ja rahulolu on intervalltunnus). ANOVA-Nagu sõltumatute v. T-test 3 või enama grupiga. Sõltuv tunnus peab olema intervalltunnus. Võrreldavad grupid (3 või enam gruppi!) sõltumatud. Hajuvused peavad olema gruppides sarnased (Levens test). Tulemuste jaotus vastab normaaljaotusele (loetakse kehtivaks ilma kontrollimata). Kui ANOVA eeldused ei ole täidetud, siis MPAR (mitteparameetrilised väärtused) test Kruskal-Wallis või Games-Howell. Kui H1, siis Post-Hoc testid, et välja selgitada, milliste gruppide vahel on erinevused. Tukey – gruppide suurused sarnased. Bonferroni – gruppide suurused erinevad. Korrelatsioon näitab seost kahe tunnuse vahel. Korrelatsiooni koefitsent on alati -1…1 ja näitab kahte asja: seose suunda ja tugevust. Pearson r eranditeta invervalltunnused, pole erandlikke väärtusi, seos
tõttu hakkab vähenema. Väide oleks, kui hinnangu statistiline olulisus suureneks ning standardviga vähenes. Kui me kasutame hinnangute andmisel järjest suuremaid valimeid, siis hinnangu stat. olulisus hakkab suurenema ja standardviga väheneb, kuna hinnang läheb täpsemaks. Standardviga saab suureneda juhul, kui andmed valimites hakkavad suuresti hajuma ja sellega stat. olulisus väheneb. Milliseid mudeleid kasutatakse sõltuva fiktiivse muutuja modeleerimisel? Millised on peamised erinevused nimetatud mudelite vahel ja probleemid selliste mudelite korral? Lineaarne tõenäosusmudel Probleemid LTM kasutamisel • Jääkliikmed ei ole normaalselt jaotunud. Nii nagu Y omavad ka jääkliikmed sisuliselt ainult kahte võimalikku väärtust. • Jääkliikmed on heteroskedastiivsed. • Tõenäosus võib olla negatiivne või suurem kui 1. • Determinatsioonikordaja on küsitava väärtusega ja jääb tavaliselt üsna madalaks.
2015 plaan : • Vähendada kodutöö kirjaliku osa mahtu • Uurida ettevõtete asemel kaastudengeid • Alustame uuringu ettevalmistust kohe esimestes seminarides Kodutöö üldteema ‘innovatsioon/ õppimisvõime’ Kvantitatiivne küsimustik Kvalitatiivne case-study – intervjuud (avatud küsimused, läheb sügavuti) Kodutöös on kohustuslik leida 25 kontakti Kvantitatiivne küsimustik: statistiline analüüs, seosed kodutööti erinevad – valim 50 Kvalitatiivne intervjuu – trantskribeerimine, within-case analüüs, märksõnade leidmine. Psühholoogilised faktorid: • Values • Traits • Beliefs • Emotions • Cognitive bias Väärtused – saavutus, võim, traditsioonid Omadused – ausus, integrity Cognitive bias – tsempion, üleoptimism, tatus quo Emotisoonid – õnnelik – kurb, excited – calm, controlling - controlled Õppimisvõime: ACAP process: • Acquisition • Assimilation • Transformation • Exploitation
1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, millel on vähe väärtuseid (ehk siis 2 väärtust) 2. Hii-runt-test Kontrollida seose olemasolu Mittearvulised või sagedustabeli põhjal diskreetsed arvtunnused 3. Korrelatsioon Võrrelda tunnuste paare; 2 pidevat arvutunnus Kontrollida seose olemasolu 4.Regresioon analüüs Prognoosida ühte tunnust teise 2 pidevat arvutunnus järgi. Regresioonivõrrandi olulisus 5.Dispersioon Keskmiste erinevus mitmes Pidev arvtunnus- keskmised, analüüs grupis (üle 2) Tunnus, millel on vahe
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
Eesti Maaülikool Metsandus- ja maaehitusinstituut Geomaatika osakond Matemaatika andmestiku analüüs Aruanne õppeaines matemaatiline statistika Koostajad: Juhendaja: Eve Aruvee Tartu Sisukord Sissejuhatus....................................................................................................................... 3 Tunnuste esmaanalüüs.......................................................................................................4 Seoste analüüs................................................................................................................... 8 Mudeli koostamine.......................................................................................................... 13 Kokkuvõte.......................................................................................................................
Andmeanalüüs MS Exceli abil Andmeanalüüs MS Exceli abil Järgnev õpetus püüab võimalikult 'puust ja punaselt' ette näidata elementaarse andmeanalüüsi teostamise võimalused MS Excelis. Samas ei ole see materjal mõeldud matemaatilise statistika konspektiks, vastavad teadmised/materjalid eeldatakse kasutajal enesel olemas olevat. Seetõttu pole ka eriti tegeletud konkreetsete näidetega ega tulemuste tõlgendamisega. See konspekt ei ole Andres Kiviste 1998 aastal ilmunud vihiku "Matemaatilise statistika algteadmisi ja rakenduslikke näiteid MS Exceli keskkonnas" ümbertrükk. MS
normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud normaaljaotuse kohaselt: kui juhuslik suurus Y on jaotunud normaaljaotuse järgi, siis juhuslik suurus X=expY on jaotunud lognormaalse jaotusseaduse järgi
EESTI MAAÜLIKOOL Metsandus- ja maaehitusinstituut Metsakorralduse osakond Mikk Sülla Proovitükk nr 613. Hinnangud, hüpoteesid, regressioon Kodune töö nr. 5 õppeaines Metsandusliku andmetöötluse alused II Juhendaja Külliki Kiviste Tartu 2012 Sisukord Sisukord Sissejuhatus Käesoleva töö eesmärgiks on analüüsida, kas proovitükil mõõdetud diameetri jaotus on lähendatav mõne klassikalise teoreetilise jaotusega. Töös on kasutatud Aakre metskonna proovitükki nr. 613
xii. Mõned isikud lahkuvad riskipopulatsioonist surres, mujale kolides või edasisest osalemisest keeldudes. e.xiii. Levimuse hindamine läbilõikelistes uuringutes. e.xiv. Haigestumuse hindamine kohortuuringus. f. Populatsioon ühikute kogum, mille hulgast me leiame oma uuringu osalised. Kogum, mille kohta tahame esitada väiteid oma uuringu tulemuste põhjal. g. Valim osa populatsioonist, mida me uurime. Et valimi uurimise tulemusi saaks üldistada populatsioonile, peab olema teada iga populatsiooni liikme võimalus valimisse sattuda. Lihtsaim variant võimalus valimisse sattuda on võrdne: juhuvalim. h. Sansid- vt valemit. Kasutatakse esinemisnäitajana harva. Sansside suhe on oluline esinemise võrdlusnäitaja. i
muutumisvahemiku sees kõik juhusliku suuruse väärtused on tekke mõttes samaväärsed. Jaotuse parameetriteks on juhusliku suuruse muutumisintervalli alumine piir a ja ülemine piir b. Eksponentjaotus (pidev) kirjeldab mingi sündmuse toimumisaja jaotust eeldusel, et sündmuse tekkimise jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate
.. 200-300 200-300 250 28 7000 38 -179,5 32220,25 ... 300-400 300-400 350 42 14700 80 -79,5 6320,25 ... 400-600 400-600 500 50 25000 130 70,5 4970,25 ... Üle 600 600-1000 800 20 16000 150 370,5 137270,3 ... Kokku 150 64425 4822025 USALDUSINTERVALLID Usaldusintervalle on vaja selleks, et hinnata valimi ja üldkogumi vastavust. Valim on juhuslik,võib esineda erinevaid tulemusi. Tehes üldistusi üldkogumile,peame veaga arvestama. Usaldusintervalle kasutataksegi selle vea hindamiseks. Keskmine esindusviga. Valimi suurenedes esindusviga väheneb. Selle leidmiseks on erinevad valemid lähtuvalt sellest, kas üldkogumi suurus on teada või ei ole.(valimi mahu võtmisel ei arvestata missing lahtrit) Piiresindusviga. Jälle kaks valemit lähtuvalt üldkogumist. Kasutatakse t-jaotuse täiendkvantiili
muutujad (X) · matemaatiliste ja statistiliste meetoditega hinnatavad mudeli parameetrid · juhuslik komponent () ÖKONOMEETRILISE MODELLEERIMISE ETAPID: 1. teooria ja sellel baseeruva verbaalse mudeli formuleerimine 2. andmebaasi korraldamine 3. ökonomeetrilise (matemaatilise) mudeli valik 4. ökonomeetrilise mudeli parameetrite hindamine 5. parameetrite usaldatavuse kontrollimine 6. mudeli omaduste parandamine 7. järelduste tegemine 8. prognooside koostamine 3. Lihtne regressioon, regressioonivõrrandi põhikuju. Determineeritud regressioonivõrrand. Lineaarse regressiooni korral kirjeldatakse seost uuritavate muutujate väärtuste vahel sirge abil võrrandiga Y = a0+a1X Eesmärgiks on leida punktiparvega antud X ja Y vahelist seost iseloomustava parima sirge võrrand Lineaarse kahe muutujaga determineeritud regressioonimudeli korral eeldatakse, et juhusliku suuruse Y tingliku keskväärtuse ja sõltumatu muutuja X vahel on seos
· Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks). · Hüpoteeside kontrollimine: nullhüpotees, sisukas hüpotees, Listra, E. Ökonomeetria. Aegread. kriitiline väärtus, olulisuse tõenäosus