Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Andmeanalüüsi konspekt". Need materjalid aitavad sul teemat sügavamalt mõista.
muutuja, anova, regressioon, käsklus, statistik, korrelatsioon, valim, spss, mean, ravim, hüpotees, parameetriline, valimite, doos, mitteparameetriline, aknas, dependent, interaktsioon, variable, plot, logistilise, mann, tests, esmalt, andmestik, katseisiku, independent, valimitega, shapiro, nullhüpotees, asümmeetriakordaja, cohen, pearson, legacy1. PRAKTIKUM 1) JÄRJESTAMINE NOOREMAST VANIMANI Parmeklõps Sort Ascending/Descending -> Kasvavas/Kahanevas järjestuses Data Sort cases Sort Ascending/Sort Descending (tuleb valida muutujad ka) 2) VARIABLE VIEW 3) KIRJELDAVAD ANDMED Leiame vanusele antud hinnangute keskmise, moodi, mediaani, maksimaalse ning minimaalse hinnangu. + HISTOGRAMM Käsklusrida: Analyze - Descriptive statistics Frequencies. Muutujatekasti liigutage muutuja. Statistics -Mean, Mode, Median, Minimum, Maximum. Charts - Histograms 2. PRAKTIKUM 1) UUE MUUTUJA ARVUTAMINE Tihtipeale tuleb andmete töötlemise jooksul tekitada uusi muutujaid eelmiste muutujate põhjal. Käesolevas praktikumis tutvume uue muutuja arvutamise põhitõdedega. Etteruttavalt võib öelda, et me arvutame saadavaloleva andmestiku põhjal uueks muutujaks kehamassiindeksi (BMI body mass index). Käsklusrida:
jn) - valid mille puhul tahad uurida - Options - valid milliseid väärtusi leida tahad ja ok, vastused ilmuvad OutPuti aknasse. Charts all on võimalik kasutada histogrammi joonistamise võimalust. Joonisel olev küsimärk käib osutatud linnukese kohta. Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel. Küsimärk on juurde tehtud, et uurida, kas sellise tabeli koostamine on vajalik. Uue muutuja arvutamine: Transform - Compute variable - kirjutad uue lahtri nimetuse (tühikuid ei kasuta) - liidad mida vaja liita (võrdusmärki pole vaja) Kehamassiindeks=Kaal kg'des jagadtud pikkus cm'tes ruudus (Pikkus x Pikkus) Andmete eraldamine: Data - select cases - If condition is satisfied ette linnuke - klikid If...-le - valid nt ainult meeste tulemuste saamiseks vasakult Sugu, siis = ja 1 (sest 1=mees ja tahan ainult meeste tulemusi) ja continue.
Statistiline modelleerimine – kokkuvõte Muutujad: Sõltuvad muutujad (dependent, outcome variables) – muutujad, mis on uurimise keskmes, millele uurija arvab, et teised muutujad mõju avaldavad. Nö katseisikust sõltuv muutuja. Sõltumatud muutujad (independent, predictor variables) – muutujad, mille kohta uurija arvab, et neil võiks olla mõju uuritavatele muutujatele. Statistilise analüüsi keskmes on uurida, kuidas teatud tunnused koos muutuvad. Kui on vaja muutujat iseloomustada, on kaks põhilist viisi, kuidas seda teha: o Milline on selle muutuja tüüpiline väärtus? o Kui hästi iseloomustab see tüüpiline väärtus kõiki mõõdetud juhtumeid? Ehk
Yes) h) avaneb Gretli-i menüü aken koos muutujate nimedega: Excel 2. Lineaarse mudeli parameetrite hindamine vähimruutude meetodil (Model -> Ordinary Least Squares) Põhimenüü ribalt valida menüü - Model. Avanevast rippmenüüst valida Ordinary Least Squares. Seejärel tuleb aknas "gretl: specify model" olemasolevate muutujate hulgast valida sõltuv muutuja Y (Dependent variable) ja üks või mitu sõltumatut muutujat X (Independent variables). Vajutada OK. 3. NÄIDE piima kogutoodangut kirjeldava regressioonimudeli konstrueerimisest Otsime mudelit kujul: Y-PKT_ha = a0 +a1TASU + a2SOOT + a3HP + a4PMYYK + a5 TOETUS + a6 KHIND Y_PKT_ha – piima kogutoodang ha kohta, kg TASU - töötasu 1 kg piima tootmiseks, senti SOOT – söödakulu 1 kg piima tootmiseks, senti HP – mullaviljakus, maa hindepunkt pallides
Heteroskedastiivsuse test........................................................................................29 Lisa 11. Multikollineaarsuse test...........................................................................................30 Lisa 12. Jääkliikmete normaaljaotuse testid.........................................................................31 Lisa 13. Jääkliikmete normaaljaotuse graafik.......................................................................32 Lisa 14. ANOVA tabel...........................................................................................................33 Lisa 15. Mudeli jääkliikmete kirjeldavad statistikud............................................................34 Lisa 16. Lõpliku mudeli regressioonikoefitsientide koovariatsiooni maatriks.....................35 Lisa 17. Mudeli stabiilsuse test (Chow test).........................................................................36 SISSEJUHATUS
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
Statilised järeldused Isiklik veeb: www.tlu.ee/ˇkairio Kursuse veeeb: www.tlu.ee/ˇkairio/7070 Kursus hõlmab üldistavat statistikat. Tõmba SPSS 14p treial Võid ka vaadata nuditud vabavara PSPP Tunnused on väga oluline. Intervall - – väärtused on järjestatavad ning nende väärtuste vahemikud on võrdsed. Nt. sissetulek (123€, 125€, 130€, 1500€ jne.); -pikkus, kaal, avtelg, mitu eurot. Saab arvutada skeskväärtust. On anud vahemike otspunktid – siis läheb ta selle alla nt kui üks on hea ja 10 on halb, siis määramatu keskosa annab meile intervalltunnused.
(dependent variable). teatud suurusi v. tingimusi hoitakse muutumatutena - neid nimetatakse kontrollitavateks muutujateks (control variable). Uurimisprojekti läbiviimine koosneb enamasti järgmistest etappidest: a) idee tekkimine (aluseks vaatlused ja tähelepanekud elust; ekspertide hinnangud ja soovitused; ajakirjad); b) testitatava hüpoteesi sõnastamine - see sisaldab kahe v. enama muutuja vahelise teoreetilise suhte lühikirjelduse, samuti muutujate mõõtmisviisi kirjelduse (nimetamise). (näit. Kas õppimine on efektiivsem üksinda v. väikeses grupis? Tuleks lisada, kuidas me õppimise efektiivsust mõõdame!) c) kirjanduse ülevaate koostamine; d) piloot-uuring (pilot study), et leida ja täpsustada sobivad uurimisprotseduurid; samuti sobivad sõltumatu muutuja tasemed; e) lõplik uurimiskava koostamine; f) andmete kogumine; g) andmete statistiline töötlemine;
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
Mitmese lineaarse regressioonmudeli parameetrite hindamine Parameetrite tõlgendus Standardiseeritud kordajad Mitmene regressioonmudel I ANOVA tabel F-test ja mudeli statistilise olulisuse kontroll Korrigeeritud determinatsioonikordaja Parameetrite statistilise olulisuse kontroll
82, F 15.342 ( p 0.001) kus Y – küsitletu tarbimine eurodes, X – küsitletu sissetulek eurodesning D – küsitletu sugu (D = 1, kui mees ning D = 0, kui naine); t – statistiku kriitiliseks väärtuseks on t 0.025,96 1.99 . Vastake järgmistele küsimustele ning põhjendage vastuseid a) kas mudel on statistiliselt oluline olulisuse nivool 0.05; mida saate öelda mudeli kirjeldatuse taseme kohta. b) millised muutujad on statistilised olulised olulisuse nivool 0.05; c) Leida muutuja X ees oleva kordaja 95% usalduspiirid. Lahendus. a) Mudel on statistiliselt oluline olulisuse nivoo 0.05 korral, kuna F-testi olulisuse tõenäosus p 0.001 on väiksem kui 0.05. Mudeli sõltumatud muutujad kirjeldavad ära 82% tarbimise varieeruvusest. b) Kuna muutujate X ja D t-statistikute absoluutväärtused on suuremad kui kriitiline väärtus ( 22.54 1.99; 2.34 1.99) , siis statistiliselt olulised muutujad mudelis on muutuja X ja muutuja D
ka: var, D(X)). Seega, mida suurem on Xi väärtus võrreldes keskväärtusega, (aritmeetilise keskmisega) seda suurem on hajuvus e dispersiooni. 5. Dispersiooni meetod 6. Diskreetne arvuline tunnus omab vaid täisarvulist väärtust, n laste arv perekonnas, eesti elanike arv. 7. DurbinWatsoni test. Kasut 1. järku autokorrelatsiooni avastamiseks. Kasut.tingimused: reg.mudel sisaldab vabaliiget. Mudel ei sisalda sõltuva muutuja viitajaga liikmeid (nt Yt1, Yt2) 8. Fiktiivne muutuja (dummy) iseloomustavaid binaarseid muutujaid. Binaarne muutuja nominaalsel tunnusel vaid 2 erinevat väärtust, näiteks abielus v vallaline. 9. Entroopia määramatus (Prognoosi entroopia E on see osa infost tuleviku kohta, mida olemasoleva lähteinfo põhjal ei olnud võimalik leida). 10
· Vormistus korrektne, ühtne stiil. Valim on mõõtmiseks valitud (uuringusse kaasatud) üldkogumi osa. Valimit kasutatakse, kuna koguvalimit mõõta on liiga kallis ja mahult võimatu. Statistilise analüüsi jaoks peab olema vähemalt 60-100 vastust. Vastuseid peab olema muutujatest vähemalt viis korda rohkem. Kvantitatiivne andmeanalüüs: · Statistilised andmetöötlusprogrammid, näiteks SPSS · Atribuudid o sõltumatu atribuut - manipuleeritav atribuut o sõltuv atribuut - see, mida mõõdetakse · Eeldused (normaaljaotus) · Andmeanalüüsid o Parameetrilised testid (peavad vastama eeldustele) o Testid muutujate vaheliste seoste leidmiseks (pideva atribuudi keskväärtuste võrdlemine) Korrelatsioon - seose tugevus kahe pideva atribuudi vahel
5 21 0,95018 0,23954 40,96176 Summad 171 0,95018 162,4808 p= 3,6579E-10 Järelikult H1 - tunnuse hinne jaotus ei lähene normaaljaotusele Tabel 15. Kirjeldavad statistikud. aasta sugu test eksam/kool hinne kood Mean 2003,731 1,4 8,291803 50,0729167 3,491228 2,872131 Standard Error 0,156329 0,028098 0,177857 1,46060454 0,070072 0,064523 Median 2003 1 8 53 4 3 Mode 2003 1 6 4 4 4 Standard Deviation 2,730164 0,490703 3,106143 24,787281 0,916312 1,126845
Märgistan kõik: ctrl+ A Valid percent- kes reaalselt ka vastasid Percent-alati kasulikum (kui valid percenti) seda kasutada Haridustasemed peab kõik välja tooma Töötab-1, õpib-2 jne nummerdamine- kõikidel gruppidele omad väärtused! 10 varianti- tahan muuta 5ks: transform- recode into dif. Valiables. valim→teise välja→name→change→old and new values (old: 1- copy old values) Transform- compute variable target variable?? Programmi SPSS kasutamine View – Value Labels: näidata koodide asemel nimetusi Utilites – Variables: muutujate/tunnuste sisu ülevaade Muutuja/tunnuse määrangute muutmine: topeltklõps selle nimel tabeli ülal. Nii saab näiteks muutujale uut nime anda või väärtuste nimetusi muuta. Output-aknast saab tabeleid ja graafikuid Word’i tõsta need valides ja siis Copy ning Word’is Paste. Sagedustabeli koostamine- vanuse puhul, kui väärtusi kiiga
teatud väitega nõustumise astme (nt täiesti nõus, pigem nõus, ei ole nõus). Summeeritud hinnangute skaala ehk Likerti skaala – hoiakute mõõtmisel kasutatav skaala, mis koosneb väidetest, millest igaüht hinnatakse positiivselt ja negatiivselt orienteeritud mitmepunktilisel (kõige sagedamini 5-punktilisel) skaalal; saadud hinnangud summeeritakse 4. Andmete kirjeldamise viisid: jaotus; tsentraalse tendentsi karakteristikud; variatiivsus; korrelatsioon Normaaljaotus - Praktiline väärtus on normaaljaotuskõvera eri piirkondade protsentuaalse suuruse ja standardhälbe ühikute vahelisel seose teadmisel. Kujutame histogrammina ehk tulpdiagrammina. Normaaljaotus on väga paljudele psühhol. omadustele iseloomulik. Tsenteraalse tendentsi karakteristikud: Näitab skooride keskmist suurust erinevatel viisidel. Need on mood, mediaan ja aritmeetiline keskmine. Mood - kõige sagedasem väärtus
.. 200-300 200-300 250 28 7000 38 -179,5 32220,25 ... 300-400 300-400 350 42 14700 80 -79,5 6320,25 ... 400-600 400-600 500 50 25000 130 70,5 4970,25 ... Üle 600 600-1000 800 20 16000 150 370,5 137270,3 ... Kokku 150 64425 4822025 USALDUSINTERVALLID Usaldusintervalle on vaja selleks, et hinnata valimi ja üldkogumi vastavust. Valim on juhuslik,võib esineda erinevaid tulemusi. Tehes üldistusi üldkogumile,peame veaga arvestama. Usaldusintervalle kasutataksegi selle vea hindamiseks. Keskmine esindusviga. Valimi suurenedes esindusviga väheneb. Selle leidmiseks on erinevad valemid lähtuvalt sellest, kas üldkogumi suurus on teada või ei ole.(valimi mahu võtmisel ei arvestata missing lahtrit) Piiresindusviga. Jälle kaks valemit lähtuvalt üldkogumist. Kasutatakse t-jaotuse täiendkvantiili
väikest mõju avaldavate muutujate eemaldamine. Selliste muutujate leidmiseks tehakse korrelatsioonianalüüs, mis oma olemuselt on nähtuste vaheliste seoste statistilise analüüsi meetod. Kasutades Exceli protseduuri Tools/Data Analysis/Correlation, koostasime korrelatsioonimaatriksi , mille abiga leitakse seoste olemasolu, tugevus, suund ning statistiline olulisus, korrelatsioonimaatriks (tabel 2.) Valiku kriteeriumiks võeti iga muutuja ja ettevõtte kogumüügi vaheline korrelatsioon Edasisel analüüsil määrati kindlaks näitajat, mis avaldavad piima tootmise muutusele kõige suuremat mõju. Seose tugevust tuli hinnata korrelatsioonikordaja absoluutväärtuse alusel. Mida suurem on kordaja absoluutväärtus, seda suurem on kahe juhusliku suuruse vaheline lineaarne korrelatiivne seos. Korrelatsioonimaatriksist näeb, et kõige suurem seos on uuritaval näitajal ( piima
tõttu hakkab vähenema. Väide oleks, kui hinnangu statistiline olulisus suureneks ning standardviga vähenes. Kui me kasutame hinnangute andmisel järjest suuremaid valimeid, siis hinnangu stat. olulisus hakkab suurenema ja standardviga väheneb, kuna hinnang läheb täpsemaks. Standardviga saab suureneda juhul, kui andmed valimites hakkavad suuresti hajuma ja sellega stat. olulisus väheneb. Milliseid mudeleid kasutatakse sõltuva fiktiivse muutuja modeleerimisel? Millised on peamised erinevused nimetatud mudelite vahel ja probleemid selliste mudelite korral? Lineaarne tõenäosusmudel Probleemid LTM kasutamisel • Jääkliikmed ei ole normaalselt jaotunud. Nii nagu Y omavad ka jääkliikmed sisuliselt ainult kahte võimalikku väärtust. • Jääkliikmed on heteroskedastiivsed. • Tõenäosus võib olla negatiivne või suurem kui 1. • Determinatsioonikordaja on küsitava väärtusega ja jääb tavaliselt üsna madalaks.
sisestatakse andmeblokk ilma tunnuse nimeta. Protseduur Descriptive Statistics Kolmas viis leida tunnuseid iseloomustavaid arvkarakteristikuid on protseduur Descriptive Statistics, mis peale "linnukese" tegemist valiku Summary statistics ette väljastab korraga kõik olulisemad valimi arvkarakteristikud ja valiku Confidence Level for Mean korral ka keskväärtuse usaldusintervalli. Protseduuri Descriptive Statistics (Tools -> Data Analysis) tellimisaknas tuleb määrata järgmised väljad: Input Range - algandmete blokk (võib sisaldada ka mitut veergu (rida), st. võib analüüsida korraga mitut tunnust); Grouped By - määratakse andmete paigutus blokis, tavaliselt on erinevad
muutujad (X) · matemaatiliste ja statistiliste meetoditega hinnatavad mudeli parameetrid · juhuslik komponent () ÖKONOMEETRILISE MODELLEERIMISE ETAPID: 1. teooria ja sellel baseeruva verbaalse mudeli formuleerimine 2. andmebaasi korraldamine 3. ökonomeetrilise (matemaatilise) mudeli valik 4. ökonomeetrilise mudeli parameetrite hindamine 5. parameetrite usaldatavuse kontrollimine 6. mudeli omaduste parandamine 7. järelduste tegemine 8. prognooside koostamine 3. Lihtne regressioon, regressioonivõrrandi põhikuju. Determineeritud regressioonivõrrand. Lineaarse regressiooni korral kirjeldatakse seost uuritavate muutujate väärtuste vahel sirge abil võrrandiga Y = a0+a1X Eesmärgiks on leida punktiparvega antud X ja Y vahelist seost iseloomustava parima sirge võrrand Lineaarse kahe muutujaga determineeritud regressioonimudeli korral eeldatakse, et juhusliku suuruse Y tingliku keskväärtuse ja sõltumatu muutuja X vahel on seos
või valemina , mis iga väärtuspaari jaoks fikseerib selle tõenäosuse pij=P(X=xi,Y=yj). Seejuures X võimalike väärtuste diskreetne hulk ja Y võimaike väärtuste diskreetne hulk võivad sisaldada lõpliku või loenduva hulga väärtusi ning tõenäosuste kogumi jaoks peavad kehtima omadused pij>=0 ja summa(pij)=1(normeeritus). Kahe juhusliku suuruse paarina (X,Y) esitatud kahekomponendilise pideva vektori jaotusseadus on kahe muutuja x ja y funktsioon, mida saab esitada jaotusfunktsioonina või jaotustihedusena. Jaotusseaduse omadused: monotoonssus, normeeritus, ristküliku tõenäosus. Kaht juhuslikku suurust nim sõltumatuteks, kui nende kahemõõtmeline jaotusseadus avaldub ühemõõtmeliste marginaalsete jaotustiheduste korrutisena. Kui juhuslikud suurused pole sõltumatud, on nad sõltuvad. Juhuslike suuruste vastastikune sõltuvus: *kaks juhuslikku suurust on determineeritud/funktsionaalses seoses
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
2015 plaan : • Vähendada kodutöö kirjaliku osa mahtu • Uurida ettevõtete asemel kaastudengeid • Alustame uuringu ettevalmistust kohe esimestes seminarides Kodutöö üldteema ‘innovatsioon/ õppimisvõime’ Kvantitatiivne küsimustik Kvalitatiivne case-study – intervjuud (avatud küsimused, läheb sügavuti) Kodutöös on kohustuslik leida 25 kontakti Kvantitatiivne küsimustik: statistiline analüüs, seosed kodutööti erinevad – valim 50 Kvalitatiivne intervjuu – trantskribeerimine, within-case analüüs, märksõnade leidmine. Psühholoogilised faktorid: • Values • Traits • Beliefs • Emotions • Cognitive bias Väärtused – saavutus, võim, traditsioonid Omadused – ausus, integrity Cognitive bias – tsempion, üleoptimism, tatus quo Emotisoonid – õnnelik – kurb, excited – calm, controlling - controlled Õppimisvõime: ACAP process: • Acquisition • Assimilation • Transformation • Exploitation
mis iga väärtuspaari jaoks fikseerib selle tõenäosuse pij=P(X=xi,Y=yj). Seejuures X võimalike väärtuste diskreetne hulk ja Y võimaike väärtuste diskreetne hulk võivad sisaldada lõpliku või loenduva hulga väärtusi ning tõenäosuste kogumi jaoks peavad kehtima omadused pij>=0 ja summa(pij)=1(normeeritus). Pidev kahekomponendiline vektor - Kahe juhusliku suuruse paarina (X,Y) esitatud kahekomponendilise pideva vektori jaotusseadus on kahe muutuja x ja y funktsioon, mida saab esitada jaotusfunktsioonina või jaotustihedusena. Jaotusseaduse omadused: monotoonssus, normeeritus, ristküliku tõenäosus. Kaht juhuslikku suurust nim sõltumatuteks, kui nende kahemõõtmeline jaotusseadus avaldub ühemõõtmeliste marginaalsete jaotustiheduste korrutisena. Kui juhuslikud suurused pole sõltumatud, on nad sõltuvad. Juhuslike suuruste vastastikune sõltuvus:
jalanõudele. Kaalutud hinnad näitavad riikidevahelist tarbekaupade hindade võrdlust. See näitab hindade ajalist muutust ja hindade taset. Töötuse määr on tarbimiskulutuste seisukohalt samuti oluline, sest kui inimene on töötu, on ta sissetulek väiksem ja saab teha vähem kulutusi. Antud projektis on tegemist ühendatud andmete analüüsiga ning sellele vastavalt on andmete analüüsimiseks moodustatud järgmine mudel: Yi=β0+β1X1i+β2X2i+β3X3i+D1i+u Yi-sõltuv muutuja, riietele ja jalanõudele tehtavad kulutused i-ndas riigis aastatel 2007 ja 2010 X1i-sõltumatu muutja, SKP inimese kohta i-ndas riigis aastatel 2007 ja 2010(eurodes) X2i- netosissetulek i-ndas riigis aastatel 2007 ja 2010 (ostujõu pariteedi ühikutes) X3i-töötuse määr i-ndas riigis aastatel 2007 ja 2010 (%) D1i- fiktiivne muutuja, mis tähistab aastat (D1i=0 aastal 2007 ja D1i=1 aastal 2010) ui- juhuslik komponent ehk vealiige β0 – mudeli vabaliige
xii. Mõned isikud lahkuvad riskipopulatsioonist surres, mujale kolides või edasisest osalemisest keeldudes. e.xiii. Levimuse hindamine läbilõikelistes uuringutes. e.xiv. Haigestumuse hindamine kohortuuringus. f. Populatsioon ühikute kogum, mille hulgast me leiame oma uuringu osalised. Kogum, mille kohta tahame esitada väiteid oma uuringu tulemuste põhjal. g. Valim osa populatsioonist, mida me uurime. Et valimi uurimise tulemusi saaks üldistada populatsioonile, peab olema teada iga populatsiooni liikme võimalus valimisse sattuda. Lihtsaim variant võimalus valimisse sattuda on võrdne: juhuvalim. h. Sansid- vt valemit. Kasutatakse esinemisnäitajana harva. Sansside suhe on oluline esinemise võrdlusnäitaja. i
iga üksikfaktori mõju on väike, puudub domineeriv faktor. Normaaljaotuse jaotustihedus - Määratud ära kahe parameetriga: Keskväärtus µ määrab ära jaotuskõvera asukoha, standardhälbest σ sõltub, kui lai on jaotuskõver. Valem: Normaaljaotuse keskmised: aritmeetiline keskmine = mood = median 6. Valikuuringud Statistiline uuring võib olla: kõikne – uuritakse läbi terve üldkogum või valikuline – uuritakse läbi üldkogumit esindav osa : valim Valikuuring - eesmärgiks on valimi põhjal järelduste tegemine üldkogumi kohta. Kasutamise põhjused: Väiksem maksumus, Suurem kiirus, Suurem paindlikkus, Laiem rakendatavus • spetsiaalne aparatuur; • spetsiaalselt ettevalmistatud töötajad. • Suurem täpsus andmete kogumisel • suurema kvalifikatsiooniga tööjõud; • võimalik paremini kontrollida töötlemisvigu. • Mõnikord võib objekti testimine rikkuda objekti. Loend - vahend pääsemiseks üldkogumi objektide juurde
-;bn kindlaksmääramineon ökonomeetrilise analüüsi üheks peaülesandeks. Mitmese lineaarse regressioonivõrrandi parameetrid (regressioonikordajad) võimaldavad nende majanduslikku tõlgendamist. Igal regressioonikordajal on majanduslik sisu. Mittelineaarse regressioonivõrrandi parameetrid ei ole üldjujhul sisuliselt tõlgendatavad. Lineaarse regressioonivõrrandi parameetrite (regressioonikordajate) väärtuste järgi on võimalik otsustada mil määral üks või teine sõltumatu muutuja mõjutab muutujat Yt, s.t. on võimalik otsustada, milliste sõltumatute muutujate (majanduslik) mõju on suurem, milliste oma väiksem jne. Regressioonikordaja -;i näitab mitme ühiku võrra muutub sõltuv muutuja Yt kui sõltumatu muutuja Xi muutub (suureneb) ühe ühiku võrra. Vähimruutude meetodil leitud regressioonikordajad on parameetrite tegelike väärtuste parimaks hinnanguks siis, kui on täidetud vastavad eeldused (nn.
Teine ülesanne on sageli ka praktiliste probleemide lahendamine. Uurimisprojekti läbiviimine koosneb järgmistest etappidest: 1. idee tekkimine 2. uurimuse eesmärkide, uurimisküsimuste, kontrollitavate hüpoteeside sõnastamine 3. kirjanduse uurimine ja ülevaate koostamine 4. metoodika väljatöötamine ja piloot-uuring (pilot study), et leida ja täpsustada sobivad uurimisprotseduurid; samuti sobivad sõltumatu muutuja tasemed; 5. lõplik uurimiskava koostamine; 6. andmete kogumine; 7. andmete statistiline töötlemine; 8. tulemuste interpreteerimine; 9. uurimisaruande (artikli) koostamine. Uuringu kõigis etappides tuleb järgida eetikanõudeid! 12. Uurimistöö erinevad allikad. (loeng, õpik) Üldiselt saab jagada kolmeks 1. Käsiraamatutud, kogumikud 2. Teaduslik perioodika ehk ajakirjad Ülevaate artiklid Empiirilised artiklid 3
majandusnähtuste vahelise seose tugevuse ja usaldatavuse ning samas ka seose funktsionaalse vormi. Regressioonianalüüsi põhiülesanded:1) hinnata kvantitatiivselt majandusnähtuste vaheliste seoste suunda, tugevust ja kuju; 2)prognoosida maj. nähtuste ja protsesside tõenäosuslikku arengut; 3)kontrollida empiiriliselt maj. teoreetiliste seisukohtade ja hüpoteesi paika pidavust. Regressioonivõrrandiks on lineaarne mitme muutuja funktsioon. Regressioonikordaja i näitab mitme ühiku võrra muutub sõltuv muutuja Yt kui sõltumatu muutuja Xi muutub 1 ühiku võrra. Kui regressioonmudelis on 1 sõltumatu muutuja, siis on tegemist lihtsa regressioonvõrrandiga Y=b0+ b1xi+ei, i=1,2...n. Kui sõltumatuid muutujaid on vähemalt 2 (k>2), siis on tegemist mitmese regressioonimudeliga. Enim praktikas kasutusel olev mittelineaarne regressioonvõrrand on ruutmudel e. parabool. Parabooli abil on
n ( y^ t - y)2 D=R = 2 i =1 n (y t - y)2 i =1 Statistiline prognoosimine ja terve hulk lihtsamaid prognoosimudeleid tugineb senise arengutrendi kindlaksmääramisel ja selle ekstrapoleerimisele tulevikku Aproksimeerimisviga - Mudeli headust mõõdetakse enamasti tema kirjeldatuse tasemega ehk determinatsioonikordajaga, R 2 Näitab kui palju sõltuva muutuja (y) hajuvusest seletav muutuja (trend, t) kirjeldab Omab väärtusi vahemikus [0, 1]; mida kõrgem, seda paremini seletav tunnus sõltuva tunnuse hajuvust kirjeldab Üldjuhul eristatakse aegreas kolme komponenti: · Trend ehk arengutendents · Lühiajalised süstemaatilised võnked (sesoonsus, tsüklilisus vms) · Juhuslik komponent (hõlmab paljude juhuslike mõju avaldavate tegurite koondmõju)