Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Statistiline modelleerimine praktikumide juhised.". Need materjalid aitavad sul teemat sügavamalt mõista.
muutuja, regressioon, käsklus, statistik, anova, astak, korrelatsioon, faktorit, andmestik, valim, ravim, variable, praktikum, mean, spss, dependent, tests, doos, mudelis, varieeruvuse, levene, valige, regression, value, case, cases, andmestiku, aknas, independent, rank, factor, interaktsioon, logistilise, faktoranalüüs, omaväärtus, valimite, method......................... 3 Andmeanalüüs SPSS'is........................................................................................... 4 Kirjeldav statistika............................................................................................... 4 Kuidas testida normaaljaotust?........................................................................... 4 Sagedustabeli analüüs (Hii-ruut).........................................................................5 Ühesuunaline ANOVA........................................................................................... 5 Faktoriaalne ANOVA............................................................................................. 6 Korduvmõõtmsite ANOVA (Repeated measures ANOVA).....................................6 Kurskall-Wallise test (e. mitteparameetriline ANOVA)..........................................7 T-test sõltumatute gruppidega.......................................................................
jn) - valid mille puhul tahad uurida - Options - valid milliseid väärtusi leida tahad ja ok, vastused ilmuvad OutPuti aknasse. Charts all on võimalik kasutada histogrammi joonistamise võimalust. Joonisel olev küsimärk käib osutatud linnukese kohta. Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel. Küsimärk on juurde tehtud, et uurida, kas sellise tabeli koostamine on vajalik. Uue muutuja arvutamine: Transform - Compute variable - kirjutad uue lahtri nimetuse (tühikuid ei kasuta) - liidad mida vaja liita (võrdusmärki pole vaja) Kehamassiindeks=Kaal kg'des jagadtud pikkus cm'tes ruudus (Pikkus x Pikkus) Andmete eraldamine: Data - select cases - If condition is satisfied ette linnuke - klikid If...-le - valid nt ainult meeste tulemuste saamiseks vasakult Sugu, siis = ja 1 (sest 1=mees ja tahan ainult meeste tulemusi) ja continue.
Statistiline modelleerimine – kokkuvõte Muutujad: Sõltuvad muutujad (dependent, outcome variables) – muutujad, mis on uurimise keskmes, millele uurija arvab, et teised muutujad mõju avaldavad. Nö katseisikust sõltuv muutuja. Sõltumatud muutujad (independent, predictor variables) – muutujad, mille kohta uurija arvab, et neil võiks olla mõju uuritavatele muutujatele. Statistilise analüüsi keskmes on uurida, kuidas teatud tunnused koos muutuvad. Kui on vaja muutujat iseloomustada, on kaks põhilist viisi, kuidas seda teha: o Milline on selle muutuja tüüpiline väärtus? o Kui hästi iseloomustab see tüüpiline väärtus kõiki mõõdetud juhtumeid? Ehk
Yes) h) avaneb Gretli-i menüü aken koos muutujate nimedega: Excel 2. Lineaarse mudeli parameetrite hindamine vähimruutude meetodil (Model -> Ordinary Least Squares) Põhimenüü ribalt valida menüü - Model. Avanevast rippmenüüst valida Ordinary Least Squares. Seejärel tuleb aknas "gretl: specify model" olemasolevate muutujate hulgast valida sõltuv muutuja Y (Dependent variable) ja üks või mitu sõltumatut muutujat X (Independent variables). Vajutada OK. 3. NÄIDE piima kogutoodangut kirjeldava regressioonimudeli konstrueerimisest Otsime mudelit kujul: Y-PKT_ha = a0 +a1TASU + a2SOOT + a3HP + a4PMYYK + a5 TOETUS + a6 KHIND Y_PKT_ha – piima kogutoodang ha kohta, kg TASU - töötasu 1 kg piima tootmiseks, senti SOOT – söödakulu 1 kg piima tootmiseks, senti HP – mullaviljakus, maa hindepunkt pallides
Heteroskedastiivsuse test........................................................................................29 Lisa 11. Multikollineaarsuse test...........................................................................................30 Lisa 12. Jääkliikmete normaaljaotuse testid.........................................................................31 Lisa 13. Jääkliikmete normaaljaotuse graafik.......................................................................32 Lisa 14. ANOVA tabel...........................................................................................................33 Lisa 15. Mudeli jääkliikmete kirjeldavad statistikud............................................................34 Lisa 16. Lõpliku mudeli regressioonikoefitsientide koovariatsiooni maatriks.....................35 Lisa 17. Mudeli stabiilsuse test (Chow test).........................................................................36 SISSEJUHATUS
Samas ei ole nende väärtuste vahemikud võrdsed. Nt. hinnang (väga hea, hea, rahuldav) nt 0-100, 101-100 jne –vahemikud ei ole ühepikkuses, keskmist arvutada ei saa. Ka skaalad. – on olemas kindel järjekord aga v.heast heani ja heast halvani ei ole ühepikused Binaarne- sellel on ainult kaks võimalikku väärtust. Must v valge, mees v naine Nimitunnus – mille väärtusi ei saa mitte mingil moel järjestada nt eriala, linn, kool 1s sossi failis on üks fail ja üks andmestik, mida saab vaadata kahes vaates –üks on andmevaade ja avaneb tavaliselt esimesene, teine vaade on tunnuse vaade. Nt sugu, pikemalt SUGU, sisestatud on numbreid, kodeerimiseeskiri on väärtute alla –nt 1 on mees ja 2 on naine Andmevaatel on omakorda andmevaade –numbrid ehk koodid ja kirjeldused. View-value labels –saab muuta kas numbrid või tekstiline. Esimesena, mida vaja on teha andmestik puhtaks. On nii sisestuse kui ka arusaamise vigu
(dependent variable). teatud suurusi v. tingimusi hoitakse muutumatutena - neid nimetatakse kontrollitavateks muutujateks (control variable). Uurimisprojekti läbiviimine koosneb enamasti järgmistest etappidest: a) idee tekkimine (aluseks vaatlused ja tähelepanekud elust; ekspertide hinnangud ja soovitused; ajakirjad); b) testitatava hüpoteesi sõnastamine - see sisaldab kahe v. enama muutuja vahelise teoreetilise suhte lühikirjelduse, samuti muutujate mõõtmisviisi kirjelduse (nimetamise). (näit. Kas õppimine on efektiivsem üksinda v. väikeses grupis? Tuleks lisada, kuidas me õppimise efektiivsust mõõdame!) c) kirjanduse ülevaate koostamine; d) piloot-uuring (pilot study), et leida ja täpsustada sobivad uurimisprotseduurid; samuti sobivad sõltumatu muutuja tasemed; e) lõplik uurimiskava koostamine; f) andmete kogumine; g) andmete statistiline töötlemine;
Andmestikus kultuur.sav on selliseks tunnuseks vanus. Koostades vanuse väärtustest sagedustabeli, on see liiga mahukas, et seda andmete esitamiseks kasutada. Statistics – Summarize – Frequencies Variable(s): millistest muutujatest sagedustabelit soovitakse Statistics: võimalus tellida muutuja(te) kohta statistikuid (kvartiile-min/max, keskmist, standardhälvet jne) – ainult rangelt arvandmete korral! Charts: võimalus tellida muutuja kohta graafikuid (histogrammi) Format: peamiselt muutujate järjestus (ei taha koos histogrammiga töötada): Ascending values: muutuja väärtuste kasvavas järjekorras Descending values: sama kahanevas järjekorras Ascending counts: muutujad esinemissageduste suurenevas järjekorras Descending counts: sama kahanevas järjekorras Tulemuseks saame Output-aknasse taolised tabelid: Kodakondsus
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
82, F 15.342 ( p 0.001) kus Y – küsitletu tarbimine eurodes, X – küsitletu sissetulek eurodesning D – küsitletu sugu (D = 1, kui mees ning D = 0, kui naine); t – statistiku kriitiliseks väärtuseks on t 0.025,96 1.99 . Vastake järgmistele küsimustele ning põhjendage vastuseid a) kas mudel on statistiliselt oluline olulisuse nivool 0.05; mida saate öelda mudeli kirjeldatuse taseme kohta. b) millised muutujad on statistilised olulised olulisuse nivool 0.05; c) Leida muutuja X ees oleva kordaja 95% usalduspiirid. Lahendus. a) Mudel on statistiliselt oluline olulisuse nivoo 0.05 korral, kuna F-testi olulisuse tõenäosus p 0.001 on väiksem kui 0.05. Mudeli sõltumatud muutujad kirjeldavad ära 82% tarbimise varieeruvusest. b) Kuna muutujate X ja D t-statistikute absoluutväärtused on suuremad kui kriitiline väärtus ( 22.54 1.99; 2.34 1.99) , siis statistiliselt olulised muutujad mudelis on muutuja X ja muutuja D
jalanõudele. Kaalutud hinnad näitavad riikidevahelist tarbekaupade hindade võrdlust. See näitab hindade ajalist muutust ja hindade taset. Töötuse määr on tarbimiskulutuste seisukohalt samuti oluline, sest kui inimene on töötu, on ta sissetulek väiksem ja saab teha vähem kulutusi. Antud projektis on tegemist ühendatud andmete analüüsiga ning sellele vastavalt on andmete analüüsimiseks moodustatud järgmine mudel: Yi=β0+β1X1i+β2X2i+β3X3i+D1i+u Yi-sõltuv muutuja, riietele ja jalanõudele tehtavad kulutused i-ndas riigis aastatel 2007 ja 2010 X1i-sõltumatu muutja, SKP inimese kohta i-ndas riigis aastatel 2007 ja 2010(eurodes) X2i- netosissetulek i-ndas riigis aastatel 2007 ja 2010 (ostujõu pariteedi ühikutes) X3i-töötuse määr i-ndas riigis aastatel 2007 ja 2010 (%) D1i- fiktiivne muutuja, mis tähistab aastat (D1i=0 aastal 2007 ja D1i=1 aastal 2010) ui- juhuslik komponent ehk vealiige β0 – mudeli vabaliige
ka: var, D(X)). Seega, mida suurem on Xi väärtus võrreldes keskväärtusega, (aritmeetilise keskmisega) seda suurem on hajuvus e dispersiooni. 5. Dispersiooni meetod 6. Diskreetne arvuline tunnus omab vaid täisarvulist väärtust, n laste arv perekonnas, eesti elanike arv. 7. DurbinWatsoni test. Kasut 1. järku autokorrelatsiooni avastamiseks. Kasut.tingimused: reg.mudel sisaldab vabaliiget. Mudel ei sisalda sõltuva muutuja viitajaga liikmeid (nt Yt1, Yt2) 8. Fiktiivne muutuja (dummy) iseloomustavaid binaarseid muutujaid. Binaarne muutuja nominaalsel tunnusel vaid 2 erinevat väärtust, näiteks abielus v vallaline. 9. Entroopia määramatus (Prognoosi entroopia E on see osa infost tuleviku kohta, mida olemasoleva lähteinfo põhjal ei olnud võimalik leida). 10
Sõltumatud valimid – erinevad objektid, sama tunnus. (Nt meeste ja naiste üldine rahulolu, kus mehed ja naised on 2 erinevat gruppi ja rahulolu on intervalltunnus). ANOVA-Nagu sõltumatute v. T-test 3 või enama grupiga. Sõltuv tunnus peab olema intervalltunnus. Võrreldavad grupid (3 või enam gruppi!) sõltumatud. Hajuvused peavad olema gruppides sarnased (Levens test). Tulemuste jaotus vastab normaaljaotusele (loetakse kehtivaks ilma kontrollimata). Kui ANOVA eeldused ei ole täidetud, siis MPAR (mitteparameetrilised väärtused) test Kruskal-Wallis või Games-Howell. Kui H1, siis Post-Hoc testid, et välja selgitada, milliste gruppide vahel on erinevused. Tukey – gruppide suurused sarnased. Bonferroni – gruppide suurused erinevad. Korrelatsioon näitab seost kahe tunnuse vahel. Korrelatsiooni koefitsent on alati -1…1 ja näitab kahte asja: seose suunda ja tugevust. Pearson r eranditeta invervalltunnused, pole erandlikke väärtusi, seos
Regressioonisirge lisamiseks Chart Layout Trendline Linear trendline. Andmete lisamiseks graafikult, parem klõps Format trendline ja kaks alumist ticki teha. Tee regressioonanalüüs: Data analysis: regression. Seejärel pane paika võrrand, a+b*otsitav; a ja b saad regressioonitabelist. a=intercept ja b on selle all. Seejärel püstita hüpoteesid: H0: regressioonivõrrand ei ole statistiliselt oluline; H1: regressioonivõrrand on statistiliselt oluline. P väärtus on ANOVA all, significance F. NÄITED: Prognoosige hinge kinni pidamise võimet kehalise võimekuse testi abil, Prognoosige tudengite massi nende pikkuse abil. Kui palju võiks keskmiselt kaaluda 170 cm pikkune tudeng? Prognoosige pikkust jalanumbri alusel. Hiiruut-test: Vt ka PRAKS 7 Kõige pealt tee kahemõõtmeline Pivottable, kus columni tunnuse panen ka value alla. Et saada rea ja veeruprotsente, lisa value alla veel kaks korda sama tunnust ja seejärel parema klõpsuga show values as.
informatsiooni, koosnedes tavaliselt ühest või mitmest tabelist ja/või joonisest. Pivot Table Neljas andmeanalüüsil kasutatav MS Exceli vahend on Pivot Table (nn. pöördtabel või risttabel), mille konstrueerimiseks tuleb liikuda menüüst Data käsule Pivot Table Report.... Esimese sammuna tuleb valida, millisel kujul on uuritav andmestik (vaikimisi ühel lehel paiknev Exceli andmetabel, ülejäänud valikud võimaldavad konstrueerida risttabeli ka mitte-Exceli andmete või mitme andmetabeli baasil). Edasi vaatame juhtu, kus andmestikuks on ühel lehel paiknev Exceli andmetabel. Teise sammuna tuleb määrata uuritav andmeblokk (kas klaviatuurilt või hiirega andmetabelist
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
teatud väitega nõustumise astme (nt täiesti nõus, pigem nõus, ei ole nõus). Summeeritud hinnangute skaala ehk Likerti skaala – hoiakute mõõtmisel kasutatav skaala, mis koosneb väidetest, millest igaüht hinnatakse positiivselt ja negatiivselt orienteeritud mitmepunktilisel (kõige sagedamini 5-punktilisel) skaalal; saadud hinnangud summeeritakse 4. Andmete kirjeldamise viisid: jaotus; tsentraalse tendentsi karakteristikud; variatiivsus; korrelatsioon Normaaljaotus - Praktiline väärtus on normaaljaotuskõvera eri piirkondade protsentuaalse suuruse ja standardhälbe ühikute vahelisel seose teadmisel. Kujutame histogrammina ehk tulpdiagrammina. Normaaljaotus on väga paljudele psühhol. omadustele iseloomulik. Tsenteraalse tendentsi karakteristikud: Näitab skooride keskmist suurust erinevatel viisidel. Need on mood, mediaan ja aritmeetiline keskmine. Mood - kõige sagedasem väärtus
tõttu hakkab vähenema. Väide oleks, kui hinnangu statistiline olulisus suureneks ning standardviga vähenes. Kui me kasutame hinnangute andmisel järjest suuremaid valimeid, siis hinnangu stat. olulisus hakkab suurenema ja standardviga väheneb, kuna hinnang läheb täpsemaks. Standardviga saab suureneda juhul, kui andmed valimites hakkavad suuresti hajuma ja sellega stat. olulisus väheneb. Milliseid mudeleid kasutatakse sõltuva fiktiivse muutuja modeleerimisel? Millised on peamised erinevused nimetatud mudelite vahel ja probleemid selliste mudelite korral? Lineaarne tõenäosusmudel Probleemid LTM kasutamisel • Jääkliikmed ei ole normaalselt jaotunud. Nii nagu Y omavad ka jääkliikmed sisuliselt ainult kahte võimalikku väärtust. • Jääkliikmed on heteroskedastiivsed. • Tõenäosus võib olla negatiivne või suurem kui 1. • Determinatsioonikordaja on küsitava väärtusega ja jääb tavaliselt üsna madalaks.
muutujad (X) · matemaatiliste ja statistiliste meetoditega hinnatavad mudeli parameetrid · juhuslik komponent () ÖKONOMEETRILISE MODELLEERIMISE ETAPID: 1. teooria ja sellel baseeruva verbaalse mudeli formuleerimine 2. andmebaasi korraldamine 3. ökonomeetrilise (matemaatilise) mudeli valik 4. ökonomeetrilise mudeli parameetrite hindamine 5. parameetrite usaldatavuse kontrollimine 6. mudeli omaduste parandamine 7. järelduste tegemine 8. prognooside koostamine 3. Lihtne regressioon, regressioonivõrrandi põhikuju. Determineeritud regressioonivõrrand. Lineaarse regressiooni korral kirjeldatakse seost uuritavate muutujate väärtuste vahel sirge abil võrrandiga Y = a0+a1X Eesmärgiks on leida punktiparvega antud X ja Y vahelist seost iseloomustava parima sirge võrrand Lineaarse kahe muutujaga determineeritud regressioonimudeli korral eeldatakse, et juhusliku suuruse Y tingliku keskväärtuse ja sõltumatu muutuja X vahel on seos
Mitmese lineaarse regressioonmudeli parameetrite hindamine Parameetrite tõlgendus Standardiseeritud kordajad Mitmene regressioonmudel I ANOVA tabel F-test ja mudeli statistilise olulisuse kontroll Korrigeeritud determinatsioonikordaja Parameetrite statistilise olulisuse kontroll
Determinatsioonikordaja näitab argumendi X võimet kirjeldada uuritava suuruse Y hajuvust. 20. Mida näitab otsustusmuutuja kordaja (tõus) lineaarses ühe otsustusmuutujaga regressioonvõrrandis? Lineaarne seos on määratud kahe parameetriga: D (regressioonsirge tõus) kirjeldab juhusliku suuruse Y keskväärtuse muutumise kiirust suuruse X mõjul; E on regressioonsirge algordinaat. Ideaalse mitmese regressioonanalüüsi korral on otsustusmuutujad sõltumatud, igaüks kirjeldab sõltuva muutuja hajuvusest üht kindlat osa. Otsustusmuutuja kordaja näitab otsustusmuutuja mõju juhusliku suuruse Y keskväärtusele, kui teised muutujad jäävad samaks. Näiteks: Y=13,07x1+82,28, kus Y on läbimüük ja x1 on reklaam. Kui reklaami näitamine kasvab 1 võrra, siis läbimüük kasvab 13,07 võrra. 21. Kuidas tõlgendada otsustusmuutujate kordajaid mitme otsustusmuutujaga regressioonvõrrandis? Näiteks: Y=8,23x1+0,29x2+86,25, Y on läbimüük, x1 on reklaam ja x2 on õhutemperatuur
katsealused (Haag 2004). Probleem on ainult selles, et selline katsedisain sobib ainult interventsioonide puhul, millel on lühiajaline mõju. Vastasel juhul interventsiooni mõju segab kontrollsituatsiooni mõju üks periood hiljem (Haag 2004). 2. Väljundeid eksperimentaalsete uuringute analüüsiks Ilmselge on, et moodus, millega eksperimentaalse uurimuse andmeid analüüsitakse sõltub uurimust huvitavadest küsimusdest. Lisaks on tähtis tulemuse muutuja jaotamine või omadused. Enamustes situatsioonides on võimalik vahet teha pideva tulemuse muutuja ja dihhotoomse tulmuse muutuja vahel (jah/ei muutuja) (Haag 2004). 2.1 Regressionanalüüs Regressioon on enim kasutatud andmete analüüsi tehnika, mis on olemas, et tuvastada tegureid, mis on seotud opitmaalse sportliku sooritusega. Konkreetset tüüpi regressioonanalüüsi kasutus uuritavast sportlikust sooritusest oleneb sõltuvast muutujast.
Kui tegu on „veidrakujulise“ jaotusega Aritmeetiline keskmine - saab kasutada vaid intervallskaal korral Kui tulemused on jaotunud enam-vähem sümmeetriliselt keskmise ümber Kui ülesanne nõuab sellise keskmise määramist, mis on aluseks mingile teisele meetodile Kui nõutakse eri gruppide sama tunnuse mõõtmisel saadud tulemuste võrdlemist Kui on tarvis analüüsida populatsiooni, millest uuritav valim pärineb 3 Kahe tunnuse analüüs. Sageduste risttabel. Hii-ruut-test 3.1 Risttabelis üks lahter esile toodud (värviga). Kuidas interpreteerida (rea / veeru / üldprotsent) 3 küsimust. 3.2 Formuleerida hii-ruut-testi nullhüpotees. Teha otsustus näite põhjal. (Lisatingimusi pole vaja arvestada) H0: Tunnuse A ja B vahel ei esine olulist sõltuvust. => Prob < 0.05 (H1: Tunnuse A ja B vahel esineb oluline sõltuvus. => Prob > 0.05)
.......................................... 13 Kokkuvõte....................................................................................................................... 20 Lisad................................................................................................................................21 2 Sissejuhatus Oma aruandes uurisime Eesti Maaülikooli erinevate erialade üliõpilaste andmeid. Antud aruande andmestik koosneb sellistest andmetest nagu üliõpilaste sugu, matemaatika keskkooli hinne, eriala, kood, matemaatika riigieksamieksami tulemus, matemaatika testi tulemus. Analüüs on koostatud 2000, 2002, 2003 ja 2008 aasta andmete põhjal. Esmalt võtsime vaatluse alla keskkooli matemaatika hinde ning riigieksami tulemuse, kus eesmärgiks oli uurida, kas riigieksami tulemus on seotud keskkooli hindega. Seejärel uurisime matemaatika riigieksami tulemuse sõltumist aastast. Siis vaatasime
2015 plaan : • Vähendada kodutöö kirjaliku osa mahtu • Uurida ettevõtete asemel kaastudengeid • Alustame uuringu ettevalmistust kohe esimestes seminarides Kodutöö üldteema ‘innovatsioon/ õppimisvõime’ Kvantitatiivne küsimustik Kvalitatiivne case-study – intervjuud (avatud küsimused, läheb sügavuti) Kodutöös on kohustuslik leida 25 kontakti Kvantitatiivne küsimustik: statistiline analüüs, seosed kodutööti erinevad – valim 50 Kvalitatiivne intervjuu – trantskribeerimine, within-case analüüs, märksõnade leidmine. Psühholoogilised faktorid: • Values • Traits • Beliefs • Emotions • Cognitive bias Väärtused – saavutus, võim, traditsioonid Omadused – ausus, integrity Cognitive bias – tsempion, üleoptimism, tatus quo Emotisoonid – õnnelik – kurb, excited – calm, controlling - controlled Õppimisvõime: ACAP process: • Acquisition • Assimilation • Transformation • Exploitation
Loenguplaan · Seos kahe tunnuse vahel kovariatsioon korrelatsioon Harilik lineaarne · Harilik lineaarne regressioonmudel Vähimruutude meetod parameetrite hinnangute leidmiseks regressioonmudel
väikest mõju avaldavate muutujate eemaldamine. Selliste muutujate leidmiseks tehakse korrelatsioonianalüüs, mis oma olemuselt on nähtuste vaheliste seoste statistilise analüüsi meetod. Kasutades Exceli protseduuri Tools/Data Analysis/Correlation, koostasime korrelatsioonimaatriksi , mille abiga leitakse seoste olemasolu, tugevus, suund ning statistiline olulisus, korrelatsioonimaatriks (tabel 2.) Valiku kriteeriumiks võeti iga muutuja ja ettevõtte kogumüügi vaheline korrelatsioon Edasisel analüüsil määrati kindlaks näitajat, mis avaldavad piima tootmise muutusele kõige suuremat mõju. Seose tugevust tuli hinnata korrelatsioonikordaja absoluutväärtuse alusel. Mida suurem on kordaja absoluutväärtus, seda suurem on kahe juhusliku suuruse vaheline lineaarne korrelatiivne seos. Korrelatsioonimaatriksist näeb, et kõige suurem seos on uuritaval näitajal ( piima
vähemalt viis korda rohkem. Kvantitatiivne andmeanalüüs: · Statistilised andmetöötlusprogrammid, näiteks SPSS · Atribuudid o sõltumatu atribuut - manipuleeritav atribuut o sõltuv atribuut - see, mida mõõdetakse · Eeldused (normaaljaotus) · Andmeanalüüsid o Parameetrilised testid (peavad vastama eeldustele) o Testid muutujate vaheliste seoste leidmiseks (pideva atribuudi keskväärtuste võrdlemine) Korrelatsioon - seose tugevus kahe pideva atribuudi vahel Regressioon - millisel määral sõltumatud atribuudid mõjutavad sõltuvat atribuuti, mängitakse läbi erinevad kombinatsioonid Faktoranalüüs - lubab vähendada atribuutide arvu vähemaks hulgaks faktoriteks o Testid gruppide vaheliste erinevuste leidmiseks T-test ANOVA - kahe või enama grupi omavaheline võrdlus
SPSS/PC+ The Statistical Package for IBM PC 6/12/ 2 set /beep off. GET /FILE 'tud.sys'. The SPSS/PC+ system file is read from file tud.sys The file was created on 2/21/10 at 11:40:26 and is titled SPSS/PC+ System File Written by Data Entry II The SPSS/PC+ system file contains 247 cases, each consisting of 44 variables (including system variables). 44 variables will be used in this session. ------------------------------------------------------------------------------- Page 2 SPSS/PC+ 6/12/ 2 This procedure was completed at 10:26:32 * more on - iga lehekylje ja"rel tehakse paus, suvaline klahvivajutus viib edasi * more off - pausi ei tehta, ko~ik ka"sud ja"rjest. SET MORE OFF. SET LENGTH 500. *---------------------------------- * iga tudengi oma va"ljavo~tu tingimused. * Tingimuses olevaid tunnuseid ei tohi analyysis kasutada. SELECT IF (T614=1 AND T713=1). *-----------
majandusnähtuste vahelise seose tugevuse ja usaldatavuse ning samas ka seose funktsionaalse vormi. Regressioonianalüüsi põhiülesanded:1) hinnata kvantitatiivselt majandusnähtuste vaheliste seoste suunda, tugevust ja kuju; 2)prognoosida maj. nähtuste ja protsesside tõenäosuslikku arengut; 3)kontrollida empiiriliselt maj. teoreetiliste seisukohtade ja hüpoteesi paika pidavust. Regressioonivõrrandiks on lineaarne mitme muutuja funktsioon. Regressioonikordaja i näitab mitme ühiku võrra muutub sõltuv muutuja Yt kui sõltumatu muutuja Xi muutub 1 ühiku võrra. Kui regressioonmudelis on 1 sõltumatu muutuja, siis on tegemist lihtsa regressioonvõrrandiga Y=b0+ b1xi+ei, i=1,2...n. Kui sõltumatuid muutujaid on vähemalt 2 (k>2), siis on tegemist mitmese regressioonimudeliga. Enim praktikas kasutusel olev mittelineaarne regressioonvõrrand on ruutmudel e. parabool. Parabooli abil on
või valemina , mis iga väärtuspaari jaoks fikseerib selle tõenäosuse pij=P(X=xi,Y=yj). Seejuures X võimalike väärtuste diskreetne hulk ja Y võimaike väärtuste diskreetne hulk võivad sisaldada lõpliku või loenduva hulga väärtusi ning tõenäosuste kogumi jaoks peavad kehtima omadused pij>=0 ja summa(pij)=1(normeeritus). Kahe juhusliku suuruse paarina (X,Y) esitatud kahekomponendilise pideva vektori jaotusseadus on kahe muutuja x ja y funktsioon, mida saab esitada jaotusfunktsioonina või jaotustihedusena. Jaotusseaduse omadused: monotoonssus, normeeritus, ristküliku tõenäosus. Kaht juhuslikku suurust nim sõltumatuteks, kui nende kahemõõtmeline jaotusseadus avaldub ühemõõtmeliste marginaalsete jaotustiheduste korrutisena. Kui juhuslikud suurused pole sõltumatud, on nad sõltuvad. Juhuslike suuruste vastastikune sõltuvus: *kaks juhuslikku suurust on determineeritud/funktsionaalses seoses
-;bn kindlaksmääramineon ökonomeetrilise analüüsi üheks peaülesandeks. Mitmese lineaarse regressioonivõrrandi parameetrid (regressioonikordajad) võimaldavad nende majanduslikku tõlgendamist. Igal regressioonikordajal on majanduslik sisu. Mittelineaarse regressioonivõrrandi parameetrid ei ole üldjujhul sisuliselt tõlgendatavad. Lineaarse regressioonivõrrandi parameetrite (regressioonikordajate) väärtuste järgi on võimalik otsustada mil määral üks või teine sõltumatu muutuja mõjutab muutujat Yt, s.t. on võimalik otsustada, milliste sõltumatute muutujate (majanduslik) mõju on suurem, milliste oma väiksem jne. Regressioonikordaja -;i näitab mitme ühiku võrra muutub sõltuv muutuja Yt kui sõltumatu muutuja Xi muutub (suureneb) ühe ühiku võrra. Vähimruutude meetodil leitud regressioonikordajad on parameetrite tegelike väärtuste parimaks hinnanguks siis, kui on täidetud vastavad eeldused (nn.