nulliga, mis tähendab et hinnangu keskväärtus võrdub parameetri tegeliku väärtusega. E(a) = . EFEKTIIVNE HINNANG: hinnangute hajuvust isel efektiivsuse mõistega. Parameetri 1 nihketa hinnang a1 on efektiivsem kui parameetri 1 nihketa hinnang a2, kui hinnangu a1 dispersioon on väiksem kui hinnangu a2 dispersioon. Efektiivne hinnang on selline hinnang, ille dispersioon on minimaalne, st hinnangu kui juhusliku suuruse varieeruvus on minimaalne. 10. Multikollineaarsuse olemus. Multikollineaarsuse avastamine. Tolerants (TOL), varieeruvusindeks (VIF). Multikollineaarsuse tagajärjed. Terminiga multikollineaarsus iseloomustatakse olukorda või seisundit, kui regressioonivõrrandi sõltumatute muutujate arvväärtused on omavahelises sõltuvuses. Kaks erinevat multikollineaarsuse taset: · y täielik multikollineaarsus · y mittetäielik multikollineaarsus AVASTAMINE · Korrelatsioonikordaja kahe sõltumatu muutuja korral on suurem kui > 0,8
Kui JB empiiriline väärtus ületab kriitilise (p on väiksem kui alfa), lükatakse H0 normaaljaotuse esinemise kohta ümber. KOKKUVÕTTE: 53. Multikollineaarsus, selle liigitus. Regressioonmudeli korral eeldame, et tunnused x2 , x3 ,.., xk on sõltumatud, st nad ei ole omavahel seotud. Sõltuvus võib olla erineva tugevusega: i. Perfektne multikollineaarsus · Kaks või rohkem tunnust on omavahel lineaarselt seotud. ii. Ligikaudne multikollineaarsus · Multikollineaarsuse all mõeldakse tavaliselt just seda. · Ökonomeetriliste mudelite korral kõige problemaatilisem. iii. Täielik sõltumatus, multikollineaarsus puudub. 54. Tugeva ligikaudse multikollineaarsuse ilmingud. Tugev ligikaudne multikollineaarsus tähendab, et sõltumatute tunnuste vahel on tugev, kuid mitte perfektne lineaarne seos. Kui seos on tugev, siis selle determinatsioonikordaja R2 suur.
......................25 Lisa 7. Esialgne hinnatud mudel...........................................................................................26 Lisa 8. Teine hinnatud mudel (ilma meeste osakaaluta).......................................................27 Lisa 9. Kolmas hinnatud mudel (ilma meeste osakaaluta ja linlaste osakaaluta).................28 Lisa 10. Heteroskedastiivsuse test........................................................................................29 Lisa 11. Multikollineaarsuse test...........................................................................................30 Lisa 12. Jääkliikmete normaaljaotuse testid.........................................................................31 Lisa 13. Jääkliikmete normaaljaotuse graafik.......................................................................32 Lisa 14. ANOVA tabel...........................................................................................................33 Lisa 15
Näide: tegeliku Y ja arvutusliku Ŷ vaheline seos c) regressioonijääkide normaaljaotuse kontrollimine Tabelid - menüü Analysis a) display actual, fitted data, residual (algandmed, arvutuslikud Y, ja regressioonijäägid (üks osa tabelist) b) forecasts - Y arvutusliku 95%-lised prognoosiväärtused c) confidence intervals – regressioonikordajate usalduspiirid d) ANOVA tabel (Excelis teostatud regressiooni väljundtabeli keskmine tabel (hajuvused, R2, F)) 5. Multikollineaarsuse testimine OLSi menüü Tests –> Collinearity 6. Heteroskedastiivsuse kontrollimine Heteroskedastiivsuse kontrollimiseks kasutada OLS-i menüüd Tests ja avanevast rippmenüüst valida White’s test või muu huvipakkuv test ja anda hinnang regressioonijääkide varieeruvuse konstantuse kohta (kas esineb heteroskedastiivsus või ei esine, vaata labortunni tööd otsuse tegemiseks). 7. Erikujuliste regressioonimudelite konstrueerimine
Labor 13. Kantregressioon Leida regressioonivõrrandi parameetrid kantregressiooni meetodil. Koostada graafikud, mis iseloomustavad regressioonikordajate sõltuvust kantregressiooni parameetrist kolme erineva algandmete variandi korral. Juhend STATGRAPHICS'is kantregressiooni leidmiseks. 1. Kopeerida labor 7-st algandmete (multikollineaarsuse tabel) koopia uuele töölehele. 2. Teha juurde uus veerg x3 jaoks (x2 kõrvale) ja kopeerida labor 3 sheet2-lt uus vektor, mis ei lange kokku eelnevatega. Arvutada uued y väärtused (x3 ka sisse arvutada). (Tase 1, r1,2; r1,3 = 0) 3. Teostada regressioonanalüüs (Excel). 4. Märgistada ära piirkond: x1, x2, x3 ja y ja teha Kopeeri. 5. Avada STATGRAPHICS DEMO. Andmete sisestamiseks märkida ära: Analyze Existing Data
67) Multikollineaarsus, selle liigitus. Perfektne multikollineaarsus - kaks või rohkem tunnust on omavahel lineaarselt seotud (deterministlik lineaarne seos) (Tugev) ligikaudne multikollineaarsus - tugev, kuid mitte perfektne lineaarne seos Täielik sõltumatus - multikollineaarsus puudub Kui mudel on statistiliselt oluline (pmultikollineaarsuse ilmingud Mudel on statistiliselt oluline, F-testi olulisusetõenäosus väike, aga enamus tunnuseid statistiliselt mitteolulised, tunnuste standardvead suured Korrelatsioonikordajad sõltumatute tunnuste vahel väga suured, suuremad kui nende korrelatsioonikordaja sõltuva muutujaga. Parameetrite märgid ebaloogilised Parameetrite hinnangud väga tundlikud -üksikute tunnuste lisamise/eemaldamise suhtes -vaatluste arvu suurenemisel/vähenemisel
ökonomeetrilist mudelit.Mudeli korrektsus sõltub ühelt poolt analüüsi tegija (ökonomeetrilise mudeli koostaja) majandusteoreetilisest ettevalmistusest ja teadmistest ning teiselt poolt mudeli koostamiseks vajalike arvandmete kättesaadavusest. Paljudel juhtudel me võime teooriast tulenevalt või vastava analüüsi tulemusena jõuda järeldusele, et üks või teine tegur on käsitletava probleemi jaoks oluline,kuid selle kohta puuduvad arvandmed. Multikollineaarsuse mõju regressioonianalüüsi tulemustele(lab. tööde järeldused).Multikokollineaarsus -; olukord, kus regressioonivõrrandi sõltumatute muutujate arvväärtused on omavahelises sõltuvuses. Eristatakse kolme erinevat multikollineaarsuse taset:1.täpne (täielik) multikollineaarsus 2.peaaegu täielik multikollineaarsus,3.sõltumatud muutujad on omavahelises korrelatiivses sõltuvuses.Täpne (täielik) multikollineaarsus -; esineb siis, kui üks
Ei tohi esineda täpset multikollineaarsust, aga võib esineda ligikaudne multikollineaarsus. Kui mudel ise on statistiliselt oluline, aga parameetrid on kõik statistiliselt mitteolulised, on tõenäoliselt tegemist multikollineaarsusega. Esineda võib kahte liiki multikollineaarsus: ● Prefektne multikollineaarsus - kaks või rohkem tunnust on omavahel lineaarselt seotud ● Ligikaudne multikollineaarsus - Multikollineaarsuse all mõeldakse tavaliselt just seda; ökonomeetriliste mudelite korral kõige problemaatilisem 68. Tugeva ligikaudse multikollineaarsuse ilmingud. ● Mudel on statistiliselt oluline, F-testi olulisuse tõenäosus on väike, aga enamus tunnuseid statistiliselt mitteolulised, tunnuste standardvead suured ● Korrelatsioonikordajad sõltumatute tunnuste vahel on väga suured, suuremad kui nende korrelatsioonikordaja sõltuva muutujaga.
Labor 8 Multikollineaarsuse kindlakstegemine - VIFj MS.0151 Ökonomeetria 2011 Sõltumatute muutujate vahel esineva multikollineaarsuse kindlasktegemiseks leitakse varieeruvusindeks ehk dispersiooni mõju faktor VIF j (Variance Inflationary Factor). Varieeruvusindeks näitab argumendi mõju regressiooniparameetri hajuvusele. 1 VIF j= 1- R 2 j kus Rj2 on determinatsioonikordaja, mis on leitud sõltumatu muutuja X j
• Probitmudeli funktsioon on mõnevõrra järsema kaldega ja läheneb kiiremini äärmuslikele tõenäosustele. Tüüpiline: Heteroskedastiivsust on raske testida, selgitusvõime jääb hästi madalaks 1. Mis probleem on mudelis, kui selgitavad muutujad on tugevalt korreleerunud ja kuidas seda vähendada? (mis probleem on mudelis, kui eksogeensed muutujad korreleeruvad) Mudelis on multikollineaarsus, kui sõltumatute muutujate vahel eksisteerib tugev korrelatsioon. Multikollineaarsuse vähendamiseks mudelis võib välja pakkuda järgmisi võimalusi: mõne muutuja eemaldamine mudelist; muutujate ja mudeli teisendamine (näiteks aegridade korral üleminek mudelile esimest järku diferentside vahel); lisaandmete hankimine (valimi muutmine); faktor- ja komponentanalüüsi eelnev kasutamine selleks, et mudeli sõltumatute tegurite arvu eelnevalt vähendada ning esitada nende mõju faktorite kaudu 2
29. Kuidas tõlgendada kvalitatiivsete muutujatega regressioonivõrrandi kordajaid (vabaliiget ja muutujate kordajaid)? Kvalitatiivsed muutujad on mittenumbrilised muutujad. Kvalitatiivsete muutujate puhul kasutatakse dummy- variable, et andmeid regressiooni sisendada. Näiteks kui tahetakse kirjeldada inimese soo mõju palgale, siis saab lisada muutuja Df, mis võrdub ühega kui inimene on naissoost ning nulliga kui inimene ei ole naissoost. Muutujat Dm ei lisata kuna tekib perfektse multikollineaarsuse probleem. Selle asemel võrdub vabaliige meessoost inimese palgaga ning Df-i kordaja kirjeldab vahet meeste ja naiste palga vahel. Muutujate kordajad: muutuja kordaja näitab, kui palju muutub sõltuva muutuja väärtus, kui sõltumatut muutujat suurendada ühe võrra, teiste muutujate konstantseks jäämise korra, siis sõltuv muutuja muutub sõltumatu muutuja kordaja võrra. Vabaliige: Y^ a1 X 1 a 2 X 2 b Kolmanda taseme keskmine vastab vabaliikmele b . 1, kui poest A osteti kaupa
prediktorite lisamist. Tavaliselt on vaikimisi Enter, las see jääb. Statistics alt - Estimates, Model Fit, Descriptives, Confidence intervals (95%), Collinearity diagnostics. Salvestame ka regressioonijäägid uue muutujana: Save Residuals Unstandardized. Pärast analüüsi läbiviimist tuleb selle uue, salvestatud muutujaga läbi viia normaaljaotuslikku test. Tulemused: a) Multikollineaarsuse statistikud koefitsientide tabelis: Kui Tolerance on alla 0.1, on tõenäoliselt tõsine probleem multikollineaarsusega, väärtused vahemikus 0.1-0.2 viitavad võimalikule problemaatilisusele; kui VIF on üle 10, siis on tõenäoliselt meie mudelis multikollineaarsus. b) Nüüd tasub koefitsientide tabelist vaadata, millised prediktorid ei ole statistiliselt olulised (kui kasutatud on Enter meetodit). Mõistlik on need
ennustatava muutuja väärtus saab olla 0 ja 1 vahel). Binaarse logistilise regressiooni eeldused: 1 sõltuv muutuja on dihhotoomne väärtus (nt jah/ei, on/ei ole, 0/1); see eeldab ka vastavat muutuja kodeerimist (st kujule 0 ja 1), kuivõrd arvutatakse sündmuse asetleidmise tõenäosust. 2 on üks või rohkem sõltumatut muutujat (võivad olla nii pidevad kui diskreetsed tunnused) 3 vaatluste sõltumatus 4 multikollineaarsuse puudumine 5 lineaarne seos prediktorite ja logit-transformeeritud ennustatava muutuja vahel Logistilise regressiooni protseduur on sarnane üldise regressioonianalüüsi läbiviimise protseduuriga. Käsklusterida: Analyze Regression Binary Logistic Nagu ka mitmese regressiooni puhul, on teil võimalik valida meetod, millega analüüs läbi viiakse; vaikimisi on sellek Enter, mis tähendab, et kõik muutujad lisatakse analüüsi korraga. Las see valik olla ka siin analüüsis.
eeldatakse, et arvandmed on korrektsed. Arvandmete representatiivsus tähendab seda, et vaatlustulemuste arv on küllaltki suur ja isel. modelleeritavat probleemi. reg.jääke puudutavate eelduste korral: a) kui ei ole täidetud võimalus kasut. standardseid statistilisi hüpoteese reg.võrrandi ja reg.kordajate kohta, siis selle põhjuseks on ebakorrektne mudel. b) kui ei ole täidetud reg.jääkide homoskedastiivsuse eeldus, siis on tegemist nn heteroskedastiivsete reg.jääkidega. 6. Multikollineaarsuse mõju regressioonanalüüsi tulemustele. Multikollineaarsusega isel. olukorda, kus regressiioonvõrrandi sõltumatute muutujate arvväärtused on omavahelises sõltuvuses. 3 taset: 1)täpne (täielik); multikollineaarsus esineb siis, kui 1 sõltumatutest muutujatest kujutab endast teiste sõltumatule muutujate lineaarset funktsiooni. Täieliku multikol. põhjus tuleb üles otsida ja see kõrvaldada. 2)peaaegu täielik multikolli-neaarsus.- teatud liiki arvandmete omadus, mis muudab mudeli
Determinatsioonikordaja näitab argumendi X võimet kirjeldada uuritava suuruse Y hajuvust. x korrelatsioonikoefitsientide statistilise olulisuse kontroll (Studenti t-kriteerium, Fisheri F-kriteerium, korrelatsioonikoefitsiendi kriitilise väärtuse leidmine) ja usaldusintervallide arvutamine x osakorrelatsiooni uurimine (teguri puhasmõju) x multikollineaarsuse kontroll ja vähendamise võimalused (mudeli sõltumatute liikmete vahel on kollineaarne seos palk ja sissetulek) x ajanihke (viitaja) mõju selgitamine (teguri mõju avaldub hiljem) x regressioonimudelisse lülitatavate tegurite valimine. 5. Resultaatnäitaja regressioonimudeliks sobiva funktsioonitüübi valimine, mudeli parameetrite leidmine ja hindamine (regressioon- teatud usaldatavus teatud tõenäosuse juures)