ö keskmine väärtus ehk see tunnuse väärtus, millest väiksemate väärtuse osa on 50% ehk pool. 25. Mudeli diagnostika kas sõltuv/sõltumatu muutuja on valitud õigesti. Kontrolli multikollineaarsust. Kas funktsionaalne kuju on õige? (logaritm, lineaarne, hüperbool jne). reg.mudeli statistiline analüüs, heteroskedestatiivsus, autokorrelatsioon, erindid. 26. Multikollineaarsus maj. nähtused on omavahel tihedalt seotud. Nende modelleerimisel esineb sageli multikollineaarsust, mille põhjuseks on regressioonimudelisse lülitavate tunnuste omavaheline korrelatsioon. Sellisel juhul on raske eristada nende mõju. Mõned mult. koll. tunnused a) Mõne sõltumatute tunnuste paari omavaheline korrelatsioon on tugevam kui korrelatsioon sõltuva muutujaga
lülitamine mudelisse on põhjendatud. Vastupidisel juhul tuleks tunnus mudelist eemaldada ja viia läbi uue mudeli hindamine. Väiksem valim -> suuremad standardvead -> tekib mitteolulisus. 37. Parameetrite mitteolulisuse võimalikud põhjused. 1. Tunnus ei sobi mudelisse. 2. Teooriast lähtudes peaks tunnus suurust Y mõjutama ja mudelis olema, kuid valimi maht on liiga väike ja standardviga tuleb liiga suur. 3. Esineb multikollineaarsus · Mudelisse võetud tunnused on omavahel tugevas korrelatsioonis, ei ole sõltumatud · Parameetrite standardvigade hinnangud tulevad sel juhul suured. 4. Vabadusastmete arv n-k liiga väike, st kui tunnuste arv on suur ja valimi maht n väike. · Soovitatav, et parameetrite arv k on oluliselt väiksem valimi mahust n 38. Mis juhtub parameetrite hinnangutega, kui vealiikmete keskväärtus ei ole 0? Kui mõni eeldus pole täidetud, siis parameetrite hinnangud ei ole enam korraga nihketa,
Kasutatakse mudelite võrdlemisel kui lisatakse või eemaldatakse tunnuseid. Mida suurem korrigeeritud determinatsioonikordaja seda täpsem/parem mudel. Mudelite võrdlemiseks tunnuste lisamisel. Kui R suureneb uue tunnuse lisamisel, siis mudel paranes ja on õigustatud 34) Parameetrite mitteolulisuse võimalikud põhjused Tunnus ei sobi mudelisse Teoorias peaks tunnus mõjutama suurust Y ja mudelis olema, aga valimi maht liiga väike (standardviga liiga suur) Multikollineaarsus (parameetrite standardvigade hinnangud tulevad suured) Vabadusastmete arv n-k liiga väike. Tunnuste arv liiga suur ja valimi maht väike (valimi maht vähemalt 2 korda suurem kui tunnuste summa) 35) Klassikalise lineaarse mudeli eeldused (loeng 3) mudel on lineaarne parameetrite suhtes, vaatluste arv ei tohi olla väiksem kui hinnatavate parameetrite arv (n>=k), regressori väärtused valimis ei tohi olla
Kui suur osa koguhajuvusest on mudeliga seletatud, näitab ikka tavaline determinatsioonikordaja R2 . Korrigeeritud determinatsioonikordaja on vaid üks kvantitatiivne näitaja, mida kasutatakse erinevat arvu tunnuseid sisaldavate mudelite võrdlemiseks. 34. Parameetrite mitteolulisuse võimalikud põhjused. 1. Tunnus ei sobi mudelisse. 2. Teooriast lähtudes peaks tunnus suurust Y mõjutama ja mudelis olema, kuid valimi maht on liiga väike ja standardviga tuleb liiga suur. 3. Esineb multikollineaarsus. • Mudelisse võetud tunnused on omavahel tugevas korrelatsioonis, ei ole sõltumatud. • Parameetrite standardvigade hinnangud tulevad sel juhul suured. 4. Vabadusastmete arv n-k liiga väike, st kui tunnuste arv on suur ja valimi maht n väike. • Soovitatav, et parameetrite arv k on oluliselt väiksem valimi mahust n. 35. Klassikalise lineaarse mudeli eeldused. 1. Eeldus: mudel on lineaarne parameetrite suhtes Eristada tuleb: • lineaarsus regressorite suhtes;
majandussuuruste omavahelise sõltuvuse analüüsi tegemine, mille jaoks ei ole vaja parameetreid identifitseerida. Milles seisneb paneelandmete mudelite eripära? Paneelandmed – paljude objektide karakteristikud mitmel ajahetkel. Paneelandmete puhul ei pöörata tähelepanu aegridade analüüsile. Efekte ajas vaadeldakse tavaliselt kui üleminekud ühest olekust teise. Paneelandmete korral ei ole tingimata vaja, et objekte jälgitaks võrdsete ajavahemike tagant. Kui mudelis esineb multikollineaarsus, siis ei saa samaaeglaselt mudelis esineda autokorrelatsiooni, sest nende probleemide tekkepõhjused on teinetesit välistavad Multikol. tekkepõhjused: x-de vahel on tugev seos (kui nad on sisuliselt sarnased; üks on teine tulemus; sarnane trend). Autokorrelatsiooni tekkepõhjused: mudelis on jäetud arvastamata tähtsad x-id, samuti kui on jäetud arvestamata vähetähtsad x-id, kui on ülereageerimine, inertsus, sessoonsus, trend
järeldused on õiged, regressioonimudel lineaarset mudelit kolme erineva sõltumatute tunnuste komplekti korral, determinatsioonikordaja ja korrigeeritud determinatsioonikordaja regressioonmudeli hindamisel saadud anova tabelid regressioonmudeli hindamisel saadud aruanne, tunnused on statistiliselt olulised x1 x2 x3 x4 regressioonmudelis olevate sõltumatute tunnuste omavaheline korrelatsioon, heteroskedastiivsus, multikollineaarsus Test 11 momentrida, perioodrida, voosuurus, vaosuurus momentrida, kronoloogiline keskmine alusjuurdekasv, aheljuurdekasv, alusjuurdekasvutempo, aheljuurdekasvutempo, juurdekasvutempo, kasvutempo absoluutne aheljuurdekasv absoluutne alusjuurdekasv, aegrea silutud väärtus eksponentsilumine aditiivne mudel, trendi mudel, keskmine sesoonne komponent, prognoositav väärtus
KLASSIKALISE REGRESSIOONIANALÜÜSI PÕHIEELDUSED 1. Regressioonimudel on korrektne, lineaarne parameetrite suhtes. 2. Regressioonijääkide (jääkliikmete) tinglikud keskväärtused on võrdsed nulliga. 3. Regressioonijäägid ei korreleeru sõltumatute muutujatega. 4. Jääkliikmete dispersioonid on konstantsed (ei esine heteroskedastiivsust). 5. Regressioonijäägid ei korreleeru omavahel (ei esine autokorrelatsiooni). 6. Sõltumatud muutujad ei tohi olla täpses lineaarses sõltuvuses (multikollineaarsus). 7. Sõltumatud muutujad omavad küllaldast varieeruvust 8. Regressioonijäägid on normaaljaotusega. GAUSS MARKOVI TEOREEMI OLEMUS GAUSS MARKOVI TEOREEM: kui on täidetud klassikalise regressioonmudeli eeldused, siis vähimruutude meetodil leitud parameetrite hinnangud on parimad, lineaarsed, nihutamata . Lineaarne lineaarsed funktsioonid sõltumatust muutujast Y; parameeter peab olema esimeses astmes, et saaks kasutada vähimruutude meetodit
1. Kas mudel on statistiliselt oluline, st kas F - testi olulisuse 2. Teooriast lähtudes peaks tunnus suurust Y mõjutama ja tõenäosus p < ? mudelis olema, kuid valimi maht on liiga väike ja 2. Kas parameetrite hinnangud on statistiliselt olulised, st kas standardviga tuleb liiga suur. parameetrite t-testi olulisuse tõenäosused p < ? 3. Esineb multikollineaarsus. Mitteolulised tunnused eemaldatakse ühekaupa mudelist: viiakse · Mudelisse võetud tunnused on omavahel tugevas korrelatsioonis, läbi uue mudeli hindamine ilma nende tunnusteta. ei ole sõltumatud. 3. Statistiliselt oluliste parameetrite märk (kas vastav tunnus · Parameetrite standardvigade hinnangud tulevad sel juhul suured.
Paljudel juhtudel me võime teooriast tulenevalt või vastava analüüsi tulemusena jõuda järeldusele, et üks või teine tegur on käsitletava probleemi jaoks oluline,kuid selle kohta puuduvad arvandmed. Multikollineaarsuse mõju regressioonianalüüsi tulemustele(lab. tööde järeldused).Multikokollineaarsus -; olukord, kus regressioonivõrrandi sõltumatute muutujate arvväärtused on omavahelises sõltuvuses. Eristatakse kolme erinevat multikollineaarsuse taset:1.täpne (täielik) multikollineaarsus 2.peaaegu täielik multikollineaarsus,3.sõltumatud muutujad on omavahelises korrelatiivses sõltuvuses.Täpne (täielik) multikollineaarsus -; esineb siis, kui üks sõltumatutest muutujatest kujutab endast teiste sõltumatute muutujate lineaarset funktsiooni.Sel juhul regressioonivõrrandi parameetreid ei saa leida (hinnata). Täielik multikollineaarsus analüüsitulemusi ei mõjuta, sest täieliku multikollineaarsuse olemasolu korral vähimruutude meetod ja ka sellel meetodil põhinevad
5. Majanduspraktikas esinevad kõrvalekaldumised regressioonanalüüsi põhieeldustest. Kõrvalekalded regressioonianalüüsi põhieeldustest. Kõige olulisemaks neist on mudeli korrektsuse eeldus. Mudeli korrektsus sõltub ühelt poolt analüüsi tegija majanduslikteoreetilisest ettevalmistusest ja teadmistest ning teiselt poolt mudeli koostises vajalike arvandmete kättesaadavusest. Arvandmeid iseloomustab eelduste (2-5) olulisemateks kõrvalekaldumisteks on: 1)multikollineaarsus (sõltumatud muutujad on omavahelises sõltuvuses) 2)multikollineaarsese ja sõltumatute muutujate mitteküllaldase varieeruvuse mõju ökonomeetria mudeli parameetrite hinnangule. Ökon. analüüsis eeldatakse, et arvandmed on korrektsed. Arvandmete representatiivsus tähendab seda, et vaatlustulemuste arv on küllaltki suur ja isel. modelleeritavat probleemi. reg.jääke puudutavate eelduste korral: a) kui ei ole täidetud võimalus kasut. standardseid statistilisi hüpoteese reg
1) jääkliikmete tinglikud keskväärtused on võrdsed nulliga; 2) jääkliimete dispersioon on konstantne (esineb homoskedastiivsus) ja heteroskedastiivsus puudub; 3) jääkliikmed ei korrelleeru omavahel, st nende kovaratsioon on null (autokorrelatsioon puudub); 4) juhuslikud liikmed ei korrelleeru seletavate tunnustega – mudelis puudub multikollineaarsus; 5) jääkliikmed alluvad normaaljaotusele. Klassikalise lineaarse regressioonimudeli esimene eeldus, et juhuslike liikmete keskväärtus on 0 on täidetud, kuna mudelis on konstant ja sellest tulenevalt on see eeldus automaatselt täidetud ja seda eraldi testida ei ole vaja (Brooks 2008, 131). Täiendavalt kinnitavad seda ka teise ja viienda klassikalise eelduse täidetus, mida autorid järgnevalt tõestavad.
22. Mis on faktoranalüüsi eesmärk? Faktoranalüüsi eesmärgiks on leida ühisosa omavad tunnused ja moodustada nende põhjal uued ühist laiemat aspekti kirjeldavad summamuutujad e faktorid. Sotsiaalteadustes on uuritav näitaja sageli sõltuv paljudest argumentidest, mille omavahelise sõltuvuse kohta on raske teha järeldusi. Faktoranalüüsi abil asendatakse mõõdetud argumendid (tunnused) vähema arvu üksteisest sõltumatute üldistatud tunnustega (faktoritega), mille puhul multikollineaarsus on välistatud. Faktorid on tavaliselt kvalitatiivsed suurused. Kuna tunnuste arv väheneb ja seos esialgsete muutujatega on ligikaudne, siis osa infot läheb paratamatult kaduma. 23. Mida näitab esialgse muutuja kommunaliteet? Mingi tunnuse (muutuja) kommunaliteediks nimetatakse faktormaatriksi vastava rea elementide ruutude summat, see näitab sellist osa selle tunnuse koguhajuvusest, mida faktorid suudavad kirjeldada. Kui faktorite
a. Predictors: (Constant), kaalutud_hinnad_HICP, SKP_pc Eemaldasime mudelist töötuse näitaja ning viisime läbi regressioonianalüüsi. Nüüd on kõik sõltumatud muutujad ja ka mudel ise statistiliselt oluline (sig ≤0,05). Samuti puudub mudelist mulitkollineaarsus, mida näeme Tolerantsuse näitajast ja VIFist. Tolerantsuse näitaja peab olema suurem kui 0,1, et mudelist puuduks multikollineaarsus ning VIF peab olema alla 10. Mõlemad tingimused on täidetud. Tabel 8. Regressiooni analüüs. Coefficientsa Mudel Standardiseerimata Standardi t Olulisu Kollineaarsuse statistikud koefitsendid seeritud s koefitsend id
Determinatsioonikordaja R2 – näitab, kui suur osa y-st on määratud x-I poolt. Saab hinnata, kui palju sõltuva muutujua hajuvusest on regresioonimudeli poolt kirjeldatud. Võimalikud väärtused 0…1. Mitmene regresioon – sõltumatuid muutujaid on võrrandisse võetud rohkem kui üks. Et võrrelda regressioonmudeleid, milled sõltumatute muutujate arv ja/või valimite mahud on erinevad, on kasutusele võetud kohandatud ehk reguleeritud determinatsioonikordaja (adjusted R2). Multikollineaarsus – regerssioonimudelisse lülitavate sõltumatute tunnuste omavaheline korrelatsioon. Sellisel juhul on raske eristada ennde tunnuste mõju. Sõltumatute muutujate omavaheline korrelatsioon ei tohiks olla suure kui nende seos uuriatav tunnusega. TEOORIA EKSAM kell 12:15, 24.november. Korrelatsioonikordaja tugevuse hinnang: ● 0,0 - 0,2 olematu, väga nõrk ● 0,2 - 0,4 nõrk ● O,4 - 0,7 keskmine ● 0,7 - 0,9 tugev ● 0,9 - 1,0 väga tugev
alusel prognooside tegemist; i) varad on hinnatud soetusmaksumuses, mis ei kajasta tegelikku väärtust. Subjektiivsed hinnangud põhivara kulumile ja debitoorsele võlgnevusele. Põhivarade väärtuse suurenemist ignoreeritakse; j) määratlematus paljude väärtust omavate tegurite (inimressursid, goodwill) kajastamisel, sest nende objektiivne hindamine on keeruline; k) regressioonianalüüsi probleemid (autokorrelatsioon, heteroskedastiivsus, multikollineaarsus). 5. Finantsaruandluse analüüsi teeb keerukaks veel arvestusstandardite teadmise eeldus. Need on riigiti ja isegi riigi siseselt erinevad. Ka on teatud mõttes finantsarvestus ise paindlik. 14. Palun nimetage vähemalt kolm ettevõttest pärinevat informatsiooniallikat, kust on võimalik saada infot ettevõtte kohta finantsaruandluse analüüsi põhjalikumaks teostamiseks? Bilanss, rahavoogude aruanne, kasumiaruanne. 15
alusel prognooside tegemist; i) varad on hinnatud soetusmaksumuses, mis ei kajasta tegelikku väärtust. Subjektiivsed hinnangud põhivara kulumile ja debitoorsele võlgnevusele. Põhivarade väärtuse suurenemist ignoreeritakse; j) määratlematus paljude väärtust omavate tegurite (inimressursid, goodwill) kajastamisel, sest nende objektiivne hindamine on keeruline; k) regressioonianalüüsi probleemid (autokorrelatsioon, heteroskedastiivsus, multikollineaarsus). 5. Finantsaruandluse analüüsi teeb keerukaks veel arvestusstandardite teadmise eeldus. Need on riigiti ja isegi riigi siseselt erinevad. Ka on teatud mõttes finantsarvestus ise paindlik. 14. Palun nimetage vähemalt kolm ettevõttest pärinevat informatsiooniallikat, kust on võimalik saada infot ettevõtte kohta finantsaruandluse analüüsi põhjalikumaks teostamiseks? Bilanss, rahavoogude aruanne, kasumiaruanne. 15
Lahendus. a) Ainus statistiliselt oluline muutuja on intressimäär. Regressioonimudeli tulemused ei ole kooskõlas sisuliste kaalutluste ja korrelatsioonanalüüsi tulemustega, kuna korrelatsioonanalüüs näitas tugevat seost autode müügi ning keskmise palga ja SKP-ga inimese kohta, kuid regressioonimudelis tulid need muutujad ebaolulised. Samuti on mudelis SKP inimese kohta ebaloogilise märgiga. b) Mudelis on (väga) suur multikollineaarsus, mis on põhjustatud palga ja SKP (inimese kohta) tugevast omavahelisest seosest. Sellele viitab SKP ja palga vaheline korrelatsioonikordaja, mis on suurem kui 0.9. Samuti on SKP ja palga vaheline korrelatsioonikordaja suurem kui autode müügi ja SKP ning autode müügi ja palga vahelised korrelatsioonikordajad. Tugevat multikollineaarsust näitavad ka VIF väärtused, mis SKP ja palga korral on suuremad kui 10 ning suurim konditsiooniindeks, mis on suurem kui 30.
jääkhajumisega? Mudel c, vastav suhe F on kõige suurem 16. Toodud on regressioonmudeli hindamisel saadud aruanne. Millised tunnused on statistiliselt olulised nivool 0,05? X1, X3, X4. 17. Toodud on regressioonmudeli hindamisel saadud aruanne. Millised tunnused on statistiliselt olulised nivool 0,01? X3, X4. 18. Regressioonmudelis olevate sõltumatute tunnuste omavaheline korrelatsioon on multikollineaarsus. Aegread & prognoos - Test 11 1. Vali, millise alljärgneva suuruse aegrida on momentrida, millisel perioodrida. a. sündide arv perioodrida, b. liiklusõnnetuste arv perioodrida, c. veemõõtja näit momentrida, d. ettevõtete arv äriregistris momentrida 2. Vali, milline allpool toodud suurustest on varusuurus ja milline voosuurus. a. sissetulek voosuurus, b. summa pangakontol varusuurus,
Save Residuals Unstandardized. Pärast analüüsi läbiviimist tuleb selle uue, salvestatud muutujaga läbi viia normaaljaotuslikku test. Tulemused: a) Multikollineaarsuse statistikud koefitsientide tabelis: Kui Tolerance on alla 0.1, on tõenäoliselt tõsine probleem multikollineaarsusega, väärtused vahemikus 0.1-0.2 viitavad võimalikule problemaatilisusele; kui VIF on üle 10, siis on tõenäoliselt meie mudelis multikollineaarsus. b) Nüüd tasub koefitsientide tabelist vaadata, millised prediktorid ei ole statistiliselt olulised (kui kasutatud on Enter meetodit). Mõistlik on need prediktorid enda mudelist eemaldada ning uus regressioonianalüüs läbi viia. 10. PRAKTIKUM: 1) LOGISTILINE REGRESSIOON Logistilise regressiooni olemus on sarnane lineaarse ja mitmese regressiooni omaga põhiline erinevus seisneb selles, et logistilise regressiooniga ennustame kategooriat väljendavat tunnust
ehk valemid (3) + (6) = (9) x Isokvandid - sama toodangu koguse jooned x Isokliinid näitavad ressursside asendatavust x Isokost - sama maksumuse joon 3.4. Faktoranalüüs Sotsiaalteadustes on uuritav näitaja sageli sõltuv paljudest argumentidest, mille omavahelise sõltuvuse kohta on raske teha järeldusi. Faktoranalüüsi abil asendatakse mõõdetud argumendid tunnused) vähema arvu üksteisest sõltumatute üldistatud tunnustega (faktoritega), mille puhul multikollineaarsus on välistatud. Faktorid on tavaliselt kvalitatiivsed suurused. Kuna tunnuste arv väheneb ja seos esialgsete muutujatega on ligikaudne, siis osa infot läheb paratamatult kaduma. Erinevad tunnused, millele leitakse ühine nimetaja (faktor) (hind, kvaliteet, säilivus majanduslikkus). Analüüsima hakatakse faktoreid. Ei teki multikollineaarsust. Tekivad faktorite panused, mis näitavad kõige olulisemaid faktoreid. Samuti saab välja arvutada lähtetegurite
teguriruumis. Struktuurivõrrandite süsteemi koostamine on kahtlemata sammuks edasi alternatiivide ruumi piiritlemise probleemi põhjendatud lahendamisel. Nende võrrandite lülitamine matemaatilisse modelleerimisse võimaldab oluliselt tõsta lahendusvariantide kvaliteeti. Puudused: · Esiteks, struktuurivõrrandite koostamise statistilised raskused: tegurnäitajate statistiline seos (multikollineaarsus) põhjustab seosevõrrandite parameetrite ebastabiilsust ja madalat usaldusväärsust. · Teiseks, analuutilised raskused: mitmemõõtmeliste struktuurivõrrandite parameetreid ei ole tegurnäitajate statistilise seotuse korral võimalik kasutada analuutilistel eesmärkidel. Seetõttu jääb tunnetamata konkreetsete alternatiivide kujunemise protsess
Struktuurivõrrandite süsteemi koostamine on kahtlemata sammuks edasi alternatiivide ruumi piiritlemise probleemi põhjendatud lahendamisel. Nende võrrandite lülitamine matermaatilisse modelleerimisse võimaldab oluliselt tõsta lahendusvariantide kvaliteeti. Samal ajal tuleb juhtida tähelepanu ka struktuurivõrrandite kasutamise mõningatele puudustele: statistilised raskused koostamisel – multikollineaarsus tegurnäitajate vahel põhjustab seosevõrrandite parameetrite ebastabiilsust ja madalat usaldusväärsust; analüütilised raskused – mitmemõõtmeliste struktuurivõrrandite parameetreid ei ole tegurinäitajate statistilise seotuse korral võimalik kasutada analüütilistel eesmärkidel, seetõttu jääb tunnetamata konkreetsete alternatiivide kujunemise protsess;