Harilik lineaarne regressioonmudel Loenguplaan • Seos kahe tunnuse vahel – kovariatsioon – korrelatsioon • Harilik lineaarne regressioonmudel – Vähimruutude meetod parameetrite hinnangute leidmiseks – Parameetrite tõlgendamine – Standardvead, usalduspiirid – Parameetrite statistilise olulisuse kontrollimine – Determinatsioonikordaja – Mudeli korrektne esitamine – Erindi mõju – Vabaliikme olulisus – Mittelineaarsed lineariseeritavad mudelid Kovariatsioon = E ( X − X )
ja sisukas hüpotees. Korrelatsioonikordaja statistilise olulisuse kontrollimine seisneb hüpoteeside paari H0: r = 0; H1: r ≠ 0; kontrollimises 18. Regressioonanalüüs ja regressioonmudeli komponendid. Regressioonmudel koosneb deterministlikust ja juhuslikust komponendist. Y = deterministlik komponent + juhuslik komponent Tinglik keskväärtus on deterministlik komponent y=E[Y|X]+u Näiteks lineaarne regressioonmudel y=ax+b + u ax+b - deterministlik komponent ehk tinglik keskväärtus u - juhuslik komponent Regressioonanalüüs uurib suuruste vahelist sõltuvust ja võimalusi selle funktsionaalseks kirjeldamiseks etteantud valemi põhjal. Regressioonanalüüsi käigus leitakse regressioonmudeli deterministlik komponent, st leitakse vastava matemaatilise funktsiooni parameetrite hinnangud. 19. Vähimruutude meetodi olemus.
väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on punkthinnang kogumi keskväärtusele). Intervallhinnang on lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5. Hinnangfunktsioon. Hinnangfunktsioon on reegel parameetrite hinnangute leidmiseks. Tuntudmad regressioonmudeli parameetrite hindamismeetodid on: harilik vähimruutude meetod (OLS), suurima tõepära meetod, momentide meetod ja üldistatud vähimruutude meetod. 6. Hinnangute omadused. Nihe, efektiivsus, mõjusus 7. Hinnangu nihe, nihketa hinnang. Hinnangu nihe võrdub parameetri hinnangu Beeta keskväärtuse ning parameetri tegeliku väärtuse beeta vahega. Parameetri hinnang on nihketa kui hinnangu keskväärtus võrdub parameetri tegeliku väärtusega. Parem on see, mis on nihketa. Hinnangu keskväärtus - tegelik keskväärtus
Teemad · Mitmene lineaarne regressioonmudel Mitmese lineaarse regressioonmudeli parameetrite hindamine Parameetrite tõlgendus Standardiseeritud kordajad Mitmene regressioonmudel I ANOVA tabel
iseloomustava keskruuduga. 25) Determinatsioonikordaja, selle arvutus ja tõlgendamine Kui suur osa koguhajumisest on mudeli poolt ära seletatud. R = ESS/TSS = 1 - RSS/TSS. R = r. Puudus: lisades mudelisse uusi tunnuseid alati suureneb 26) Mudeli korrektne esitamine Regressioonanalüüsi põhitulemuste esitamisel esitatakse: Parameetrite hinnangud, parameetrite standardvead, determinatsioonikordaja R2, valimi maht n 27) Regressioon läbi nullpunkti Ühe tunnuse korral y = ax + u Deterministlik komponent on võrdeline seos y = ax (Vabaliige garanteerib, et regressioonjääkide summa u = 0 ) 28) Seletavate tunnuste astmeid, ruutjuurt ja pöördväärtust sisaldava mittelineaarse mudeli lineariseerimise võtted (loeng 2) Tunnuste logaritmimine, mille tulemusena saame log-log mudeli. Log-log mudeli kordaja näitab, mitu % muutub Y, kui X suureneb 1%. See on elastsuskordaja. Log-
mitteoluline? tunnus ei sobi mudelisse, valimi maht on liiga väike, esineb multikollineaarsus, tunnuste arv k on suur ja valimi maht n väike, st vabadusastmete arv n-k on väike. 4. F-testi olulisuse tõenäosus = 0,006738 5. Kui mudelisse lisada uusi tunnuseid, siis determinatsioonikordaja alati suureneb 6. Korrigeeritud determinatsioonikordaja = 0,440525 7. Kas mudelit y = a + b/x + u saab hinnata, kasutades harilikku vähimruutude meetodit? jah, sest see on parameetrite suhtes lineaarne 8. Milliste lineaarse mudeli eelduste rikkumine põhjustab nihke parameetrite hinnangutes? rikutud on eksogeensuse tingimus, st regressorid ja juhuslikud liikmed pole sõltumatud 9. Millised klassikalise lineaarse mudeli eeldused saab võtta kokku ühte lausesse: "Juhuslikud liikmed peavad olema jaotunud ühtlaselt ja sõltumatult keskväärtusega 0 ning konstantse dispersiooniga σ2" lühidalt - iid (Independent and Identically Distributed)
Õppejõud Kadri Männasoo. Inglise keeles, edasijõudnutele, tarkvara R. Kursuse teemad Õppemeetodid 1. Sissejuhatus. · Loengud 2. Harilik lineaarne regressioonmudel. Teooria, mõistete, meetodite seletamine, näited. 3. Mitmene regressioonmudel I. Küsimustele vastamine. Loenguslaidid on saadaval 4. Mitmene regressioonmudel II. pdf failina õpekeskkonnas Moodle enne loengut. 5. Mudeli omaduste parandamine. · Praktikumid 6. Fiktiivsed tunnused. Andmeanalüüs programmis Gretl. 7. Statsionaarsed aegread I
vajadusel välja jätta. Lineaarse korrelatsioonikordaja puuduste tõttu kasutatakse ka teisi seosekordajaid Spearmanni, Kendalli. Siis kui arvad, et nähtuste vahel peaks tulema tugev seos, aga r tuleb väga väike siiski. Korrelatsioon puudub: r=0; korrel on nullist erinev r =/ 0 (võrdusmärg läbiva kriipsuga) 17. Korrelatsioonikordaja (p) 2 juhusliku suuruse X ja Y vahelise lineaarse, seose tugevust ja suunda võimaldab mõõta lineaarne paariskorrelatsioonikordaja. Võib olla positiive/negatiivne. Saab olla vahemikus 1/+1. Kordaja märk näitab 2 juhusliku suuruse X ja Y ühise muutumise suunda. Mida suurem on kor.kordaja absoluutväärtus, seda tugevam on uuritavate nähtuste vaheline lineaarne seos. Kor.kordaja ruut ehk determinatsioonikordaja näitab kui suure osa ühe tunnuse hajuvusest saab kirjeldada teise tunnuse abil. Kui H0 on õige, siis 2 juhusliku suuruse vahel seost ei ole. 18
Kõik kommentaarid