Residual 33 58,14841 1,762073 Total 34 165,5017 Coefficients Standard Error t Stat P-value Lower 95% Intercept 5,502895 0,707134 7,781965 5,75E-09 4,064219 d 0,452119 0,057924 7,805411 5,39E-09 0,334272 Regr. Võrrand h=5,5029+0,4521*d Jah. Regressioonivõrrand on sama mis graafikul. Regressioonivõrrand on usaldatav. 22. 1 Jääkstandardhälve ja kõrguse standardhälve Jääkstandardhälve iseloomustab funktsioontunnuse keskmist erinevust regressioonijoonest Tabel 8 Võrrandi jääkstandardhälve ja kõrguse standardhälve Jääkstandardhälve 1,3274 Kõrguse standardhälve 2,206285901 m 23. Determinatsioonikordaja Determinatsioonikordaja on 0,648654. See iseloomustab kui suur osa funktsioonitunnuse
96 3.56 esimene EHF 1 617.8 11767.5 3.45 3.48 esimene EHF 1 590.1 12283.9 3.02 2.99 sorditu EHF 1 533.0 11299.2 3.77 3.48 esimene EHF 1 633.3 13529.1 4.17 3.61 esimene EHF 1 566.4 7975.3 4.21 3.40 esimene EHF 1 617.5 10570.8 4.17 3.59 sorditu EHF 1 664.7 8590.8 4.53 3.64 sorditu EHF 1 612.7 19676.3 3.99 3.38 kõrgem Regressioonivõrrand lahti kirjutat EHF 1 626.2 10455.6 4.31 3.52 esimene EPK 1 550.2 10346.9 4.28 3.83 kõrgem Piimatoodang = 3328,288 + 11,10614 * EPK 1 516.3 6618.8 4.54 4.26 esimene EPK 1 539.9 12336.0 4.21 4.00 sorditu Prognoos 600 kg lehma piimatood EPK 1 662.7 8622.6 3.99 3.41 sorditu Arvutused: EPK 1 607.5 7740.0 4.33 3.63 sorditu EPK 1 581.4 7753.6 4.18 3
viimase aasta jooksul Intercept -52,48723 18,75379 -2,798752 0,007099 viimase kuu jooksul PIKKUS 0,689403 0,11003 6,265562 6,4E-008 viimase aasta jooksul viimase aasta jooksul viimase kuu jooksul viimase kuu jooksul viimase aasta jooksul viimase kuu jooksul viimase 10 päeva jooksul viimase kuu jooksul viimase 10 päeva jooksul viimase aasta jooksul viimase aasta jooksul viimase aasta jooksul Regressioonivõrrand lahti kirjutatuna leitud kordajate väärtusi viimase kuu jooksul viimase kuu jooksul Mass=a+b*pikkus; Mass= -52,4872+0,689403*pikkus viimase kuu jooksul viimase 10 päeva jooksul Prognoos 170 cm pikkuse tudengi kehamassile leitud regressi viimase 10 päeva jooksul viimase aasta jooksul Mass= - 52,4872+0,689403*170= 64,71131 viimase aasta jooksul viimase aasta jooksul rohkem kui aasta tagasi Kirjeldage leitud regressioonivõrrandi abil saadavate prognoos
data-Edit. Nimeta teljed, võta pealkiri ära, eemalda jooned, muuda suurused telgedel, muuda punktid selgemaks. Regressioonisirge lisamiseks Chart Layout Trendline Linear trendline. Andmete lisamiseks graafikult, parem klõps Format trendline ja kaks alumist ticki teha. Tee regressioonanalüüs: Data analysis: regression. Seejärel pane paika võrrand, a+b*otsitav; a ja b saad regressioonitabelist. a=intercept ja b on selle all. Seejärel püstita hüpoteesid: H0: regressioonivõrrand ei ole statistiliselt oluline; H1: regressioonivõrrand on statistiliselt oluline. P väärtus on ANOVA all, significance F. NÄITED: Prognoosige hinge kinni pidamise võimet kehalise võimekuse testi abil, Prognoosige tudengite massi nende pikkuse abil. Kui palju võiks keskmiselt kaaluda 170 cm pikkune tudeng? Prognoosige pikkust jalanumbri alusel. Hiiruut-test: Vt ka PRAKS 7 Kõige pealt tee kahemõõtmeline Pivottable, kus columni tunnuse panen ka value alla.
Kui palju võiks keskmiselt kaaluda 170 cm pik tudeng? Protseduuriga teostatud lineaarne regressioonanalüüs Prognoosiheaduse kirjeldus peab lähtuma leitud väärtustest. Definitsiooni SUMMARY OUTPUT eest eksamil punkte ei saa. Leitud regressioonivõrrand kirjeldab ära Regression Statistics 40,5% tudengite kehamasside Multiple R 0,6363752991 varieeruvusest (R2=0,405), R Square 0,4049735213 Adjusted R Square 0,394154858 Standard Error 11,073402715 Observations 57 ANOVA df SS MS F Significance F
0,7 |r| < 1,0 - tugev seos 4. r = 0 - seos puudub t= =ABS(r(Pikkus,JalaNr)*SQRT(n(Pikkus,JalaNr)-2)/SQRT(1-r(Pikkus,JalaNr)*r(Pikkus,JalaNr))) 2. Data-Data Analysis- Correlation- Input Range (Pikkus, Mass, Pea_P, Jalanr Praks 6 Regressioonanalüüs graafiliselt ja protseduuriga Regression. Data Analysis- Regression- Input Y Range pikkus, Input X Range jalanr, Labels Hüpoteeside paar, mille testimiseks vajaliku p-väärtuse väljastab Excel tabelisse ANOVA, on kujul: H0: regressioonivõrrand ei ole statistiliselt oluline H1: regressioonivõrrand on statistiliselt oluline ehk H0: leitud võrrand ei ole parem võrreldes konstantse võrrandiga H1: leitud võrrand on parem võrreldes konstantse võrrandiga ehk H0: Pikkus = a H1: Pikkus = a + b×Jalanumber Reaalselt rakendada on põhjust vaid statistiliselt olulist regressioonivõrrandit. Praks 7 2-mõõtmelised sagedustabelid Pivot Table'i vahendiga; hii2-test funktsiooniga CHITEST.
näitab, et mida halvem on distiplineeriv kliima, seda rohkem minuteid kulub õppimisele. Seda näitab ka distsiplineeriva kliima regressioonikordaja (B=-3,80), mis omab käesolevas analüüsis kõige tugevamat toimet võrreldes õpetaja toetusega (B=1,41). Õpetaja toetus ja kodused õppimist toetavad vahendid ei avalda testi keele õppimisele kuluvale ajale aga statistiliselt olulist mõju. Regressioonaalüüsi tabelist saadud kordajet abil on võimalik kirjutada välja regressioonivõrrand: Testi keele õppimiseks kuluv aeg=199,9 + (-3,8) x distsiplinaarne kliima + (-0,4) x kodused õppimist toetavad vahendid + 1,8 x õpetaja abi Kollineaarsusanalüüsi läbiviimisel näitasid tolerantsikordajad ja varieeruvusindeks, et argumenttunnuste vahel ei esine multikollineaarsust.
ANOVA df SS MS F Regression 1 6944,307600653 6944,308 40,25841 Residual 66 11384,56004641 172,4933 Total 67 18328,86764706 Coefficients Standard Error t Stat P-value Intercept -121,6820381 30,2451763004 -4,023188 0,00015 PIKKUS 1,1082989106 0,1746741303 6,344952 2,3E-008 Regressioonivõrrand lahti kirjutatuna leitud kordajate väärtusi kasutades mass= -121,68 + 1,108 x pikkus Prognoos 170 cm pikkuse tudengi kehamassile leitud regressioonivõrrandi põhjal Arvutused: mass 66,73 Vastus täislausega: Keskmiselt võiks 170cm pikk tudeng kaaluda 66, 73 kg. Kirjeldage leitud regressioonivõrrandi abil saadavate prognooside täpsust vähemalt determinatsioonikordaja) põhjal NB
Kopeerige filtreeritud andmetest välja diameetri, kõrguse ja võra alguse andmed teisele töölehele. Kirjutage, kui suur tuli vaatluste arv N. 25) Joonistage graafik kõrguse (y) ja diameetri (x) vahelise sõltuvuse hindamiseks. Tooge graafikul välja ka regressioonisirge võrrand ja determinatsioonikordaja (R 2). 26) Käivitage protseduur 'Regression' ning tehke regressioonanalüüs kõrguse sõltuvuse leidmiseks diameetrist. Esitage regressioonanalüüsi tulemused. Kirjutage välja regressioonivõrrand (kas on sama, mis graafikul?) 27) Kas saadud regressioonivõrrand on usaldatav? 28) Kui suur on saadud võrrandi jääkstandardhälve? Kui suur on kõrguse standardhälve? Mida iseloomustab jääkstandardhälve? 29) Kui suur on determinatsioonikordaja? Mida iseloomustab determinatsioonikordaja? 30) Käivitage veelkord protseduur 'Regression' ja tehke mitmene regressioonanalüüs võra alguse sõltuvuse leidmiseks diameetrist ja kõrgusest. Esitage analüüsi tulemused
teisele töölehele. Kirjutage, kui suur tuli vaatluste arv N. N= 20 25) Joonistage graafik kõrguse (y) ja diameetri (x) vahelise sõltuvuse hindamiseks. Tooge graafikul välja ka regressioonisirge võrrand ja determinatsioonikordaja (R 2). 26) Käivitage protseduur 'Regression' ning tehke regressioonanalüüs kõrguse sõltuvuse leidmiseks diameetrist. Esitage regressioonanalüüsi tulemused. Kirjutage välja regressioonivõrrand (kas on sama, mis graafikul?) y = 1,8883x - 4,1935 27) Kas saadud regressioonivõrrand on usaldatav? Ei ole, sest p=0,284736 28) Kui suur on saadud võrrandi jääkstandardhälve? Kui suur on kõrguse standardhälve? 0.721537 Mida iseloomustab jääkstandardhälve? Iseloomustab funktsioontunnuse keskmist erinevust regressioonijoonest. 29) Kui suur on determinatsioonikordaja? Mida iseloomustab determinatsioonikordaja? 0
% võrra. Seega 0.93 näitab, milline on keskmine tarbimise elastsus naistel ning -0.02 näitab tarbimiselastsuse erinevust meestel võrreldes naistega (ehk 0.02 näitab, kui palju on meeste puhul tarbimiselastsus väiksem naiste omast). Seega, kui sissetulek kasvab 1 % võrra, siis keskmiselt kasvab tarbimine naistel 0.93% ning meestel 0.91%. Ülesanne 7. Tööhõivelise elanikkonna küsitlustulemuste (n= 1000) põhjal on hinnatud regressioonivõrrand: Yi 4000 120 X i 500D1i 800D2i kus Y - i-nda töötaja palk, X - i.nda tööstaaž (aastates) D1i - sugu ( 1- mees, 0 - naine) D2i - haridus ( 1 - kõrgem haridus, 0 - ei ole kõrgemat haridust) Mudel ja mudeli parameetrid on statistiliselt olulised. Tõlgendage parameetrite hinnangute arvulisi väärtusi. Leida kõrgema haridusega 20 aastase tööstaažiga naise keskmine palk Lahendus. Kirjutame mudeli iga küsitletute grupi jaoks:
· juhuslik komponent () ÖKONOMEETRILISE MODELLEERIMISE ETAPID: 1. teooria ja sellel baseeruva verbaalse mudeli formuleerimine 2. andmebaasi korraldamine 3. ökonomeetrilise (matemaatilise) mudeli valik 4. ökonomeetrilise mudeli parameetrite hindamine 5. parameetrite usaldatavuse kontrollimine 6. mudeli omaduste parandamine 7. järelduste tegemine 8. prognooside koostamine 3. Lihtne regressioon, regressioonivõrrandi põhikuju. Determineeritud regressioonivõrrand. Lineaarse regressiooni korral kirjeldatakse seost uuritavate muutujate väärtuste vahel sirge abil võrrandiga Y = a0+a1X Eesmärgiks on leida punktiparvega antud X ja Y vahelist seost iseloomustava parima sirge võrrand Lineaarse kahe muutujaga determineeritud regressioonimudeli korral eeldatakse, et juhusliku suuruse Y tingliku keskväärtuse ja sõltumatu muutuja X vahel on seos E(YX ) = 0+ 1X
ln p = f (1/T). Graafiku tüübiks valida Scatter (ainult punktid ilma joonteta). Seejärel valitakse regressiooni- võrrand. Antud katses tuleb Exceli puhul klõpsata parema hiireklahviga katsepunktidel ja valida Insert trendline/Linear/Options/Display equation on chart (Origin'i korral FIT LINEAR). Leitud 1 Või log (paur) – vastavalt sellele on ka arvutusvalemid erinevad (ln x = 2,303·log x) regressioonivõrrand kuvatakse graafikul ning võrrandi parameetrite (tõus, algordinaat) abil arvutatakse vedeliku aurustumise entalpia. Siinkohal on esitatud näide katseandmete töötlemisest programmiga Excel. 1/T log paur 0.00308 2.0675 0.00305 2.1265 0.00299 2.2299 logpaur 0.00294 2.3135 3.0000 0
teisele töölehele. Kirjutage, kui suur tuli vaatluste arv N. Vaatluste arv N=28 25) Joonistage graafik kõrguse (y) ja diameetri (x) vahelise sõltuvuse hindamiseks. Tooge graafikul välja ka regressioonisirge võrrand ja determinatsioonikordaja (R 2). 26) Käivitage protseduur 'Regression' ning tehke regressioonanalüüs kõrguse sõltuvuse leidmiseks diameetrist. Esitage regressioonanalüüsi tulemused. Kirjutage välja regressioonivõrrand (kas on sama, mis graafikul?) 27) Kas saadud regressioonivõrrand on usaldatav? ei ole kuna kuna p väärtus on suurem kui 0,05 28) Kui suur on saadud võrrandi jääkstandardhälve? Kui suur on kõrguse standardhälve? Mida iseloomustab jääkstandardhälve? standardhälve on 2,795 Jääkstandardhälve ehk lineaarse regressio jääkstandardhälve on 0,021424 standardviga 29) Kui suur on determinatsioonikordaja
õppeaine A 0,296 0,461 1 õppeaine B 0,323 0,327 0,270 1 õppeaine C 0,408 0,374 0,233 0,668 1 õppeaine D 0,398 0,429 0,229 0,206 0,445 1. OSA Eelmise ülesande faili korr_ja_reg.xls põhjal: Lehel 2 tehke regressioonianalüüs. Veerus A on tagajärgne tunnus, ülejäänud on põhjuslikud tunnused. 1. Kirjutage välja regressioonivõrrand. 2. Analüüsige regressioonivõrrandi usaldatavust. 3. Analüüsige regressioonivõrrandi parameetrite usaldatavust. 4. Milline on kõigi regressioonivõrrandi parameetrite majanduslik sisu? 2. OSA Leidke Eesti Statistikaameti kodulehelt andmed kaubakala kasvatamise ja müügi kohta kokku (Kala kokku; valige kas kasv Paragraph SUMMARY OUTPUT Regression Statistics Multiple R 0,51004223 R Square 0,26014307
viimase kuu jooksul Total 56 4061,9298245614 rohkem kui aasta tagasi viimase aasta jooksul Coefficients Standard Error viimase kuu jooksul Intercept 79,3727035251 10,4263453444 viimase aasta jooksul JALANR 2,3213629579 0,2512871575 viimase 10 päeva jooksul viimase kuu jooksul viimase kuu jooksul Lineaarne regressioonivõrrand viimase kuu jooksul Pikkus = a + b×Jalanumber viimase aasta jooksul Pikkus = 79,3727 + 2,321363 x Jalanumber rohkem kui aasta tagasi viimase kuu jooksul viimase aasta jooksul viimase kuu jooksul rohkem kui aasta tagasi viimase kuu jooksul Kui suur on keskmiselt pikkuste vaheline erinevus tudengitel, kelle viimase kuu jooksul jalanumbrid erinevad kahe (2) numbri võrra?
testitakse saadud tulemisi jne. Kuni saadakse vastuvõetav tulemus. Klassikaline regressioonianalüüs- kõikidest võimalikest regressioonimudelitest leiab ökonomeetriliste mudelite koostamisel kõige enam kasutamist mitmene lineaarne regressioonimudel. Taolise regressioonimudeli koostamist nim. ka klassikaliseks regressioonianalüüsiks. Antud juhul eeldatakse, et sõltuvat muutujat Y mõjutavad mitu sõltumatut muutujat X1, X2,-;Xn ning nende mõju sõltuvale muutujale on lineaarne. Regressioonivõrrand-;-;-;-;-;-;-;-;-;-;-;-;-;-;-;-; Mudeli parameetrite hindamiseks kasutatakse üldtuntud vähimruutude meetodit. Regressioonivõrrandi parameetrite -;-;-;-;-;-;-;-;-;. .väärtuste ehk täpsemalt väljendades nende parameetrite hinnangute b1, b2, -;bn kindlaksmääramineon ökonomeetrilise analüüsi üheks peaülesandeks. Mitmese lineaarse regressioonivõrrandi parameetrid (regressioonikordajad) võimaldavad nende majanduslikku tõlgendamist. Igal regressioonikordajal on majanduslik sisu
kasut. matemaatilisi ja statistilisi lähenemisviise ja meetodeid. Ökonomeetrilise mudeli põhikomponendid: 1)modelleeritavad näitajad on sõltuvad e. endogeensed muutujad (Y); 2)modelleeritavat nähtust mõjutavad näitajad on eksogeensed e. sõltumatud muutujad (X); 3)juhuslik komponent; 4)matem. ja statistiliste meetoditega hinnatavad mudelite parameetrid. 2. Klassikaline regressioonanalüüs. Regressioonivõrrand. Seose tiheduse näitajad. Klassikaline regressioonanalüüs Regressioonianalüüs võimaldab selgitada majandusnähtuste vahelise seose tugevuse ja usaldatavuse ning samas ka seose funktsionaalse vormi. Regressioonianalüüsi põhiülesanded:1) hinnata kvantitatiivselt majandusnähtuste vaheliste seoste suunda, tugevust ja kuju; 2)prognoosida maj. nähtuste ja protsesside tõenäosuslikku arengut; 3)kontrollida empiiriliselt maj
Mõõtühik on : tagajärgse mõõtühik/põhjusliku mõõtühik. 53.Regressioonanalüüs mitme põhjusliku tunnuse korral – lineaarne mitmese reg võrrand näeb üldjuhul välja y= a+b1x1+.. +bnxn kus y=tagajärgne tunnus ja x = põhjuslik. 54.Regressioonanalüüs mittelineaarse seose korral – Lineaarseid seoseid esineb reaalsuses harva, aga lineaarseid regvõrrandeid kasutatakse sageli, sest regressioonikordaja pole absoluutselt täpne, regressioonivõrrand kehtib meie poolt vaadeldava muutumispiirkonna kohta, mittelineaarsed võrrandid on tundlikumad erandlike väärtuste osas, ebastabiilsemad. 55.Baas- ja ahelindeksid, teisendamine ühest kujust teise. – Baasindeks –arvutatakse kui vaadeldaval perioodil olemasoleva tunnuse väärtuse p1 ja mingi baasiks valitud ajaperioodil omandatud tunnuse väärtuse pb suhtes. Ahelindeks – leitakse kahe järjestikuse perioodi tunnuse väärtuste suhtenda
Vaatluste sõltumatus; Muutujatevaheline suhe on lineaarne – kontrollime hajuvusdiagrammiga; Puuduvad märkimisväärsed erindid (outliers) – kontrollime hajuvusdiagrammiga; Koostamine JASPis: Valige Regression - Linear Regression. Tõstke sõltuv muutuja kasti nimega Dependent Variable ja sõltumatu muutuja ehk prediktor kasti nimega Covariate. Tulemuste tõlgendamine: o Regressioonivõrrand: sissetulek = −3.57 × vanus + 409,98 a näitab, kui palju muutub y ühe x-ühiku muutumise korral (iga aastaga sissetulek väheneb 3,57 võrra) Oluline on R2 ehk kui suure osa kogu ennustatava muutuja variatiivsusest kirjeldab ära prediktor. ANOVA tabelis ennekõike oluline p-väärtus <0,05, mis näitab, kas mudel on statistiliselt oluline.
valida samast Add Trendline...-aknast (sama aken avaneb ka peale hiire parempoolse nupu topeltklõpsu trendijoonel) lipik Options ja märkida seal ära käsud Display equation on chart ja Display R-squared value on chart. Tulemuseks on joonis, kus lisaks punkti parvele on kujutatud ka regressiooni joon, regressioonivõrrand ja determinatsioonikordaja R2. http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/regress.html (1 of 6)29.05.2006 15:09:10 Andmeanalüüs MS Exceli abil - regressioonanalüüs Antud näite korral on meil tudengi kaal prognoositav tema pikkusest valemiga Kaal = -107,5 + 0,9967*Pikkus, kusjuures selline mudel võimaldab ära kirjeldada 82% tunnuse 'Kaal' hajuvusest. NB
jälgitavad. Nad püstitasid hüpoteesi, et filme, millest palju räägitakse, ka vaadatakse palju. Nad analüüsisid miljoneid siutse 24 filmi kohta, mis esilinastusid kolme kuu jooksul. Analüüsi tulemused andsid ühese vastuse: sumin ja kuulujutud sotsiaalmeedias võivad olla täpsed indikaatorid tuleviku tulemuste kohta. Asur ja Huberman märgivad, et sotsiaalmeedia jõudu illustreerib fakt, et lihtne lineaarne regressioonivõrrand, mis võtab arvesse ainult siutsude hulka filmi kohta, suudab prognoosida tulemusi paremini kui kunstlikud rahaturud (nt Hollywood Stock Exchange, mille abil samuti filmide kassaedu ennustatakse). Autorid leiavad, et meetodit saab laiendada paljudele teistele teemadele ja valdkondadele (uute toodete edu ja valimistulemuste ennustamine jne). Sügavamal tasandil näitab nende töö, kuidas sotsiaalmeedia väljendab kollektiivset tarkust, mis annab väga võimsa ja täpse indikaatori tulemuste
-0,16 keskimine saagikus on alumine ja ülemine usalduspiir. Alumine usalduspiir lahutan ülemine ja kõige alumine; ülemisel usa 95% on alumine usalduspiir 3186 kg /ha ja ülemine 3315 kg /ha standardviga 31,6 kg/ha erinevad? Kasutage selle tõestamiseks sobivat t-testi. KUUSIKU JA VILJANDI p on üle 0,05, seega statistiliselt ei ole usutav. Katsekohal on ei olulist mõju rapsi saagikusele ( t =-0,3 ; df =502 ; p =0,7). aagikusega? Leida lineaarne regressioonivõrrand kõige tugevama seosega näitaja ja saagikuse 1000 vahel. tera mass ja kasvuperiood ust-valge ja korrektselt vormindada. kui saagikus tõuseb siis tõuseb ka 1000 tera mass 8,5% g
5 115 8 102 45.8 107 8 98 45.7 110 8 114 46.2 113 9 102 45.4 113 8 108 46.2 112 9 107 46.1 111 9 102 46.6 118 9 101 46 113 8 111 45.9 119 9 106 45.3 135 8 114 49.3 138 9 105 47.3 114 9 101 45.7 ruvusega (24,88) e saagikus 361,69 kg/ha le standard viga on 184,54 03011) on suurema saagikusega aga Belinda (RG 405/13) on stabiilsema saagikusega t = 1,29 ; df = 37 ; p = 0,206 e lineaarne regressioonivõrrand. Leidke korrelatsioonikordaja, determinatsioonikordaja ja olulisuse tõenäosus (p-väärtus). Proteiin kuivaines % 22.3 24.9 23.2 25 22.6 24.8 22.2 25.5 22.2 25