4714469089 30 1979529261 228693 2 73897337 228693 479744 1.3411860293 0 1979529261 2286932 siooni abil: regressioonisirge võrrand: 479839167.47 55003940.02 0.8853700495 siooni abil: 2 mõõdetud suurusi hästi 0,8 r 0,9: e) kogumuudust on kirjeldatud regressioonivõrrandiga. aste arvu korrelatsiooniväli koos regressioonisirge ja determinatsioonikordajaga 1860293x + 5767.4714469089 700495 8000 10000 12000 14000 Abiellude arv 1860293x + 5767.4714469089 700495 8000 10000 12000 14000 Abiellude arv ised usalduspiirid 0.0210319 1401.5799760708 2 hinnangud: 1979529261 01 .579976 740.8273032964 30 1979529261 228693 2 1401.57997 6 0.0912003793
Ekstrapoleerimine trendi retrospektiivne ja/või perspektiivne leidmine n ( y^ t - y)2 D=R = 2 i =1 n (y t - y)2 i =1 Statistiline prognoosimine ja terve hulk lihtsamaid prognoosimudeleid tugineb senise arengutrendi kindlaksmääramisel ja selle ekstrapoleerimisele tulevikku Aproksimeerimisviga - Mudeli headust mõõdetakse enamasti tema kirjeldatuse tasemega ehk determinatsioonikordajaga, R 2 Näitab kui palju sõltuva muutuja (y) hajuvusest seletav muutuja (trend, t) kirjeldab Omab väärtusi vahemikus [0, 1]; mida kõrgem, seda paremini seletav tunnus sõltuva tunnuse hajuvust kirjeldab Üldjuhul eristatakse aegreas kolme komponenti: · Trend ehk arengutendents · Lühiajalised süstemaatilised võnked (sesoonsus, tsüklilisus vms)
ANOVA tabel analüüsib varieeruvust. Ruutude summasid näeb ANOVA tabelis, peale mudeli hindamist F- statistiku empiirilist väärtust võrreldakse F-jaotuse kriitilise väärtusega (või empiirilisele väärtusele vastavat olulisuse tõenäosust p võrreldakse olulisuse nivooga Q) F statistik on keskruutude jagatis. Allub Fisheri ehk F- jaotusele. Võib olla väga suur, piire pole. Väärtus ei ole nii hästi tõlgendatav. On seotud determinatsioonikordajaga. 32) Regressioonmudeli statistilise olulisuse kontrollimine F-testiga H0 kõik seletavate tunnuste kordajad on nullid, b2=b3=… =bk =0 H1 vähemalt üks kordaja b2 , b3 …., bk on nullist erinev. Mudel on statistiliselt oluline (p
3. Joonistel on kujutatud empiirised punktid ja neile vastav regressioonjoon. Millisel joonisel on regressioonmudeli jäägid (kriipsukesed) kujutatud õigesti? joonis (b). 4. 20 OECD riigi andmete põhjal analüüsiti, kuidas sõltub sissetulek elaniku kohta (PCNIC, $) põllumajanduses hõivatute osakaalust (AGR, protsent kõigist hõivatutest). Regressioonanalüüs viidi läbi Excelis ja tulemuseks saadi joonisel olev tabel. a. Vastav mudel koos determinatsioonikordajaga: PCNIC= -18,9 AGR + 1318 R2= 0,632 b. Järeldus: riikides, kus põllumajanduses hõivatute osakaal on suurem, on keskmine sissetulek elaniku kohta väiksem. 5. Determinatsioonikordaja näitab kui suure osa summaarsest varieerumisest kirjeldab ära seosega seletatud varieerumine. 6. Lineaarse mudeli y= ax+b parameetrite hinnangute leidmiseks viidi Excelis läbi regressioonanalüüs ja saadi joonisel toodud tabel
lahtimõtestamisel lähtutakse varieeruvuste võrdlemisest. Seejuures varieeruvust mõõdetakse hälvete ruutude summa abil. Kõige üldisemaks varieeruvuseks on varieeruvus aritmeetilise keskmise ümber. Determinatsioonikordjaja ei ole seotud konkreetse mudeliga (lineaarne, mittelineaarne jne.) ning seda saab kasutada mistahes regressioonimudeli korral. Determinatsioonikordajast ei saa teha olulisi sisulisi järeldusi. Sellest ei saa järeldada, et suurema determinatsioonikordajaga regressioonimudel on parem või korrektsem mudel kui mõni teine mudel. Kõige ohutum on käsitleda determinatsioonikordajat kui arvnäitajat, mis näitab kui hästi regressioonivõrrand iseloomustab arvandmeid.Determinatsioonikordaja on kujunenud üheks populaarsemaks seose tihedust iseloomustavaks näitajaks. Erinevate tüüpi andmete korral tuleks determinatsioonikordaja arvväärtusesse suhtuda erinevalt. Näiteks aegridade analüüsi korral võib R2 = 0,99 olla
..). Lihtsa regressiooni läbiviimiseks on Excelis olemas võimalus lisada hajuvusdiagrammile sobiva kujuga tasandusjoon (Add Trendline), seejuures joone sobivust hinnataksegi determinatsiooni- kordaja (R2) abil mida suurem on determinatsioonikordaja väärtus, seda paremat kirjeldatuseastet vastav mudel pakub. Näide 11-7 Lihtne regressioon USA-s uuriti, kuidas pere elektrienergia tarbimine sõltub maja pindalast. Vasakpoolsel joonisel on leitud vastav lineaarne mudel koos determinatsioonikordajaga, millest selgub, et maja pindala suurenemisel 1000 m2 võrra suureneb eletrienergia tarbimine kuus 557 kWh võrra. Kuid on näha, et lineaarse mudeli kasutamine pole siin õigustatud, parema tulemuse annab lähendamine parabooliga (parempoolne joonis), kuna determinatsioonikoefitsient R2 on suurem. Selgub, et pindala suurenedes kasvab elektrienergia tarbimine üha aeglasemalt, olles maksimaalne 2500 m2 suurustes majades, hakates seejärel taas vähenema.