Tabelid - menüü Analysis a) display actual, fitted data, residual (algandmed, arvutuslikud Y, ja regressioonijäägid (üks osa tabelist) b) forecasts - Y arvutusliku 95%-lised prognoosiväärtused c) confidence intervals – regressioonikordajate usalduspiirid d) ANOVA tabel (Excelis teostatud regressiooni väljundtabeli keskmine tabel (hajuvused, R2, F)) 5. Multikollineaarsuse testimine OLSi menüü Tests –> Collinearity 6. Heteroskedastiivsuse kontrollimine Heteroskedastiivsuse kontrollimiseks kasutada OLS-i menüüd Tests ja avanevast rippmenüüst valida White’s test või muu huvipakkuv test ja anda hinnang regressioonijääkide varieeruvuse konstantuse kohta (kas esineb heteroskedastiivsus või ei esine, vaata labortunni tööd otsuse tegemiseks). 7. Erikujuliste regressioonimudelite konstrueerimine Erikujulisis (logaritmitud muutujaid) saab konstrueerida põhimenüüst
X2_X3 -23761,4 13938,4 -1,705 0,0943 * X2_X4 -13735,4 13049,8 -1,053 0,2975 X2_X5 -8144,71 13638,6 -0,5972 0,5530 Unadjusted R-squared = 0,159573 Test statistic: TR^2 = 9,574352, with p-value = P(Chi-square(8) > 9,574352) = 0,296180 Lisa 11. Multikollineaarsuse test Variance Inflation Factors Minimum possible value = 1.0 Values > 10.0 may indicate a collinearity problem Korgharitud 1,006 DAasta_1 1,500 DAasta_2 1,505 DAasta_3 1,501 VIF(j) = 1/(1 - R(j)^2), where R(j) is the multiple correlation coefficient between variable j and the other independent variables Properties of matrix X'X: 1-norm = 115,11179 Determinant = 10938,745 Reciprocal condition number = 0,0015792541 Lisa 12. Jääkliikmete normaaljaotuse testid Test for normality of uhat8: Doornik-Hansen test = 0,071569, with p-value 0,964848
OSAKORRELATSIOON LEIDMINE: Osakorrelatsioonide leidmiseks kasutame käsklusterida Analyze Correlate Partial. Üles pisa ja Iq, alla demogracy (sest meid huvitab osakorrelatsioon pisa ja iq vahel nii, et demokraatiaindeks on kontrollitud) siis üles pisa ja demogracy ja alla iq (sest meid huvitab see nii, et iq on kontrollitud). Kollineaarsus: Linnukesed ette analyze-regression-linear-statistics part and partial correlations ja collinearity ... Oluline on jälgida, et Tolerance ei oleks alla 0.01 ning et VIF ei oleks suurem kui 10 - kui on üle 0,01 jn siis pole kollineaarne. MITMENE REGRESSIOONIANALÜÜS Paarisregressioon: Ennustame... näide 1: õpilaste lugemise tulemusi matemaatika tulemuste järgi. näide 2: Kas inimese pikkus ennustab tema kaalu? ehk Ennustame inimese kaalu tema pikkuse kaudu. Oluline ära taibata, kumb on sõltuv ja kumb sõltumatu muutuja!
279 0.077 8 3 ANOVA Model Sum of Squares df Mean Square F p H₁ Regression 1.095e +6 3 365069.781 125.088 <.001 Residual 1.301e +7 4458 2918.511 Total 1.411e +7 4461 Note. The intercept model is omitted, as no meaningful information can be shown. Coefficients Collinearity Statistics Mode Unstandardize Standar Standardize Toleranc t p VIF l d d Error d e (Intercept 93.56 H₁ 254.753 2
Remove programm võtab prediktoreid välja; Backward programm võtab järjest kõiki prediktoreid hõlmavast mudelist välja nõrgema ennustusvõimega prediktoreid; Forward programm alustab kõige tugevamale prediktoritele nõrgemate prediktorite lisamist. Tavaliselt on vaikimisi Enter, las see jääb. Statistics alt - Estimates, Model Fit, Descriptives, Confidence intervals (95%), Collinearity diagnostics. Salvestame ka regressioonijäägid uue muutujana: Save Residuals Unstandardized. Pärast analüüsi läbiviimist tuleb selle uue, salvestatud muutujaga läbi viia normaaljaotuslikku test. Tulemused: a) Multikollineaarsuse statistikud koefitsientide tabelis: Kui Tolerance on alla 0.1, on tõenäoliselt tõsine probleem multikollineaarsusega, väärtused vahemikus 0.1-0.2 viitavad võimalikule
arvutamine. , selle valemiga saab arvutada parameetrite varieeruvusindeksit Multikollineaarsuse tugevus saab hinnata kolmel erineval moodusel: ● Korrelatsioonimaatriks (suure arvu regressorite korral ebamugav; näitab vaid paarikaupa esinevat kollineaarsust) ● Varieeruvusindeks VIF (matemaatliliselt lihtsalt arusaadav; kasutame seda) ● Konditsiooniindeks (matemaatiliselt keerukam) Varieeruvusindeks VIF Gretlis Analysis>Collinearity Kõik parameetrid, mille korral on väärtus oluliselt suurem kui 10, on tugevalt multikollineaarsed. Kui väärtus on 10 lähedal, aga parameetrite märgid on loogilised, siis võime ignoreerida. Stadardvead ja VIF 70. Mis juhtub parameetrite hinnangutega ja nende standardvigadega, kui esineb multikollineaarsus? Kui multikollineaarsus esineb, siis: ● parameetrite standardvead ja usaldusvahemikud on suured ● Parameetrite hinnangud on nihketa