1665,3061224 0,5874487612 53,86 250 000 714,2857142857 2499,1556906 0,9678407163 259,30 1 025 000 496,4539007092 1293,7062937 0,7069314636 121,52 142 801 1699,300699301 Regression Statistics X1 - Y X2 - Y X3 - Y X4 - Y Multiple R 0,4433659456 0,2504434603 0,819144 0,786003 R Square 0,1965733617 0,0627219268 0,670997 0,6178 Adjusted R Square 0,1212521143 -0,0251478926 0,640153 0,581969 Standard Error 536,1476481701 0,3302241854 134,3823 465784,2 Observations 36 36 36 36 VIF= 1,2446687131 1,0669192298 3,039482 2,616432 SUMMARY OUTPUT
2.1 Koopia- Teenindaja Töötundide masinate tööstaaz, arv arv kuudes 1 1 12 SUMMARY OUTPUT 3,1 3 8 17 10 5 Regression Statistics 14 8 2 Multiple R 0,9346801 6 5 10 R Square 0,8736269 1,8 1 1 Adjusted R Square 0,8578302 11,5 10 10 Standard Error 2,056276 9,3 5 2 Observations 10 6 4 6 12,2 10 18 ANOVA df SS MS
Põhja-Korea 24 051 706 37000 356000 Ghaana 23 837 000 1669000 757000 Jeemen 23 580 000 265000 846000 Eesti 1 340 021 202000 14000 Populatsioon Klasside arv 19,74889026 Variatsiooni kordaja 205,32% Klasside laius 67604303,9 68000000 Mean 118256430,96 Standard Error 34337359,309124 Ülemine piir Sagedus Median 49546822,5 35340021 16 Mode #N/A 103340021 23 Standard Deviation 242801796,155206 171340021 6 Sample Variance 5,895271222E+016 239340021 2 Kurtosis 19,8300035296 307340021 0
Labor 1 - ül 2 Leida regressioonimudel Y = a0 + a1 X, kui perede arv on X ja autode arv Y. Regressioonikordajate (parameetri hinnangute) ja usalduspiiride leidmiseks kasutada vahendit Andmed - Data Analysis - Regression. Alevik Perede arv (X) A 7000 B 7500 C 8000
89833 9685.27416 11181.73983 13390.76938 16069.403 16304.20885 13839.56372 14305.26396 15973.00018 SUMMARY OUTPUT Regression Statistics Multiple R 0.93001005 R Square 0.864918694 Adjusted R Square 0.856476112 Standard Error 197.413872 Observations 18 ANOVA df SS MS Regression 1 3992595.82144818 3992595.821 Residual 16 623555.789662928 38972.23685
3 1634 Lilly (Elli) Co. 6763 26.8 4239 Merck & Co. 16681 45.2 5269 Pharmacia & Upjohn Inc. 7094 35.0 3383 Pfizer 10021 43.8 3472 Rhone-Poulence Roren 5142 28.0 1621 Schering-Plough 5104 20.1 2098 Warner-Lambert Co. 7039 37.0 2006 SUMMARY OUTPUT Regression Statistics Multiple R 0.9800610328 R Square 0.9605196281 Adjusted R Square 0.8890910566 Standard Error 1989.3430527166 Observations 15 ANOVA df SS MS F Significance F Regression 1 1347945730.06 1347945730.06 340.60658825 1.044501E-010 Residual 14 55404800
4,85 49 3 5 3 5 4,89 71 4 5 3 5 4,91 71 4 5 3 5 4,3146666667 55,1666666667 2,8333333333 3,56666667 2,5 2,9 y x x x x x SUMMARY OUTPUT Regression Statistics Multiple R 0,2914756837 R Square 0,0849580742 Adjusted R Square 0,0522780054 Standard Error 14,0519899745 Observations 30 ANOVA df SS MS F Significance F Regression 1 513,330843841 513,330844 2,599690801 0,1181007 Residual 28 5528,83582283 197,458422
Summad 171 0,95018 162,4808 p= 3,6579E-10 Järelikult H1 - tunnuse hinne jaotus ei lähene normaaljaotusele Tabel 15. Kirjeldavad statistikud. aasta sugu test eksam/kool hinne kood Mean 2003,731 1,4 8,291803 50,0729167 3,491228 2,872131 Standard Error 0,156329 0,028098 0,177857 1,46060454 0,070072 0,064523 Median 2003 1 8 53 4 3 Mode 2003 1 6 4 4 4 Standard Deviation 2,730164 0,490703 3,106143 24,787281 0,916312 1,126845 Sample Variance 7,453796 0,240789 9,648123 614,409299 0,839628 1,26978
12 #NAME? #NAME? #NAME? Vastus: tõenäosus, et järgmise minuti jooksul helistab rohkem kui 12 inimest on ~0,424. t on ~0,424. 2 Läbimüük, Tootmisvarud, tuh. kr tuh. kr 192,78 9,400 197,51 9,550 SUMMARY OUTPUT 197,53 9,590 199,48 9,720 Regression Statistics 207,48 10,030 Multiple R 0,9312647 212,50 10,240 R Square 0,867254 200,22 9,820 Adjusted R Square 0,8506607 207,61 10,081 Standard Error 0,2506178 214,18 11,200 Observations 10
Mida iseloomustab mitmene korrelatsioonikordaja? 0.733264 Mitmene korrelatsioonikordaja R mõõdab uuritava tunnuse ja tema prognoositud vää 32) Kas saadud regressioonivõrrandi kordajad on usaldatavalt nullist erinevad? On usaldatavalt nullist erinevad, sest m 33) Kui suured on saadud regressioonivõrrandi kordajate vead? 34) Arvutage saadud võrrandi järgi, kui suur on selle puu võra algus, mille diameeter on 15 cm ja kõrgus 16 m? 30. SUMMARY OUTPUT Regression Statistics Multiple R 0.733264 R Square 0.537676 Adjusted R Sq 0.511991 Standard Error 0.721537 Observations 20 ANOVA df SS MS F Significance F Regression 1 10.89841 10.89841 20.9337 0.000235 Residual 18 9.371086 0.520616 Total 19 20.2695 Coefficients Standard Error t Stat P-value Lower 95%Upper 95%Lower 95,0%
n(n 2) LL kiiruse sõltumine keelt pingutavast jõust: Laine levimise kiirus v, (m/s) SUMMARY OUTPUT 250 200 Regression Statistics 150 Multiple R 0.949622528 100 R Square 0.901782946 Adjusted R Square 0.882139535 50 Standard Error 26.93268322 0
38 44,5583068429 36,4372469636 1,05 1516 39 35,9871452826 17,8035178035 1,05 1566 43 39,3236520102 20,0927357032 1,05 1644 38 32,3002707017 25,2365930599 1,05 1284 45 51,5075841657 7,3130752742 1,05 1609 39 47,2103528263 19,5348837209 1,05 1594 46 42,1644144144 8,492855217 1,05 1392 37 40,4813393791 10,2040816327 1,05 1293 korranumbrist. 1) SUMMARY OUTPUT Regression Statistics Multiple R 0,8331163283 R Square 0,6940828165 Adjusted R Square 0,68466998 Standard Error 219,67192353 Observations 135 ANOVA df SS MS F Significance F Regression 4 14233112 3558278 73,7379 1,69E-032
väikest mõju avaldavate muutujate eemaldamine. Selliste muutujate leidmiseks tehakse korrelatsioonianalüüs, mis oma olemuselt on nähtuste vaheliste seoste statistilise analüüsi meetod. Kasutades Exceli protseduuri Tools/Data Analysis/Correlation, koostasime korrelatsioonimaatriksi , mille abiga leitakse seoste olemasolu, tugevus, suund ning statistiline olulisus, korrelatsioonimaatriks (tabel 2.) Valiku kriteeriumiks võeti iga muutuja ja ettevõtte kogumüügi vaheline korrelatsioon Edasisel analüüsil määrati kindlaks näitajat, mis avaldavad piima tootmise muutusele kõige suuremat mõju. Seose tugevust tuli hinnata korrelatsioonikordaja absoluutväärtuse alusel. Mida suurem on kordaja absoluutväärtus, seda suurem on kahe juhusliku suuruse vaheline lineaarne korrelatiivne seos. Korrelatsioonimaatriksist näeb, et kõige suurem seos on uuritaval näitajal ( piima
Joonis 1. Kõrguse sõltuvus diameetrist. 26) Kasutades MS exceli protseduuri 'Regression' tegin regressioonanalüüsi kõrguse sõltuvuse leidmiseks diameetrist. Regressioonanalüüsi tulemused on esitatud tabelis 6. Enese kontrolliks kirjutasin välja ka regressioonivõrrandi, mis pidid olema sama, mis graafikul. h=0,4093*d+3,9025 Tabel 6. Regressioonanalüüs kõrguse sõltuvuse leidmiseks diameetrist Regression Statistics Multiple R 0,881340398 R Square 0,776760897 Adjusted R Square 0,760815246 Standard Error 0,585169098 Observations 16 ANOVA df SS MS F Significance F Regression 1 16,68045478 16,68045 48,71302735 6,45445E-06 Residual 14 4,793920222 0,342423 Total 15 21,474375
4 Sveits 59376 83.4 Türgi 21147 75.8 Ukraina 8230 71.3 Suurbritannia 42514 81.2 summa 1411404 3221.9 valimi maht 41 keskmine 34424.4878048781 78.5829268293 hta SKP (PPP) ja ja keskmine oodatav eluiga. itada näitaja sisulist tähendust (selgitada tuleb kui hästi mudel töötab ja mitu protsenti sõltuva muutuja k + bx ja determinatsioonikordaja. utada lahenduse juurde lause, mis ütleb, mida arvutati. mis ütleb, mida arvutati. xi ruut xy (yi-ykatusega)ruut ynurk=a+bx (yi-ynurk)ruut 140683321 922785.8 0.6129744 75.542869 5.094642 2290196736 3900264 8.5093159 80.392602 1.2263308 306145009 1265033.1 39.47517 76
Esitage analüüsi tulemused. Kirjutage välja regressioonivõrrand 31) Kui suur on mitmene korrelatsioonikordaja? Mida iseloomustab mitmene korrelatsioonikordaja? 32) Kas saadud regressioonivõrrandi kordajad on usaldatavalt nullist erinevad? 33) Kui suured on saadud regressioonivõrrandi kordajate vead? 34) Arvutage saadud võrrandi järgi, kui suur on selle puu võra algus, mille diameeter on 15 cm ja kõrgus 16 m? SUMMARY OUTPUT Regression Statistics Vaatluste arv N=28 Multiple R 0,665563 R Square 0,442975 Adjusted R Square 0,421551 Standard Error 2,794997 Observations 28 ANOVA df SS MS F Significance F
Kõik Leibkonnad 3 388,23 2 897,88 5 937,23 Tabel 3 Tulu Kulu Palk Leibkonnapea elab linnas 3790,96 3275,197777778 6893,851851852 Leibkonnapea elab maal 2029,0125 1624,43875 2708,625 Kõik Leibkonnad 3 388,23 2 897,88 5 937,23 SUMMARY OUTPUT Regression Statistics Multiple R 0,948422877 R Square 0,899505953 Adjusted R Square 0,896460679 Standard Error 1160,052615 Observations 35 ANOVA df SS MS F Significance F Regression 1 397496237,381 397496237,4 295,37766127 4,969708E-018 Residual 33 44408828,2678 1345722,069 Total 34 441905065,649
Mass, kg 67 62 57 52 47 150 155 160 165 170 175 Pikkus, cm SUMMARY OUTPUT Regression Statistics Multiple R 0,648811715 R Square 0,420956641 Adjusted R Square 0,410233616 Standard Error 6,868962883 Observations 56 ANOVA df SS Regression 1 1852,261841 Residual 54 2547,863159
Kuud Lahutused MA 7 EK 0,3 jaan.04 272 #N/A #N/A M veebr.04 299 #N/A 272,00 märts.04 454 #N/A 280,10 500 apr.04 349 336,29 332,27 400 mai.04 356 343,71 337,29 300 juuni.04 357 352,00 342,90 Value 200 juuli.04 267 339,57 347,13 100 aug.04 324 347,86 323,09 0 sept.04 357 346,86 323,36 1 4 7 1013 okt.04 367 339,29 333,46 nov.04 407 346,71 343,52 dets.04 349 351,57 362,56 jaan.05 304 349,86 358,49 veebr
94094104 5 1 r 2 1 - 0.94094104 5 2 3.3 Järeldus: t emp t kr Kuna siis on alus nullhüpoteesi tagasi lükata, ehk oleme tõestanud sisuka hüpoteesi H Ehk 5% eksimisriskiga võime väita, et inimeste abiellude ja sündinud laste vahe Võime lugeda tõestatuks, et ka üldkogumis erineb korrelatsioonikordaja nullist. 4. Määran sõltuv muutuja (tagajärg) ja sõltumatu muutuja (põhjus) Sõltumatuks muutujaks valin X tunnuse, ehk siis abiellude arv põhjus. Sõltuvaks muutujaks on Y tunnus, nii et sündinute laste arv tagajärg. Peamiseks põhjuseks on nende sündmuste kronoloogiline järjekord. Andmed olid valitud nii, et Y tunnuse aasta on X tunnuse aasta + 1 (järgmine). 5. Regressioonisirge y = bx + a parameetrid 5.1 Parameetrite arvutamine valemi abil: a y x x x y i 2 i i i i
Statistiline modelleerimine – kokkuvõte Muutujad: Sõltuvad muutujad (dependent, outcome variables) – muutujad, mis on uurimise keskmes, millele uurija arvab, et teised muutujad mõju avaldavad. Nö katseisikust sõltuv muutuja. Sõltumatud muutujad (independent, predictor variables) – muutujad, mille kohta uurija arvab, et neil võiks olla mõju uuritavatele muutujatele. Statistilise analüüsi keskmes on uurida, kuidas teatud tunnused koos muutuvad. Kui on vaja muutujat iseloomustada, on kaks põhilist viisi, kuidas seda teha: o Milline on selle muutuja tüüpiline väärtus? o Kui hästi iseloomustab see tüüpiline väärtus kõiki mõõdetud juhtumeid? Ehk
Heteroskedastiivsuse test........................................................................................29 Lisa 11. Multikollineaarsuse test...........................................................................................30 Lisa 12. Jääkliikmete normaaljaotuse testid.........................................................................31 Lisa 13. Jääkliikmete normaaljaotuse graafik.......................................................................32 Lisa 14. ANOVA tabel...........................................................................................................33 Lisa 15. Mudeli jääkliikmete kirjeldavad statistikud............................................................34 Lisa 16. Lõpliku mudeli regressioonikoefitsientide koovariatsiooni maatriks.....................35 Lisa 17. Mudeli stabiilsuse test (Chow test).........................................................................36 SISSEJUHATUS
8 9695.9 3.42 3.45 esimene Kui suur võiks keskmiselt olla piimatood EHF 1 506.5 10601.0 3.50 3.20 esimene EHF 1 488.3 15697.9 3.52 3.52 esimene Protseduuriga teostatud lineaarne EHF 1 565.5 9419.2 3.41 3.63 sorditu EHF 1 542.6 10558.3 3.72 3.37 kõrgem SUMMARY OUTPUT EHF 1 599.5 9806.6 3.55 3.39 kõrgem EHF 1 600.1 10152.1 3.65 3.00 kõrgem Regression Statistics EHF 1 630.3 9232.4 3.84 3.19 kõrgem Multiple R 0.294367 EHF 1 556.2 11892.5 3.61 3.56 kõrgem R Square 0.086652 EHF 1 617.3 8803.9 4.26 3.71 esimene Adjusted R 0.077784 EHF 1 585.9 11231.4 4.08 3.67 kõrgem Standard E 2205.78 EHF 1 587.3 11280.9 3.90 3.29 sorditu Observatio 105 EHF 1 598.1 11589.1 3.61 3.12 esimene EHF 1 629
http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/sagedustab.html (3 of 4)29.05.2006 15:08:54 Andmeanalüüs MS Exceli abil - sagedustabelid Tulemusena saame järgmise sagedustabeli: Count of Mannapuder? Mannapuder? ei jah vist Grand Total Total 4 4 1 9 [email protected] http://ph.eau.ee/~ktanel/kool_ja_too/ märts, 2000 http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/sagedustab.html (4 of 4)29.05
tudeng? Protseduuriga teostatud lineaarne regressioonanalüüs Prognoosiheaduse kirjeldus peab lähtuma leitud väärtustest. Definitsiooni SUMMARY OUTPUT eest eksamil punkte ei saa. Leitud regressioonivõrrand kirjeldab ära Regression Statistics 40,5% tudengite kehamasside Multiple R 0,6363752991 varieeruvusest (R2=0,405), R Square 0,4049735213 Adjusted R Square 0,394154858 Standard Error 11,073402715 Observations 57 ANOVA df SS MS F Significance F Regression 1 4590,027 4590,027 37,43286 1,035729441E-007
Jõhvi vald on kaevandatud territooriumi poolest (70%) juba praegu Nauru saarega võrreldavas seisus. Kui põlevkivi kaevandamine suureneb näiteks 20 miljonile tonnile aastas, siis on Ida- Virumaa põhjaosa 1015 aasta pärast umbes 100 ruutkilomeetri kaevandatud maa võrra "rikkam". Pealegi väheneb Ida-Virumaa elanikkond Eestis kõige kiiremini, sest sealsel rahval on ka tervis kõige kehvem. [9] 6.Korrelatsioon ja regressioon Valisime oma funktsiooni muutuja (Y-muutujaks) ressursimaksud, sest see mõjutab põlevkivi kaevandamis mahte ja nõudlust. Argumentmuutujateks: x1 - vee erikasutuse tasu, sest põlevkivi kaevandamisel ja töötlemisel läheb hulgaliselt vett vaja. Seega on vesi suur faktor ressursimaksu kujunemisel. X2 - põlevkivi kaevandamisõigus tasu, sest põlevkivi algne hind moodustab nõudluse. Kui hind oleks liiga kõrge, ei kaevandataks seda nii palju.
viimase kuu jooksul ei jah ei kuni 0,5 l jah viimase kuu jooksul viimase kuu jooksul ei jah jah ei joo ei viimase kuu jooksul viimase kuu jooksul Prognoosige tudengite massi nende pikkuse abil. Kui palju võiks keskmiselt k tudeng? Protseduuriga teostatud lineaarne regressioonanalüüs SUMMARY OUTPUT Regression Statistics Multiple R 0,62 R Square 0,38 Adjusted R Square 0,37 Standard Error 13,13 Observations 68 ANOVA df SS MS F Regression 1 6944,307600653 6944,308 40,25841 Residual 66 11384,56004641 172,4933 Total 67 18328,86764706
Jah Ei Ei oska öelda Jah Ei Ei oska öelda Kui tihti külastat e nädalas toidukau Sugu plust? Kas nädalas toidukaupluse külastamine on 1 1 1 4 Sum - Sugu Kui tihti külastate nädalas toidu 2 3 Sugu 1 2 2 2 1 11 15 1 1 2 16 20 2 4 Total Result 27 35 1 5 2 3 1 2 1 3 Mees 11 15 1 4 Naine 8 10 1 1 Kokku 19 25 1 2 2 1 1 2 1 1 Mees 10.19 13.41 2 2 Naine 8.81 11.59 1 4 2 3 1 2
KTUD.RH. küllastatud rasvhapped Toitainete sisaldus tabelis tähendab... C16 palmitiinhape 0 C18 steariinhape MKTA.RH. monoküllastamata rasvhapped PKTA.RH. polüküllastamata rasvhapped C18:2 linoolhape C18:3 linoleenhape VL.KIUDAINED vees lahustuvad kiudained RET.EKV. retinooli ekvivalent NIATS.EKV. niatsiini ekvivalent PANT.HAPE pantoteenhape R% sisaldab x% rasva KLASS E tailiha sisaldus üle 55% KLASS O tailiha sisaldus 40-45% (0.9) söödav osa 90% Sul. sulatatud Rasvas. rasvasusega Toitainete sisaldus tabelis tähendab... vastava toitaine sisaldus antud toiduaines on 0 või minimaalne andmed toitaine sisalduse kohta antud toiduaines puuduvad ENERGIA (kcal) ENERGIA (kJ)
504.064.38 (, , , , , .), . ..................................................................................................4 1. ..............5 1.1. ....................................................................................5 1.2. .........................................................................................5 1.3. .....................................................................................6 1.4. ....................................................................................7 1.5. ........................................................................................7 2. 30 /.....................................................................9 2.1. ..................................................................................9 2.2. .......
51- Omanik/FI 10- E või ev Pm.maa, 12-Pm.maa, juht 1 - omandis, 11-Pm.maa, ühiskasutuse Maakasutus v_toojou_a jrk Aasta 5_Maakond ha renditud, ha s, ha kokku astauhik X1 X3 X4 X5 X6 X7 X8 1 2000 Jõgeva 0,00 2 177,00 0,00 2 177,00 0,00 2 2000 Jõgeva 0,00 872,00 0,00 872,00 0,00 3 2000 Jõgeva 46,70 38,00 0,00 84,70
Eesti M 188 95 59 44 Eesti M 188 80 48 48 Eesti M 180 74 56 42 Eesti N 173 59 58 40 Data Count of HOMMIK HOMMIK Count - HOMMIK Count - HOMMIK Total Count Total - HOMMIK Count - HOMMIK 26 võileib 26 0,4561403509 26 0,45614 10 helbed või müsli 10 0,1754385965 10 0,175439 8
1. 1. N n . , m k . N = 20, n = 5, m = 4, k = 2. . . C nk C Nm--nk C 52 C152 5!15!4!16! 5 4 3 15 14 4 P ( A) = = = = = 0,217 . CN m C 204 2!3!2!13!20! 2 20 19 18 17 2. n , k . , m . n = 10, k = 4, m = 2. . . C km C 42 4!2!8! 43 2 P ( A) = m = 2 = = = = 0,133 . Cn C10 2!2!10! 10 9 15 3. . 15% , 25%, 30%. , ( ) . . : A1 ; A2 ; A3 . , ( ) P ( A) = P ( A1 A2 A3 + A1 A2 A3 + A1 A2 A3 ) = = P( A1 A2 A3 ) + P( A1 A2 A3 ) + P ( A1 A2 A3 ) = = P ( A1 ) P ( A2 ) P ( A3 ) + P ( A1 ) P ( A2 ) P ( A3 ) + P ( A1 ) P ( A2 ) P ( A3 ) = = 0,85 0,75 0,3 +