kovariatsioon korrelatsioon Harilik lineaarne · Harilik lineaarne regressioonmudel Vähimruutude meetod parameetrite hinnangute leidmiseks regressioonmudel Parameetrite tõlgendamine Standardvead, usalduspiirid
ilm.ee) h elavhõbeda nivoode vahe manomeetris, mm (lugem skaalalt) Katseandmete põhjal 1) Koostatakse kaks graafikut: paur = f (t) ja ln (paur) = f (1/T); 2) Teise graafiku alusel arvutatakse empiirilise võrrandi ln p = A + B*1/T koefitsiendid A ja B kui saadud logaritmilise graafiku sirge algordinaat ja tõus; a) tabelarvutusprogrammi graafikult, nagu näidatud eespool, b) vähimruutude meetodil (käsitsi või Exceli tabelit kasutades); 3) Arvutatakse aine aurustumissoojus, arvestades, et sirge tõus B graafikul ln (p aur) = f (1/T) H aur B=- R ja graafikul log (paur) = f (1/T) H aur B=- 2,303R 4) Arvutatakse saadud sirge võrrandist ln p = A + B*1/T aine keemistemperatuur T 0 normaalrõhul (p0 = 760 mm Hg); 5) Arvutatakse Troutoni konstant, s.o
hindamine regressioonanalüüsil. Faktorite olulisuse hindamine regressioonianalüüsil - t-krit t>2, F-krit F>3. Täpsem hinnang olulisusenivoo abil, kujutab endast eksimuse tõenäosust, faktori väärtus a< 0,05. Juhuslikke suurusi isel. karakteristikud on: jaotusfunktsioon F(t), tiheduspunkt p(t), keskväärtus E(t), dispersioon D(t) jne. 4. Klassikalise regressioonanalüüsi põhieeldused. Klassikalise regressioonanalüüsi põhieeldused. Vähimruutude meetodil saame mitmese lineaarse regressioonivõrrandi parameetrite parimad hinnangud, kui on täidetud järgmised eeldused: 1)Regressioonimudel on korrektne- kõik olulised analüüsitavat protsessi mõjutavad sõltumatud muutujad (X) on lülitatud regressioonivõrrandisse ning sõltuva muutuja ja sõltumatute muutujate vahel on lineaarne sõltuvus; 2)Sõltumatud muutujad on üksteisest statistiliselt sõltumatud; 3)Sõltumatud muutujad omavad küllaldast varieeruvust;
Praktikum nr 4. Mõõtmistulemuste võrrandite lahendamine vähimruutude meetodil. Ülesanne 1. Antud on kolm lineaarset mõõtmistulemuste parameetrilist võrrandit: 1) Kõigepealt tuleb meil ülesande lahendamiseks leida tundmatute parameetrite x ja y kõige tõenäolisemad väärtused vähimruutude meetodil. Arvestada tuleb ka, et mõõtmistulemused on vastavalt kaaludega 6, 4 ja 3. Ülesande lahendamiseks peame parameetriliste võrrandite abil koostama maatriksid A (Tabel 1) ja L (Tabel 2), mis vastavalt koosnevad tundmatute ees asetsevatest kordajatest ja paremal pool võrdusmärki asetsevatest väärtustest. Lisaks veel mõõtmistulemuste kaaludest moodustatud kaalumaatriks W (Tabel 3). Tabel 1. Maatriks A 3 2 2 -3 6 -7 Tabel 2. Maatriks L
leiab ökonomeetriliste mudelite koostamisel kõige enam kasutamist mitmene lineaarne regressioonimudel. Taolise regressioonimudeli koostamist nim. ka klassikaliseks regressioonianalüüsiks. Antud juhul eeldatakse, et sõltuvat muutujat Y mõjutavad mitu sõltumatut muutujat X1, X2,-;Xn ning nende mõju sõltuvale muutujale on lineaarne. Regressioonivõrrand-;-;-;-;-;-;-;-;-;-;-;-;-;-;-;-; Mudeli parameetrite hindamiseks kasutatakse üldtuntud vähimruutude meetodit. Regressioonivõrrandi parameetrite -;-;-;-;-;-;-;-;-;. .väärtuste ehk täpsemalt väljendades nende parameetrite hinnangute b1, b2, -;bn kindlaksmääramineon ökonomeetrilise analüüsi üheks peaülesandeks. Mitmese lineaarse regressioonivõrrandi parameetrid (regressioonikordajad) võimaldavad nende majanduslikku tõlgendamist. Igal regressioonikordajal on majanduslik sisu. Mittelineaarse regressioonivõrrandi parameetrid ei ole üldjujhul sisuliselt tõlgendatavad
Näiteks lineaarne regressioonmudel y=ax+b + u ax+b - deterministlik komponent ehk tinglik keskväärtus u - juhuslik komponent Regressioonanalüüs uurib suuruste vahelist sõltuvust ja võimalusi selle funktsionaalseks kirjeldamiseks etteantud valemi põhjal. Regressioonanalüüsi käigus leitakse regressioonmudeli deterministlik komponent, st leitakse vastava matemaatilise funktsiooni parameetrite hinnangud. 19. Vähimruutude meetodi olemus. Vähimruutude meetod on kõige tuntum meetod, selle abil minimeeritakse hälvete ruutude summat. ● Lineaarne mudel: harilik vähimruutude meetod OLS (Ordinary Least Squares). ● Mittelineaarne mudel: mittelineaarne vähimruutude meetod NLS (Nonlinear Least Squares) ● Teatud juhtudel üldistatud vähimruutude meetod GLS (Generalized Least Squares) Vähimruutude meetodi kasutamiseks peab mudel olema lineaarne parameetrite suhtes.
hindamismeetodid Tuntumad regressioonmudeli parameetrite Üldkogumi keskväärtuse hindamiseks võib hindamismeetodid ökonomeetrias: kasutada näiteks harilik vähimruutude meetod (Ordinal Least Squares, valimi keskmist; OLS); valimi mediaani; suurima tõepära meetod (Maximum Likelihood, ML); valimi minimaalse ja maksimaalse elemendi kaalutud vähimruutude meetod (Weighted Least aritmeetilist keskmist
väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on punkthinnang kogumi keskväärtusele). Intervallhinnang on lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5. Hinnangfunktsioon. Hinnangfunktsioon on reegel parameetrite hinnangute leidmiseks. Tuntudmad regressioonmudeli parameetrite hindamismeetodid on: harilik vähimruutude meetod (OLS), suurima tõepära meetod, momentide meetod ja üldistatud vähimruutude meetod. 6. Hinnangute omadused. Nihe, efektiivsus, mõjusus 7. Hinnangu nihe, nihketa hinnang. Hinnangu nihe võrdub parameetri hinnangu Beeta keskväärtuse ning parameetri tegeliku väärtuse beeta vahega. Parameetri hinnang on nihketa kui hinnangu keskväärtus võrdub parameetri tegeliku väärtusega. Parem on see, mis on nihketa. Hinnangu keskväärtus - tegelik keskväärtus
Iseseisev töö nr 4. Mõõtmistulemuste võrrandite lahendamine vähimruutude meetodil. Ülesanne 1. Antud on kolm lineaarset mõõtmistulemuste parameetrilist võrrandit: 1) Leida tundmatute parameetrite X ja Y kõige tõenäolisemad väärtused vähimruutude meetodil. Mõõtmistulemused on võrdsete kaaludega. Kuna mõõtmistulemused on võrdsete kaaludega, siis paregusel juhul neid arvestama ei pea ja kaalumaatriksit arvutustes kasutada ei ole vaja. Vastavalt ette antud võrranditele kirjutame välja maatriksid A (Tabel 1) ja L (Tabel 2), mis vastavalt koosnevad tundmatute muutujate X ja Y kordajatest ning paremal pool võrdusmärki asetsevatest suurustest (mõõtmistulemustest). Tabel 1. Maatriks A 1 2 2 -3
Vormistatud Exceliga. NB! Näiteks toodud graafikul on arvutused tehtud kümnendlogaritme kasutades. Katseandmete põhjal 1) Koostatakse kaks graafikut:paur = f (t)jaln (paur) = f (1/T); 2) Teise graafiku alusel arvutatakse empiirilise võrrandi ln p = A + B*1/T koefitsiendid A ja B kui saadud logaritmilise graafiku sirge algordinaat ja tõus; a) tabelarvutusprogrammi graafikult, nagu näidatud eespool, b) vähimruutude meetodil (käsitsi või Exceli tabelit kasutades); 3) Arvutatakse aine aurustumissoojus, arvestades, et sirge tõus B graafikul ln (p aur) = f(1/T) H aur B R ja graafikul log(paur) = f(1/T) H aur B 2,303R 4) Arvutatakse saadud sirge võrrandist ln p = A + B*1/T aine keemistemperatuur T0 normaalrõhul (p0 = 760 mm Hg); 5) Arvutatakse Troutoni konstant, s.o
o Antud ülesannet nimetatakse tingliku ekstreemumi ülesandeks ja selle ülesande lahendeid tinglikeks ekstreemumiteks. Võrrand (2) määrab teatud joone xy- tasandil. Lihtsuse mõttes eeldame, et joon g(x; y) = 0 on kinnine, st tema alg- ja lõpp-punkt ühtivad. Geomeetriliselt tähendab tingliku ekstreemumi ülesande lahendamine funktsiooni z = f(x; y) graafiku madalaima ja kõrgeima punkti leidmist joone g(x; y) = 0 kohal 2. Vähimruutude meetod Suurust x nimetatakse sõltumatuks suuruseks ja suurust y sõltuvaks suuruseks. Eesmärgiks on leida "parimat" x ja y vahelist seost iseloomustava funktsiooni võrrandit, mille saamiseks kasutatakse vähimruutude meetodit. Leitakse selline funktsioon, mille puhul vaatlusest saadud punktide ja seost kirjeldava funktsiooni sirge vaheliste kauguste (hälvete, vigade) ruutude summa oleks minimaalne:
e) valida, mitmendast veerust ja reast importimist alustatakse f) näidatakse töölehtede , muutujate ja vaatlustulemuste arv g) valida andmete liik – vastata No(ristandmed). (Aegread, paneelandmed – vastata Yes) h) avaneb Gretli-i menüü aken koos muutujate nimedega: Excel 2. Lineaarse mudeli parameetrite hindamine vähimruutude meetodil (Model -> Ordinary Least Squares) Põhimenüü ribalt valida menüü - Model. Avanevast rippmenüüst valida Ordinary Least Squares. Seejärel tuleb aknas "gretl: specify model" olemasolevate muutujate hulgast valida sõltuv muutuja Y (Dependent variable) ja üks või mitu sõltumatut muutujat X (Independent variables). Vajutada OK. 3. NÄIDE piima kogutoodangut kirjeldava regressioonimudeli konstrueerimisest Otsime mudelit kujul:
Ökonomeetria mõisted 1. Autokorrelatsioon ja heteroskedastatiivsus võivad mudelis olla kahel põhjusel: 1) mudeli spetsifikatsioon on vale. Mudelist on välja jäetud mõned olulised muutujad ja/või mudeli funktsionaalne kuju on vale. Mudel tuleb ümber vaadata. 2) Tavalise vähimruutude meetodi rakendamise protseduur võib anda standardhälvete nihkega hinnangud. Tuleb kasutada uusi lähenemisi mudeli parameetrite hindamiseks. Autokorrelatsiooni testitakse aegridade puhul. Kui juhuslikud vead korreleeruvad omavahel, siis on olemas autokorrelatsioon. Kui autok. Esineb, tuleb mudel ümber vaadata, tuleb muuta spetsifikatsiooni. 2. Asümptootilised hinnangud kui juhuslike vigade normaaljaotuse eeldus ei ole täidetud, siis
1-1,5 1 11 ,6-0,6 25 ,3-21 ,3 =- 11,6 25,3 =1 11 ,6-3,6 16 11 ,6-7,6 y=f(x)+f(x0,x1)(x-x0)+f(x0,x1,x2)(x-x0)(x-x1)+f(x0,x1,x2,x3)(x-x0)(x-x1)(x-x2) y 39,8911859154 Vähimruutude meetod 70 60 50 40 30 20 10 0 0 5 10 15 20 25 30 35 40 y = 0,0000135308x4 - 0,0000109799x3 - 0,0401884618x2 + 2,1011560167x + 7,46605335 y 37,2966 Column C 35 40 45 1560167x + 7,4660533574
sirget jääks ühepalju katsepunkte. Lähendussirge tõusu määramiseks tähistatakse sellel kaks punkti ja määratakse nende koordinaadid, vastavalt ( x1 , y1 ) ja ( x 2 , y 2 ) . y1 y1 x1 x2 Tõus arvutatakse valemist y - y2 k= 1 . x1 - x 2 Tõusu määramatuse k arvutamiseks kasutatakse mitmesuguseid meetodeid, tuntuim nendest on nn. vähimruutude meetod, mida kirjeldatakse metoodilises juhendis lk. 26. Praegu kasutame ühte arvutuslikult lihtsamat meetodit nn. keskmise tõusu meetodit. Selleks poolitatakse lähendussirge esmalt ristipidi, nii et mõlemale poole eraldusjoont jääks ühepalju katsepunkte. Järgnevalt ühendatakse ühel ja teisel pool eraldusjoont olevad katsepunktid paarikaupa, esimene punkt vasakul pool esimese punktiga paremal, teine punkt vasakul teise punktiga paremal jne
luksmeetri väikseima näidu järgi. 4. Arvutage sama järku maksimumide (või miinimumide) vahelised kaugused 2lk = |x+k – x-k| ja leidke nende kaugused lk tsentraalsest. 5. Arvutage valemi (6) järgi difraktsioonijärkudele k vastavate nurkade φk siinused. Kandke funktsiooni sin φk = f (k) (valemid (7) ja (8)) väärtustele vastavad punktid koordinaatteljestikule. Maksimumide korral [valem (7)] alustage argumendi väärtusest k = 2. Leidke vähimruutude meetodil katsepunktide parvele parim lähendussirge. λ Kuna pilu laius D on teada, siis arvutage sirge tõusu järgi, milleks on D , laserkiirguse lainepikkus ja tõusu määramatuse järgi lainepikkuse mõõtemääramatus. 6. Joonestage difraktsioonipildi suhtelise intensiivsuse graafik lk / l0 = f(l), lugedes miinimumide intensiivsused nulliks.
tumedaid rõngaid. Arvutage diameetrite kaudu Newtoni rõngaste raadiused ja seejärel nende ruudud. (Raadiuste otsene mõõtmine oleks ebatäpne, sest tsentraalne laik on küllalt suur ning seepärast on tsentri asukoha määramine raskendatud.) 10. Kandke koordinaatteljestikule funktsiooni r2j =f väärtustele vastavad punktid (y-teljel on r2j, x-teljel j ). Lähendage punktiparve sirgega. Kui mõõtmised on õigesti tehtud, asetsevad katsepunktid sirge lähemas ümbruses. Leidke vähimruutude meetodil sirge tõus Rλ0 koos A- tüüpi laiendmääramatusega usaldusnivool 95%. (Soovitame nii tõusu kui tema määramatuse leidmiseks kasutada füüsika II praktikumi arvutites olevat programmi “Lineaarne regressioon”. Selle kasutusjuhendi leiate töö nr 6 lisast.) Lähtudes tõusust, arvutage välja läätse kõverusraadius. Hinnake tema laiendatud liitmääramatus. 3 Tabel 14.1
väärtused. Järk-järgult rõhku tõstes määratakse vedeliku keemistemperatuur 10-20 erineval rõhul, viimane lugem võetakse atmosfäärirõhul. Teoreetiline põhjendus, valemid: Seadeldises valitsev (vedeliku auru-)rõhk Paur=P-h, kus P-atmosfäärirõhk(baromeetri lugem), h- elavhõbeda nivoode vahe manomeetris, mm Empiiriline võrrand (vastab lineaarsele sõltuvusele teljestikus ) Konstandid A ja B saab arvutada vähimruutude meetodil: Kus n-mõõtmiste arv, y- mõõdetud ln p väärtus, x- temperatuuri pöördväärtus. Logaritmid tuleb esitada vähemalt nelja kümnendkoha täpsusega. Katseandmed: Tabel 1 Atmosfäärirõhk P=762 mm Hg Jrk nr Keemistemperatuur T, h, Paur=P-h ln Paur t, °C K mm Hg
muutumise korral Dispersioonanalüüsi eesmärk: Uuritava nähtuste tegurite mõju olulisuse hindamine Dispersioon on: standardhälbe ruut hälvete ruutude aritmeetiline keskmine Regressioonanalüüsikäigus regressiooniseose selgitusvõimet kirjeldab determinatsioonikordaja hinnatakse parameetreid enamasti vähimruututde meetodil kasutatakse parameetrite leidmisel sageli vähimruutude meetodit tuleb kontrollida parameetrite statistilist olulisust Regressioonianalüüsi eesmärk: Kirjeldada korrelatiivset seost matemaatika funktsioonina Lineaarne regressioonimudelil: Regressiooni kordaja b abil saame kirjeldada seose tugevust Tugeva negatiivse lineaarse seose korral regressioonikordaja iseloomustab sõltuva muutuja vähenemist sõltumatu muutuja ühe ühikulise muutumise korral (õige) Seoste analüüsil
Tunnuse X2 väärtused: x21, x22,...x2n ... yn b1 b2 x2 n b3 x3n ... bk xkn un Tunnuse X3 väärtused: x31, x32,...x3n Üldiselt tunnuse Xj väärtused: xj1, xj2, xjn Kasutame maatrikseid · Parameetrite hinnangud leitakse vähimruutude meetodil y1 1 x21 x31 xk1 b1 u1 1 u (OLS) y x22 x31 xk 2 b
Lähendussirge tõusu arvutamisel kasutasin Microsoft Exceli funktsiooni SLOPE, mille arvutusvalem, on vastavas kohas ka ära toodud. Juhend soovitas kasutada 'lineaarset regressiooni', vastavasisulise Exceli töölehe võis leida Marek Vilipuu kodulehelt (http://www.emliit.ee/marekv/index_files/Page1082.htm). See arvutas ka tõusu määramatuse, milleks oli 0,01893. Mina võtsin määramatuse arvutamisel aluseks sirge tõusu arvutamise valemi vähimruutude meetodil ja juhendi selle määramatuse arvutamisel. Sellekohase juhendi võis leida samuti M. Vilipuu ülaltoodud lehelt. Miks need kaks väärtust teineteisest nõnda rohkelt erinevad, ma kommenteerida ei oska. Võib-olla ei saanud ma juhendist aru või kasutasin seda valesti. Ka kõverusraadiuse määramatuse arvutamise aluseks on sama tõusu-arvutamise valem, mida ülal juba kirjeldatud.
Test võrdleb kahte dispersiooni valitud olulisuse nivool ja otsustab, kas need on statistiliselt võrdsed või mitte. Testi tulemusena jõudsime sama lahenduseni, st et tõestati alternatiivne hüpotees (mõõtmistulemustest arvutatud dispersion on suurem kui tehase poolt ette nähtud). Teisisõnu- dispersioonid ei ole statistilises mõttes võrdsed. Joonis 2. χ 2 -statistiku kasutamine dispersioonide võrdlemisel. Ülesanne 3: Polügonomeetriavõrku tasandati vähimruutude meetodil kaks korda. Vähimate piirangute meetodil tasandamisega (v=28) saadi dispersiooniks S2²=0,81. Lõplike piirangute korral (v=35) saadi dispersiooniks S1²=1,15. A’priori võeti 2 2 tasandamisel mõlemad dispersioonid võrdseks ühega, st σ 1=σ 2=1 . a) Püstitage hüpoteesid. Nullhüpotees: kahe üldkogumi dispersioonid on võrdsed, seega lähtepunktides ei ole vigu. 3
17,87525 0,054078 6,4947E-005 MÄÄRAMINE DÜNAAMILISEL MEETODIL Arvutused 1) arvutatakse empiirilise võrrandi logp = A + B*1/T koefitsiendid A ja B a) kui saadud logaritmilise graafiku sirge algordinaat ja tõus, y = -1642,2x + 7,549 A=7,549 B=-1642,2 b) vähimruutude meetodil; x 2y-xyx A=7,549 A= nx 2- ( x )2 nxy-xy B=-1642,2 B= 0033 0,0034 nx2 -( x )2 2) arvutatakse aine auramissoojus, arvestades, et H aur
Optimeerimine kasutatakse juhul kui arvutamine ei ole kasulik või on liiga tülikas. Optimeerimiseks nimetatakse programmi abil väärtuste sobitamist. On mitu varianti, kuidas saab optimeerida – antud töös ma kasutasin RANDOM (ehk siis juhusliku) ja GRADIENT (teiste sõnadega, “targa” variandi, mis kasutab gradient funktsiooni). 3. Veakfunktsiooni teavitus Veafunktsioon on väärtuste erinevuse funktsioon. Kõige tuntum variant on vähimruutude meetod. 4. Lineaarne simuleerimine/mittlineaarne simuleerimine? Lineaarset simuleerimist kasutatakse siis, kui skeem (või selle aseskeem) on lineaarne, ehk siis ei sisalda mittelineaarseid elemente (sh dioodid jne). Mittelineaarset simuleerimist kasutatakse kõikidel teistel variantidel. 5. Koond – ja hajusparameetritega süsteemid? Koondsüsteeme kasutatakse, kui on vaja optimaalselt hõivata antud diapasooni.
y i yi 2 . (8) U A ( y A ) t n 2, i 1 n n 2 Täpsemaks, aga samal ajal arvutuslikult töömahukamaks meetodiks lähendusjoone leidmisel on nn vähimruutude meetod. Selle meetodiga leitakse lähendusjoon, millest katsepunktide kõrvalekallete ruutude summa oleks minimaalne. Eeldame mõõdetud suuruste xi ja yi vahelist lineaarset sõltuvust y i A xi B . (9) Sirge tõus A ja vabaliige B leitakse valemitega: n x i x yi y
chi² = 54.018>40.646 = critical value Reject H_0 2 Järeldus: Võtame vastu nullhüpoteesi tahumeeter mõõdab joone pikkust ette antud joonepikkusega Ülesanne 3 F- test. Seda testi kasutatakse mingi kahe valimi või üldkogumi ja valimi dispersioonide võrdlemiseks, et näha kas nad valitud olulisuse nivool erinevad üksteisest statistiliselt oluliselt või mitte. Polügonomeetriavõrku tasandati vähimruutude meetodil kaks korda. Vähimate piirangute meetodil tasandamisega (v=60) saadi dispersiooniks S²=0,77. Lõplike piirangute korral (v=64) saadi dispersiooniks S²=1,11. A’priori võeti tasandamisel mõlemad dispersioonid võrdseks ühega, st F test at 0.050 level of significance. H_0: S1² = S2² Vaba tasanduse ja seotud tasanduse kaaluühiku dispersioonid on võrdsed H_a: S1² > S2² vaba tasanduse ja seotud tasanduse kaaluühiku dispersioonid ei ole võrdsed
hüpotees: 18) Regressioonanalüüs ja regressioonmudeli komponendid: Uurib suuruste vahelist sõltuvust ja võimalusi selle funktsionaalseks kirjeldamiseks etteantud valemi põhjal. Regressioonanalüüsi käigus leitakse deterministlik komponent --> leitakse vastava matemaatilise funktsiooni parameetrite hinnangud. Komponendid – y= deterministlik komponent + juhuslik komponent, y = ax + b +u; Tinglik keskväärtus on deterministlik komponent y=E[Y X] + u 19) Vähimruutude meetodi olemus: Regressioonmudeli parameetrite hinnangud leitakse nii, et jääkide (hälvete) ruutude summa on minimaalne 20) Vähimruutude meetodil leitud hinnangute omadused, kui kehtivad klassikalise lineaarse mudeli eeldused: Hinnangud on: 1) nihketa, 2) efektiivsed (vähima dispersiooniga kõigi nihketa lineaarsete hinnangute seas 3) lineaarsed vaatluse y suhtes 21) Lineaarse mudeli parameetrite tõlgendus üldjuhul: y=b+ax a sirge tõus
muutuja Y keskväärtuse ja eksogeensete ehk sõltumatute muutujate Xi vahel. Võrrandi vasakul pool on tinglikud keskväärtused, mis ei sõltu juhusest 4. Stohhastiline regressioonivõrrand. Juhuslik komponent (regressioonijääk). Visualiseerimine (joonis). Stohhastiline regressioonivõrrand sisaldab juhuslikku liiget i Juhuslik liige i kirjeldab juhuslikke hälbeid endogeense (sõltuva) muutuja keskväärtusest Yi= E(YXi) + i ehk Yi= 0+ 1Xi+ i 5. Vähimruutude meetod, olemus, visualiseerimine. Vähimruutude meetod on regressioonimudeli parameetrite hindamise enamkasutatav meetod. Eesmärgiks on leida regressioonimudeli parameetrid (a0ja a1) selliselt, et juhusliku suuruse Y mõõdetud väärtuste Yi ja regressioonimudeli abil määratud hinnangute i hälvete (jääkliikmete) ruutude summa oleks minimaalne OLEMUS: · Et funktsioon S saavutaks miinimumi, peavad tema osatuletised parameetrite a0 ja a1 suhtes võrduma nulliga
lahendada vastav võrrandisüsteem) 3) Arvutada valimi järgi arvkarakteristikute hinnangud 4) Arvutada valimi arvkarakteristikute järgi parameetrite hinnangud, kasutades leitud pöördseoseid. Suurima tõepära meetod: Meetodi aluseks on põhimõte leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise tõenäosus. Vähimruutude meetod: Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel (nt regressioonanalüüsis). Nullhüpotees- kontrollitav väide Alternatiivhüpotees- nullhüpoteesi välistav alternatiivne väide Statistiline hüpotees tekib tavaliselt mingi vaadeldava juhusliku suuruse kohta käiva väite (oletuse, hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea
hajumisdiagramm, tunnuste vaheline seos kõige tugevam korrelatsioonikordaja ja kovariatsioon hajumisdiagramm, esitatud seos positiivne korrelatsioon, negatiivne korrelatsioon, pearsoni korrelatsioonikordaja, lineaarne korrelatsioonikordajad, tunnuste vahel on kõige tugevam seos, monotoonne seos, spearmani korrelatsioonikordaja tõene, väär, suurendades suurust x suureneb ka y, korrelatsioonikordaja Test 9 regressioonanalüüs, regressioonmudeli parameetrite hinnang, vähimruutude meetod, jäägid, kriipsukesed determinatsioonikordaja determinatsioonikordaja näitab vaatluste arv, korrigeeritud determinatsioonikordaja, kordaja a, vabaliige b, kordaja a standardviga regressioonanalüüs kolm mudel, kõige parem mudel regressioonmudelid valiksid diagrammil toodud sõltuvuste kirjeldamiseks, logaritmiline, pöördvõrdeline, eksponentsiaalne regressioonaanalüüsil, regressioonmudel
Joonis . Lahuse elektrijuhtivuse sõltuvus ajast. Joonis . Aja ja naturaallogaritmi elektrijuhtivuste (alg- ja lõpphetkel) ajast sõltuvus Arvutused Graafikult näeme, et ajahetkel : Seega Katsetulemustest teame, et Seega Keskmine kiiruskonstant: Graafiku tõusu järgi leitud kiiruskonstant on . Tõus on leitud lineaarse regressiooni abiprogrammiga, mis arvutas automaatselt välja graafiku tõusu lineaarse regressiooni ehk vähimruutude meetodil. Järeldused tööst ja hinnang tulemusele Antud katses pidin määrama esimest järku reaktsiooni kiiruskonstanti. Katses leitud kiiruskonstant tuli keskmiselt 0,06759 . Graafiku f(t) sirge tõusu järgi on kiiruskonstant 0,04318 . Antud tulemused on üksteisele suhteliselt lähedased tulemused. Erinevus võis tulla sellest, et arvutustel arvestati vaid väikene osa kõikidest tulemustest.
n =8 20,641 0,0241 0,0617 7,2623E-05 6 Graafikud: Arvutused atseandmete põhjal: 1) arvutatakse empiirilise võrrandi logp = A + B*1/T koefitsiendid A ja B a) kui saadud logaritmilise graafiku sirge algordinaat ja tõus, y = -1694,3x + 7,6774 A=7,6774 B=-1694,3 b) käsitsi vähimruutude meetodil; x 2 y - x y x A= =7,6774 nx 2 - ( x ) 2 nx y - x y B= =-1694,3 nx 2 - ( x ) 2 2) arvutatakse aine auramissoojus, H aur B =- => H aur = -B* 2,303R 2,303R H aur =32441 J/mol 3) arvutatakse saadud sirge võrrandist aine keemistemperatuur normaalrõhul (760 torr); log760= -1694,3x + 7,6774 x=(7,6774-log760)/ 1694,3
Otselõige-Mõõdetakse nurgad baasjoonte suundade ja lähtepunkte määravate punktidega ühendavate suundade vahel.Võrreldes vastulõikega on kirjeldatav meetod töömahukam, mistõttu seda kasutatakse harvemini ja enamasti mitteligipäästetavate punktide koordinaatide määrimiseks.Otselõike lahendamiseks on küllalt kahest lõikesuunast, kuid polügonomeetrias vajalike lisamõõtmistulemuste saamiseks kasutatakse lõiget vähemalt kolmelt suunalt, mis tasandatakse vähimruutude meetodil.Hanseni ülesanne-Kui käigu kahest naaberpunktist on kummastki näha kaks sama kõrgema järgu punkti, võib polügonomeetriakäigu sidumise teha Hanseni ülesandega.Seinapolügonomeetria-Pinnases kindlustatud geodeetilised märgid hävinevad tihti kaevetööde käigus ja seetõttu kasutatakse asulates sageli nn. Seinapolügonomeetriat, kus geodeetilised märgid kindlustatakse reeperilaadsete märkidega hoonete seintel.Nimetatud märkide eeliseks on see, et neid saab
Otselõige-Mõõdetakse nurgad baasjoonte suundade ja lähtepunkte määravate punktidega ühendavate suundade vahel.Võrreldes vastulõikega on kirjeldatav meetod töömahukam, mistõttu seda kasutatakse harvemini ja enamasti mitteligipäästetavate punktide koordinaatide määrimiseks.Otselõike lahendamiseks on küllalt kahest lõikesuunast, kuid polügonomeetrias vajalike lisamõõtmistulemuste saamiseks kasutatakse lõiget vähemalt kolmelt suunalt, mis tasandatakse vähimruutude meetodil.Hanseni ülesanne-Kui käigu kahest naaberpunktist on kummastki näha kaks sama kõrgema järgu punkti, võib polügonomeetriakäigu sidumise teha Hanseni ülesandega.Seinapolügonomeetria-Pinnases kindlustatud geodeetilised märgid hävinevad tihti kaevetööde käigus ja seetõttu kasutatakse asulates sageli nn. Seinapolügonomeetriat, kus geodeetilised märgid kindlustatakse reeperilaadsete märkidega hoonete seintel.Nimetatud
0277 0 78 0 0 0 0.062 0 0 5 0 0 0 0 0 15625 0 20408. 0 0 0 0 16 Tundmatute parandite dx ja dy leidmiseks kasutame programmi Matrix. Sisendfaili tuleb kirjutada kaalumaatriks W, parandite kordajate maatriks J ning maatriks K. Kasutame arvutamiseks kaalutud vähimruutude meetodit ning saame tulemuseks maatriksi X (Tabel 7), mis sisaldab parandeid dx ja dy. Parandid liites esialgsetele punkti B koordinaatidele, siis saame uuteks koorinaatideks B: X=1132,10 ja Y= 1281,32. Tabel 7. Parandite maatriks X -0.0439 - 0.0203 3 Teeme uue lähenduse. Selleks viime kõik arvutused excelis uuele lehele ning asendame punkti B koordinaadid esimese lähenduse parandatud koordinaatidega ning saame uued
libisemissammu pikkuseks.Tavaliselt võetakse selleks mingi paaritu arv osaperioode (päevi, kuid,
aastaid)
Nt loomuliku iibe libisev keskmine: leian loomuliku iibe (sündimus-suremus) leian nt 3 aasta libiseva,
selleks liidan esimesed 3 iibe tulemust saan libiseva summa, jagades selle libisemissammuga (eks mitu
arvu ma liitsin) saan kätte keskmise libiseva.
27. Aegrea analüütiline tasandamine sirgega
Kui kasutatakse vähimruutude meetodi, siis tuleb läbida järgmised 3 etappi:
1) Valitakse sobiv tasandusjoon
2) Normaalvõrranditesüsteemi abil leitakse empiirilist kõverat tasandava teoreetilise joone parameetrite
hinangud
3) Leitakse teoreetilise joone punktide väärtused ja konstrueeritakse tasandusjoon.
Näiteks: pannakse iibed aastate järgi ritta. Leita
Näiteks: pannakse iibed aastate järgi ritta. Leitakse T, nii et keskmine aasta T =0. Muidu –x
5 104 646,8 6,472037 10. 79,5 352,5 0,00283 7 8,25 742,55 6,61009 Graafikud 2) arvutatakse empiirilise võrrandi ln p = A + B/T(sama mis ln p = A + B* 1/T)koefitsiendid A ja B logaritmilise graafiku sirge tõusu abil; a) tabelarvutusprogrammi graafikult, nagu näidatud eespool A = 17,425 B = -3810,5 b) vähimruutude meetodil (Exceli tabelit kasutades); Järjekorra Keemis- T, Paur y= ln p x=1/T x*y x2 nr. temperatuur K =P-h t,°C 1. 24,9 297,9 1,12683 100,8 4,613138 0,003357 0,015486 05 2
Iseseisev töö nr. 8. GPS-võrgu tasandamine programmiga Adjust Tasandada Joonisel 1 kujutatud GPS-võrk vähimruutude meetodil programmiga Adjust. Lähtepunktid on punktid nr 2 (2904829,045; 1460511,739; 5468898,116) ja 5 (2901645,054; 1461580,539; 5470285,543). Andke tasandustulemustele hinnang jämedate vigade, kaalude valiku ja tulemuste usaldusväärsuse osas. Joonis 1. Tasandatav GPS-võrk Ülesande programmiga Adjust lahendamiseks peame esmalt koostama lähtefaili. Nagu ikka tuleb faili esimesele reale kirjutada töö pealkiri. Järgnevalt lähtepunktide,
on r=0,4201 (p=0,001), r=-0,6028 (p=0,000) ja r=-0,2652 (p=0,0406). Meeste osakaal tööjõust ja linlaste osakaal keskmise brutopalgaga statistiliselt olulist seost ei oma. Samal ajal on tugev korrelatsioon ka osade sõltumatute muutujate vahel, näiteks kõrghariduse ja linnalises asulas töötajate vahel (r = 0,5873) ja fiktiivsete muutujate D1, D2 ja D3 vahel (kõigi fiktiivsete muutujate vahel r = -0,3333). Mudeli parameetritele hinnangud leiti leiti vähimruutude meetodil. Lisas 6 toodud esialgse lineaarse mudeli koefitsientide tabelist on näha, et kõrgharitute osakaau hõivatutest X1 (p=0,000), fiktiivse muutuja D1 (p=0,000), D2 (p=0,000) ning fiktiivse muutuja D 3 (p=0,000) parameetrite hinnangud on statistiliselt olulised usaldusnivool 0,95. Saame väita, et keskmise brutopalga kujunemine sõltub olulisel määral vaid kõrghariduse määrast ning on mõjutatud ka ajaperioodist. Meeste osakaal hõivatutest ning linlaste osakaal on antud mudelis
Temperatuur hakkab aeglaselt tõusma. Alates algtemperatuurist mõõdke etteantud temperatuurivahemike tagant pooljuhi ja metalli takistus ning kandke tabelisse. 5. Kandke ühele teljestikule R T sõltuvused R=f(T) metalli ja pooljuhi jaoks. Võrrelge saadud graafikuid. 6. Leidke vähemruutude meetodil metalli takistuse temperatuurisõltuvuse R=f(T) lähendussirge võrrandi parameetrid Ro ja Ro, millest arvutage metalli takistuse temperatuuritegur . 7. Leidke vähimruutude meetodil pooljuhi takistuse temperatuurisõltuvuse lnR=f(1/T) lähendussirge võrrandi kordaja W/2k, millest arvutage pooljuhi omajuhtivuse aktivatsioonienergia W. Tabel Jrk.Nr. Metall Pooljuht t (C) T(K) R t (C) T(K) 1/T (K-1) R Ln R Metalli takistuse temperatuuritegur: R1 - R 2 = R 2 t1 - R 1t 2 Metalli takistus 0o C juures: R1 Ro = 1 + t1
7. 80,5 0C 353,5 K 0,00283 0 mmHg 770 mmHg 6,6464 Katseandmete põhjal 1) Graafikud: paur = f (t) ja ln (paur) = f (1/T) 2) Teise graafiku alusel arvutatud empiirilise võrrandi ln p = A + B*1/T koefitsiendid A ja B kui saadud logaritmilise graafiku sirge algordinaat ja tõus; a) tabelarvutusprogrammi graafikult, nagu näidatud eespool A = 17,6 B = -3873,1 vähimruutude meetodil (Exceli tabelit kasutades); b) Mõõtmine t, °C T, K paur, y = ln p x = 1/T x·y x2 0 mm Hg 1. 32 C 305 K 135 4,9053 0,00328 0,01608 1,07498E-05 2. 45,5 0C 318,5 K 232 5,4467 0,00314 0,01710 9,85783E-06 3
, . , . , (vähimruutude meetod). . . ( ). . 3. , , , , . , .. .
ilm.ee) h elavhõbeda nivoode vahe manomeetris, mm (lugem skaalalt) Katseandmete põhjal 1) Koostatakse kaks graafikut: paur = f (t) ja ln (paur) = f (1/T); 2) Teise graafiku alusel arvutatakse empiirilise võrrandi ln p = A + B*1/T koefitsiendid A ja B kui saadud logaritmilise graafiku sirge algordinaat ja tõus; a) tabelarvutusprogrammi graafikult, nagu näidatud eespool, b) vähimruutude meetodil (käsitsi või Exceli tabelit kasutades); 3) Arvutatakse aine aurustumissoojus, arvestades, et sirge tõus B graafikul ln (paur) = f (1/T) H aur B=- R ja graafikul log (paur) = f (1/T) H aur B=- 2,303R 4) Arvutatakse saadud sirge võrrandist ln p = A + B*1/T aine keemistemperatuur T0 normaalrõhul (p0 = 760 mm Hg); 5) Arvutatakse Troutoni konstant, s.o
November 55 600 33000 360000 Detsember 59 710 41890 504100 360 4210 253790 2979100 1) Tuleta laokulude ja müügikäibe seosevõrrand maksimum-miinimum meetodil vc (65-55)/(800-600)=0,05 fc 65-(800*0,05)=25 Laokulud = 25 + 0,05 * müük 2) Tuleta laokulude ja müügikäibe seosevõrrand vähimruutude meetodil 1072476000-1068455900 a= (360)(2979100)-(4210)(253790) = 26,71 6(2979100)-(17724100) 150500 160,26 b= (360)-6*26,71 = 0,047 4210 Laokulud = 26,71 + 0,047 * müük
Hindamise meetodid: Momentide meetod- üldkogumile vastavad seosed jaotuse parameetrite ja arvkar. Vahel kantakse üle valimile ja vastavalt valimilt saadud arvk. Hinnangutele arvutatakse nende seoste järgi param. Hinnangud. Eelis: lihtne arvutus- mõjus hinnang, kuid ei pruugi olla nihutamata ja efektiivne. Suurima tõepära meetod leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise P. Eelis: efektiivsus! Vähimruutude meetod tavalisim, Eelis: lihtne arvutus, optimaalsus. Nullhüpotees kontrollitav väide. Alternatiivne hüpotees- H0-i välistav alternat. väide. Esim. järku viga H0 on õige, peetakse valeks. Vea tõenäosus- alfa (olulisuse nivoo) 2. Järku viga H0 on vale, peetakse õigeks, vea tõenäosus on beeta. Teststatistik x kasut hüpoteesi kontrollimiseks. Lihthüpotees kui fikseerib üldkogumi jaotuse üheselt. Testi võimsus= 1-beeta
Järgnevalt koostame kovariatsioonimaatriksi E, mille peadiagonaal koosneb plokkidest. Ploki moodustavad tabelis 2 toodud elemendid δ 2x , δ 2y , δ 2z , δ xy , δ xz ja δ yz . Moodustatud 24x24 maatriks E ning selle pöördmaatriksiks olev kaalumaatriks W on toodud lisatud Excel’i failis. Moodustatud maatriksid viime programmi Matrix ning teeme läbi tasanduse kaalutud vähimruutude meetodil. Tulemusena saame X maatriksi (Tabel 5), mis sisaldab otsitava punkti E koordinaate. Lisaks saame kaaluühiku dispersiooni S 02, mille väärtuseks on 1,07605 ning S0= 1,037. Tabel 5. Maatriks X punkti E koordinaatidega - 1589221.2 7 - 4307629.6 8 4415024.0 1 2
f(x) = - 3980.03x + 17.95 ln Paur 0 0 0 0 0 0 0 1/ T 2) Teise graafiku alusel arvutan empiirilise võrrandi ln p = A + B*1/T koefitsiendid A ja B kui saadud logaritmilise graafiku sirge algordinaat ja tõus. a) Tabelarvutusprogrammi graafikust y = -3980x + 17,945 A=17,945 B= -3980 b) Vähimruutude meetodil Mõõtmin paur, t, °C T, K y = ln p x = 1/T x·y x2 e mm Hg 1 31 304 130,71 4,87298113 0,003289474 0,016029543 0,00001082 2 45,5 318,5 230,71 5,44116151 0,003139717 0,01708371 0,00000986 5,8012418
MatLab'is psd(). Bartletti meetod kasutab periodogrammi 3. Signaali digitaalaja mudelid: Wold, Tihti on mugav digitaalaja signaali kuju esitamiseks mainida, et jääksignaal tekib sellest, et meie koeffitsiente, kasutades vähimruutude meetodit ehk kasutada maatriksesitust või selle erandjuhu fluktuatsioonide vähendamiseks kogu andmerea mudel on ikkagi ligikaudne reaalsele signaalile. Ja minimeerides vea ruutu. harmooniline, AR/MA/ARMA jagamist K = N/L segmentideks. Kui esialgse rea
arvteljel.Et hinnata punkthinnangu erinevust jaotusparameetri tegelikust väärtusest, kasutatakse vahemikhinnangut.Matemaatilises statistikas kasutatakse hinnangu ã täpsuse määramiseksusaldusvahemikke. Usaldusvahemik on valimi põhjal arvutatav piirkond, millesse hinnatava parameetri tegelik väärtus kuulub tõenäosusega, mis ei ole väiksem etteantud suuruse usaldusnivoo väärtusest. Usaldusvahemiku otspunkte nimetatakse usalduspiirideks. Student: 25. Vähimruutude meetod: lineaarne regressioon PILT. Kui tunnuste X ja Y vahel on tugev lineaarne korrelatsioon, siis on võimalik koostada lineaarne mudel, mis väljendab ühe tunnuse keskväärtuse sõltuvust teisest tunnusest. Lineaarse regressiooni korral uuritakse sõltuvust kujul .kus a ja b on vähimruutude meetodi abil määratavad parameeetrid e. regressioonikordajad.
*arvutada valimi järgi arvkarakteristikute hinnangud *arvutada valimi arvkarakteristikute järgi parameetrite hinnangud, kasutades leitud pöördseoseid. Suurima tõepära meetodi aluseks on põhimõte leida selliseid jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise tõenäosus. See tõepärasusfunktsioon kujutab endast valimi elementide kui sõltumatute juhuslike suuruste n-mõõtmelist jaotustihedust. Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel. Tõenäosust, et tegelik väärtus satub väljaspoole usaldusvahemikku, tähistatakse tavaliselt alfa ja nim olulisuse nivooks. Kahepoolse sümmeetrilise usaldusvahemiku arvutamiseks on järgmised: *leitakse keskväärtuse ja standardhälbe hinnangud *valitud usaldustõenäosuse p ja vabadusastmete arvu f=N-1 järgi leitakse t-jaotuse tabei või arvutiprogrammi abil vajalik t-jaotuse kvantiil