Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Harilik lineaarne regressioonmudel". Need materjalid aitavad sul teemat sügavamalt mõista.
regressioon, elektrienergia, ruutude, juhu, kovariatsioon, hüpotees, korrelatsioon, vähimruutude, komponent, keskväärtus, usalduspiirid, linear, sales, hajuvus, hajumine, deterministlik, hinnangud, nullhüpotees, investeering, tinglik, demo, erind, väärtustele, least, valim, programmis, gretl, standardviga, töötasu, journal, nihketa, regressionÖkonomeetria KT kordamisküsimused 1. Ökonomeetrilise mudeli komponendid. ● Modelleeritavad näitajad: endogeenselt (sisemiselt) määratud ehk sõltuvad muutujad (Y). Väärtused määratakse mudeli siseselt ● Modelleeritavat nähtust mõjutavad näitajad: eksogeenselt (väliselt) määratud ehk sõltumatud, seletavad muutujad (X). Väärtused määratakse mudeli väliselt. ● Statistiliste meetoditega hinnatavad mudeli parameetrid (b). ● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim
KORDAMINE ÖKONOMEETRIA KONTROLLTÖÖKS 2013 sügissemester kasutatud 2017. aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal
Tunnuse X2 väärtused: x21, x22,...x2n ... yn b1 b2 x2 n b3 x3n ... bk xkn un Tunnuse X3 väärtused: x31, x32,...x3n Üldiselt tunnuse Xj väärtused: xj1, xj2, xjn Kasutame maatrikseid · Parameetrite hinnangud leitakse vähimruutude meetodil y1 1 x21 x31 xk1 b1 u1 1 u (OLS) y x22 x31 xk 2 b
1) Ökonomeetrilise mudeli komponendid: Endogeensed muutujad - sõltuvad muutujad, väärtused mudeli siseselt Y Eksogeensed muutujad – sõltumatud muutujad, modelleeritavat nähtust mõjutavad X Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline
· Mõõteskaalad, keskmised (aritmeetiline, mediaan, mood), · Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks)
Ökonomeetria mõisted 1. Autokorrelatsioon ja heteroskedastatiivsus võivad mudelis olla kahel põhjusel: 1) mudeli spetsifikatsioon on vale. Mudelist on välja jäetud mõned olulised muutujad ja/või mudeli funktsionaalne kuju on vale. Mudel tuleb ümber vaadata. 2) Tavalise vähimruutude meetodi rakendamise protseduur võib anda standardhälvete nihkega hinnangud. Tuleb kasutada uusi lähenemisi mudeli parameetrite hindamiseks. Autokorrelatsiooni testitakse aegridade puhul. Kui juhuslikud vead korreleeruvad omavahel, siis on olemas autokorrelatsioon. Kui autok. Esineb, tuleb mudel ümber vaadata, tuleb muuta spetsifikatsiooni. 2. Asümptootilised hinnangud kui juhuslike vigade normaaljaotuse eeldus ei ole täidetud, siis
Ökonomeetria-BA. Harjutusülesande koos lahendustega Koostanud: Tiiu Paas Ülesanne 1. Analüüsime regressioonimudelit Yi 800 0.93 X i 50 Di 0.01Di X i uˆ i , i 1,2,..,100 , (t ) (22.54) (2.34) (0.56) R 2 0.82, F 15.342 ( p 0.001) kus Y – küsitletu tarbimine eurodes, X – küsitletu sissetulek eurodesning D – küsitletu sugu (D = 1, kui mees ning D = 0, kui naine); t – statistiku kriitiliseks väärtuseks on t 0.025,96 1.99 . Vastake järgmistele küsimustele ning põhjendage vastuseid a) kas mudel on statistiliselt oluline olulisuse nivool 0.05; mida saate öelda mudeli kirjeldatuse taseme kohta. b) millised muutujad on statistilised olulised olulisuse nivool 0.05; c) Leida muutuja X e
Ökonomeetriline mudel on matemaatilise mudeli eriliik, mis koosneb üldjuhul algebralistest võrranditest või võrrandisüsteemidest ning sisaldab juhuslikku komponenti. ÖKONOMEETRILISE MUDELI KOMPONENDID: · modelleeritavad näitajad: endogeensed ehk sõltuvad muutujad (Y) · modelleeritavat nähtust mõjutavad näitajad: eksogeensed ehk sõltumatud muutujad (X) · matemaatiliste ja statistiliste meetoditega hinnatavad mudeli parameetrid · juhuslik komponent () ÖKONOMEETRILISE MODELLEERIMISE ETAPID: 1. teooria ja sellel baseeruva verbaalse mudeli formuleerimine 2. andmebaasi korraldamine 3. ökonomeetrilise (matemaatilise) mudeli valik 4. ökonomeetrilise mudeli parameetrite hindamine 5. parameetrite usaldatavuse kontrollimine 6. mudeli omaduste parandamine 7. järelduste tegemine 8. prognooside koostamine 3. Lihtne regressioon, regressioonivõrrandi põhikuju. Determineeritud regressioonivõrrand.
Keskmise kasvutempo arvutamisel TULEB kasutada geomeetrilist keskmist. Saab leida vaid intervallskaala korral ja positiivsetest arvudest. Valem: Kaalutud geomeetriline keskmine valem – 3. VARIATSIOON - NÄITARVUD JA JAOTUSE KUJU NÄITARVUD Variatsioonamplituud ehk haare on rea kõige suurema liikme ja kõige väiksema liikme arvväärtuste vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi
lahendada vastav võrrandisüsteem) 3) Arvutada valimi järgi arvkarakteristikute hinnangud 4) Arvutada valimi arvkarakteristikute järgi parameetrite hinnangud, kasutades leitud pöördseoseid. Suurima tõepära meetod: Meetodi aluseks on põhimõte leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise tõenäosus. Vähimruutude meetod: Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel (nt regressioonanalüüsis). Nullhüpotees- kontrollitav väide Alternatiivhüpotees- nullhüpoteesi välistav alternatiivne väide Statistiline hüpotees tekib tavaliselt mingi vaadeldava juhusliku suuruse kohta käiva väite (oletuse, hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea
Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud
vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X~N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud normaaljaotuse
nihketa, efektiivne, optimaalne keskväärtus, normaaljaotus, suur valim keskväärtuse standardviga standardhälve standardviga, keskväärtuse usalduspiirid valimvaatlus usaldatavus suur valim, usaldatavus suurem üldkogumi keskväärtuse usaldusvahemiku laius, vabadusastmete arv studenti jaotus mediaani usalduspiiride leidmisel kasutatakse binoomjaotust, loend on ülekaetud ankeetküsitluse läbiviimisel, mõõtmisvahendi viga Test nr 8 sisukas hüpotees, järeldus peale parameetri empiirilise väärtuse võrdlust kriitilisega z-testi parameetri kriitiline väärtus t-testi parameetri empiiriline väärtus sisukas hüpotees, sõltuv valim, sõltumatu valim empriiline väärtus, kriitiline, nullhüpotees, sisukas hüpotees t-testi parameetri empiiriline väärtus mittekehtiv nullhüpotees, I liiki viga, ii liiki viga, teststatistiku empiiriline väärtus olulisuse nivoo olulisuse nivoo vähendamine
sündmuste A ja B summa 2. Sündmus C, mille korral toimub nii sündmus A kui ka sündmus B C on sündmuste A ja B korrutis 3. Kindel on see, et toimub kas sündmus A või sündmus B või sündmus C A, B ja C moodustavad täeliku süsteemi 2. Juhusliku suuruse X väärtuste hulk on {2; 4; 5}. Vastavate väärtuste esinemise tõenäosused on p(2)=0,5; p(4)=0,2 ja p(5)=0,3. Suuruse X keskväärtus on järelikult 3,3 3. Kui sündmuse A tõenäosus p(A)= 0,7, siis selle vastandsündmuse tõenäosus on 0,3 4. Visatakse korraga kahte täringut. Kui suur on tõenäosus, et mõlemal täringul tuleb silmade arv "6"? 1/36 5. Kui p(A)=p(A|B), siis sündmused A ja B on sõltumatud 6. Kahe sündmuse korrutise tõenäosus võrdub nende sündmuste korrutiste tõenäosusega, kui sündmused A ja B on sõltumatud. 7
Korrelatsioonkordajate tabelist (vt lisa 5) ja vastavate olulisuse tõenäosuste tabelist (vt lisa 6) näeme, et keskmisel brutopalgal on statistiliselt oluline seos nii kõrgharidusega kui ka fiktiivsete muutujatega D1 ja D2, kus korrelatsioonikordajad ja vastavad olulisuse tõenäosused on r=0,4201 (p=0,001), r=-0,6028 (p=0,000) ja r=-0,2652 (p=0,0406). Meeste osakaal tööjõust ja linlaste osakaal keskmise brutopalgaga statistiliselt olulist seost ei oma. Samal ajal on tugev korrelatsioon ka osade sõltumatute muutujate vahel, näiteks kõrghariduse ja linnalises asulas töötajate vahel (r = 0,5873) ja fiktiivsete muutujate D1, D2 ja D3 vahel (kõigi fiktiivsete muutujate vahel r = -0,3333). Mudeli parameetritele hinnangud leiti leiti vähimruutude meetodil. Lisas 6 toodud esialgse lineaarse mudeli koefitsientide tabelist on näha, et kõrgharitute osakaau hõivatutest X1 (p=0,000), fiktiivse muutuja D1 (p=0,000), D2 (p=0,000) ning fiktiivse muutuja D 3
30 1979529261 228693 2 30 8151649352 479744 2 2.2 Kontrollime tulemust Exceli funktsiooni abil: 2.3 Järeldus: Korrelatsioonikordaja absoluutväärtus on lähedane ühele, sellega a vaheline sõltuvus on lähedane lineaarsele. |r| 0,8 ehk korrelatsioon on tugev. Korrelatsioonikordaja märk näitab, et lineaarne seos uuritavate abiellude ja sünd 3. Kontrollime korrelatsiooni olemasolu olulisusnivooga 5% H0: rxy = 0 üldkogumis abiellude arvu ning järgmisel aastal sündinute la H1: rxy 0 üldkogumis abiellude arvu ning järgmisel aastal sündinute la 3.1 Leiame kriitilise punkti kahepoolsele sümmeetrilisele kriitilisele piirkonnale 3.1.1 Kriitilise punkti leidmine tabeli alusel:
e) valida, mitmendast veerust ja reast importimist alustatakse f) näidatakse töölehtede , muutujate ja vaatlustulemuste arv g) valida andmete liik – vastata No(ristandmed). (Aegread, paneelandmed – vastata Yes) h) avaneb Gretli-i menüü aken koos muutujate nimedega: Excel 2. Lineaarse mudeli parameetrite hindamine vähimruutude meetodil (Model -> Ordinary Least Squares) Põhimenüü ribalt valida menüü - Model. Avanevast rippmenüüst valida Ordinary Least Squares. Seejärel tuleb aknas "gretl: specify model" olemasolevate muutujate hulgast valida sõltuv muutuja Y (Dependent variable) ja üks või mitu sõltumatut muutujat X (Independent variables). Vajutada OK. 3. NÄIDE piima kogutoodangut kirjeldava regressioonimudeli konstrueerimisest Otsime mudelit kujul:
5 9,19 y^ | x = 2, 4469 1,12 = 2, 73 P((7, 06 - 2, 73) < µ y ( x) < (7,06 + 2, 73)) = 1 - 0, 05 P(4,33 < µ y ( x) < 9, 79) = 0,95 11.6 Regressioonimudeli graafik koos katsepunktidega KOKKUVÕTE Rakendusstatistika arvestusharjutuses AGT-1 leidsin erinevaid valimit iseloomustavaid parameetreid, kontrollisin hüpoteese ja esitasin mitmeid graafikuid. Osa A Ülesandes 1 on toodud põhilised valimit A iseloomutavad arvkarakteristikud: keskväärtus 46,2, dispersioon 867,9, standardhälve 29,46. Samuti on välja toodud mediaan 46 (valimi keskelement) ja haare 99 (valimi suurima ja vähima elemendi vahe). Ülesandes 2 on leitud keskväärtuse ja dispersiooni usaldusvahemikud, ehk piirkonnad, kus normaaljaotuse puhul paiknevad keskväärtus ja dispersioon 90% juhtudest. Keskväärtus asub vahemikus 35,91<<56,49 ja dispersioon vahemikus 572,0<2<1504,2.
2 Haare: R = xmax - xmin = 99 - 0 = 99 Mo = {94} Mood: 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : X -t < µ < X +t n n 30,90 30,90 53,92 -1,96 < µ < 53,92 +1,96 50 50 45,36 < µ < 62,48 Tõene standardhälve P=95% q=0,21 : Enne leida korrigeeritud standardhälve n ( x ) 2 i i -X 47735,68
Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: 21.11.2013 Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs, aegrida ) 37 54 94 32 19 33 69 51 89 43 18 88 9 30 62 41 81 54 49 54 15 94 85 43 87 Andmed-B: valimid B1 ja B2 ( korrelatsioon, regressioonimudeli leidmine ja analüüs) xi 1,1 2,8 2,2 5,1 3,7 yi 7,2 8.9 6,8 19,3 13,1 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,4 3,2 6,4 4,2 7,1 5,5 4,9 Lahenduse kontrollelemendid
Tunnused: 1)0 <= F(x) <=1 2)F(x)kasvab;3)F(+lõpmatus)=1 Juhuslik suurus võib alluda binoomjaotusele, Poissoni jaotusele. Pidev juhuslik suurus omandab iga väärtuse tõenäosusega 0. Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon = ( | ( ) = ) = ( = ); pi ≥ 0; ∑pi=1 Omavahelised seosed: Ω X P R [0;1] D 9. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust DEF:kindlat suurust EX = ∫ ( ) nim juhusliku suuruse X keskväärtuseks. Seega juhusliku suuruse X keskväärtus EX kui kindel suurus on arv. Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c
Xi; A∈ F. Juhusliku suuruse X jaotuseks nimetatakse funktsiooni D: R → [0;1] selliselt, et D(X(A)) = P(A) Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon pi=P ( ω| X ( ω ) =xi ) =P( X =x i) ; pi ≥ 0; ∑pi = 1 Omavahelised seosed: Ω X P [0; R 1] D 8. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c E(c) = cP(X=c) = c d. Keskväärtus on adiktiivne. Olgu juhuslikud suurused X ja Y, siis
5 100 2,005 3 0,9772 0,0775 1,9375 0,5827 kokku 25 24,43 2,1543 χ 2=2,1543 χ 2 vabadusastmete arv k = m – 1 – r = 5 – 1 – 2 = 2. (r = 2, sest normaaljaotusel on kaks parameetrit) 2 χ kr ( 0,10 ; 2 )=4,605 Et hüpotees vastu võetaks peab χ²kr > χ², antud juhul 4,605 >2,1543, seega hüpoteesi võib vastu võtta ning järeldada, et tegemist on normaaljaotusega. 4.2 Põhikogumi jaotuseks on ühtlane jaotus fikseeritud parameetritega a = 0, b = 100. 2 k ( ni−n'i ) χ =∑ 2 i=1 n'i n'i=n∙ [( ) ( x m −a b−a x −a − m−1
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 1 2 17 81 97 75 22 21 94 62 81 73 74 52 79 45 14 70 2 71 48 79 77 39 19 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: = 51,8 Dispersioon: s x² = 968,58 Standardhälve: s x = 31,12 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 62 Haare:
Samuti on eesmärgiks leida tegurid, mis nende kulutuste mahtu võisid muuta ja hinnata nende mõju. Lähtuvalt projekti eesmärgiks on püstitatud järgmised uurimisküsimused: 1. Kas inimeste kulutused riietele ja jalanõudele sõltuvad riigi SKP-st inimese kohta? 2. Kas inimeste kulutused riietele ja jalanõudele sõltuvad kaalutud hindade tasemest? 3. Kas inimeste kulutused riietele ja jalanõudele sõltuvad töötuse määrast riigis? Projekti esimene hüpotees väidab, et mida suurem on SKP inimese kohta, seda suuremad on inimeste kulutused riietele ja jalanõudele. Teiseks hüpoteesiks on kaalutud hindade positiivne mõju riiete ja jalanõude tarbimisele, see tähendab, et mida madalamad on kaalutud hinnad, seda rohkem tarbitakse. Kolmandaks arvasid autorid, et töötuse määr vähendab kulutusi riietele ja jalanõudele. Seda sellepärast, et kui pole töökohta, siis on palju väiksem võimalus endale riideid ja jalanõusid osta.
Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: Me = 41 Haare: 2 Keskväärtuse usaldusvahemik: (35,08 ; 54,60) Dispersiooni usaldusvahemik: (536,45 ; 1410,64) 3. 3.1 t-statistik: t=0,90 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 44,84 27,97 - statistik: Järeldus: peab paika 4
7 1. Keskväärtuse, dispersiooni, standarthälbe, mediaani, moodi ja haarde hinnangud Keskväärtus xk=(xini)/n=2849/60=47,48 Dispersioon Dx=[ni(xi-xk)2]/n=1005,5 Standarthälbe S=Dx=1005,5=31,71 Scor=(n/(n-1))*S=(60/(60-1))*31,71=31,97 Me=(43+44)/2=43,5 Mo=25, Mo=96 esinesid 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : 47,48-1,96(31,97/60) < < 47,48+1,96(31,97/60) 39,39 < < 55,57 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 31,97(1-0,21) < < 31,97(1+0,21) 25,26 < < 38,68 Dispersiooni usaldusvahemik (31,97(1-0,21))² < D < (31,97(1+0,21))² 638 < D < 1496,1 3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3.1 H0: µ=50 alternatiiviga H1: µ50 T-kriteerium
Hindab faktorite mõju grupi keskmistele grupivaheliste ja grupisiseste hälvete kaudu. x x & Safrn ] q x pj x p q p 2 2 Sj,o ] ij i 1 i 1 i 1 Fyf,k = s2afrn / s2jcn > s2jcn ] Sjcn / p (q-1), s2afrn ] Safrn / (p-1) 52. Regressioonanalüüs y = +x+; y a^1 b^1 x 53. Lineaarne korrelatsioon. Mittelineaarne korrelatsioon. Tasemeline korrelatsioon rxy xi x y i y n x y yx = Ax2 + Bx + C. Kaks taset andmeid. Spearman taseme korrelatsiooni koefitsient 6 d i2 B 1 n3 3 54. Paari regressiooni arvutamine vähimruutude meetodil. Meetodi hälbed x'i = xj - x; y'i = yj - y, b = x'i y'i / (x'i)2; x'i y'i = xi yi - n x y; (x'i)2 = (xi)2 - n x2. Dispersioon s2b= s2 / (x'i)2; s2a=
Hüpoteeside testimine ehk keskmiste võrdlemine: Vaja vastata küsimustele: (1) kas rühmad (või valimid ja nende jaotused) on nii sarnased, et võime öelda, et nad kuuluvad samasse üldkogumisse või (2) on nad nii erinevad, et esindavad kahte erinevat üldkogumit? (Nt. Kas naissoost üliõpilased saavad sõnavaratestis paremaid tulemusi kui meessoost üliõpilased?) Hüpoteesi kontrollimine: püstitada nullhüpotees (nt erinevust ei ole) ning alternatiivne e. sisuline hüpotees (erinevus on) defineerida testimise protseduur, sealhulgas olulisuse nivoo (psühholoogias 95%) otsustada, millist keskmiste erinevuste testi kasutada arvutada teststatistikud ja nendega seotud olulisuse tõenäosused arvutada efekti suuruse näitajad teha järeldus, kas andmed on kooskõlas nullhüpoteesiga või mitte Nullhüpotees ja alternatiivne hüpotees: Alustatakse eeldusest, et valimid ei erine; H0: μ1= μ 2 (nullhüpotees)
.................................................... 71 11.1 Korrelatsioonanalüüs ............................................................................................................ 71 11.2 Lineaarse korrelatsioonikordaja puudused ........................................................................... 72 11.3 Determinatsioonikordaja ...................................................................................................... 74 11.4 Mitmene korrelatsioon ......................................................................................................... 74 11.5 Regressioonanalüüs............................................................................................................... 75 12 Aegridade analüüs .............................................................................................................. 81 12.1 Aegrea mõiste ..............................................................................
= P(707,6 ¿ σ <¿ 1866,4) =0,9 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). 3.1 H0: μ = 50 alternatiiviga H1: μ 50 x´ −μ 45,8−50 t= √N t= √ 25=−0,6 t kr=1,71 1 s 32,8 Et hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,6. Hüpotees on vastu võetud. 3.2 H0: σ2 = 800 alternatiiviga H2: σ2 800 s 2 ( N −1 ) 1073,2 ∙ (25−1 ) χ 2= = = 32,2 σ2 800 χ 20,05=36,42 χ 20,95=13,84
· Keskmine lineaarhälve (d katusega) ehk keskmine absoluuthälve. Hälve ehk erinevus. Kokkuvõtlikult on lineaarhälve erinevuste keskmine. Keskmise lineaarhälbe eeliseks on tema lihtne interpreteeritavus. Probleemiks on absoluutväärtuse kasutamine arvutustes, mis muudab keskmise lineaarhälbe matemaatiliste operatsioonide jaoks ebamugavaks. · Dispersioon 2 ehk hajuvus ehk hälvete ruutude keskmine (keskmine ruuthälve). Dispersiooniks nimetatakse variantide väärtuste ja aritmeetilise keskmise erinevuste ruutude (ruuthälvete) aritmeetilist keskmist. · Standardhälve ehk hälvete keskmine on leitud ruutkeskmise abil. Standardhälve ehk ruutkeskmine hälve on ruutjuur dispersioonist. Standardhälve on seotud tõenäosusteooria rakendustega, lineaarhälve ei ole. Standardhälve ON ALATI varieeruvas kogumis keskmisest lineaarhälbest suurem
3) Normaal- olulisim, ka Gaussi jaotus, seotud keskse piirteoreemiga: suvalise ühtmoodi jaotunud sõltumatute juh.su. summa v keskv jaotus läheneb liidetavate arvu kasvades norm.jaotusele. aspektid: 1)pole vaja suurt liidet. Arvu 2) lubatav mõningane vastastikune sõltuvus 3)normjaotusega liidetavate summa on normajaotus ERIJUHT: keskv=0, standrdh= 1, normeeritud normjaotus. ,,k-sigma reegel" näitab, kui suur on juh.su. P normajaotuse korral sattuda piirkonda keskväärtus + - k standardhälvet. 4)Lognormaalne: kui juh.su. logaritm on jaotunud normaaljaotuse kohaselt. Kui Y on norm.jaotuse järgi, siis X=exp Y on lognormaalse järgi. Juh. Vektor vektor, mille komponentideks juh.su. Olulised aspektid:komponentide arv ja vastastikune sõltuvus ning jaotusseadus Diskr 2-komp vektor jaotus antakse 2mõõtmelise jaotustabelina v valemina Pidev x ja y funktsioon, saab esitada jaotusfunkts v tihedus Marginaaljaotus 1 komp jaotus nö eraldi vaadatuna