Labor 1 - ül 2 Leida regressioonimudel Y = a0 + a1 X, kui perede arv on X ja autode arv Y. Regressioonikordajate (parameetri hinnangute) ja usalduspiiride leidmiseks kasutada vahendit Andmed - Data Analysis - Regression. Alevik Perede arv (X) A 7000 B 7500 C 8000
tõenäosuslik valikumeetod, empiiriline valik fikseeritud samm, süstemaatiline valik, punkthinnang nihketa, efektiivne, optimaalne keskväärtus, normaaljaotus, suur valim keskväärtuse standardviga standardhälve standardviga, keskväärtuse usalduspiirid valimvaatlus usaldatavus suur valim, usaldatavus suurem üldkogumi keskväärtuse usaldusvahemiku laius, vabadusastmete arv studenti jaotus mediaani usalduspiiride leidmisel kasutatakse binoomjaotust, loend on ülekaetud ankeetküsitluse läbiviimisel, mõõtmisvahendi viga Test nr 8 sisukas hüpotees, järeldus peale parameetri empiirilise väärtuse võrdlust kriitilisega z-testi parameetri kriitiline väärtus t-testi parameetri empiiriline väärtus sisukas hüpotees, sõltuv valim, sõltumatu valim empriiline väärtus, kriitiline, nullhüpotees, sisukas hüpotees t-testi parameetri empiiriline väärtus
Output options - määratakse tulemuste väljastamise asukoht: samale töölehele (Output Range), uuele töölehele (New Worksheet Ply) või uude faili (New Workbook); Summary statistics - määratakse, kas karakteristikute väärtused üldse väljastatakse; Confidence Level for Mean - määratakse usaldusnivoo protsentides keskväärtuse usalduspiiride arvutamiseks; Kth Largest - määratakse järjekorranumber K, et teada saada suuruse poolest K-ndat väärtust; Kth Smallest - määratakse järjekorranumber K, et teada saada väiksemalt poolt K- ndat väärtust. http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/arvkar.html (2 of 5)29.05.2006 15:08:55 Andmeanalüüs MS Exceli abil - sagedustabelid
5%. Eksimisriski tähtsus: Normaaljaotusega tunnuse puhulon teada, milliste punktide vahel 95% tunnuse väärtustest (umb keskmine +/- 2standardhälvet) Kui eeldame, et eksimus on samuti normaaljaotusega, siis on nomaaljaotuse kohta käivaid tingimusi teades võimalik välja arvutada vahemik, kus keskm väärtus üldkogumil tegelikult võiks olla Normaaljaotusega tunnuse keskmise usalduspiiride leidmiseks kasutatakse järgnevat valemit u: usalduspiir m: keskmine s: standardhälve n: vastajate arv : 1 usaldusnivoo z :vastav standardiseeritud /2 :normaaljaotuse kvantiil SPSS: Usalsusvahemiku laius sõltub: 1. usaldusnivoost, mille me valime (e. Teistpidi sellest, lui palju lubame endale järelduste tegemisel eksimist) 2. tunnuse hajuvusest 3. valimi mahust Usaldusvahemik on seda laiem, mida:
.. lõpmatus (kui on alternatiivne tunnus, siis saab olla kuni 0,5 see on triki küsimus, kui panid õige, siis on õige Aegridade tasandamisel valitakse trendijoon võimalikult suure determinatsioonikordaja põhjal (õige) valitakse trendijooneks võimalikult lihtne geomeetriline joon trendijoone valikul peaks kasutama võimalikult lihtsat geomeetrilist joont (õige) Valimvaatluse korral valitud usaltatavus avaldab mõju moodustavva valimi suurusele Usalduspiiride laius sõltub väärtuste varieerumisest Väljavõtukogumi suurus ei tohi sõltuda üldkogumi keskmisest väärtusest Vahemikhinnangu andmisel usalduspiiris on suurema valitud usaltatavuse puhul laiemad Hüpoteeside kontrollimisel: On võimalik I tüüpi vea tekkimine kui lükatakse tagasi nullhüpotees Kui kasutada otsuste langetamisel väiksemat valimit, siis vea tekkimise võimalus suureneb Valimi suurus mõjutab hüpoteesi kontrollimisel tehtavad otsust
Valimi mahu kasvades tõenäosus, et hinnangu ja parameetri tegeliku väärtuse erinevus oleks väiksem kui mistahes positiivne arv, läheneb ühele. Iseloomustab koondumist suurte valimite korral. 10) Hinnangu asümptootiline jaotus – Asümptootiline jaotus näitab, millisele klassikalisele jaotusele läheneb hinnangu valimjaotus valimi mahu kasvamisel. Asümptootiliselt normaaljaotusega, kui hinnangu valimjaotus läheneb valimi mahu kasvamisel normaaljaotusele. Kasutatakse usalduspiiride leidmisel, testimisel. Sellest leitakse kriitilised väärtused, olulisuse tõenäosus. 11) Hinnangu asümptootiline efektiivsus – Mõjus hinnang on asümptootiliselt efektiivne, kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. 12) Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiiriline ja kriitiline väärtus:
X~t(5) X~t(10) 0,2 0,1 t 0 -4 -3 -2 -1 0 1 2 3 4 Kui vabadusastmete arv k on vähemalt 30, võib usalduspiiride määramisel Studenti jaotuse asemel kasutada normeeritud normaaljaotust. Studenti jaotus on oluline väikesearvuliste valimite korral. Väikeste valimitega tegelevat statistikaharu nimetatakse mikrostatistikaks. Normaaljaotuse keskväärtuse usalduspiirkond. Usalduspiirkonna leidmine: P (| X - m |< ) = n n P (| X - m | < )= s s
r=0,42 r=-0,78 r=1 r=-1 Järeldav: Hüpoteesi paikapidavuse kontrollimiseks tehtav tulemustenstatistilise olulisuse kontroll. Tulemuste olulisuse statistiline testimine: tehakse kindalks selle tõenäosus, et tulemus saadi puhtjuhuslikult, st mitte sõltumatute muutujate näol. See peaks olema võimalikult väike. Testitakse paljude spetsiaalselt välja arendatud statistilise analüüsi meetoditega: Keskimste erinevuste võrlemine t-testid usalduspiiride leidmine korrelatsiooni olulisus regressioonianalüüs tihe-või mitmefaktoriline dispersiooni analüüs testimaks sõltumatute muutujate põhiefekte ja muutujatevahelisi interaktsiooniefekte OLULINE Uurimsiandmete töötlemine nende usaldusväärsuse ja tähenduse hindamiseks Tulemused võivad tingimuseti erineda ja puhtjuhuslikult ning juhuslikult saadud tulemust ei tohi teadusteabeks üldistada. Statistikameetodid aitavad kindlaks teha, milline on tõenäosus,
Regressioonianalüüs võimaldab mõõta nähtuste vahelise seose olemasolu, suunda ja tugevust, kuju ning välja tuua regressivõrrandi eristamaks sõltuvat ja sõltumatuid ehk seletavaid muutujaid. Reg.analüüs uurib sõltuva muutuja Y sõltuvust ühest või mitmest sõltumatus (seletavast) muutujast (X). 37. Reg.mudeli statistiline analüüs mudeli parameetrite statistiline olulisus, usalduspiirid (t statistik, tjaotus). Usalduspiiride ja parameetrite kohta käivate hüpoteeside testimiseks on vaja teada parameetrite standardvigasid ja hinnangut regressiooni standardveale. Reeglina testitakse, kas parameetri hinnang erineb etteantud olulisuse nivoo korral nullist (st parameeter on statistiliselt oluline). Hüpoteeside testimisel leitakse tstatistiku väärtus ja vaadeldakse, kas ta kuulub t ja t vahele. Kui I t I >t tab vabadusastmetel nk (n on valimi
väärtused fikseeritud). Alati ei saa aga vaadata muutujat X mittestohhastilisena ning sel juhul on vajalik mittekorreleeruvuse eeldus. See eeldus võib olla täitmata spetsiaalsete mudelite (näiteks autoregressiivsed mudelid) korral või juhul, kus X ja Y mõjutavad teineteist samaaegselt. Juhuslikud vead on normaaljaotusega. Praktikas oleme me huvitatud mitte ainult punkthinnangute leidmisest ning nende teoreetilistest omadustest, vaid ka usalduspiiride leidmisest ning hüpoteeside testimisest hinnangute kohta. Selleks tuleb meil teha aga eeldus juhuslike vigade jaotuse kohta. 4. Autokorrelatsiooni tekkimise põhjused ja kuidas sellest lahti saada; Kui juhuslikud vead korreleeruvad omavahel, siis öeldakse, et mudelis esineb autokorrelatsioon. Autokorrelatsiooni põhjused: regressioonivõrrandis on jäänud arvestamata mingi oluline resultaatnähtust mõjutav faktor,
hinnang tegelikule väärtusele. Järelikult on valimi keskmine kogumi keskväärtuse jaoks mõjus hinnang. 10. Hinnangu asümptootiline jaotus. ● Asümptootiline jaotus näitab, millisele klassikalisele jaotusele läheneb hinnangu valimjaotus valimi mahu kasvamisel. ● Hinnang on asümptootiliselt normaaljaotusega, kui hinnangu valimjaotus läheneb valimi mahu kasvamisel normaaljaotusele ● Asümptootilist jaotust kasutatakse parameetrite usalduspiiride leidmisel, testimisel. Sellest leitakse kriitilised väärtused, olulisuse tõenäosus 11. Hinnangu asümptootiline efektiivsus. Mõjusat hinnangut nimetatakse asümptootiliselt efektiivseks (asymptotically efficient), kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. Näiteks mõningad suurima tõepära meetodil leitud hinnangud. 12
4 Ei ükski eelnevatest variantidest Eksponentkeskmist kasutatakse, kui on tegemist: 6 Keskmise taseme leidmisega väga pikkades aegridades 7 Keskmise taseme leidmisega momentreas ja ajavahemikud on võrdsed 8 Keskmise taseme leidmisega perioodreas ja perioodid ei ole võrdsed 9 Aegreaga ja väärtuste standardhälbe arvutamise juures 10 Aegreaga ja selle tasandamise juures Valimivaatluse korral 6 Usalduspiiride laius sõltub väärtuste varieerumisest 7 Suurema valimi kasutamisel usalduspiirid laienevad 8 Valitud usaldatavus ei avalda mõju moodustatava valimi suurusele 9 Keskmine esindusviga ei sõltu valimi suurusest 10 Suurem valimi kasutamine vähendab väärtuste varieerumist üldkogumis Esindusviga on oma sisult: 5 Viga mis tekib aritmeetilise keskmise ebatäpsuse tulemusena 6 Kõikide võimalike esindusvigade harmooniline keskmine
hinnangu valimjaotus läheneb valimi mahu kasvamisel dispersioonist. normaaljaotusele. Näiteks valimite keskmiste jaotus läheneb valimite mahu n kasvamisel normaaljaotusele keskväärtusega ja dispersiooniga Näiteks mõningad suurima tõepära meetodil leitud 2/n, kus ja 2 on vastavalt kogumi keskväärtus ja dispersioon. hinnangud. · Asümptootilist jaotust kasutatakse parameetrite usalduspiiride leidmisel, testimisel. Sellest leitakse kriitilised väärtused, olulisuse tõenäosus. Demo: valimite keskmiste valimjaotus Hinnangute omadused, kokkuvõte · Nihe (bias). Iseloomustab süstemaatilist viga. · Efektiivsus (efficiency). Iseloomustab hinnangute hajuvust. Hüpoteeside statistiline kontrollimine · Mõjusus (consistency). Iseloomustab
hajuma. Parameetrite hinnangute usalduspiirid Parameetrite usalduspiirid ja sirge asend Usalduspiiride leidmisel lähtutakse sellest, et parameetrite hinnangute standardiseeritud erinevused tegelikest väärtustest alluvad t jaotusele Mõlema parameetri vabadusastmete arvuga = n - 2 Lineaarliikme määramatus Vabaliikme määramatus määramatus
usaldusvahemiku laiuse 95% usaldatavuse jaoks. Vahemiku laius on 8,2. Vastus: 95% ostjatest kulutavad leiva- ja saiatoodete ostmise peale kuus ühe inimese kohta 71,1 ± 8,2 krooni ehk 95%-l on vastavad kulutused vahemikus 62,9 ÷ 79,3 krooni. 15 Väikeste valimite korral valimi keskväärtuste jaotus erineb normaaljaotusest ja tsentraalne piirteoreem ei kehti. Sellisel juhul kasutatakse kogumi keskväärtuse usalduspiiride määramisel t-jaotust ehk Studenti jaotust. Jaotuse võttis kasutusele inglise matemaatik William Seally Gosset (1876-1937) oma töös, mille ta avaldas Studenti varjunime all. MS Excelis leiab Studenti koefitsiendi funktsioon TINV, kus argument probability on vea tõenäosus ja deg_freedom vabadusastmete arv. NÄIDE 2.2 Kauba X nädalane läbimüük viies kesklinna poes oli 16, 82, 29, 31 ja 55 tk. Leida keskmine nädala läbimüük mingis kesklinna poes.
05 korral, kuna F-testi olulisuse tõenäosus p 0.001 on väiksem kui 0.05. Mudeli sõltumatud muutujad kirjeldavad ära 82% tarbimise varieeruvusest. b) Kuna muutujate X ja D t-statistikute absoluutväärtused on suuremad kui kriitiline väärtus ( 22.54 1.99; 2.34 1.99) , siis statistiliselt olulised muutujad mudelis on muutuja X ja muutuja D. Muutujate X ja D koostoimemuutuja DX on statistiliselt ebaoluline c) Usalduspiiride leidmiseks on esmalt vaja leida parameetri hinnangu standardviga ˆ vastavalt valemile se ˆ . Antud juhul se 0.93 / 22.54 0.041 . Parameetri t hinnangu usalduspiirid avalduvad valemiga ˆ se ˆ t / 2, nk . Seega muutuja X ees
p*q* 41 kuni 67%. (0.54-0.128)*100%41 Näite järg: Uurime mitu inimest tuleks küsitleda, et samadel andmetel ja usaldusnivooga jääks toetajate osatähtsus üle 50 %. Erinevalt eelmisest lahendusest on nüüd teada n = 0.04 ja pole teada n. Saame = 2.575 ja n > 1030. p*q* Üldine valem üldvalimi keskväärtuse usalduspiiride leidmiseks: lb = ( x - , x + ) s = 2-1( ) n 15
erinevus. Kui kattuvad, siis ei saa väita, et esineb erinevus. Usaldusvahemiku määramise täpsus: Suhteline viga E= Väikesed valimid t-jaotus - Väikeste valimite korral valimite keskväärtuste jaotus erineb normaaljaotusest. t-jaotuse kuju sõltub vabadusastmete arvust ν. Vabadusastmete arv on sõltumatute muutujate arv. Valimi standardhälbe leidmisel vabadusastmete arv v=n-1. Väikese valimi korral üldkogumi keskväärtuse usalduspiiride poollaius ∆x = tα /2(v)*(s/√n) Valimi mahu planeerimine - ∆X<=d ⇒ n>=(tα/2(v)*s0/d)^2 kus s0 proovivalimi standardhälve, kui soovime et usaldusvahemiku poolvahemik oleks väiksem kui d. Kaheväärtuselise tunnuse usalduspiirid – Suure valimi tingimus – valemit võib kasutada juhul, kui kumbagi väärtust omavate elementide arv on valimis ≥ 5, st kehtib tingimus Kui
KORDAMINE ÖKONOMEETRIA KONTROLLTÖÖKS 2013 sügissemester kasutatud 2017. aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on ...
* õige/vale vastustega testides saab arvutada ka KR20, kasutades Kuder- Richardsoni valemit 13. Mõõtmise standardviga (kuidas me saame selle abil õigesti määratleda tegelikku tulemust). Mõõtmise standardviga SEM (standard error of measurment) = SD_x x sqrt(1 - r_{xx'}) * Suurust SEM interpreteeritakse kui üksikmõõtmiste jaotuse standardhälvet, st 68% võimalikest kordustulemustest jääks vahemikku x +/- SEM. * Kuna tüüpiline on 95% usalduspiiride kasutamine, siis tuleks leida vahemik x +/- 1,96 x SEM 14. Mis on põhjused, kui kordustesti reliaablus on madal? .. kui parallelletesti reliaablus on madal? .. kui sisereliaablus on madal? Madala kordustesti reliaabluse võimalikud põhjused: * isikute konsistentne kogemus on ajas muutunud * vastajate reaktiivsusest tulenevad ülekande nähtused Madala paralleeltesti reliaabluseks võib olla see, et paralleeltestid ikkagi ei mõõda ühte ja sama asja.
B 14. Usaldatavuse suurendamisel usalduspiirid lähevad laiemaks. 15. Kas on õige väide: Suurema valimi korral on usaldatavus suurem. Väär 16. Üldkogumi keskväärtuse usaldusvahemiku laius sõltub valimi standardhälbest, valimi mahust, usaldatavusest. 17. Vabadusastmete arv on sõltumatute muutujate arv. 18. Studenti jaotus kirjeldab valimite keskväärtuste jaotust väikeste valimite korral. 19. Mediaani usalduspiiride leidmisel kasutatakse binoomjaotust. 20. Loend on ülekaetud, kui loend sisaldab üldkogumisse mittekuuluvaid objekte. 21. Ankeetküsitluse läbiviimisel mõõtmisvahendi viga võib tulla küsimuse valesti sõnastamisest. Test 8 1. Müügil olevas joogipudeli sildil on kirjas, et maht on 0,33 l. Tarbijakaitseamet soovib kontrollida, ega pudelites jooki vähem pole. Selleks valiti juhuslikult välja 30 pudelit ja määrati nendes sisalduva joogi maht
Ehk kui kordaksime testi, siis selle teatud tõenäosusega jääks ka uue valimi keskmine nendesse piiridesse. Kui näiteks kahe võrreldava grupi usalduspiirid ei kattu, saame öelda, et tõenäoliselt laieneb valimi erinevus ka populatsioonile. Vastavalt usaldusnivoo väärtusele arvutatakse parameetri usalduspiirid so. kaks arvu, mille vahel parameeter asub etteantud tõenäosusega. Valem 95% usalduspiiride arvutamiseks: Alumine usalduspiir= X̅-1.96SD*SEM Ülemine usalduspiir= X̅+1.96SD*SEM Usaldusnivoo (confidence level) on psühholoogias 95%, ehk et 95 % tõenäosusega on tulemus usaldusäärne. Olulisusnivoo (level of significance) ehk vea tõenäosus on sellisel juhul p=0,05 ehk tõenäosus eksida valimi tulemuste populatsioonile laiendamises on 5% o Esimest liiki viga – arvatakse, et tulemused kehtivad populatsioonile, kuigi ei
Regressioonimudeli olulisuse hindamine eksimise tõenäosuse p abil (significance F). Kui p < a, siis mudel on statistiliselt oluline. Olulisuse nivoo (maksimaalne eksimise tõenäosus) a = 5% (0,05) või 1% (0,01). F-kriteeriumi abil kontrollitakse regressioonimudeli kui terviku statistilist olulisust. Fkriitilise leidmiseks kasutada funktsiooni FINV. Kui F emp > F krit, siis on regressioonimudle kui tervik stat usaldusväärne c. mudeli parameetrite statistilise olulisuse kontrollimine; usalduspiiride leidmine; t-statistiku abil hinnatakse parameetri (regressioonikordaja usaldusväärsust). t- kriitilise leidmiseks kasutada funktsiooni TINV. Usaldusvahemiku alumine ja ülemine piir (Lower 95% ja Upper 95%) määravad vahemiku, millesse jääb 95% tõenäosusega regressioonikordaja. d. eespool toodud näitajate leidmine ja seoste analüüs Exceli regressioonanalüüsi tabeli põhjal. Vaata moodles regressiooni selgitused. 9. Mitmene regressioon
üle ühe), näitab x ühikulist mõju y-le) 3. Lineaarse korrelatsioonikordaja ja regressioonifunktsiooni vabaliikme märgid alati kokku 4. Regresioonikordaja peab olema eranditult positiivne 5. Regressioonikordaja iseloomustab sõltuva muutuja kordset muutumist sõltumatu muutuja ühe ühikulise muutumise korral 6. Lineaarne seos ei saagi olla samasuunaline (saab olla sama- ja vastasuunaline) Valimvaatluse korral 1. Usalduspiiride laius sõltub väärtuste varieerumisest 2. Suurema valimi kasutamisel usalduspiirid laienevad 3. Valitud usaldatavus ei avalda mõju moodustatava valimi suurusele 4. Keskmine esindusviga ei sõltu valimi suurusest 5. Suurema valimi kasutamine vähendab väärtuste varieerumist üldkogumis Kronoloogilist keskmist kasutatakse kui on tegemist: 1. periodreaga ja perioodid on võrdsed 2. perioodreaga ja perioodid ei ole võrdsed 3
hindamine (regressioon- teatud usaldatavus teatud tõenäosuse juures) x erineva kujuga ja mõõtühikutega regressioonimudelite arvutamine x mudelite headuse hindamine determinatsioonikoefitsientide abil x mudelite usaldatavuse kontroll F- kriteeriumi abil x mudelite adekvaatsuse hindamine (jääkstandardhälve ja keskmine aproksimeerimisviga) x regressioonikoefitsientide statistilise olulisuse kontroll t-kriteeriumi abil ja usalduspiiride leidmine x autokorrelatsiooni kontroll (Durbin - Watsoni jt kriteeriumitega) ja vähendamise võimalused (autokorrelatsioon- järgnevad andmed sõltuvad eelneva perioodi omadest; firma toodang antud kuul sõltub toodangust eelmisel kuul) x heteroskedastiivsuse hindamine (regressioonimudeli üheks eelduseks on juhusliku liikme dispersioonide konstantsus s.t. dispersioonid (e. hälbed keskväärtuse ümber) on samad iga i korral. Näiteks, kui
Eksponentkeskmist kasutatakse, kui on tegemist: 1. Keskmise taseme leidmisega väga pikkades aegridades 2. Keskmise taseme leidmisega momentreas ja ajavahemikud on võrdsed 3. Keskmise taseme leidmisega perioodreas ja perioodid ei ole võrdsed 4. Aegreaga ja väärtuste standardhälbe arvutamise juures 5. Aegreaga ja selle tasandamise juures Valimivaatluse korral 1. Usalduspiiride laius sõltub väärtuste varieerumisest 2. Suurema valimi kasutamisel usalduspiirid laienevad 3. Valitud usaldatavus ei avalda mõju moodustatava valimi suurusele 4. Keskmine esindusviga ei sõltu valimi suurusest 5. Suurem valimi kasutamine vähendab väärtuste varieerumist üldkogumis Esindusviga on oma sisult: 1. Viga mis tekib aritmeetilise keskmise ebatäpsuse tulemusena 2. Kõikide võimalike esindusvigade harmooniline keskmine 3