· Heteroskedastiivsus Näited Mõju Testimine Kohandatud standardvead Mitmene lineaarne regressioonmudel Näide: loomaliha nõudlusfunktsioon I loomaliha.gdt Kasutame andmeid USA-st aastatel 1925-1941 (n=17)
regressioonmudel Parameetrite tõlgendamine Standardvead, usalduspiirid Parameetrite statistilise olulisuse kontrollimine Determinatsioonikordaja Mudeli korrektne esitamine
tarbimine aastas 1,68 kWh võrra suurem. Kui sissetulek on 100 GBP võrra suurem, on tarbimine aastas 168 kWh võrra suurem. Parameetri b tõlgendus: kui sissetulek on 0, on tarbimine 274 kWh. NB! Ei pruugi olla õige, sest 0 lähedal andmed puuduvad. a sirge tõus - näitab, kui palju muutub y, kui x muutub ühiku võrra. b konstant ehk vabaliige - näitab, millega võrdub y, kui x=0. 25. Parameetrite hinnangute usalduspiirid, millest sõltub usaldusvahemiku laius Parameetrite hinnangute standardvead näitavad, kui täpsed on parameetrite hinnangud. Täpsemate hinnangute saamiseks peavad x väärtused võimalikult palju hajuma. Usalduspiiride leidmisel lähtutakse sellest, et parameetrite hinnangute standardiseeritud erinevused tegelikest väärtustest alluvad t jaotusele vabadusastmete arvuga. 26. Hüpoteeside testimine parameetrite jaoks ja parameetrite statistilise olulisuse kontrollimine (t-test).
Jääkhajuvus RSS F-statistik on seletatud hajuvust iseloomustav keskruut jagatud jääkhajuvust iseloomustava keskruuduga. 25) Determinatsioonikordaja, selle arvutus ja tõlgendamine Kui suur osa koguhajumisest on mudeli poolt ära seletatud. R = ESS/TSS = 1 - RSS/TSS. R = r. Puudus: lisades mudelisse uusi tunnuseid alati suureneb 26) Mudeli korrektne esitamine Regressioonanalüüsi põhitulemuste esitamisel esitatakse: Parameetrite hinnangud, parameetrite standardvead, determinatsioonikordaja R2, valimi maht n 27) Regressioon läbi nullpunkti Ühe tunnuse korral y = ax + u Deterministlik komponent on võrdeline seos y = ax (Vabaliige garanteerib, et regressioonjääkide summa u = 0 ) 28) Seletavate tunnuste astmeid, ruutjuurt ja pöördväärtust sisaldava mittelineaarse mudeli lineariseerimise võtted (loeng 2) Tunnuste logaritmimine, mille tulemusena saame log-log mudeli. Log-log mudeli
21. Lineaarse mudeli parameetrite tõlgendus üldjuhul. y = b + ax a - sirge tõus (näitab, kui palju muutub y, kui x muutub ühiku võrra) b - konstant ehk vabaliige (näitab, millega võrdub y, kui x=0) 22. Parameetrite hinnangute usalduspiirid, millest sõltub usaldusvahemiku laius Usalduspiiride leidmisel lähtutakse sellest, et parameetrite hinnangute standardiseeritud erinevused tegelikest väärtustest alluvad t jaotusele vabadusastmete arvuga v=n-2 Parameetrite hinnangute standardvead näitavad, kui täpsed on parameetrite hinnangud. Täpsemate hinnangute saamiseks peavad x väärtused võimalikult palju hajuma. Usalduspiiride leidmisel lähtutakse sellest, et parameetrite hinnangute standardiseeritud erinevused tegelikest väärtustest alluvad t jaotusele vabadusastmete arvuga. 23. Hüpoteeside testimine parameetrite jaoks ja parameetrite statistilise olulisuse kontrollimine (t-test). Parameetrite statistiline olulisus
Kergejõustikuliidu vanemtreeneri Valter Espe poolt. Uuringus osales 33 naissprinterit ja 38 meessprinterit. Muude parameetrite järgi ei olnud osalejaid grupeeritud. Vaatlusaluste valik ja arv toetasid püstitatud eesmärgi saavutamist. Uurimisprotseduuri läbiviimise kord võimaldab eesmärgi saavutamist kontrollida. Uuringu andmete töötlemisel kasutati Microsoft Exceli tarkvara, millega arvutati aritmeetilised keskmised, standardvead ning teostati korrelatsioonianalüüs. Valitud meetodid, mida kasutati andmete statistiliseks analüüsiks, olid adekvaatsed. Uuringu teostamiseks ei olnud vajalik eetikakomisjoni luba. Kehaliste katsete tulemused olid avalikult kasutatavad ja esitatud Eesti Kergejõustikuliidu kodulehel. Nende katsete tulemuste kasutamiseks on saadud nõusolek Eesti Kergejõustikuliidu sprindi- ja tõkkejooksu alarühma vanemtreener Valter Espelt.
Genereeritakse vastav aruanne. Parameetri t-statistiku Parameetri t- hinnangute olulisuse hinnangud statistikud standardvead tõenäosus p Sõltuva muutuja standardhälve (STDEV.S) Sõltuva muutuja
klassi ülempiiri ei pane. ·Klassidele sagedustabeli moodustamiseks vali Data Analysis..... Histogram. Input range: vaadeldavad andmed. Bin range: ülempiirid. Diagrammi tegemiseks kirjuta välja klassid. ·Kas kehamass sõltub pudru söömisest? Pivottable puder läheb row labelisse, kehamass values. Field settings, kui tahad muuta summa nt tudengite arvuks. ·Keskmised, standardhälbed ja standardvead ümardada ühe kohani peale koma ·Data analysis - Descriptive statistics annab kõik keskmised, min, max .. jne ·Alumine ja ülemine usalduspiir - = keskmine -+ usalduspiir ·T-test näited: kas autot omavate ja mitteomavate tudengite keskmised kehamassid on erinevad? Kas hinge kinni pidamise võime on meestel ja naistel erinev? Kas spordiga tegelevate ja mitte tegelevate tudengite keskmised kehamassid on erinevad? ·T- test läbi viimine: lisa vt PRAKS 4
nominaalsel tunnusel vaid 2 erinevat väärtust, näiteks abielus v vallaline. 9. Entroopia määramatus (Prognoosi entroopia E on see osa infost tuleviku kohta, mida olemasoleva lähteinfo põhjal ei olnud võimalik leida). 10. Heteroskedastiivsusega on tavaliselt tegemist siis: a) parameetrite hinnangud on lineaarsed nihketa hinnangud, kuid nad ei ole parimad, st nad ei ole vähima dispersiooniga b) standardvead ei ole korrektsed ja seega ei ole korrektsed ka parameetrite hinnangute usaldusvahemikud. Fkriteeriumi hinnang ei pruugi olla õige; c) mudel võib viia uurija valedele järeldustele, kui tegemist on statistiliste hüpoteeside kontrollimisega. Kasutatakse graafilist analüüsi. Juhuslik liige ehk jääkliige ui on juhuslik suurus, mille keskväärtus ehk matemaatiline ootus on võrdne nulliga. E (ui) = 0