OSA A 1. Hindame valimi parameetreid Hindamiseks kasutame järgmised valemid: Keskväärtus: 44,12 Dispersioon: 673,44 Standardhälve: 25,95 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestuse: Mediaan: 51 Haare: 92-4= 88 2. Leiame keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0,10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0,95(24) = 1,7109 = 8,88 (poollaius) P(35,24 < < 53) = 0,9 Dispersiooni jaoks kasutame 2-statistikut f = N 1 = 24 20.95(24) = 36,415 20.05(24) = 13,848 P (443,9 < 2 < 1167,15) = 0,9 3. Kontrollime hüpoteese keksväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0,10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: t = 1,1329 f = N 1 = 24 Kriitiline t-statistiku väärtus t0,95(24) = 1,711
Kasutan järgmisi valemeid: Keskväärtus: 44,28 Dispersioon: 772,46 Standardhälve: 27,79 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestust: 1; 2; 5; 14; 18; 19; 25; 27; 31; 33; 37; 39; 39; 45; 46; 50; 56; 63; 65; 71; 74; 77; 83; 89; 98 Mediaan: 39 Haare: 98 1 = 97 2. Leian keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0.10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0.95(24) = 1.711 = 9.51 Keskväärtuse usaldusvahemik arvutatakse valemiga: P(34,77 < < 53,79) = 90% Dispersiooni usaldusvahemiku leidmiseks kasutatakse 2-statistikut f = N 1 = 24 P (509,10 < 2 < 1338,75) = 90% 3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24
Hüpoteeside kontrollimisel: On võimalik I tüüpi vea tekkimine kui lükatakse tagasi nullhüpotees Kui kasutada otsuste langetamisel väiksemat valimit, siis vea tekkimise võimalus suureneb Valimi suurus mõjutab hüpoteesi kontrollimisel tehtavad otsust Hüpoteesi kontrollimisel viga saab tekkida: kuna anname hinnangu valimi põhjal ja valim on moodustatud juhuväljavõtu teel Statistilite hüpoteeside kontrollimisel: võrreldakse empiirilistel andmetel leitud statistikut kontrollstatistikuga Normaalselt jaotuvad kogumis: ei ükski; Mood, mediaan ja aritmeetiline keskmine on võrdsed asümmeetriakordaja ei erine 0-st Dispersioon on standardhälbe ruut jaotuskõver on sümmeetriline Normaaljaotuse korral: Kolmandat järku standardmomemt on võrdne nulliga Tugeva neg lineaarse seose korral: regressioonikordaja iseloomustab sõltuva muutuja välenemist sõltumatu mutuja ühe ühikulise muutumise korral
lisafunktsioonid nõuavad ootamatult palju kulusid. Tegevuspõhine kuluanalüüs on selle edasiarendus. Toodete lõikes kuluanalüüs jääb varju. Idee on vähendada võimalikke vastuolusid disaini ja tootlikkuse vahel. Võib turundusele vastu töötada, aga võetakse maha oht, et tarbijat petetakse. Väga oluline on hindamise etapp. E(efekt)/Z(kulud)=max, ehk saadav efekt kulude suhtes peaks olema maksimaalne 4. MIDA NÄITAB DURBIN-WATSONI KRITEERIUMI SUUR VÄÄRTUS? Durbin-Watsoni statistikut kasutatakse 1. järku autokorrelatsiooni avastamiseks. Valemist on näha, et autokorrelatsiooni olemasolu korral on kriteeriumi väärtus väike. DW statisiku kasutamise eeldused: 1) regressioonimudel peab sisaldama konstantset liiget 2) mudel ei sisalda sõltuva muutuja viitajaga liikmeid. D- statistiku väärtus alati 0 d 4. Vähem kui 1,5 on positiivne autokorrelatsioon, 1,5-2,5 autokorrelatsioon puudub, suurem kui 2,5 on negatiivne autokorrelatsioon
Võrratus kehtib, seega aegrea võib lugeda käänupunktide kriteeriumi järgi juhuslikuks. Osa B 10. Leida x ja y seose jaoks korrelatsioonitegur ja determinatsioonitegur. Kontrollida x ja y korreleerimatust t-statistika ja z-statistiku abil, võttes olulisuse nivooks . Korrelatsioonitegur (CORREL-funktsioon MS Excelis) Determinatsioonitegur Hüpoteesi kontrolliks kasutatakse korrelatsiooni hinnangu põhjal leitud statistikut Et hüpotees vastu võetaks peab seega hüpotees võetakse vastu ja x ja y on korreleerimatud. Hüpoteesi kontrolliks kasutatakse Fisheri teisendust Et hüpotees vastu võetaks peab seega hüpotees võetakse vastu ja x ja y on korreleerimatud. 11. Leida ühefaktoriline lineaarne regressioonimudel ja analüüsida selle täpsust võttes olulisuse nivooks 11.1 Leida mudeli parameetrite hinnangud b0 ja b1 1 4,8 10,2 3,460
28. Mida näitab Durbin-Watsoni kriteeriumi suur väärtus? Durbin-Watsoni kriteerium arvutatakse valemiga n ¦ H H i 1 2 i i 2 DW n ¦H i 1 i 2 Valemist on näha, et autokorrelatsiooni olemasolu korral on kriteeriumi väärtus väike. Durbin-Watsoni statistikut kasutatakse 1. järku autokorrelatsiooni avastamiseks (ut = U ut-1 + vt, kus juhuslik viga vt rahuldab klassikalisi eeldusi). Durbin-Watsoni statisiku kasutamise eeldused: x regressioonimudel peab sisaldama konstantset liiget x mudel ei sisalda sõltuva muutuja viitajaga liikmeid (nt. Yt-1, Yt-2 ) n ¦ (u t u t1 ) 2 t 2 d n ¦ ut2 t 1
Tasemete arvuks (Number of Levels) pange kolm, üks tase iga katsetingimuse kohta. Tasemete sisu saate määrata järgmisest menüüst. 7. PRAKTIKUM = KT 8. PRAKTIKUM Korrelatsiooni kasutatakse selleks, et uurida muutujate vahelisi seoseid ning nende seoste tugevust. Parameetriline seosekordaja on Pearsoni r, mitteparameetrilisteks seosekordajateks on Spearmani roo ning Kendalli tau. Mitteparameetriliste analüüside korral kasutatakse tihtipeale Spearmani roo statistikut, ent Kendalli tau-d peetakse paremaks näitajaks väiksematel valimitel. Korrelatsioonikordaja on sisuliselt ka efekti suuruse ning mudeli seletusvõime näitaja. Võttes korrelatsiooni ruutu, saame R2 statistiku ehk, eesti keeles, determinatsioonikordaja. Kui me seda kordajat sajaga korrutame, saame protsendid selle kohta, kui palju ühe muutuja varieerimine teise muutuja varieeruvusest seletab.
Korrelatsiooni ruutu nim determinatsiooniks d=r2. Kui x ja y vahel on statistiline seos, siis determinatsioon d näitab, missugune osa ühe juhusliku suuruse dispersioonist on tingitud teise juhusliku suuruse mõjust. Kui X ja Y on korreleerimatud, siis hinnangu r väärtus peaks olema nullilähedane. X ja Y korreleerimatuse kontrollimine viib järgmise hüpoteesipaari kontrollile: H 0: p=0, H1: p ei võrdu 0. Nullhüpoteesi kontrolliks kasutatakse korrelatsiooni hinnangu põhjal lleitud statistikut t, mis x ja y normaaljaotuse korral on f=N-2 vabadusastmetega t- jaotusega. Seega, kui valitud olulisuse nivoo alfa juures kriitiline väärtus on suurem kui leitud t, võtakse nullhüpotees vastu. Kasutatakse ka Fisheri teisendust: korreleerimatuse nullhüpoteesi kontrolliks arvutatakse z-statistik, mis on jaotunud normeeritud normaaljaotusega N(0,1). Lineaarne ühefaktoriline regressioonimudel. Mudeli leidmiseks vajalike
Risttabeli elementideks on read, veerud ja lahtrid, mille järgi nimetatakse ka tabelisse märgitavaid protsente. ·Rea protsendid: mitu % selle rea inimestest kuulub ühte või teise veergu. ·Veeru protsendid: mitu % selle veeru inimestest kuulub ühte või teise ritta. ·Üldised protsendid: mitu % selle tabeli inimestest kuulub ühte või teise lahtrisse. 13) Hii-ruut-statistik, selle kasutamine seose uurimiseks risttabelis, Crameri V, milliste tunnuste puhul kasuatatakse hii-ruut statistikut. järjestus- ja nominaaltunnused ·Tunnuste vahel on statistiline seos siis, kui ühe tunnuse käitumine sõltub teise tunnuse väärtustest. Näiteks kui inimese valimiseelistus sõltuks tema soost. ·Uurides seost nominaaltunnuste vahel võetakse appi risttabel. ·Seost risttabelis mõõdetakse hii-ruut-statistiku (²-statistiku) abiga. Hii-ruut-statistiku idee: ·Kõrvutada reaalset (näiteks küsitluse tulemusena tekkinud) risttabelit sellise risttabeliga,
´x ja ´y , arvutasin x ja y ruuthajuvused V ja V ning arvutasin korrelatsiooni x y hinnangu rxy. Determinatsiooniteguriks on d=r2. H0: =0 (x ja y on korreleerimata) kontrollimiseks leidsin korrelatsiooni hinnangu järgi statistiku t. Olulisuse nivool =0,05 peab nullhüpoteesi vastuvõtmiseks tt1-/2(f), f=N-2, seega on nullhüpotees kummutatud ning x ja y võib lugeda korreleerituks. Kasutades z-statistikut, peab nullhüpoteesi vastu võtmiseks z0z1-/2, seega nullhüpotees on kummutatud ning x ja y võib lugeda korreleeritud suurusteks. 11. Regressioonimudeli y=b0+b1x (joonis 5) leidmiseks arvutasin b1 ja selle kaudu b0; y=3,96x+1,94. Usaldusvahemike leidmiseks (=0,05) tuli arvutada mudeli parameetrite hinnangute standardhälbed si. Dispersioon s2(b1) on korduskatsete seeria
Kui x ja y vahel on statistiline seos, siis determinatsioon d näitab, missugune osa ühe juhusliku suuruse dispersioonist on tingitud teise juhusliku suuruse mõjust. Kui X ja Y on korreleerimatud, siis hinnangu r väärtus peaks olema nullilähedane. X ja Y korreleerimatuse kontrollimine viib järgmise hüpoteesipaari kontrollile: H0: p=0, H1: p ei võrdu 0. Nullhüpoteesi kontrolliks kasutatakse korrelatsiooni hinnangu põhjal lleitud statistikut t, mis x ja y normaaljaotuse korral on f=N-2 vabadusastmetega t-jaotusega. Seega, kui valitud olulisuse nivoo juures kriitiline väärtus on suurem kui leitud t, võtakse nullhüpotees vastu. Kasutatakse ka Fisheri teisendust: korreleerimatuse nullhüpoteesi kontrolliks arvutatakse z-statistik, mis on jaotunud normeeritud normaaljaotusega N(0,1). Lineaarne ühefaktoriline regressioonimudel.
statistiliselt oluliselt kõrgemad kui kõrvale vaatava pilguga piltide astakud, Z = ..., p = .02. Korrelatsioon Korrelatsiooni kasutatakse selleks, et uurida muutujate vahelisi seoseid ning nende seoste tugevust. Parameetriline seosekordaja on Pearsoni r, mitteparameetrilisteks seosekordajateks on Spearmani roo ning Kendalli tau. Mitteparameetriliste analüüside korral kasutatakse tihtipeale Spearmani roo statistikut, ent Kendalli tau-d peetakse paremaks näitajaks väiksematel valimitel. Pearsoni korrelatsioonikordaja eeldused: - muutujad peaksid olema mõõdetud intervall või suhteskaalal; - lineaarne seos muutujate vahel (hea viis testimiseks -> Scatterplot -> visuaalselt hinnata seose olemust); - ei tohiks olla märkimisväärseid erindeid (saab samuti hinnata joonise abil); - muutujad peaksid olema vähemalt ligilähedaselt normaaljaotuslikud.
nimetatakse tabelit jaotustabeliks. Kui tunnused on sõltumatud, siis peaksid suhtelised sagedused olema jaotunud üle ridade või veergude ühtlaselt ehk ridade suhtelised sagedused võrduma marginaalsete suhteliste sageduste reaga ja veergude suhtelised sagedused marginaalsete suhteliste sageduste veeruga. Kui nii ei ole ja vastav erinevus (ebaühtlus) on piisavalt oluline, siis on tegemist sõltuvate tunnustega. Olulise hindamiseks kasutatakse hii-ruut statistikut, tähis 2 : m k (n nij - ni. n. j ) 2 2 = i =1 j =1 n ni . n. j Selle statistiku kasutamiseks peab kehtima eeldus, et iga lahtri oodatav absoluutne sagedus on vähemalt 5. Statistik 2 annab väärtuse seose olulisuse hindamiseks, kuid seose tugevuse hindamiseks on levinuim näitaja Crameri V: 2
Küsitlus viidi läbi 60 koolis (ühes 10. klassis) üle Eesti. Kehakaalu küsimustele vastas 1312 õpilast (526 poissi ja 786 tüdrukut), kelle keskmine vanus oli 15,6 aastat. 967 küsitletut (386 p ja 581 t) õppis eesti, 349 (137 p ja 212 t) vene koolis. Andmeanalüüsil kasutati andmetöötlusprogrammi STATISTICA. Tunnuste vaheliste seoste leidmiseks kasutati korrelatsioonanalüüsi, erinevuste leidmiseks t-testi ja x2 statistikut. Tulemused Kehakaaluindeks. Kehakaaluindeksit kasutatakse kehakaalu hindamisel ja see leitakse pikkuse ja kaalu suhtena järgmise valemi abil: KKI = kehakaal(kg)/(kehapikkus (m))2. Üldjuhul loetakse normaalkaaluks vahemik 20>=KKI<25, alakaaluks KKI<20 ja ülekaaluks KKI>=25. Andmed õpilaste pikkuse ja kaalu kohta ei toetu mõõtmistele, vaid õpilaste endi hinnangutele, mis võib kaasa tuua mõningase ebatäpsuse, kuid samas ei ole ka alust arvata, et enesehinnang oluliselt tegelikust erineb
ning on vähima dispersiooniga kõigi nihketa lineaarsete hinnangute seas. PARIM HINNANG: et hinnang leitakse valimi alusel, mis on juhuslik, siis on ka hinnang juhuslik suurus. Samast üldkogumist komplekteeritud sama suurusega valimite põhjal saadud hinnangud on tavaliselt erinevad, mis kinnitab valimi alusel leitavate hinnangute juhuslikku iseloomu. Eesmärgiks on valimi andmeid kasutades leida võimalikult täpselt parameetri Xhinnang a. Parameetrihinnanguks nim statistikut mis leitakse valimi põhjal ning mis annab ühese väärtuse x-le. Hinnangut, mis on nihketa ja millel on antud valimi korral väiksem võimalik dispersioon, nimetatakse parimaks hinnanguks. NIHUTAMATA HNNANG: hinnangu erinevust tegelikust väärtusest iseloomustatakse nihke abil. Parameetri hinnangu keskväärtuse E(a) ja parameetri tegeliku vahel käsitletaksegi nihkena. Kui tegemist on nihutamata hinnanguga, siis see vahe võrdub
Sig.”). Ettevaatust! Suurte a. 7 cells (38,9%) have expected count less than tabelite puhul ja kui tabelis on palju väikeste 5. The minimum expected count is ,04. väärtustega lahtreid (selle kohta märkus a) ei saa hii-ruut statistikut eriti usaldada. Andmete filtreerimine (objektide valimine – selecting cases)