empriiline väärtus, kriitiline, nullhüpotees, sisukas hüpotees t-testi parameetri empiiriline väärtus mittekehtiv nullhüpotees, I liiki viga, ii liiki viga, teststatistiku empiiriline väärtus olulisuse nivoo olulisuse nivoo vähendamine sisukas hüpotees, olulisuse nivoo, liiki vea, tõke analüüsimeetod hüpoteesi statistilisel kontrollimisel saadi olulisuse tõenäosuseks uuritava tunnuse jaotuse võrdlemisel normaaljaotusega Test 9 ühefaktoriline dispersioonanalüüs anova nullhüpoteesi dispersioonanalüüs, teststatistik, faktori poolt põhjustatud seletatud hajumine suurem, seletamata hajumine teststatistiku f väärtus toodud anova tabeli korral funktsioontunnus faktor korrelatsioonimaatriks negatiivne kovariatsioon, autokorrelatsioon, spearmani korrelatsioon summaarne dispersioon arvutusvalemis, kovariatsioon õige hajumisdiagramm hajumisdiagramm, tunnuste vaheline seos kõige tugevam
. % of column/row. Tabelit mugavamaks saab muuta tõstes Value sakk row alla. Pane paika hüpoteesid: H0: ..ei ole seost. H1: on seos. Siis tee uus Pivottable, ilma protsentideta. Copy selle arvud ning asenda uutega. Seda vt praksi alt. Siis tee test. Chisq.test, kus actual values on algses pivottableis, ja teine on see uus, mis arvutasid. Siis tee JÄRELDUS: Seos auto omamise ja haige olemise vahel ei ole statistiliselt oluline, lisaks tuleb kirjutada rea- ja veeruprotsentide kohta. Dispersioonanalüüs: vt ka PRAKS 8 Kõigepealt sorteeri diskreetse arvtunnuse järgi.tee abitabel eraldamaks erinevate diskreetsete tunnuste vastuseid. Pane kirja hüpoteesid. Viige läbi dispersioonanalüüs Data analysise alt Anova single factor. Tee abitabel joonise tegemise jaoks. Pane kirja keskmised (massid) ja standardhälbed. Standardhälve saad SQRT variance. Tee tulpdiagramm keskmiste alusel. Lisa tulpadele veajooned:Chart layout error bars-
KODUTÖÖ METEROLOOGIA JA MÕÕTETEHNIKA MHT0010 Esitamise kuupäev: 19.05.2011 Üliõpilane: Matrikli number: Õpperühm: MAHB-41 Variandi number: 7 Lahenduste kontrollelemendid: Eksed 1 47,05 algandmetes: 2 mittejuhusliku komponendi olemasolu, dispersioonanalüüs F-statistik. järeldus: homogeensus hüpotees ei kehti tulpades 5 ja 8 (vt. tabel 1 ) 4 Keskväärtus: dispersioon: Standardhälve: Mediaan: 37,5 0,069 0,262 37,48 Keskväärtuse Standardhälbe usaldusvahemik usaldusvahemik 37,44 < 37,50 <
4.LOENG STATISTILISED TESTID Hii-ruut test - Võimaldab otsustada juhuslike suuruste jaotuste erinevuse ja sarnasuse üle. Annab vastuse küsimustele: kas erinevus (kahe) grupi sagedusjaotuses on statistiliselt oluline või mitte. T-testid – kõige lihtsam meetod uurida pidev tunuse keskmiste erinevust rühmiti. T-tesi puhul on neid rühmi kaks või üks. Küsimus kas vaadeldav (valimis esinev) kahe rühma keksmiste erinevus on statistliselt oluline ehk siis ei ole juhusega seletatav. Dispersioonanalüüs: selle abil on võimalik analüüsida: diskreetsete, samuti kvalitatiivsete faktorite toiet, mitme faktori koosmõju ning kontrollida hüpoteese. Vastavalt faktorite arvule on olemas ühe-, kahe- ja mitmefaktoriline dispersioonanalüüs. Korrelatsioonanalüüs – seoste lähemaks uurimiseks pakuvad võimalusi korrelatsioon- ja regressioonanalüüs. Kahe nähtuse vahel esineva seose iseloomustamiseks peame pöörama tähelepanu neljale erinevale aspektile:
võime lugeda tõestatuks, et erinevate väetamisvariantide korral on vähema ühe variandi poogendite keskmine okka pikkus teistest erinev. Sama tulemust võime väita ka p-väärtuse (olulisuse tõenäosuse) põhjal. le korraldati Dispersioonanalüüsi eesmärk on kontro astikväetisega (N), fosforväetisega (P) ja täis- t-testist võimaldab dispersioonanalüüs mõõdeti iga katseala poogenditelt 10 juhuslikult 64 61 65 58 52 51 50 50 58 59 58 53 59 53 54 56 ogendite keskmised okka pikkused erinevad? gendite okka pikkuste keskväärtused ühesugused. ral on okka pikkuse keskväärtus teistest erinev. ata Analysis, Avova: Single Factor.
sallivust soodustavat mõju nii sugu kui ka vanus, siis on loogiline, et naiste puhul on vanus suuremaks diferentseerivaks faktoriks kui meeste puhul. 4 Joonis 5. Vanusgruppide ja soo mõju homoseksuaalide õiguste hinnangule. Joonis 6. Haridustaseme ja vanusgruppide mõju homoseksuaalide õiguste hinnangule. 5 Dispersioonanalüüs Järgnevalt tegin dispersioonanalüüsi, kaasates mudelisse kõik tausttunnused, kuid vaadates sõltuvaid tunnuseid eraldi. Immigrantide mõju hinnagu puhul osutus mudeli kirjeldusastmeks 10,5% (vaata ka Tabel 1). Olulisuse tõenäosusega alla 0,05 omasid mõju vanus ja sugu. Vanuse erinevus tuli ka varem keskmiste võrdluses välja, kuid soo erinevus tuli ainult dispersioonanalüüsis. Tabel 1. Dispersioonanalüüs immigrantide mõju elukeskkonnale hinnangute kohta.
Studenti kriteerium (tx) Kõrgus Võrade läbimõõt I ja II katseala 0,4 2,2 I ja III katseala 4,0 9,0 II ja III katseala 4,1 6,5 Kui Studenti kriteerium puhul on saadud tulemus on väiksem kui 2, siis on erinevus oluline ja kui saadud tulemus on suurem kui 2 siis erinevus ei ole oluline. 2. Dispersioonanalüüs On statistilise analüüsi meetod, mis põhineb dispersioonide arvutamisel ja võimaldab analüüsida faktorite mõju juhusliku suuruse keskväärtusele. Kõige lihtsamalt öeldes näitab dispersioonanalüüs, kas valimi rühmakeskmiste erinevus on põhjustatud uuritava faktori mõjust või valimi juhuslikkusest. Dispersioonanalüüs põhineb dispersioonide aditiivsuse (liidetavuse) omadusel. Tabelis 3 on toodud dispersioonide arvutamiseks kasutatud ja arvutatud abiväärtused
· Wilcoxoni test pidevate tunnuste jaotuste võrdlemiseks, kui tunnus ei ole normaaljaotusega. · Z-test kahe grupi protsentide võrdlemiseks. · Mitmene võrdlemine nt kehakaal ja värskes õhus viibimise aeg. · Mitmese võrdlemise/testimise probleem: o Ühe statistlise testi korral (usaldusnivoo 5%) on I liiki vea tõenäosus 5%. o Mitmese testimise probleem? o Lahendus: üldise olulisuse/seose testimiseks dispersioonanalüüs o Individuaalsete erinevuste testimiseks/leidmiseks post hoc testid gruppidevahelisteks paarikauoa võrdlusteks. · Dispersioonanalüüs (ANOVA) o Ühemõõtmeline dispersioonanalüüs Arvuline uuritav e sõltuv tunnus (pidev ligikaudse normaaljaotusega) Kategooriline kirjeldav tunnus (ehk grupitunnus, mittearvuline) Testitakse gruppide keskmiste olulist erinevust (ehk kahe tunnuse vahelist seost)
Konkreetset tüüpi regressioonanalüüsi kasutus uuritavast sportlikust sooritusest oleneb sõltuvast muutujast. Kui sõltuv muutuja on pidev, piiritlemata ja mõõdetav intervalli või suhte skaalal, siis sobivad tavaline lineaarne või mitmekordse lineaarse regressiooni meetodid. Teisalt kui sõltuv muutuja on kategooriline, siis sobivamateks meetoditeks on logistiline regressioon või diskriminantfunktsiooni analüüs (Atkinson; Nevill 2001). 2.2 Dispersioonanalüüs (ANOVA) Dispersioonanalüüsi eesmärk on kontrollida gruppidevaheliste erinevuste statistilist olulisust. Võimaldab võrrelda enam kui kahte gruppi nende keskväärtuste põhjal, võimalus analüüsida nominaal- ja ordinaalskaalal olevate tunnuste toimet, hüpoteeside kontrollimise meetod. Dispersioonanalüüsi kõige lihtsam mudel (ühefaktoriline dispersioonanalüüs) eeldab kahte tunnust: üht kategoriaalset tunnust, mis kirjeldab
Antud on diskreetse suuruse jaotusseadus Vajalik on leida väärtus a uuritavale suurusele. Selleks valitakse JS X, mille matemaatiline ootus on võrdne a: EX = a. 58. Juhuslikud funktsioonid Juhuslikuks funktsiooniks nimetatakse funktsiooni mittejuhusliku argumendiga t, mis iga argumendi väärtusel on juhuslikuks suuruseks. Argumendi t juhuslikku funktsiooni tähistatakse X(t) 59. Rakendusstatistika rakendusi inseneritegevuses Eksperimendi planeerimine: - dispersioonanalüüs; - jaotusele vastavuse hindamine, hüpoteeside kontroll; - regressioon Kvaliteeditagamine: - x-kaardid; - laboritevahelised võrdlused;
Hüpoteeside koltrollimine 1. Oletus, väide 2. Sobiv hüpoteeside paar (millised tunnused on vaja võrrelda) 3. Olulise tõenäosus (p) 4. Järeldus (p>0,05 H0, p<0,05 H1) 5. Lõppvastus (sama, mis oli küsitud hüpoteesis) T-test sobivad valemid 1. T-test H0: keskmised võrdsed H1: keskmised erinevad 2. F-test sõltumatud valemid H0: dispersioonid võrdsed H1: dispersioonid erinevad P>a H0, P<0,05 H1 Võrdsete disp mittevõrdsete disp t-test t-test 3. Olulisuse tõenäosus 4. Lõppvastus (p<0,05 H0) Vormistus nii nagu iseseisvates töös Ülesanne Eesmärk Tunnusetüüp 1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, ...
väga väikeste valimite puhul (<30) tuleks eelistada mitte-parameetrilisi analooge. Sõltumatu t-testi asemel nt Mann-Whitney test Sõltumatu ANOVA asemel nt Kruskal-Wallis test Sõltuvate rühmade t-testi asemel nt Wilcoxoni test Sõltuva ANOVA asemel nt Friedmani test Võrreldakse järjestusi, tavaliselt peamine mõõtmisalus keskmise asemel mediaan Dispersioonanalüüs ehk ANOVA Rohkem kui kahe võrreldava grupi vahel tehakse mõõtmised ANOVAga (ANalysis Of VAriance) Sõltumatute gruppidega (between subjects) ANOVA Ühefaktoriline dispersioonanalüüs (One-Way ANOVA) On 1 sõltumatu muutuja, millel on mitu taset (nt akadeemilise testi tulemused keskharidusega, bakalaureuse kraadi ja magistri kraadiga inimeste vahel). Leiab, kas üldse leidub rühmade vahel statistiliselt olulisi erinevusi ning kui, siis milliste.
8. Kontrollida Kolmogorovi-Smirnovi ja testi abil hüpoteesi, et põhikogumi jaotuseks on fikseeritud parameetritega a=0 ja b=100 ristkülikjaotus, võttes olulisuse nivooks =0,05, st testi statistiku DN kriitiliseks väärtuseks on Dkr = 0,265. ; Osa B. Dispersioonanalüüs 9. Jagada korrastamata algandmete valim viieks võrdse mahuga osaks võttes gruppideks valimi arvud järjekorranumbriga 1-12;13-24;25-36;37-39;49-60. Kontrollida nii moodustatud gruppide keskväärtuste homogeensushüpoteesi h0=1=2=3=4=5 kasutades dispersioonanalüüsi metoodikat (ANOVA-test) ja võttes olulisuse nivooks =0,05 Sgen=Pj-((/pq) p=5; q=12 p=5; q=12 Sfac=(Rj2/q)-((Rj)2/pq) Sjääk=Sgen- Sfac fac=Sfac/(p-1) jääk=Sjääk/p(q-1) Femp=fac/jääk
3) Mudeli liikmete olulisuse kontroll (kui tekib kahtlus, kas sisend X mõjutab väljundit Y, kas vabaliige b0 erineb nullist) 4) Mudeli adekvaatsuse kontroll (kontrollitakse, kas mudel tervikuna on katseandmetega kooskõlas, levinuim viis on adekvaatsustest, kus adekvaatsusdispersiooni võrreldakse väljund dispersiooniga vastava F-statistiku abil) 5) Jääkide analüüs. Lisamärkused (vahed katsest saadud väljundiväärtuste ja mudeli poolt prognoositud väärtuste vahel) Dispersioonanalüüs (ühe faktoriline) Analoogiliselt regressioonanalüüsiga tegeleb ka dispersioonanalüüs (võimaliku) seose selgitamisega sisendi x ja väljundi y vahel. Erinevuseks on see, et dispersioonanalüüsis on sisend x mitte pidev/kvantitatiivne/mõõdetav, vaid nn rühmitav/kvalitatiivne/diskreetne suurus, mida tavaliselt nimetatakse faktoriks. Sisendil x on k võimalikku väärtust/varianti/reziimi, mida tavaliselt nimetatakse tasemeks (nivooks)
6. Hinnata normaaljaotuse võimalikkust mõõtetulemust alusel Normaaljaotus on võimalik kui . (toodud eelmise punkti tabeli viimases veerus). = 9,5 (väärtus tabelist vastavalt intervallide arvule ning tõenäosusele). => 6,1 < 9,5 => normaaljaotus on võimalik. 7. Dispersioonanalüüs F1 F2 F3 F4 F5 yi1 yi12 yi2 yi22 yi3 yi32 yi4 yi42 yi5 yi52 1 20,063 402,524 20,049 401,962 20,133 405,338 20,117 404,694 20,072 402,885 2 20,121 404,855 20,083 403,327 20,026 401,041 20,087 403,488 20,095 403,809
± x = t ± x = t 1- Piiresindusviga - n , üldkogumi teadmisel n N 2 t 2 2 t t22N n= = n = Valmi suuruse määramine - 2 Kui üldkogum on teada - 2 N + t 2 2 Dispersioonanalüüs (DA) Uuritav tunnus peab olema arvtunnus. Tunnused on normaaljaotusega. Rohkem kui 2 võrreldavat kogumit. Analüüsitakse reklaami asukoha mõju toote ostmisele. Valitakse 30 sarnast kauplust, kus ühe ja sama kauba reklaam paigutatakse erinevalt: 10 kaupluses aknale, 10 poe sissekäigu juurde, 10 vahetult kauba müügileti juurde. Tulemusi fikseeritakse müüdud kauba koguse (tükkide) järgi. Meie näites müügikogus on tulemus ehk
Kui on 3+ gruppi, siis kasutatakse dispersioonanalüüsi. See meetod võimaldab uurida faktortunnuse X mõju arvtunnuse Y keskväärtusele, kasutades valimi andmeid. Uuritav tunnus on sõltuv tunnus ehk funtsioontunnus- Y, tegu on arvtunnusega Diskreetne- ehk faktortunnus(sõltumatu) X, sellel on k väärtust(taset). Sõltuvalt faktortunnuste X arvust eristatakse ühe-, kahe- ja kolmefaktorilist disp-analüüsi.(kui rohkem, siis mitmefaktoriline) 1)Ühefaktoriline dispersioonanalüüs- ainult üks X Nagu ka t-testide puhul, on dispersioonanalüüsi läbiviimiseks vajalik teatud eelduste täidetus: 1. uuritav tunnus on arvuline 2. uuritav tunnus on normaaljaotusega (võimalik testida) 3. uuritava tunnuse dispersioonid peavad uuritavate gruppide lõikes olema võrdsed (võimalik testida Levenega) 4. sõltumatu tunnus, mille alusel võrreldavad grupid moodustatakse, peab olema
sisukas hüpotees. See on kergem viga, mis enamasti tähendab, et soovitu tõestamiseks tuleb mõõtmisandmeid juurde koguda. Olulisuse nivooks valitakse väike arv, sageli 0,1; 0,05 või 0,01 (sõltuvalt sellest, kui rasked tagajärjed võivad esimest liiki vea tegemisel tulla). PARAMEETRILISED JA MITTEPARAMEETRILISED TESTID ÜLDKOGUMITE VÕRDLEMISEKS KOLM JA ENAM KOGUMIT (DISPERSIOONANALÜÜS) · Dispersioonanalüüs: ANOVA võrdleb kolme ja enama grupi keskväärtuseid. Uuritav tunnus on intervalltunnus. Dispersioonanalüüs on meetod, millega otsitakse vastust küsimusele, kas rühmakeskmiste erinevus on põhjustatud uuritava faktori mõjust või valimite juhuslikkusest. Ühefaktorilise dispersioonanalüüsi (One-Way ANOVA) eeldused: · Tulemuste hajuvused (dispersioonid) on võrreldavates gruppides samad (Levene test)
vahetamisega ning mida kasutatakse organisatsiooni tegevuse juhtimiseks, planeerimiseks ja kontrollimiseks. Kuluarvestus protsess, mis seisneb eelarvete koostamises organistasiooni elementidele ja tegelike kulude hälvete eelarvelistest väljatoomises ja analüüsis Juhtimis-ja kuluarvestuse universaalmeetodite ajalooline areng - Lihtsad e kesised (nt eelarveliste kulude võrdlus tegelike kuludega dispersioonanalüüs) - Traditsioonilised ja raamatupidamisaruandlusest tulenevad meetodid ( nt standardkuluarvestus) - Spetsiaalne e vastutuspõhine kuluarvestus - Integreeritud e tegevuspõhine kuluarvestus a. Vastutuspõhine kuluarvestus - organisatsiooni erinevate vastutuspiirkondade kaupa majandusinformatsiooni kogumine, kokkuvõtmine ja aruannete koostamine, seostades ettevõtte tulud, kulud, kasumid ja investeeringud nende eest otseselt vastutavate struktuuriüksuste juhtidega
osa antud geneetilise struktuuriga populatsioonis konkreetsetes keskkonnatingimustes; see ei näita tunnuse päriliku tingituse määra ega mehhanismi üksikindiviidide arengus. Päritavuskoefitsiendi arvutamise meetodid 1. Kaksikute analüüs. 2. Selektsioonieksperiment e. valikukatse. 3. Vanemate ja järglaste fenotüübilise sarnasuse määramine. 4. Poolõvede ja täisõvede rühmade dispersioonanalüüs e. Aretusväärtus- loomade valik kvantitatiivsete tunnuste järgi toimub fenotüüpi arvestades, siis on väga oluline teada, kui suur on see osa fenotüübilisest variatsioonist populatsioonis, mis antakse edasi järgmisele põlvkonnale, s.o. milline on (tõu)looma aretusväärtus. ,,Aretusteoorias defineeritakse indiviidi aretusväärtus enamasti kui tema lõpmatu arvu järglaste keskmise fenotüübiväärtuse kahekordne erinevus populatsiooni keskmisest"
2 = 7,09 n1' = n f ( x )( xmax - a*) = 9,79 emp emp 2 < kr2 H1 ei esine ristkülikjaotus Ho kehtib, kui EMP2 < KR 2 , seega põhikogumi jaotuseks on ristkülikjaotus. 5 Osa B. Dispersioonanalüüs 9. ANOVA-test =0,05 H0: µ1=µ2=µ3=µ4=µ5 Tabel 5: FAKTOR Katse nr. F1 F2 F3 F4 F5 ÜLDISTUS xi1 xi1^2 xi2 xi2^2 xi3 xi3^2 xi4 xi4^2 xi5 xi5^2 1 3 9 13 169 45 2025 86 7396 66 4356
d t = d / s ( d), kus s d i > k = n-1. n 1 50. Kahe valimi mitteparameetriline võrdlemine. Hüpoteesi kontroll Wilcoxoni kriteeriumi abil Ei vaja põhikogumi jaotuse teadmist, antud valimi paarid. Hindab kogumite ühtsust. 51. Ühefaktorilinr dispersioonanalüüs (ANOVA test) Hindab faktorite mõju grupi keskmistele grupivaheliste ja grupisiseste hälvete kaudu. x x & Safrn ] q x pj x p q p 2 2 Sj,o ] ij i 1 i 1 i 1 Fyf,k = s2afrn / s2jcn > s2jcn ] Sjcn / p (q-1), s2afrn ] Safrn / (p-1) 52. Regressioonanalüüs y = +x+; y a^1 b^1 x
suurem on väljundparameetri dispersioon, seda suurem on uuritava faktori
mõju. F.test. Tabelikujul Dispersioon=variatsioon/vabadusastmete arv. Kui
saadud tabelis osutub mõne faktori korral, et Femp>Fkriitiline siis võime
võtta vastu otsuse, et uuritav faktor avaldab olulist mõju uuritavale
nähtusele antud olulisuse nivooga(0,05). Kui Femp
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 3 9 7 4 7 7 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: 3.2.2011 Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 91 96 79 95 10 39 69 38 40 5 0 96 24 22 75 79 82 86 91 74 75 25 12 71 85 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 2,8 2,2 4,0 1,1 5,1 yi 6,9 6,1 9,8 7,2 15,3 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7)
Rakendusstatistika arvutusgraafilise AGT-1 andmed ja lahenduse kontrollelemendid MHT/2013 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: 21.11.2013 Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs, aegrida ) 37 54 94 32 19 33 69 51 89 43 18 88 9 30 62 41 81 54 49 54 15 94 85 43 87 Andmed-B: valimid B1 ja B2 ( korrelatsioon, regressioonimudeli leidmine ja analüüs) xi 1,1 2,8 2,2 5,1 3,7 yi 7,2 8.9 6,8 19,3 13,1 Valim B1: Paarisvalim (xi, yi) regressioonimudeli
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1 8 8 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5)
1. Millal kasutatakse ühefaktorilist dispersioonanalüüsi (ANOVA)? a. faktortunnus nimiskaalas ja 3 või rohkem väärtust b. funktsioontunnus intervallskaalas c. faktortunnus järjestusskaalas ja 3 või rohkem väärtust d. funktsioontunnus intervallskaalas. 2. Milline on nullhüpotees dispersioonanalüüsi korral? Funktsioontunnuse keskväärtused on kõikides rühmades võrdsed. 3. Dispersioonanalüüs viidi läbi kahe erineva faktortunnuse A ja B korral ning leiti vastav teststatistik F. Faktori A korral F = 5,9 Faktori B korral F = 2,3 Kummal juhul on faktori poolt põhjustatud seletatud hajumine suurem, võrreldes seletamata hajumisega? A 4. Milline on teststatistiku F väärtus toodud ANOVA tabeli korral (kollases lahtris)? 6,48 5. Faktori A mõju uurimiseks viidi läbi dispersioonanalüüs. Kas faktori A mõju funktsioontunnusele on
b * -a * 100,06 -4,18 n1' = n f ( x )( xmax -a*) =50 0,01043(14 -4,18) =5,12 n2' = n3' = n4' = n5' = n6' = n f ( x ) h = 50 0,01043 14 = 7,3 n7' = n f ( x)(b * -xmin ) = 50 0,01043(100,06 - 84) = 8,37 = 0,05; k = 12 => X kr2 (; k ) = 9,5 emp 2 = 2,11 2,11 < 9,5 emp 2 < kr2 Ho kehtib, kui EMP 2 < KR 2 , seega põhikogumi jaotuseks on ristkülikjaotus. Osa B. Dispersioonanalüüs 9. ANOVA-test 7 =0,05 H0: µ1=µ2=µ3=µ4=µ5 Tabel 5: FAKTOR Katse nr. F1 F2 F3 F4 F5 ÜLDISTUS xi1 xi1^2 xi2 xi2^2 xi3^2 xi3 xi4^2 xi4 xi5^2 xi5
Dispersioon standardhälbe ruut Võrdlusülesanded Tunnuse jaotuse võrdlus: risttabelid ja seosekordajad Tunnuste keskmine väärtuste võrdlus kirjeldaval tasemel: keskmine ja selle usalduspiirid Ühe tunnuse keskmine väärtuse võrdlus kahes gruppis: t-test Kahe tunnuse keskmine väärtuste võrdlus: t-test Ühe tunnuse keskmiste väärtuste võrdlus kahes v rohkemas grupis: mitteparameetrilised testid, dispersioonanalüüs LOENG 2 12.09.18 Tunnuse jaotus Mida vaadata tunnuse jaotuse puhul? -Absoluutarvudes, protsentides, kumulatiivse protsendina? - tipp - ulatus - sümmeetria - Sarnasus mõne meile seni teada oleva jaotusega Tihti on vaja jaotusi võrrelda -Omavahel -Mõne teadeoleva jaotusega Hii-ruut-statistik Kas kõrvalekalle 1,04 on ok? Olulisuse tõenäosus: kui suur on tõenäosus, et selline kõrvakalle on
kõik põhikogumi jaotuseks on fikseeritud parameetritega a = 0 ja b = 100 ristkülikujaotus, võttes olulisuse nivooks = 0,05, st testi statistiku DN kriitiliseks väärtuseks on Dkr = 0,265. D N =max|F emp ( x i )-F ( xi ) rk| F(xi) emp max = 1 F(xi)rk max = 0,97 DN = 1 0,97 = 0,03 Dkr = 0,265 Et hüpotees kehtiks, peab DN Dkr, antud arvutustes kehtib võrratus 0,03 < 0,265 Osa B - Dispersioonanalüüs 9. Jagan valimi viieks võrdse mahuga osaks. Kontrollin moodustunud rühmade keskväärtuste homogeensushüpoteesi H 0 : 1=2=3= 4= 5 , kasutan selleks dispersioonanalüüsi metoodikat ja võtan olulisuse nivooks = 0,05: Leian rühmade keskväärtused: Ni 1 ´y i= y ir N i r =1 Leian rühmade dispersioonid: Ni 2 1 2
= 0,05; k = 4 => X kr2 (; k ) = 9,5 emp 2 = 2,21 emp 2 < kr2 H1 ei esine ristkülikjaotus Ho kehtib, kui EMP 2 < KR 2 , seega põhikogumi jaotuseks on ristkülikjaotus. B. Kolmogrov-Smirnovi meetod DKR=0,265 DEMP = max{ FEMP ( x ) - FTEOR ( x)} = 0,91 - 0,77 = 0,12 Järeldus: Kuna tingimus DEMP D KR kehtib, siis järelikult ristkülikjaotus sobib Osa B. Dispersioonanalüüs 9. ANOVA-test 9 =0,05 H0: µ1=µ2=µ3=µ4=µ5 Tabel 5: FAKTOR Katse F1 F2 F3 F4 F5 nr. xi1 xi1^2 xi2 xi2^2 xi3 xi3^2 xi4 xi4^2 xi5 xi5^2
vastuvõtmise või tagasilükkamise võimaluse, suurema usaldatavuse Kui kasutada otsuse langetamisel väiksemat valimit, siis vea tekkimise võimalus suureneb – ÕIGE, mida suurem on valim seda suurem on usaldatavus Vea tekkimise võimalus on alati 5% - VALE Üliõpilane sai ülesandeks hinnata kahe erineva kogumi konkreetsete tunnuste väärtuste vahel esineva seose tugevust. Selleks tuleb tal: viia läbi dispersioonanalüüs – VALE, dispersioonanalüüsi eesmärk on faktori mõju kontrollimine (mitte varieeruvuse hindamine, varieeruvus on töövahend) leida korrelatsiooni- või regressioonikordaja ning vaadata nende märki – VALE, märk ei näita tugevust, vaid suunda kahte erinevat kogumit ei saagi võrrelda ning nende vahel seost leida – VALE, võrrelda saab kõike, kui leida õige töövahend
0.063333 0.046667 0.063333 0.05 0.033333 0.05 0.006667 0.01 0.01 0.003333 0.013333 0.013333 0.01 0.006667 0.01 0.026667 0.01 0.026667 0.033333 0.016667 0.033333 0.01 0.006667 0.01 0.026667 0.01 0.026667 0.013333 0.003333 0.013333 0.01 0.006667 0.01 Dn: 0.113333 χ^2 test: χ^2kr (0,05; 7) = 14.07 χ^2emp = Σ(ni-ni')^2/n'i = 58.75 χ2emp > χ2kr 58.75 > 14.07 Põhikogumis ei esine normaaljaotust. Osa B. Dispersioonanalüüs 9. Jagada korrastamata algandmete valim viieks võrdse mahuga osaks võttes gruppideks valimi arvud järjekorranumbriga 1.-12; 13.-24; 25.-36; 37.-48 ja 49.-60. Kontrollida nii moodustatud gruppide keskväärtuste homogeensushüpoteesi H0: µ1=µ2=µ3=µ4=µ5 kasutades dispersioonanalüüsi metoodikat (ANOVA-test) ja võttes olulisuse nivooks =0,05 Faktor Grupp 1 2 3 4 5 Summa
Eksponentkeskmist kasutatakse, kui on tegemist: 1. Keskmise taseme leidmisega väga pikkades aegridades 2. Keskmise taseme leidmisega momentreas ja ajavahemikud on võrdsed 3. Keskmise taseme leidmisega perioodreas ja perioodid ei ole võrdsed 4. Aegreaga ja väärtuste standardhälbe arvutamise juures 5. Aegreaga ja selle tasandamise juures Valimivaatluse korral 1. Usalduspiiride laius sõltub väärtuste varieerumisest 2. Suurema valimi kasutamisel usalduspiirid laienevad 3. Valitud usaldatavus ei avalda mõju moodustatava valimi suurusele 4. Keskmine esindusviga ei sõltu valimi suurusest 5. Suurem valimi kasutamine vähendab väärtuste varieerumist üldkogumis Esindusviga on oma sisult: 1. Viga mis tekib aritmeetilise keskmise ebatäpsuse tulemusena 2. Kõikide võimalike esindusvigade harmooniline keskmine 3. Väljavõtukogumi ja üldkogumi struktuurid erinevuse tulemusel tekkinud ebatäpsus ...
Mudeli adekvaatsuse kontroll. Adekvaatsuse mõte on kontrollida valitud mudeli kuju
õigsust ning selleks kontrollitakse F-statistiku abil ühepoolse alternatiiviga
hüpoteesipaari. Valemis on d oluliste liikmete arv, alfa olulisuse nivoo. Kui F
korral) F-test (kahe üldkogumi dispersioonide võrdlemine) Korrelatsioonanalüüs Regressioonanalüüs 2 Kahemõõtmeline sagedustabel, -test Dispersioonanalüüs (pole veel) [email protected] http://ph.eau.ee/~ktanel/kool_ja_too/ märts, 2000 http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/ (2 of 2)29.05.2006 15:08:49 Andmeanalüüs MS Exceli abil - vahendid
Võta Tulemus: Esimese aast üliõpilased on Astra majaga rohkem rahul (M=3,19;SD=1,006) kui magistrandid (M=2,59, SD=1,376), Hajuvus Sig=0,017, mis on väiksem kui α, mis on 0,05. Järelikult on mittevõrdsed.Eks siis võtame t-testi alumise rea – Sig=0.050, ehk siis H1. Ehk siis erinevus on ka võrdsuse korral statistiliselt oluline. t(70 (tabelis on see kui rida t-testis nimetusega df))=2,137, p=0,05 d=0,49 ehk siis keskmine. …….. Dispersioonanalüüs (ei tule eksamil). Olukord, kus ei ole enam kaks gruppi. Tahaks kõiki gruppe korraga võrrelda. Teeme a-nova. Uuritav ja faktortunnus. Kursus läheb faktorväljale: Piisab esimese nelja lahtri vaatlemisest: Kolmas õppeaastal on kõige kõrgem hinnang jne…kirjeldav Teises tabelis on dispersioonanalüüsi eedus, et sisuliselt Levensi testi Kolmandas lahtris on lõplik tulemus, mis ütleb, et erinevus kõikide gruppide vahel ei ole olulised. Sig=0.822
Mitteparameetrilised testid - kasutatakse juhul kui uuritava tunnuse mõõtmiseks ei saa kasutada intervallskaalat. Nt: märgitest, χ 2-test(hii-ruut) Märgitest – Märgitesti kriitilised väärtused - χ 2-test - Jaotuse sobivuse test - Kas valitud teoreetiline jaotus sobib empiirilise jaotuse kirjeldamiseks? Kahe kvalitatiivse tunnuse vaheline seos. Nullhüpotees: empiiriline ja teoreetiline jaotus langevad kokku. Sisukas hüpotees: empiiriline ja teoreetiline jaotus erinevad oluliselt. Dispersioonanalüüs - meetod, millega otsitakse vastust küsimusele, kas rühmakeskmiste erinevus on põhjustatud uuritava faktori mõjust või valimite juhuslikkusest. Kui erinevus on põhjustatud uuritava faktori mõjust (kehtib sisukas hüpotees), võib järgneda keskväärtuste mitmene võrdlemine. SST= SSE= MST= MSE= F=MST/MSE allub F-jaotusele MST –rühmadevaheline seletatud hajumine, MSE - seletamatu Nullhüpotees: funktsioontunnuse keskväärtused on kõikides rühmades võrdsed, faktori mõju puudub.
mitteoluliseks.
Mudeli adekvaatsuse kontroll. Adekvaatsuse mõte on kontrollida valitud mudeli kuju õigsust ning
selleks kontrollitakse F-statistiku abil ühepoolse alternatiiviga hüpoteesipaari. Valemis on d oluliste
liikmete arv, olulisuse nivoo. Kui F
diferentsiaal,; eksperimendi liigid: mis on põhjuslik seos Skaleerimine- Skaalad: Nominaal- diagnostilised näitajad, sugu, klassifitseerivad tunnused ( silmade , juuste värv, lillesort, rass); gruppi kuuluvus; elukoht, isiku nimi; toidusedeli komponendid; ei jah vastused; Andmete tüüp nimeline, matemaatilised tehted EI Ordinaal- e järjestusskaala; klass/kool; finiseerimise järjekord; nõustumise määr: Matemaatilised tehted: järjestamine (min, max, kvantiilised, dispersioonanalüüs) Andmete tüüp järjestus. Intervallskaala- e vahemikskaala. Standardiseeritud skoorid mingil skaalal (testi tulemused); skaala skoorid, mis ei saa olla tegelik null ( temp.); skoorid, kus pole selge, et null tähendab mingi joone puudumist (nt matemaatiliste võimete test); enamiku isiksuseskaalade skoorid, mis põhinevad teatud hulgale väidetele antud hinnangute kokku lugemisel. Matemaatilised tehted: liitmine, lahutamine, aritmeetiline keskmine, standardhälve, lineaarkorrelatsioon
STATISTIKA KESKMISED · Kogumit ühe arvuga iseloomustavad üldistavad näitarvud, mis edastavad informatsiooni kogumisse kuuluva tunnuse väärtuste taseme kohta. · Mahukeskmised sõltuvad statistilise rea mahust. Rea maht ei ole otseselt rea liikmete arv. Ritta kuuluvate elementide väärtuste summa. Reageerivad igale muutusele, väga tundlikud. Mahukeskmised: aritmeetiline keskmine, harmooniline keskmine, geomeetriline keskmine, ruutkeskmine ja teised astmekeskmised, kronoloogiline keskmine. · Asendi ehk struktuurikeskmised kuuluvad keskmised mis ei reageeri igale muutusele elementide väärtuste osas. Oluline on struktuur. Asendi ehk struktuurikeskmised: mood, mediaan, kvartiilid, pentiilid, sekstiilid, oktiilid (teoorias), detsiilid protsentiilid. · Harmooniline keskmine on mitmese tähendusega. Sõltuvalt andmete iseloomust võib ta tähendada kas mingi suuruse aritmeetilise keskmise leidmist kaudselt a...
• F – testi tulemus – suurem number suurem erinevus – F ja Fkriitiline võrdlus (F p – näitab kas tulemus on statistiliselt oluline Factor analüüs: • „Faktor analüüs ei ole mõeldud hüpoteeside testimiseks või gruppide vahelise oluliste erinevuste leidmiseks.“ • „Faktor analüüs on mõeldud nn. muutujate vähendamise (data reduction) tehnikana“ (Pallant, 2001: 151) • Faktor analüüs on mõeldud valiidsuse (st. kas mudel mõõdab mida peab) kontrolliks Dispersioonanalüüs (ANOVA) • Eesmärk on kontrollida gruppidevaheliste erinevuste statistilist olulisust • Võimaldab võrrelda enam kui kahte gruppi nende keskväärtuste põhjal – Näit. Kas Tallinnas, Tartus ja Viljandis tegutsevate ettevõtete tulemused on erinevad • Analüüs sisaldab: – Iga üksiku vaatluse võrdlus üldise keskmisega – Gruppidevahelised erinevused – võrreldakse gruppide keskmisi üldise keskmisega
erinevus. Ühesuunaline ANOVA Kui sõltuv muutuja on pidev tunnus ja meil on üks sõltumatu muutuja rohkem kui 2 tasemega, siis saame kasutada ühefaktorilist ANOVAT One-Way ANOVA. Selle analüüsi tegemiseks SPSS'is järgige alltoodud käsklusi: Analyze Compare Means One-Way ANOVA - Avanenud aknas viite sõltuva muutuja kasti Dependent list, sõltumatu muutuja on Factor. - Ehkki ANOVA ise näitab, kas esineb gruppievahelisi erinevusi, siis dispersioonanalüüs ei näita, milliste gruppide vahel need erinevused on. Menüüst Post Hoc saate valida nn järeltesti ehk post hoc testi, mis analüüsib konkreetsete tingimuste vahelisi erinevusi. Kui grupidde hajuvused on sarnased, tuleks kasutada Tukey (HSD) testi, kui aga ei ole sarnased, on soovitatav kasutada Games-Howell testi. - Options aknast saate lisaks valida kirjeldavate statistikute kuvamise (Descriptive) ja samuti saate ka
TEST(Q2:Q75;Q76:Q106;2;3) mittevõrdne varieeruvus on n Protseduuris t-test olete kasutanud valikut "Labels" ja seetõttu on kaduma läinud kummagi grupi es Analüüs 89.47 Interpretatsioon 85.71 KOKKU 87.59 Ül 2 regressioon "Seega on tegelike ja prognoositavate piimatoodangu väärtuste vaheline seos nõrk ". Samas pole prognoositäpsus eriti hea. Analüüs 100.00 Interpretatsioon 95.24 KOKKU 97.62% Ül 3 dispersioonanalüüs "Olulisuse tõenäosus p = 0.5539 näitab, et väites, et lehmade piimatoodang ja tõug ei ole seotud, lise tõenäosusega." ? Analüüs 100.00 Interpretatsioon 95.24 KOKKU 97.62 õrdne varieeruvus on nr 3. äinud kummagi grupi esimene väärtus. seos nõrk ". g ja tõug ei ole seotud, eksiksime 0,009%-
48. Paariskorrelatsioon 49. Mitmene korrelatsioon Valitakse selline hulk muutujaid, mille seotus resultaatnähtusega on suuremal, või vähemal määral äraseletatav. Leitakse ka muutujate endi vahelised paariskorrelatsiooni kordajad. Kõige tugevamad valitakse välja. x y xy n r ( x) 2 ( y ) 2 ( x 2 ) ( y 2 ) n n 50. Dispersioonanalüüs Dispersioon analüüsi kasutatakse mitmesuguste tegurite mõju olulisuse hindamiseks uuritavale nähtusele, seda kasutatakse ka muudes eluvaldkondades (meditsiin, pedagoogika) ja eksperimentide , katsete tulemuste analüüsimisel. Dispersioonanalüüsi protseduuri idee seisneb selles, et tehakse kindlaks see osa uuritava nähtuse mingi tunnuse varieerumisest, mis on tingitud selle jaotumisest osakogumiteks
näitab statistiliselt olulise erinevuse puudumist) Kui sõltuval muutujal on ainult üks tase (nt konkreetne testiskoor), saab kasutada ühefaktorilist ANOVAT One-Way ANOVA Käsklusterida: Analyze Compare Means One-Way ANOVA Avanenud aknas viite sõltuva muutuja kasti Dependent list, sõltumatu muutuja on Factor. Ehkki ANOVA ise näitab, kas esineb gruppievahelisi erinevusi, siis dispersioonanalüüs ei näita, milliste gruppide vahel need erinevused on. Menüüst Post Hoc saate valida nn järeltesti ehk post hoc testi, mis analüüsib konkreetsete tingimuste vahelisi erinevusi. Kui gruppide hajuvused on sarnased, tuleks kasutada Tukey (HSD) testi, kui aga ei ole sarnased, on soovitatav kasutada Games-Howell testi. Options aknast saate lisaks valida kirjeldavate statistikute kuvamise (Descriptive) ja
Standardhälve 1. leitav dispersiooni ruuduga (ruutjuurega) 2. paikneb alati vahemikus 0 ... lõpmatus (kui on alternatiivne tunnus, siis saab olla kuni 0,5 see on triki küsimus, kui panid õige, siis on ÕIGE) 3. ei saa olla lineaarhälbest suurem (väiksem) 4. varieeruvas reas = 0 (st puhul rida just varieerub) 5. ei ükski Regressioonianalüüsi kõige üldisem eesmärk: 1. kirjldada korrlatiivset seost metemaatika funktsioonina Pidev juhuslik suurus... 1. võib omada ükskõik milliseid väärtusi tema võimalikke väärtusi hõlmavas arvuvahemikus. 2. juhuslikku suurust nim pidevaks juhuslikuks suurusesks, kui tema võimalike väärtuste hulk on loenduv. Lineaarne regressioonimudelil: 1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi...
Toodangu maht kasumi-kahjumi piiril ehk... a. koguseline tasuvuspunkt b. vajadulik tasuvuspunkt c. olemuslik tasuvuspunkt 9. Traditsiooniliselt võetakse müügiprognoos etteantud tegurina ning ennustatakse selle mõju ettevõtte erinevatele kulutustele, varadele, kohustustele, omakapitalile. Millist toodud meetoditest ei kasutata eelnevalt kirjeldatud prognoosimisel? a. lihtne loogiline arvutuskäik b. regressioonanalüüs c. dispersioonanalüüs d. protsendimeetod müügitulu (käibe, läbimüügi) suhtes 25 10. Milline järgnevatest ei ole finantsprognoosimise etapp? a. konkurentide tegevuse analüüs b. müügitulu ja kulude hindamine c. selleks vajatavate investeeringute hindamine d. finantseerimisvajaduse selgitamine 11. Millises eelarves tuuakse tulud ja kulud erinevatest alaeelarvetest? a. tulueelarve b. kulueelarve c
määral. (Kui võrreldakse vaid kahte keskmist, siis annab ANOVA samad tulemused nagu sõltumatute andmerühmadega t-test (kui võrreldakse kahte erinevat vaatluste või katseisikute gruppi) või nagu sõltuvate andmerühmadega t-test (kui võrreldakse kahte tunnust ühes vaatluste või katseisikute kogumis.) Enamasti on uurimustes tegu rohkem kui kahe tingimuse võrdlemisega, seepärast on ANOVA faktoriseeritud eksperimendi andmetöötluses kasutatavaim meetod. (nimetus "dispersioonanalüüs" tuleneb faktist, et statistiliste erinevuste hindamiseks keskmiste vahel võrreldakse tegelikult dispersioone. Dispersioon (variance) on tunnuse hajuvust iseloomustav näitaja. Tunnuse hajuvus iseloomustab seda, kui erinevad on antud tunnuse väärtused kogumi erinevatel objektidel.) Näide: Näiteks uurime LSD mõju rottide jooksukiirusele. Kahe tingimusega katse korral on meil üks grupp rotte, kellele manustatakse LSD-d ja kontrollgrupp, kellele ei manustata
Lõppjäreldus: kuigi putru söövate ning vahest söövate ja vahest mittesöövate tudengite kehamassid on vastavalt 11,2 cm ja 10,3 cm võrra suuremad, kui putru mittesöövate tudengite kehamassid, on kehamasside varieeruvus võrreldavates gruppides nii suur ja andmestik ise nii väike, et keskmiste vaheline erinevus ei osutunud statistiliselt oluliseks (p = 0,132; dispersioonanalüüs) ja sestap ei ole alust teha üldistavaid järeldusi kehamassi ja pudru söömise vahelise seose kohta (pudru söömine suuremat kehamassi ilmselt ei põhjusta) . H0: Kehamass ja pudru söömine ei ole seotud H1: Kehamass ja pudru söömine on seotud Average Variance 62,125 89,26786 73,3225806452 257,5591 72,3888888889 Kirjeldage 127,1928 gruppi de erinevust: 8