32 2 2 2 5 344,00 2 398,21 3 849,00 33 2 1 1 7 975,00 6 773,87 25 700,00 34 2 1 1 12 940,34 6 157,91 13 996,00 35 2 1 1 26 328,00 21 026,27 52 650,00 Keskmised: 3 388,23 2 897,88 5 937,23 Standardhälve: 4588,534 3553,288 9101,49 1)Valimkeskmine Vastav EXCELi funktsioon: AVERAGE 2)Valimdispersioon Vastav EXCELIi funktsioon: VARP 3)Valimstandardhälve Vastav EXCELi funktsioon: STDEVP 3)Valimstandardhälve Vastav EXCELi funktsioon: STDEVP Valimkeskmiste arvutamine Tabel 1 Tulu Kulu Palk Leibkonnapea on kõrgharidusega 6850,757 5085,906 12739,7 Leibkonnapea on muu haridusega 2003,218 2022,6716 3216,24
Matrikli Number = XXXX1, keskmisele palgale lisaks 1. Ülesanne 1 Hinnata üldkogumi keskmisi: keskmist palka, keskmist kulu spordile ja keskmist kulu meelelahutusele. Leida usaldusvahemikud keskmistele usaldusnivool 0,90 ja 0,99. Keskmise leidmiseks kasutasin valemit : OpenOffices vastas sellele funktsioon AVERAGE. Usaldusvahemike leidmiseks kasutasin funktsiooni CONFIDENCE, kuhu oli ühe argumendina vaja standardhälvet, mille sain funktsiooni STDEVP abil. Alpha on 1-β . Size on valimi suurus(50). Ülesanne 2 Hinnata mittesuitsetajate osakaalu üldkogumis (a) meeste seas, (b) naiste seas usaldusnivool 0,95. Kuna valimi maht jääb alla 30, siis kasutan Studenti jaotust (OpenOffices vastab F^-1 TINV funktsioon) β=0.95 α = (1 + β) / 2 (number)
KOLLOKVIUM 3 20. mai 2012. a. 14:25 1.Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare, kovariatsioon, korrelatsioonikordaja. Definitsioonid ja arvutamine. Aritmeetiline keskmine: AVERAGE Mediaan: MEDIAN Kui N is paaritu, siis on mediaan järjestatud statistilise rea ehk variatsioonrea keskmine liige. Kui N on paaris, siis on mediaan variatsioonrea kahe keskmise liikme poolsumma. Kvartiilid: QUARTILE 25-protsentiili nimetatakse esimeseks kvartiiliks. Mediaan on 50-protsentiil ehk teine kvartiil. 75-protsentiili nimetatakse kolmandaks kvartiiliks. Mood: MODE Mood on arvrea suurima sagedusega liige.
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 69 10 76 79 84 41 15 87 44 49 38 16 58 7 24 19 82 1 40 38 35 87 51 1 69 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 44,80 Dispersioon: Excel: VAR Sx² = 814,417 Standardhälve: Excel: STDEV Sx = 28,538 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral.
Lõpliku kasutada siis, kui n/N>0,05 Kogumi keskväärtuse usalduspiirid - Suure (n>30) valimi korral on üldkogumi keskväärtuse usalduspiirid usaldatavusega β Kogumi keskväärtuse usalduspiirid lõpliku kogumi mahu N korral Usaldatavus - β näitab, millise tõenäosusega jääb kogumi keskväärtus usaldusvahemikuga antud piiridesse Usaldatavuse valik – kõige sagedamini 0,95, mõnikord 0,90 või 0,99. Ühe ja sama valimi korral suurem usaldatavus = laiem usaldusvahemik (suurem määramatus). Usaldusvahemiku poollaiuse sõltumine – usaldatavust saame valida, valimi mahtu saab muuta, standardhälvet muuta ei saa Kattuvad ja mittekattuvad usaldusvahemikud - kui vahemikud ei kattu, siis saab väita, et esineb erinevus. Kui kattuvad, siis ei saa väita, et esineb erinevus. Usaldusvahemiku määramise täpsus: Suhteline viga E= Väikesed valimid t-jaotus - Väikeste valimite korral valimite keskväärtuste jaotus erineb normaaljaotusest
Ex = E 1 n n n n (Ex1=µ, Ex2=µ, ... ,Exn=µ) 4. Üldkogumi keskmise vahemikhinnang (usaldusnivoole 1a vastav usaldusvahemik ). 1- on ühele lähedane arv, mida nim usaldusnivooks ja vahemikku x - -1 1 - ; x + -1 1 - sellele usaldusnivoole vastavaks 2 n 2 n usaldusvahemikuks ehk usaldusintervalliks. Usaldusvahemik on hinnatava parameetri vahemikhinnang. Praktikas ei ole tavaliselt üldkogumi dispersioon teada ja parameetrit lähendatakse valimstandardhälbega s. 1 s 2 , kus s 2 = n ( xi - x ) 2 on valimdispersioon n -1 i =1 Üldkogumi keskmise µ usaldusnivoole 1- vastav usaldusvahemik (ligikaudne): s s
xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: Me = 41 Haare: 2 Keskväärtuse usaldusvahemik: (35,08 ; 54,60) Dispersiooni usaldusvahemik: (536,45 ; 1410,64) 3. 3.1 t-statistik: t=0,90 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 44,84 27,97 - statistik: Järeldus: peab paika 4.2 0,022 - statistik:14,98 Järeldus:lükatakse tagasi 4
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 22 96 91 75 74 75 25 79 12 38 95 10 71 0 79 24 86 91 96 5 40 85 69 82 39 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=58,36 Dispersioon: Excel: VAR Sx²=1072,74 Standardhälve: Excel: STDEV Sx=32,75 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=74 Haare: =96-0=96 R=96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10
9 6,8 19,3 13,1 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,4 3,2 6,4 4,2 7,1 5,5 4,9 Lahenduse kontrollelemendid 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 51 Haare: 2 Keskväärtuse usaldusvahemik: (9,09 ; 44,15) Dispersiooni usaldusvahemik: (464,93 ; 1223,02) 3. 3.1 t-statistik: t= 0,61 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 53,24 25,68 - statistik: Järeldus: lükatakse tagasi 4.2 0,019 - statistik:22,39 Järeldus:lükatakse tagasi 4
OSA A 1. Leian 1.1 keskväärtuse 1 N µ^ = x = xi = 46, 2 N i =1 Excel: AVERAGE 1.2 dispersiooni 1 N ^ 2 = s 2 = ( xi - x )2 = 867,9 N - 1 i =1 Excel: VAR 1.3 standardhälbe sx = sx2 = 29, 46 Excel: STDEV 1.4 mediaani Me = 46 Excel: MEDIAN 1.5 haarde R = xmax - xmin = 99 - 0 = 99 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10, leian 2.1 keskväärtuse usaldusvahemikud P ( x - µ < µ < x + µ ) = p s 29, 46 µ = t1- ( f ) = 1, 7109 = 10, 29 2 N 24
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Mihkel Heinmaa | YAGB31 | sügis 2010 Osa A 1. Keskväärtus: Excel: AVERAGE Dispersioon: ( ) Excel: VAR Standardhälve: Excel: STDEV Mediaan:
uuritava tunnuse väärtuste vahemik tunnuse kõige tüüpilisemad väärtused tunnuse varieeruvus Lisaks aitab kirjeldav statistika sõnastada hüpoteese ning tõlgendada uurimistulemusi. Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust keskmisest) Need on dispersioon ja standardhälve. ASENDIKARAKTERISTIKUTE ARVUTAMINE 1.1. Tabuleerimata(rühmitamata) diskreetsed andmed Keskmine- näiteks KOKKU TOOTEID/NENDES ESINENUD VIGADE ARV. Näitetabelis= 2190/1500=1,46 viga on keskmiselt. X= /
Standardhälve = 2 = 814,4 = 28,54 Mediaan Me = 41 Variatsioonirea keskmine arv (juhul kui on tegemist paarituarvutlise valimiga) või kahe keskmise elemendi poolsumma (kui on tegemist paarisarvulise valimiga) (Lisaks saadav kasutades Exceli funktsiooni MEDIAN) Haare Valimi suurima ning väikseima elemendi vahe R = x max - x min R= 97 - 0 = 97 2. Jaotuse analüüs Võtan olulisuse nivooks = 0,10 ning eeldan normaaljaotust. Keskväärtuse usaldusvahemik 1) Keskväärtuse ja standardhälbe hinnangud: 1 N 1 N µ^ = xi = xi = 44,8 N i =1 25 i =1 1 N 1 N ^ 2 = s 2 = i N - 1 i =1 ( x - µ ^ ) 2 = ( xi - 44,8) 2 = 814,4 24 i =1 s= s 2 = 814,4 = 28,54 2) Valitud usaldustõenäosuse p ja vabadusastmete arvu f = N-1 järgi leitakse t- jaotuse
Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 62 Haare: R = 91 – 1 = 96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik: α = 0,10 t0,1; 24 = 1,7109 (Studenti tabelist) Dispersiooni usaldusvahemik: α = 0,10 ja on vastavalt: 13,8484 ja 36,4150 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10): 3.1. H0 : μ = 50 alternatiiviga H1 : μ 50 09 Et hüpotees vastu võetaks, peab tkr > t; 1,7109 > 0,2892.
2 x i−´x ) = 25−1 =772,46 Standarhälve s x =√ s x 2 = √ 772,46 = 27,79 Mediaan Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 39 Haare Haare on suurima ja vähima elemendi vahe R = xmax – xmin R = 98-1 = 97 2. Keskväärtuse ja dispersiooni usaldusvahemik (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik: sx sx ( P ´x −t 1−α / 2,N −1 ∙ √N < μ < ´x + t 1−α /2, N−1 ∙ √N ) =1−α
Standardhälve: 27,79 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestust: 1; 2; 5; 14; 18; 19; 25; 27; 31; 33; 37; 39; 39; 45; 46; 50; 56; 63; 65; 71; 74; 77; 83; 89; 98 Mediaan: 39 Haare: 98 1 = 97 2. Leian keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0.10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0.95(24) = 1.711 = 9.51 Keskväärtuse usaldusvahemik arvutatakse valemiga: P(34,77 < < 53,79) = 90% Dispersiooni usaldusvahemiku leidmiseks kasutatakse 2-statistikut f = N 1 = 24 P (509,10 < 2 < 1338,75) = 90% 3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24 Kriitiline t-statistiku väärtus t0.95(24) = 1.711
OSA A 1. Hindame valimi parameetreid Hindamiseks kasutame järgmised valemid: Keskväärtus: 44,12 Dispersioon: 673,44 Standardhälve: 25,95 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestuse: Mediaan: 51 Haare: 92-4= 88 2. Leiame keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0,10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0,95(24) = 1,7109 = 8,88 (poollaius) P(35,24 < < 53) = 0,9 Dispersiooni jaoks kasutame 2-statistikut f = N 1 = 24 20.95(24) = 36,415 20.05(24) = 13,848 P (443,9 < 2 < 1167,15) = 0,9 3. Kontrollime hüpoteese keksväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0,10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: t = 1,1329 f = N 1 = 24 Kriitiline t-statistiku väärtus t0,95(24) = 1,711 Kuna t < tkr, siis võtame hüpoteesi H0 vastu
jne) ja tahame teha järeldusi kogu üldkogumi kohta, ehk hinnata teoreetilisi jaotusparameetreid. Näiteks mööblitootja uurib toolide vastupidavust koormusele, selleks testitakse teatud arv toole (ei saa olla väga suur, sest testi käigus toode puruneb, lisaks ka uuring maksab) ja saatakse tunnuse purustav koormus väärtused. Aga katsetulemuste keskmine ei ole veel kogu toodangu keskmine vaid ainult hinnang sellele. Valimi keskväärtust tähistame x, Excelis funktsioon AVERAGE. Üldkogumi keskvääruse punktihinnanguks ongi valimi aritmeetiline keskmine. 1 n Valimi dispersiooni nihutamata hinnangut tähistame s2= n - 1 i =1 ( xi - EX ) 2 , Excelis funktsioon VAR.
f korrutis dispersiooni hinnanguga, aga jagatuna 2/2(f)-ga. 3. Eeldades, et kogum on normaaljaotusega ja et =0,10, kontrollisin hüpoteesi H 0: =50. Selleks arvutasin t-statistiku, jagades keskväärtuse hinnangu ja antud keskväärtuse vahe standardhälbe hinnanguga ja korrutades saadu ruutjuurega valimi mahust. Tabelist võtsin kriitilise kvantiili t1-/2(f), f=N-1, ja kuna t tkr, võetakse nullhüpotees 16 vastu. Kontrollimaks hüpoteesi H0: 2=800, leidsin 2-statistiku, korrutades f dispersiooni hinnanguga ja jagades saadu antud dispersiooniga. Tabelist võtsin kriitilised kvantiilid 2/2(f) ja 21-/2(f) ning kuna 2/2(f) 2 21-/2(f), siis võetakse nullhüpotees vastu. 4. Kontrollimaks Pearsoni 2-testi järgi olulisuse nivool = 0,10, et kogumi jaotuseks on