Me = = 55 2 Haare: R = xmax - xmin = 99 - 0 = 99 Mo = {94} Mood: 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : X -t < µ < X +t n n 30,90 30,90 53,92 -1,96 < µ < 53,92 +1,96 50 50 45,36 < µ < 62,48 Tõene standardhälve P=95% q=0,21 : Enne leida korrigeeritud standardhälve n ( x ) 2
ymax= 26364,6 Valimistandardhälve: 𝑠𝑥2 = 𝐷𝑋 = 25214411,49 𝑠𝑥 = 𝑠𝑥2 = 5021,395372 𝑥2 = 132343844,4 x̅²= 107942801,1 𝑠𝑦2 = 𝐷𝑌 = 41207276,62 𝑠𝑦 = 𝑠𝑦2 = 6419,289417 𝑦2 = 100730867,4 y̅²= 60852857,75 3. Leida 1-α = 0,95 ja 1-α = 0,99 korral usaldusvahemikud toidukulude ja eluaseme kulude üldkogumi keskmiste leibkonnaliikmete kohta. Mida sisuliselt tähendavad leitud usaldusvahemikud? Usaldusvahemikud toidukulude üldkogumi keskmiste leibkonna liikmete kohta b=0,95 ja b=0,99 𝑃(𝐸𝑋 ∈ 𝑥 − 𝜀𝛽 , 𝑥 + 𝜀𝛽 = 0.95 Tabelist F¯¹(0,95/2)=1,96 𝑠𝑥 −1 𝛽 𝜀𝛽 = Φ = 1767,663696 𝑛 2
olulisuse nivooks 11.1 Leida mudeli parameetrite hinnangud b0 ja b1 1 4,8 10,2 3,460 2 4,1 11,1 1,346 3 2,7 9,8 0,058 4 2,2 7,1 0,548 5 0,9 2,1 4,162 summa 2,94 8,06 9,572 11.2 Leida mudeli parameetrite hinnangute b0 ja b1 usaldusvahemikud 1 3,4 2,123 2 0,2 3,038 3 1,8 0,020 4 1,3 0,413 5 4,0 4,232 6 2,5 0,310 7 0,4 2,380 kokk 1,943 12,517 u Hinnangute usaldusvahemikud 11.3 Kontrollida mudeli liikmete olulisust
64; 1; 64; 40; 66; 66; 57; 13; 30; 49; 0; 68; 22; 73; 98; 20; 71; 45; 32; 95; 7; 70; 61; 22; 30; 84; 20; 89; 29; 32; 62; 55; 78; 55; 76; 11; 68; 71; 44; 98; 83; 52; 99; 54; 40; 32; 52; 48; 96; 62; 46; 31; 88; 73; 4; 61; 68; 75; 53; 31 Osa A. Hinnangud, usaldusvahemikud, statistilised hupoteesid ja jaotused. Korrastada algandmed arvreaks suuruse jargi ning hinnata eksed tabel 1 xi ni ni*xi ni*xi2 ni(xi-x)2 0 1 0 0 2816,0711 1 1 1 1 1 2710,93778 4 1 4 16 2407,53778
Rakendusstatistika arvestusharjutus. Osa A. N=25 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus Dispersioon Standardhälve Mediaan Me=49 Haare 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,71 Dispersiooni usaldusvahemik: = 0,10 ja 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > 0,6. Hüpotees võetakse vastu. H0: 2 = 800 alternatiiviga H2: 2 800
1. Valimi parameetrite hindamine. Kasutan järgmisi valemeid: Keskväärtus: 44,28 Dispersioon: 772,46 Standardhälve: 27,79 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestust: 1; 2; 5; 14; 18; 19; 25; 27; 31; 33; 37; 39; 39; 45; 46; 50; 56; 63; 65; 71; 74; 77; 83; 89; 98 Mediaan: 39 Haare: 98 1 = 97 2. Leian keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0.10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0.95(24) = 1.711 = 9.51 Keskväärtuse usaldusvahemik arvutatakse valemiga: P(34,77 < < 53,79) = 90% Dispersiooni usaldusvahemiku leidmiseks kasutatakse 2-statistikut f = N 1 = 24 P (509,10 < 2 < 1338,75) = 90% 3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10
23 1 95 95 1342,49 158,30 1342,49 25 2 96 192 2833,54 326,75 1416,77 25,00 58,36 1029,83 1719,89 22560,72 Leida selle valimi: Keskväärtus: Hinnang: Dispersioon: Hinnang: Standardhälve: Mediaan:Me = 74 järjestatud arvukogumi keskmine arv Haare: 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud. Eeldan, et üldkogum on normaaljaotusega ning võtan olulisuse nivooks = 0,10 Olulisuse nivoo ehk tõenäosus, et tegelik väärtus satub väljapoole usaldusvahemikku on 0,1. Seega usaldustõenäosus p = 1 = 1 0,1 = 0,9 ehk 90% k = n-1 = 24 näitab vabaduse astmeid. Dispersiooni usaldusvahemikud: leian - jaotuse täiendkvantiilid. Seda teen kasutades Exceli funktsiooni: Dispersiooni 90%-line usalduspiirkond on (679 ; 1791) Keskväärtuse usaldusvahemik:
N 1 1 Hinnang: σ^ =s = N −1 ∑ ( x i− x´ ) = 24 ∙ 19537,36 ¿ 814,057 2 2 2 i=1 Standardhälve: S= √ s = √ 814,056=28,53 2 Mediaan: Me = 41 – järjestatud arvukogumi keskmine arv Haare: R=x max −x min =87−1=86 2. Keskväärtuse ja dispersiooni usaldusvahemikud: Eeldan, et üldkogum on normaaljaotusega ning võtan olulisuse nivooks α = 0,10. Olulisuse nivoo ehk tõenäosus, et tegelik väärtus satub väljapoole usaldusvahemikku on 0,1. Seega usaldustõenäosus p = 1 – α = 1 – 0,1 = 0,9 ehk 90% Vabadusastmete arv k = n-1 = 24 2.1 Keskväärtuse usaldusvahemikud: t 0,95 ( 24 )=t ∝ ( k )=1,7109 1− 2 s 28,53
OSA A 1. Hindame valimi parameetreid Hindamiseks kasutame järgmised valemid: Keskväärtus: 44,12 Dispersioon: 673,44 Standardhälve: 25,95 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestuse: Mediaan: 51 Haare: 92-4= 88 2. Leiame keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0,10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0,95(24) = 1,7109 = 8,88 (poollaius) P(35,24 < < 53) = 0,9 Dispersiooni jaoks kasutame 2-statistikut f = N 1 = 24 20.95(24) = 36,415 20.05(24) = 13,848 P (443,9 < 2 < 1167,15) = 0,9 3. Kontrollime hüpoteese keksväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0,10 3.1 H0: = 50; H1: 50
Keskväärtus: Excel: AVERAGE x=45, 04 Dispersioon: Excel: VAR Sx²=1164,123 Standardhälve: Sx=34,1193 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=38 Haare: R=97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1
Keskväärtus: Excel: AVERAGE x=46,20 Dispersioon: Excel: VAR Sx²=867,9167 Standardhälve: Sx=29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 Haare: R=99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1
Sx² = = 814,0567 Standardhälve: Excel: STDEV Sx = 28,53 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=41 Haare: =96-0=96 R = 86 2. Küsimus Leida keskväärtuse ja dispersiooni usaldusvahemikud Eeldan, et üldkogum on normaaljaotusega ning võtan olulisuse nivooks = 0,10 Olulisuse nivoo ehk tõenäosus, et tegelik väärtus satub väljapoole usaldusvahemikku on 0,1. Seega usaldustõenäosus p = 1 = 1 0,1 = 0,9 ehk 90% k = n-1 = 24 näitab vabaduse astmeid. Dispersiooni usaldusvahemikud: leian - jaotuse täiendkvantiilid. Seda teen kasutades Exceli funktsiooni: Dispersiooni 90%-line usalduspiirkond on (536,45 ; 1410,64) Keskväärtuse usaldusvahemik:
1.2 dispersiooni 1 N ^ 2 = s 2 = ( xi - x )2 = 867,9 N - 1 i =1 Excel: VAR 1.3 standardhälbe sx = sx2 = 29, 46 Excel: STDEV 1.4 mediaani Me = 46 Excel: MEDIAN 1.5 haarde R = xmax - xmin = 99 - 0 = 99 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10, leian 2.1 keskväärtuse usaldusvahemikud P ( x - µ < µ < x + µ ) = p s 29, 46 µ = t1- ( f ) = 1, 7109 = 10, 29 2 N 24 Student'i teguri leidsin tabelist. P (46, 2 - 10, 29 < µ < 46, 2 + 10, 29) = 1 - 0,10 P (35,91 < µ < 56, 49) = 0,90 2.2 dispersiooni usaldusvahemikud ( N - 1) s2 ( N - 1) s2
käänupunktide kriteeriumi järgi. OSA B 10.Leida ühefaktoriline lineaarne regressioonimudel y = b0 + b1 x = 0,05 10.1 leida mudeli parameetrite hinnangud b0 ja b1 1 N b1 = ( xi - x )( yi - y ) Vx i=1 bo = y - b1 x x V on sisendi ruuthajuvus N Vx = ( xi - x ) 2 Vx = 9,752 i =1 Arvutused tegin Excelis b1 = 3,16 bo = 2,37 Lineaarne regressioonimudel: y = 2,37 +3,16 x 10.2 leida mudeli parameetrite hinnangute b0 ja b1 usaldusvahemikud P(b j - b j j b j + b j ) = 1 - b j = t ( w -1) s (b j ) 1- 2 s 2 ( y) N xi2 s 2 (b1 ) = s 2 (b0 ) = s 2 ( y ) Vx i =1 N V x Eelnevalt arvutatud Vx = 9,752 1 w s2 ( y) = w -1 r =1 ( y r - y0 ) 2 1 w y0 = yr
Excel: STDEV Sx = 28,538 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me = 41 Haare: R = 87 1 = 86 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja on arvutatavad Excel'i CHIIVN funktsiooniga ning on vastavalt: 33,196 ja 13,848 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1. H0: = 50 alternatiiviga H1: 50
Keskväärtus: Excel: AVERAGE x = 46,20 Dispersioon: Excel: VAR Sx² = 867,92 Standardhälve: Sx = 29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 46 Haare: R= 99 - 0 = 99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 Dispersiooni usaldusvahemik: = 0,10 ja (leidsin need Exceli CHIINV funktsiooni abil) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,645
Dispersioon: Excel: VAR Sx²=1072,74 Standardhälve: Excel: STDEV Sx=32,75 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=74 Haare: =96-0=96 R=96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) (Arvutatud excelis väärtuste ümardusi rakendamata) Usaldusvahemiku poollaius: 11,2 Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3
95 9 1780.84 f (vabadusaste) 24 10 104.04 11 852.64 t1-α/2(f) (t kvantiil) 1.7109 12 449.44 ∆μ (poollaius) 10.65 13 492.84 14 0.04 Keskväärtuse usaldusvahemikud 15 739.84 alumine 41.15 16 46.24 ülemine 62.45 17 1428.84 18 331.24 χ2α/2 0.05 19 2480.04 χ2 1-α/2 0.95 20 368.64
Keskväärtus: Excel: AVERAGE x=53,24 Dispersioon: Excel: VAR Sx²=705,69 Standardhälve: Sx=26,56 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=51 Haare: R=94-9=85 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (olulisuse nivoo = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 0,61. Hüpotees võetakse vastu. 3
Variant 23 0, 1, 4, 5, 6, 7, 10, 10, 11, 12, 12, 15, 20, 22, 24, 25, 25, 26, 27, 27, 31, 33, 38, 38, 39, 40, 43, 44, 44, 45, 46, 48, 52, 52, 55, 56, 56, 62, 62, 65, 69, 71, 71, 71, 74, 74, 75, 75, 79, 79, 80, 82, 85, 86, 87, 91, 91, 95, 96, 98 Dixon-test Rlow=(x3-x1)/(xn-2-x1), n=60 -> Rlow=(4-0)/(95-0)=4/95=0,042 < Dkr=0,35 Rhigh=(xn-xn-2)/(xn-x3) = (98-95)/(98-4)=3/94=0,0319 Osa A. Hinnangud, usaldusvahemikud, statilised hüpoteesid ja jaotused Tabel 1. Valim xi-juhuslik arv, ni xi kordumiste arv n=60 xmin=0 , xmax=98 xi ni ni*xi ni*xi2 ni(xi-x)2 2282,92 0 1 0 0 84 2188,36 1 1 1 1 84 1916,68 4 1 4 16 84
0, 1, 1, 4, 5, 5, 6, 7, 10, 10, 11, 12, 12, 15, 17, 20, 22, 23, 24, 25, 25, 25, 27, 33, 38, 38, 39, 39, 40, 43, 44, 44, 46, 52, 62, 62, 69, 69, 71, 71, 74, 74, 75, 75, 78, 78, 79, 79, 80, 82, 82, 85, 86, 87, 91, 91, 96, 96, 96, 98 Dixon-test Rlow=(x3-x1)/(xn-2-x1), n=60 -> Rlow=(1-0)/(96-0)=1/96=0,01 -> x1 ekse, sest et Rlow =0,01> Dkr=0,35 Osa A. Hinnangud, usaldusvahemikud, statilised h üpoteesid ja jaotused Tabel 1. Valim xi-juhuslik arv, ni xi kordumiste arv xmin=0, xmax=98 xi ni ni*xi ni*xi² ni(xi-x)² 0 1 0 0 2254.35 4320.78 1 2 2 2 1 4 1 4 16 1890.51 3609.10 5 2 10 50 1
DX = ni ( xi - x) S=30,23 n S = = D Scor=30,53 n Me= 49 S cor = D n -1 Haare 0-99 Me = x27 R = xmax - xmin Mo={13;66;73} x = 46,18 2. Usaldusvahemikud: Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : x -t < µ < x +t n n 30,53 30,53 46,18 -1,96 < µ < 46,18 +1,96 50 50 37,80 < µ < 54,56 Tõene standardhälve P=95% q=0,21 : S cor (1 -q ) < < S cor (1 +q ) 30,53(1 -0,21) < <30,53(1 +0,21) 24,12 < < 36,95 Tõene dispersioon P=95% q=0,21 : ( S cor (1 - q) ) 2
Veerg1 xi yi Veerg2 (x_i-x )^2 2,8 0,7 0,08 4,9 8,8 3,31 1,2 1,3 3,53 2,2 0,4 0,77 4,3 4,6 1,49 Keskmine 3,08 3,16 Kokku 9,19 9.2 Leida mudeli parameetrite hinnangute b0 ja b1 usaldusvahemikud. r yr-y0) 5,6 0,36 4,8 0,04 4,3 0,49 7,1 4,41 6,4 1,96 3,6 1,96 3,2 3,24 y0 5 Kokku 12,46 s 2 ( y ) = 2,077 Hinnangu b0 usaldusvahemik: Hinnangu b1 usaldusvahemik: 9.3 kontrollida mudeli liikmete olulisust
01298701 0.0125 0.01162791 0.01136364 0.01123596 0.01123596 0.01111111 0.0106383 0.0106383 0.01030928 0.01010101 Summa: 60 3093 200139 2.81784549 40694.85 Osa A. Hinnangud, usaldusvahemikud, statistilised hüpoteesid ja jaotused 1. Leida keskväärtuse (aritmeetiline, harmooniline, geomeetriline), dispersiooni, standardhälbe, mediaani, moodi ja haarde hinnangud Aritmeetiline keskmine ∑ 𝑥𝑖 ̅̅̅ 𝑥𝑘 = 𝑛 Harmooniline keskmine
Valim A mahuga N=25 variatsioonirida: 37 54 94 32 19 33 69 51 89 43 18 88 9 30 62 41 81 54 49 54 15 94 85 43 87 1.Leida keskvaartuse, dispersiooni, standardhalbe, mediaani ja haarde hinnangud. Keskväärtus: Dispersioon: Standardhälve:26,56 Mediaan: Me = 51 Haare: 2. Leida keskvaartuse ja dispersiooni usaldusvahemikud (eeldades uldkogumi normaaljaotust ning vottes olulisuse nivooks a = 0.10). 1.Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) P( 53,24 1,711<
N 1 Keskväärtus: ´x = N ∑ xi = 45,8 i=1 Dispersioon: N 1 s= 2 ∑ N−1 i=1 ( xi −´x ) 2 = 1073,2 Standardhälve: s= √ s2 = 32,8 Mediaan: Me = 44 (järjestatud arvurea keskmine arv) Haare: R=x max −x min =97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik P( ´x −∆ μ< μ< x´ + ∆ μ ) = P s t 0,95 ( 24 )❑=1,711 ∆ μ= ∙ t 0,95 ( 24 )=¿ √N 11,5 P= (45,8 – 11,5 ¿ μ<¿ 45,8 + 11,5) = P( 34,3 ¿ μ<57,3 ¿=0,9
DX = ni ( xi - x) 2 kontroll= 750,79 n S = = D S=27,40 n Scor=27,68 S cor = D n -1 Me= 55 x + x26 Me = 25 Haare 2-95 2 R = xmax - xmin Mo={18} 2. Usaldusvahemikud: Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : x -t < µ < x +t n n 27,40 27,40 52,12 -1,96 < µ < 52,12 +1,96 50 50 44,52 < µ < 59,72 Tõene standardhälve P=95% q=0,21 : S cor (1 - q ) < < S cor (1 + q ) 27,68(1 -0,21) < < 27,68(1 + 0,21) 21,87 < < 33, 49 Tõene dispersioon P=95% q=0,21 : ( S cor (1 - q) ) 2
s x² = 968,58 Standardhälve: s x = 31,12 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 62 Haare: R = 91 – 1 = 96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik: α = 0,10 t0,1; 24 = 1,7109 (Studenti tabelist) Dispersiooni usaldusvahemik: α = 0,10 ja on vastavalt: 13,8484 ja 36,4150 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10): 3.1. H0 : μ = 50 alternatiiviga H1 : μ 50
11. Leian ühefaktorilise lineaarse regressioonimudeli y = b0 + b1 x ja analüüsin selle täpsust (võttes vastavates testides jm arvutustes olulisuse nivooks = 0.05) 11.1 Leian mudeli parameetrite hinnangud b0 ja b1. xi 1,2 4,3 4,9 2,8 2,2 yi 1,3 4,6 8,8 0,7 0,4 11.2 Leian mudeli parameetrite hinnangute b0 ja b1 usaldusvahemikud. =5 Leian t-statistiku tabelist: f = 6 (korduskatsete sarja pikkus minus 1) t1-/2(f) = t0.975(6) = 2.447 Leian hinnangu b0 usaldusvahemiku: Leian hinnangu b1 usaldusvahemiku: 11.3 Kontrollin mudeli liikmete olulisust: 11.4 Kontrollin mudeli adekvaatsust: Selleks leian F-statistiku, mis näitab selle mudeli poolt prognoositud ja tegelike y väärtuste erinevust.
30 1 262,44 31 1 231,04 t,alfa,n-1 1,7108820799 32 2 201,64 32 2 201,64 ÜL 2 42 1 17,64 Usaldusvahemikkude arvutamine: 46 1 0,04 47 2 0,64 36,415028502 36,4150285018 47 2 0,64 Dispersiooni usaldusvahemikud: 48 1 3,24 _alumine^2 1 406,74 53 1 46,24 68 1 475,24 70 1 566,44 Keskväärtuse usaldusvahemikud: 75 2 829,44 Alumine piir 75 2 829,44 40,988580398 36,119337212 79 1 1075,84 94 1 2284,84
( )( ) ( ) Excel: SLOPE ( ) Excel: INTERCEPT 9.2 leida mudeli parameetrite hinnangute b0 ja b1 usaldusvahemikud. ( ) ( ) ( ) ( ) ( ) ( )
83 4.58 9.79 4.3 4.6 2.8 0.7 2.2 0.4 4.9 8.8 1.2 1.3 11.6) Regressiooni graafik ja prognoositud punktide usaldusvahemikud 12 10 8 6 f(x) = 2.0282977797x - 3.0871571615 4 5.6 2 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 -2
yˆ i y bxi b1 x y i i 2,09 x 2 i ei yi yˆ i 1 ˆ 2 n2 ei2 3,89 b0 y b x 1,93 Mudel : y 1,93 2,09 x 10.2 Mudeli parameetrite hinnangute b0 ja b1 usaldusvahemikud. 8,06 2,81 yT 8,06 2,81 ˆ 2 5,25 yT 10,87 ˆ y 0,88 n ˆ 2 0,05 ˆ b 0,64 n23 xi2
Matrikli Number = XXXX1, keskmisele palgale lisaks 1. Ülesanne 1 Hinnata üldkogumi keskmisi: keskmist palka, keskmist kulu spordile ja keskmist kulu meelelahutusele. Leida usaldusvahemikud keskmistele usaldusnivool 0,90 ja 0,99. Keskmise leidmiseks kasutasin valemit : OpenOffices vastas sellele funktsioon AVERAGE. Usaldusvahemike leidmiseks kasutasin funktsiooni CONFIDENCE, kuhu oli ühe argumendina vaja standardhälvet, mille sain funktsiooni STDEVP abil. Alpha on 1-β . Size on valimi suurus(50). Ülesanne 2 Hinnata mittesuitsetajate osakaalu üldkogumis (a) meeste seas, (b) naiste seas usaldusnivool 0,95.
Mediaan 9976,65 5798,32 Kvartiil (alumine) 7392,17 4205,52 Kvartiil (keskmine) 9976,65 5798,32 Kvartiil (ülemine) 13500,2 7510,58 9 Miinimum 3173,56 968,95 Maksimum 22577,2 18031,0 7 0 Standardhälve 5451,80 3820,09 3. Usaldusvahemikud Usaldusvahemik 1-α=0,95 V03C V34C algus 8433,71 4454,84 lõpp 13406,57 7939,34 Usaldusvahemik 1-α=0,99 V03C V34C 7541,45 3829,64 algus
24 Dispersioon (D) 678.25 Standardhälve (Sc) 26.04 Mediaan (Me) 48 Haare (R) 98 Parandatud standardhälve (Scp) 26.26 Mood 48 ja 58 (tabelist) Ül.2 Usaldusvahemikud Suurus t Laplace tabelist _x0016_(t) = γ/2 = 0,95/2 = 0,47, tabelist Keskväärtuse usaldusvahemik xk -t (Sc/√n ) < x < xk + t (Sc/√n ) 44.83 Standardhälbe usaldusvahemik Scp*sqrt((n-1)/x^2(0,95)) < σ < Scp*sqrt((n-1)/x^2(0,05)) 22.68 x^2(0,05)=43,19 ; x^2(0,095)=79,08 Dispersiooni usaldusvahemik Scp^2*(n-1)/x^2(0,95) < D < Scp^2*(n-1)/x^2(0,05) 506.03 Ül.3 Hüpoteeside kontroll 3
3227,17 0,52 x 2 i 6164,83 a y b x 25,17 0,5235 49,83 -0,92 yˆ y bxi 1 1 ei 2 2 11,48 2,87 n2 62 Regressioonimudel y= -0,92+0,52x 10.2 a ja b hinnangute usaldusvahemikud 2 2,87 b 0,022 x 6164,83 2 i x2 2 2,87 21065 A i
x 2 i 7074,85 a y b x 30,14 0,618 47,8 0,59 y^ y bxi 1 1 ei 2 2 34 6,8 n2 72 Regressioonimudel y= 30,14+0,618x 10.2 a ja b hinnangute usaldusvahemikud 2 6,8 b 0,031 xi 7074,85 2 2 xi 2 6,8 23107 A 1,781
18. Usaldusnivoo näitab uurijale kuivõrd kindel ta võib olla tulemuste kehtivuses. Seda väljendatakse protsentides, mis näitab kehtivuse tõenäosust. Seega 95%-lise usaldusnivoo korral võib uurija olla kindel, et 95% tulemustest kehtivad kogu uuritavas populatsioonis ja 5%-il juhtudel mitte 19. Andmete põhjal saab leida standardhälbe, dispersioon, moodi, mediaani, aritmeetilise keskmise. Samuti saab leida mõõtemääramatuse ja usaldusvahemikud. Nende põhjal saab analüüsida mõõtetehnikat ja mõõtmisviisi. Saab leida, miks tekkisid sellised vead ja kuidas neid järgmistes katsetes miinimumini viia 20. Mõõtemetoodikas muudaksin seda, et puhastaksin peale iga uut proovi anuma ja valaksin sinna iga kord uue värske proovi, mis ei oleks õhu käes seisnud. Teeksin nii, et tingimused igale proovile oleksid samad, siis võivad ka tulemused väiksemas vahemikus kõikuda ning usaldusvahemik oleks väiksem.
Osa B. Mõõtetulemuste hinnangud, usaldusvahemikud ja statistiline jaotumine 3. Leida detaili mõõtme B keskväärtus ning standardhälve. keskväärtus standardhälve Mõõtme B väärtused [mm] B1 20,063 20,121 20,163 20,182 20,105 20,106 20,039 20,153 20,063 20,03 B2 20,049 20,083 20,123 20,134 20,071 20,136 20,079 20,152 20,128 20,096 B3 20,133 20,026 20,084 20,111 20,1 20,071 20,117 20,1 20,14 20,045 B4 20,117 20,087 20,084 20,12 20,045 20,1 20,176 20,084 20,101 20,049 B5 20,072 20,095 20,09 20,053 20,124 20,073 20,134 20,127 20,071 20,1 (xi - x)2 B1 0,0012 0,0005 0,0042 0,0070 0,0000 0,0001 0,0035 0,0030 0,0012 0,0046 B2 0,...
5344 4.4944 0.0324 0.6084 1.8376 x*y 48.47 7.92 98.43 24.92 14.96 ^y =b 0+ b1 x N ∑ ( x i− x´ ) ( y j− ´y ) b1= i=1 N =¿ 3,25 2 ∑ ( x i−´x ) i=1 b0 = ´y −b 1 ∙ ´x =1,36 Regressioonimudel y=1,36+3,25x 11.2 Leida mudeli parameetrite hinnangute b0 ja b1 usaldusvahemikud. P ( b j−∆ b j ≤ β j ≤ b j+ ∆ b j )=1−α ∆ b j=t α ( W −1 ) ∙ s ( b j ) 1− 2 2 2 s ( y) s ( b1 )= N ∑ ( x i−´x )2 i=1 W 1 2 s ( y )= ∑
· Väiksem on tunnuse hajuvus · Suurem on valimi maht · Väiksem on usaldusnivoo · Usaldusvahemiku puhul on tegemist tunnuse väärtuste piirkonnaga, kus teatud tõenäosusega asub üldkogumi tegelik keskmine. · Täpset üldkogumi keskmise asukohta me enamasti ei tea. · Kuidas saada teada, kas keskmised erinevad piisavalt palju, et kinnitada gruppide erinevust ka üldkogumil? 1. võimalus: vaadata, kas usalduspiirid kattuvad. Kui usaldusvahemikud ei kattu, siis võime öelda, et (valitud nivool) on tegemist statistiliselt olulise erinevusega. · Kui usaldusvahemikud kattuvad, siis tuleb kõne alla võimalus, et üldkogumi keskmine mõlema tunnuse (või grupi) puhul samas kohas. 2. võimalus: Hüpoteeside kontrollimine · Statistiliseks hüpoteesiks nimetatakse mis tahes oletust otseselt või kaudselt kas üldkogumi jaotuse kohta tervikuna või jaotuse mõne parameetri (näiteks keskmise)
e e ^y =b 0+ b1 x N ∑ ( x i− x´ ) ( y j− ´y ) b1= i=1 N =3,16 2 ∑ ( x i−´x ) i=1 b0 = ´y −b 1 ∙ ´x =2,37 Regressioonimudel: ^y =2,37+ 3,16 x 11.2. Leida mudeli parameetrite hinnangute b0 ja b1 usaldusvahemikud r 3,1 4,4 4,7 4,9 5,5 3,7 7,4 y̅ 0 4,81 s²(y) 1,92 W 1 1
olemasoleva lähteinfo põhjal ei olnud võimalik leida). 10. Heteroskedastiivsusega on tavaliselt tegemist siis: a) parameetrite hinnangud on lineaarsed nihketa hinnangud, kuid nad ei ole parimad, st nad ei ole vähima dispersiooniga b) standardvead ei ole korrektsed ja seega ei ole korrektsed ka parameetrite hinnangute usaldusvahemikud. Fkriteeriumi hinnang ei pruugi olla õige; c) mudel võib viia uurija valedele järeldustele, kui tegemist on statistiliste hüpoteeside kontrollimisega. Kasutatakse graafilist analüüsi. Juhuslik liige ehk jääkliige ui on juhuslik suurus, mille keskväärtus ehk matemaatiline ootus on võrdne nulliga. E (ui) = 0. Kui juhuslike liikmete dispersioon pole konstantne ning tema jaotus oleneb Xst, on tegemist heteroskedestatiivsusega
s2 ad 3,11 F 1,428 f1 3 f2 6 Fkr 4,760 adekvaatne x 1 3 5 s y progn 1,17 0,66 1,18 d y progn 2,86 1,61 2,90 y min p 1,76 9,51 14,74 y progn 4,62 11,13 17,63 y max p 7,47 12,74 20,53 Regressiooni graafik ja prognoositud punktide usaldusvahemikud 25,00 20,00 mitteoluline f(x) = 3,2548976926x + 1,3604048759 15,00 10,00 5,00 0,00 0,5 1 1,5Row 3 2 Linear Regression 2,5 3 Row 3 3,5 for Row 31 4 4,5 5 5,5
usaldusnivoost, mille me valime (e. Teistpidi sellest, lui palju lubame endale järelduste tegemisel eksimist) 2. tunnuse hajuvusest 3. valimi mahust Usaldusvahemik on seda laiem, mida: suurem on tunnuse hajuvus väiksem on valimi maht suurem on usaldusnivoo Keskmiste erinevus kuidas saada teada, kas keskmised erinevad statistiliselt olulisel määral? - 1. võimalus: vaadata, kas usalduspiirid kattuvad - praegustes näidetes usaldusvahemikud ei kattu, seega on erinevus stat oluline T-test test kahe keskmise väärtuse võrdlemiseks kui soovime üldistada tulemusi valimit üldkogumile, on eelduseks, et tunnus oleks mõlemas gruppis normaaljaotusega kui tegemist on üldkogumi uuringuga, siis normaaljaotuse eeldust ei ole vaja est ja m-est keskmiste abiellumisvanuste võrdlus. Nägime, et est ja m-
4 3,8 9,4 0,92 2,58 5 3,2 5,1 0,32 -1,72 keskväärtused 2,88 6,82 0,927071 b1 > b => oluline b0 < b => oluline siooni graafik ja prognoositud punktide usaldusvahemikud 5043x - 1,4336062523 1,5 2 2,5 3 3,5 4 4,5 5 5,5 Row 5 Linear Regression for Row 5 Row 42 Row 43 Row 44 1,5 2 2,5 3 3,5 4 4,5 5 5,5 Row 5 Linear Regression for Row 5 Row 42 Row 43 Row 44 (x-xkesk)^2 (y-ykesk)^2 (x-xkesk)(y-ykesk) 4,3264 16,9744 8,5696 4,0804 57,4564 15,3116
mudeli põhjal prognoositud väärtuste vahel oleksid minimaalsed nende erinevuste ruutude summa minimeerimise mõttes. Mudeli analüüs 1)Katse dispersiooni leidmine (Sobivaimaks lähenemisviisiks väljundi y dispersiooni hindamiseks on enamasti eraldi korduskatsete seeria läbiviimine mingi suvalise, ent fikseeritud sisendi x väärtuse juures) 2) Mudeli parameetrite hinnangute ja mudeli väljundi prognoosi dispersioon ja usaldusvahemikud (põhinevad t-statistiku kasutamisel) 3) Mudeli liikmete olulisuse kontroll (kui tekib kahtlus, kas sisend X mõjutab väljundit Y, kas vabaliige b0 erineb nullist) 4) Mudeli adekvaatsuse kontroll (kontrollitakse, kas mudel tervikuna on katseandmetega kooskõlas, levinuim viis on adekvaatsustest, kus adekvaatsusdispersiooni võrreldakse väljund dispersiooniga vastava F-statistiku abil) 5) Jääkide analüüs. Lisamärkused (vahed katsest saadud väljundiväärtuste ja mudeli poolt
F-statistik on sad2 N ( y i-( b 0 +b1 xi ) )2 ja s2(y) jagatis. Adekvaatsusdispersioon s 2ad = i=1 =5,49, kus N=5, N-d d=2. Tabelist Fkr=F1-(f1;f2), f1=N-d, f2=w-1, FFkr ja H0 järgi võib mudelit lugeda katseandmetega kooskõlas olevaks. Leidmaks mudeli poolt prognoositava väljundi usaldusvahemikud punktides x = 1, x=3 ja x = 5, tuleb leida prognoositava väljundi dispersioon x x ^y|¿ ^y|¿ ning usaldusvahemik . s¿ ^y |x =t 1- /2 ( w-1 )s ¿ 20
Kogumi keskväärtuse usalduspiirid lõpliku kogumi mahu N korral Usaldatavus - β näitab, millise tõenäosusega jääb kogumi keskväärtus usaldusvahemikuga antud piiridesse Usaldatavuse valik – kõige sagedamini 0,95, mõnikord 0,90 või 0,99. Ühe ja sama valimi korral suurem usaldatavus = laiem usaldusvahemik (suurem määramatus). Usaldusvahemiku poollaiuse sõltumine – usaldatavust saame valida, valimi mahtu saab muuta, standardhälvet muuta ei saa Kattuvad ja mittekattuvad usaldusvahemikud - kui vahemikud ei kattu, siis saab väita, et esineb erinevus. Kui kattuvad, siis ei saa väita, et esineb erinevus. Usaldusvahemiku määramise täpsus: Suhteline viga E= Väikesed valimid t-jaotus - Väikeste valimite korral valimite keskväärtuste jaotus erineb normaaljaotusest. t-jaotuse kuju sõltub vabadusastmete arvust ν. Vabadusastmete arv on sõltumatute muutujate arv. Valimi standardhälbe leidmisel vabadusastmete arv v=n-1. Väikese valimi korral