68 88 1 88 7744 1748,91 68 95 1 95 9025 2383,39 70 97 1 97 9409 2582,67 71 98 1 98 9604 2685,31 73 99 1 99 9801 2789,95 73 Summa 50 2309 152315 45685,38 73 75 xk 46,18 Keskväärtuse usaldusvahemik: 37,80 usaldusvahemik: 24,12 << 86 S 30,23 88 Scor 30,53 Standardhälbe usaldusvahemik: 24,12 ² << 95 Me 49 97 Haare 0-99 t P q 98 Mo {13;66;73} 1,96 0,05 95% 0,21 99
Residual 33 44408828,2678 1345722,069 Total 34 441905065,649 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0%Upper 95,0% Intercept 429,600229 245,692413075 1,748528673 0,0896708332 -70,264741368 929,4651993 -70,26474 929,4651993 X Variable 1 0,73444368 0,0427336191 17,18655467 4,96971E-018 0,6475014786 0,821385881 0,647501 0,821385881 90% Usaldusvahemik Usaldusvahemik: Alumine piir Ülemine piir Tulu: 2 112,47 ; 4 663,98 Kulu: 1909,95705 ; 3885,80581 Palk: 3406,73204 ; 8467,7251 Lineaarse Regressiooni sirge võrrand: y = b0+b1*x kus Kulu = f(Tulu) 25 000 f(x) = 0,735478618x + 398,9824244106 20 000 15 000 Kulu
Excel: STDEV Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Haare: 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks =0,10. Keskväärtuse usaldusvahemik: ( ) = 0,10 t, N-1 on arvutatav Exceli TINV funktsiooniga: 1,711 (või leida Studenti tabelist) ( )
1) Üldkogumi keskmise µ hinnang on valimkeskmine: x tulu = 3 385,23 x kulu = 2 894,88 x palk = 5 937,23 , keskmiste saamiseks kasutatud valemit AVERAGE. 95% usaldusvahemik üldkogumi keskmisele: kus: n valimi maht valimstandardhälve Usaldusnivoo 0,95 puhul Tulu Kulu Palk (1842,85, 4927,61) (1700,49, 4089,27) (2877,88, 8996,58) Näiteks tulu puhul kasutatud valemit (AVERAGE(E2:E36) 1,96*(STDEV(E2:E36)/SQRT(COUNT(E2:E36)) , AVERAGE(E2:E36) + 1,96*(STDEV(E2:E36)/SQRT(COUNT(E2:E36)) NB
Usaldatavuse vahemik: 21,1 21,1 177,6− ∗2,23< E lk 0 <177,6+ ∗2,23 ⟹162,7< Elk 0 <192,4 √ 10 √ 10 4. TULEMUSTE ANALÜÜS Mõõtmiste käigus tutvusime lähemalt õlide elektriliste tugevustega, katseteks kasutati kahte tundmatute parameetritega isoleerõli. Mõõtetulemuste analüüsi põhjal saab järeldada joonise 2.1. alusel, et esimese 5 katse põhjal on õli läbilöögi usaldusvahemik 5,1-st 173,9 kV-ni ja keskmine läbilöögitugevus on 89,5kV/cm. Kuna kasutame tulemuste andmiseks ainult 5 mõõtetulemusi , siis selle põhjal on 10 määramatus väga suur. 10 mõõtmise põhjal jääb usaldusvahemik 60,5 kuni 160,3 kV vahele ja keskmine läbilöögi pinge on 110,4kV/cm. Kuna katsemõõtmise väärtused kõiguvad suures
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Keskväärtus =46,20 Dispersioon =867,91 Standardhäve =29,46 Mediaan Me=46 Haare R = xmax xmin = 99 0 = 99 2. Keskväärtuse usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 on arvutatav Exceli TINV funktsiooniga: 1,711 Dispersiooni usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja on arvutatav Exceli CHIINV funktsiooniga, ning on vastavalt: 36,415 ja 13,843 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > -0,645. Seega hüpotees H0 võetakse vastu. 3
algandmetes: 2 mittejuhusliku komponendi olemasolu, dispersioonanalüüs F-statistik. järeldus: homogeensus hüpotees ei kehti tulpades 5 ja 8 (vt. tabel 1 ) 4 Keskväärtus: dispersioon: Standardhälve: Mediaan: 37,5 0,069 0,262 37,48 Keskväärtuse Standardhälbe usaldusvahemik usaldusvahemik 37,44 < 37,50 < 0,224 < 0,262 < 0,299 37,55 5 Normaaljaotuse võimalikkuse hindamine, hii ruut-statistik Järeldus: 26, 11, tegemist ei ole normaaljaotusega, kuna leitud väärtus ületab kriitilise väärtuse (edaspidistes arvutustes arvestan, et on siiski tegemist normaaljaotusega)
9 6,8 19,3 13,1 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,4 3,2 6,4 4,2 7,1 5,5 4,9 Lahenduse kontrollelemendid 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 51 Haare: 2 Keskväärtuse usaldusvahemik: (9,09 ; 44,15) Dispersiooni usaldusvahemik: (464,93 ; 1223,02) 3. 3.1 t-statistik: t= 0,61 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 53,24 25,68 - statistik: Järeldus: lükatakse tagasi 4.2 0,019 - statistik:22,39 Järeldus:lükatakse tagasi 4
Vastavalt tabelile, antud sagedustele vastav arv on ,,6". Osa III Takistusmagasiniga Valimistoon I II III IV V Rvalimistoon kaob [] 6540 6557,4 6551,9 6559,4 6565,2 Rvalimistoon tagasi [] 6539,9 6557,3 6551,7 6559 6565,2 Rvalimistoon kaob []=R1 Rvalimistoon tagasi []=R2 Mõõtetulemustest arvutada mõõtetulemuse keskväärtus, hajuvus, mõõtmiste usaldatavus ja usaldusvahemik. Keskväärtus: R1: x = (6540+6557,4+6551,9+6559,4+6565,2)/5 = 6554,8 R2: x = (6539,9+6557,3+6551,7+6559+6565,2)/5 = 6554,6 Hajuvuse leidmiseks arvutan dispersiooni: R1: = = = = = 8,53 R2: = = = = = 8,53 Leian hajuvuse valemi järgi : v = *100 R1: v = = 0,13 R2: v = = 0,13 Leian mõõtmiste usaldusvahemiku, selleks kasutan usaldatavust 95% Valemi järgi usaldusvahemik : ( x 1,96 ; x +1,96 )
x=45, 04 Dispersioon: Excel: VAR Sx²=1164,123 Standardhälve: Sx=34,1193 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=38 Haare: R=97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,7268. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800
3-kvartiil 15236 10847 minimaalne väärtus 858 2029 maksimaalne väärtus 29320 46492 standardhälbe (S) 5678 8498 E(β=0,95) 1697 2540 min 10936 6893 max 14330 11973 Usaldusvahemik β=0,95 (10936;14330) (6893;11973) E(β=0,99) 2251 3369 min 10381 6064 max 14884 12803 Usaldusvahemik β=0,99 (10381;14884) (6064;12803) E(β=0,95) 1749 2618 min 10884 6815
x=46,20 Dispersioon: Excel: VAR Sx²=867,9167 Standardhälve: Sx=29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 Haare: R=99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,6449. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 D=2
Standardhälve = 2 = 814,4 = 28,54 Mediaan Me = 41 Variatsioonirea keskmine arv (juhul kui on tegemist paarituarvutlise valimiga) või kahe keskmise elemendi poolsumma (kui on tegemist paarisarvulise valimiga) (Lisaks saadav kasutades Exceli funktsiooni MEDIAN) Haare Valimi suurima ning väikseima elemendi vahe R = x max - x min R= 97 - 0 = 97 2. Jaotuse analüüs Võtan olulisuse nivooks = 0,10 ning eeldan normaaljaotust. Keskväärtuse usaldusvahemik 1) Keskväärtuse ja standardhälbe hinnangud: 1 N 1 N µ^ = xi = xi = 44,8 N i =1 25 i =1 1 N 1 N ^ 2 = s 2 = i N - 1 i =1 ( x - µ ^ ) 2 = ( xi - 44,8) 2 = 814,4 24 i =1 s= s 2 = 814,4 = 28,54 2) Valitud usaldustõenäosuse p ja vabadusastmete arvu f = N-1 järgi leitakse t- jaotuse
xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: Me = 41 Haare: 2 Keskväärtuse usaldusvahemik: (35,08 ; 54,60) Dispersiooni usaldusvahemik: (536,45 ; 1410,64) 3. 3.1 t-statistik: t=0,90 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 44,84 27,97 - statistik: Järeldus: peab paika 4.2 0,022 - statistik:14,98 Järeldus:lükatakse tagasi 4
või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me = 41 Haare: R = 87 1 = 86 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja on arvutatavad Excel'i CHIIVN funktsiooniga ning on vastavalt: 33,196 ja 13,848 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1. H0: = 50 alternatiiviga H1: 50 1 Et hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,911
x = 46,20 Dispersioon: Excel: VAR Sx² = 867,92 Standardhälve: Sx = 29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 46 Haare: R= 99 - 0 = 99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 Dispersiooni usaldusvahemik: = 0,10 ja (leidsin need Exceli CHIINV funktsiooni abil) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,645. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800
87 482 1 55-64 8785.71 2233.66 0.00 495 1 55-64 10160.70 3804.37 0.00 5000.00 1 Aritmeetiline keskmine 15606.06 8489.20 Mediaan 14674.20 7360.44 Kvartiil - 0,25 9129.46 4491.30 Kvartiil - 0,75 23681.97 11566.01 Minimaalne väärtus 918.57 2233.66 Maksimaalne väärtus 35186.76 19756.80 Standardhälve 9168.39 5193.27 Usaldusvahemik 0,95 3831.16 2170.09 Usaldusvahemik 0,99 2103.95 1191.75 Korrelatsioonikordaja 0.23 Hajuvusdiagramm 25000.00 20000.00 15000.00 10000.00 f(x) = 0.1286873983x + 6480.8966583674 5000.00 0.00 0.00 5000.00 10000.00 15000.00 20000.00 25000.00 30000.00 35000.00 40000.00 V03C Kood_I Sugu Vanusgrupp V03C V34C
Aritmeetiline keskväärtus:
xk=(xi*ni)/n= 53,07
Harmooniline keskväärtus:
Xk=n/(1/xi)= 26,39
Geomeetriline keskväärtus
xk=(x1*...*xn)^(1/n)= 39,43
Dispersioon
Dx=[ni(xi-xk)2]/n= 68,01
Standardhälve
S=Dx= 26,17
Mediaan: 55
Mood: arvud 32 ja 68 esinevad 3 korda
Haarde hinnangud: 99-0= 99
2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel,
et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks =0,05
Keskväärtuse usaldusvahemik: P=95% korral t=2
46,31 << 59,82
Standardhälbe usaldusvahemik:
q=0,3
18,48 < < 34,31
Dispersiooni usaldusvahemik:
q=0,3
341,34 < < 1177,26
3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on
normaaljaotus ja
olulisuse nivooks on =0,05
3.1 H0: = 50 alternatiiviga H1: 50
T-kriteerium
Sc= 26,39
tEMP= (53,06666667--50)* 60)/ 26,39= 0,90
tKR=2
tEMP
Mediaan 9976,65 5798,32 Kvartiil (alumine) 7392,17 4205,52 Kvartiil (keskmine) 9976,65 5798,32 Kvartiil (ülemine) 13500,2 7510,58 9 Miinimum 3173,56 968,95 Maksimum 22577,2 18031,0 7 0 Standardhälve 5451,80 3820,09 3. Usaldusvahemikud Usaldusvahemik 1-α=0,95 V03C V34C algus 8433,71 4454,84 lõpp 13406,57 7939,34 Usaldusvahemik 1-α=0,99 V03C V34C 7541,45 3829,64 algus 14298,83 8564,55
Parandatud standardhälve (Scp) 26.26 Mood 48 ja 58 (tabelist) 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud (intervallhinnangud) eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks α=0,05 ehk P = 0,95 Keskväärtuse usaldusvahemik 𝑆𝑐 𝑆𝑐 ̅̅̅ − 𝑡 ∙ 𝑥𝑘 ̅̅̅ + 𝑡 ∙ ≤ 𝑥̂ ≤ 𝑥𝑘 √𝑛 √𝑛 t975=t(60; α=0,05; kahepoolne) =2,000 Keskväärtuse usaldusvahemik 44
Sx=32,75 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=74 Haare: =96-0=96 R=96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) (Arvutatud excelis väärtuste ümardusi rakendamata) Usaldusvahemiku poollaius: 11,2 Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1
x=53,24 Dispersioon: Excel: VAR Sx²=705,69 Standardhälve: Sx=26,56 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=51 Haare: R=94-9=85 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (olulisuse nivoo = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 0,61. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800
Rühmadevaheline dispersioon: F-statistik kui rühmadevahelise ja rühmadesisese dispersiooni suhe: Nullhüpoteesi vastu võtmiseks peab . Seega võetakse nullhüpotees vastu. Keskväärtused on hüpoteesi põhjal homogeensed. Keili Kajava Osa B 9. keskmine x 2,2 2,7 4,8 0,9 4,1 2,94 y 7,1 9,8 10,2 2,1 11,1 8,06 9.1 9.2 Usaldusvahemiku leidmine: Keili Kajava Hinnangu b0 usaldusvahemik: Hinnangu b1 usaldusvahemik: 9.3 Kuna , siis seda mudeli liiget võib lugeda mitteoluliseks Kuna , siis seda mudeli liiget võib lugeda oluliseks. 9.4 Kuna (4,53 > 1,40), siis võib lugeda mudelit katseandmetega kooskõlas olevaks. 9.5 x=1 x=3 x=5 Keili Kajava 9.6 Regressioonisirge graafik
Rakendusstatistika arvestusharjutus. Osa A. N=25 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus Dispersioon Standardhälve Mediaan Me=49 Haare 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,71 Dispersiooni usaldusvahemik: = 0,10 ja 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > 0,6. Hüpotees võetakse vastu. H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,2< 36,42. Hüpotees võetakse vastu. 4
𝑃(𝐸𝑋 ∈ 𝑦 − 𝜀𝛽 , 𝑦 + 𝜀𝛽 = 0.99 Tabelist F¯¹(0,99/2)=2,60 𝑠𝑥 −1 𝛽 𝜀𝛽 = Φ = 2997,639878 𝑛 2 𝑦 − 𝜀𝛽 , 𝑦 + 𝜀𝛽 = (7800,8242-2997,6399 ; 7800,8242+2997,6399)= (4803,1843 ; 10798,4640) Leitud usaldusvahemik näitab sisuliselt, et usaldusvahemik usaldusnivool vastavalt b=0,95 ja b=0,99, et keskväärtus langeb leitud piirkonda. 4. Kas toidukulude ja eluasemekulude vahel on seos? Arvutada korrelatsioonikordaja, joonistada hajusdiagramm ja kirjutada välja regressiooniserge. 𝑛 ∗ 𝐾𝑥,𝑦 ≈ 𝑐𝑜𝑣 𝑋, 𝑌 = 𝑥𝑦 − 𝑥 𝑦 = 4246086,872 ≠ 0 𝑛−1
Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 62 Haare: R = 91 – 1 = 96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik: α = 0,10 t0,1; 24 = 1,7109 (Studenti tabelist) Dispersiooni usaldusvahemik: α = 0,10 ja on vastavalt: 13,8484 ja 36,4150 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10): 3.1. H0 : μ = 50 alternatiiviga H1 : μ 50 09 Et hüpotees vastu võetaks, peab tkr > t; 1,7109 > 0,2892.
¿ Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Mood tunnuse kõige sagedamini esinev väärtus Haare R = xmax xmin = 99 4 = 95 2. Leian keskväärtuse, dispersiooni ja standardhälbe usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,05 ehk P= 95% Keskväärtuse usaldusvahemik: sx sx ( P ´x -t , N-1 N < < ´x +t , N -1 N ) =1- s = t 0,95 ( 24 )
F-statistik kui rühmadevahelise ja rühmadesisese dispersiooni suhe: Nullhüpoteesi vastu võtmiseks peab . Seega võetakse nullhüpotees vastu. Keskväärtused on hüpoteesi põhjal homogeensed. 11 Keili Kajava Osa B 9. keskmine x 2,2 2,7 4,8 0,9 4,1 2,94 y 7,1 9,8 10,2 2,1 11,1 8,06 9.1 9.2 Usaldusvahemiku leidmine: 12 Keili Kajava Hinnangu b0 usaldusvahemik: Hinnangu b1 usaldusvahemik: 9.3 Kuna , siis seda mudeli liiget võib lugeda mitteoluliseks Kuna , siis seda mudeli liiget võib lugeda oluliseks. 9.4 13 Keili Kajava Kuna (4,53 > 1,40), siis võib lugeda mudelit katseandmetega kooskõlas olevaks. 9.5 x=1 x=3 x=5 14 Keili Kajava 9.6
68 88 1 88 7744 1748,91 68 95 1 95 9025 2383,39 70 97 1 97 9409 2582,67 71 98 1 98 9604 2685,31 73 99 1 99 9801 2789,95 73 Summa 50 2309 152315 45685,38 73 75 xk 46,18 Keskväärtuse usaldusvahemik: 37,80 usaldusvahemik: 24,12 << 86 S 30,23 88 Scor 30,53 Standardhälbe usaldusvahemik: 24,12 ² << 95 Me 49 97 Haare 0-99 t P q 98 Mo {13;66;73} 1,96 0,05 95% 0,21 99
yi 6,9 6,1 9,8 7,2 15,3 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 1,3 0,2 0,7 4,2 3,6 2,6 1,9 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 74 Haare: 2 Keskväärtuse usaldusvahemik: (47,38 ; 69,34) Dispersiooni usaldusvahemik: (679 ; 1791) 3. 3.1 t-statistik: t=1,3 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 58 30,5 - statistik: Järeldus: lükatakse tagasi 4.2 0,017 - statistik: 31,46 Järeldus:lükatakse tagasi 4
· Eksimist tulemuste üldistamisel valimilt üldkogumile me täielikult vältida ei saa. Seepärast kehtestatakse lubatava eksimise piir ehk usaldusnivoo. · Näiteks usaldusnivoo 95% tähendab, et lubame endale järeldustes eksimist maksimaalselt 5%. Sel juhul on 5%. · Normaaljaotusega tunnuse puhul on teada, milliste punktide vahel on 95% tunnuse väärtustest (umbes keskmine +/- 2 standardhälvet). Usaldusvahemik on seda laiem, mida: · Suurem on tunnuse hajuvus · Väiksem on valimi maht · Suurem on usaldusnivoo Usaldusvahemik on seda kitsam, mida: · Väiksem on tunnuse hajuvus · Suurem on valimi maht · Väiksem on usaldusnivoo 9) Hüpoteeside kontrollimine. · 2. võimalus: Hüpoteeside kontrollimine · Statistiliseks hüpoteesiks nimetatakse mis tahes oletust otseselt või kaudselt kas
Keskväärtus N 1 ´x = N ∑ xi i=1 ´x =53,24 Dispersioon N 1 s x 2= ∑ N−1 i=1 ( x i−´x )2 s x 2 =705,69 Standardhäve s x =√ s x 2 s x =26,56 Mediaan Me=51 Haare R = xmax – xmin = 94 – 9 = 85 2. Keskväärtuse μ usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: sx s ( P ´x −t α , N−1 ∙ √N ) < μ< ´x +t α , N −1 ∙ x =1−α √N tα, N-1 on arvutatav Exceli TINV funktsiooniga: t=1,711 P ( 44,15< μ<62.33 ) =0 , 90
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Andmete kood: 248199 Osa A 1. Keskväärtus Dispersioon Standardhälve Mediaan Haare 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks leian usaldus- vahemikud. Keskväärtuse usaldusvahemik on arvutatud MS Exceli TINV-funktsiooniga: Dispersiooni usaldusvahemik ja on arvutatud MS Exceli CHIINV-funktsiooniga 3. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks kontrollin hüpoteese 3.1 alternatiiviga Et hüpotees vastu võetaks peab seega hüpotees võetakse vastu. 3.2 alternatiiviga Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4
Valim II Arvestades uuringuprotseduuril tekkivaid kõrvalekaldumisi esialgsest kavast kasutatakse veel mõisteid kavandatud valim (intended sample) ja realiseerunud valim (resulting sample, realized sample) Parameeter mingi tunnuse kui terviku karakteristik või kirjeldus üldkogumis (perede sissetuleku keskmine, leibkonnaliikmete arvu jaotus) Statistik (?) tunnuse kirjeldus valimis, kasutatakse üldkogumi vastava parameetri hindamiseks Usaldusvahemik arvtelje vahemik, mille iga väärtus võiks võrdväärsena olla tundmatu parameetri hinnanguks Usaldusnivoo tõenäosus, millega vaadeldav vahemik võiks sisaldada parameetri tõelise, üldkogumis kehtiva väärtuse Valimite liigitus Tõenäosuslikud ja mittetõenäosuslikud valimid Mittetõenäosuslikud (empiirilised) valimid Mittetõenäosuslikud (empiirilised) valimid - objektide valimisse sattumise tõenäosused ei ole teada.
i=1 Dispersioon: N 1 s= 2 ∑ N−1 i=1 ( xi −´x ) 2 = 1073,2 Standardhälve: s= √ s2 = 32,8 Mediaan: Me = 44 (järjestatud arvurea keskmine arv) Haare: R=x max −x min =97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik P( ´x −∆ μ< μ< x´ + ∆ μ ) = P s t 0,95 ( 24 )❑=1,711 ∆ μ= ∙ t 0,95 ( 24 )=¿ √N 11,5 P= (45,8 – 11,5 ¿ μ<¿ 45,8 + 11,5) = P( 34,3 ¿ μ<57,3 ¿=0,9 Dispersiooni usaldusvahemik ( N −1 ) ∙ s x 2 ( N−1 ) ∙ s x 2 P ( χ 2α
Mida suurem on standardhälve, seda suurem on hajuvus. Üldkogum ehk populatsioon, selle all mõeldakse kõiki juhtumeid või situatsioone, mille kohta meie poolt püstitatud järeldused, oletused või prognoosid kehtivad. Valim väike objektide grupp, mis valitakse üldkogumist, et selle põhjal teha järeldus kogu üldkogumi kohta. Nõuded valimile peab olema küllalt arvukas, igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Usaldusvahemik väärtuste vahemik. Usaldusnivoo näitab tulemuse sattumise tõenäosust mingisse vahemikku. Olulisuse nivoo riskiprotsent, näitab kui suur statistiline viga on lubatud. Juhusliku suuruse normaaljaotus, selle graafik juhuslikud suurused, mille tõenäosust kirjeldavaks graafikuks on kellukesekujuline Gauss'i kõver.
04 Mediaan (Me) 48 Haare (R) 98 Parandatud standardhälve (Scp) 26.26 Mood 48 ja 58 (tabelist) Ül.2 Usaldusvahemikud Suurus t Laplace tabelist _x0016_(t) = γ/2 = 0,95/2 = 0,47, tabelist Keskväärtuse usaldusvahemik xk -t (Sc/√n ) < x < xk + t (Sc/√n ) 44.83 Standardhälbe usaldusvahemik Scp*sqrt((n-1)/x^2(0,95)) < σ < Scp*sqrt((n-1)/x^2(0,05)) 22.68 x^2(0,05)=43,19 ; x^2(0,095)=79,08 Dispersiooni usaldusvahemik Scp^2*(n-1)/x^2(0,95) < D < Scp^2*(n-1)/x^2(0,05) 506.03 Ül.3 Hüpoteeside kontroll 3.1) H0: μ = 50 alternatiiviga H1: μ ≠ 50 temp =((xk- μ)*√n)/Sc= 0.461
o Nihe statistiku süstemaatiline erinevus üldkogumi vastavast parameetrist. Tekib kirjeldavas uuringus kui uuringupop ei esinda populatsiooni, mida me tahame kirjeldada. o Juhuslik valim ja uuringu hoolikas korraldamine väldib nihet üldkogumi parameetri hindamisel. o Juhuslik varieeruvus allub tõenäosusteooria reeglitele ja tema võimalikku ulatust saab hinnata. 7. KAHE VALIMI VÕRDLEMINE · Usaldusvahemik ja olulisuse tõenäosus vahendid juhuse ja seaduspära eristamiseks- · 95% usaldusvahemik teatud valiminäitajale vahemik, kuhu üldkogumi vastav parameeter jääb 95% tõenäosusega. · Olulisuse tõenäosus tõenäosus, et leitud või veel suurem erinevus kahe valimi näitajate saab tekkida vaid juhuslikult. · Nt vererõhkude erinevuseks 7mmHg, 95% Cl (0,5mmHg;13.5mmHg)ning olulisuse tõenäosuseks p=0,03.
i=1 i=1 S 46.68 n -1 5-1 Tabel 2. 5 esimese katse tulemused ja usaldusvahemik El. (Elk- Katse nr Pinge kV kV/cm El)^2 1 49,6 204,352 41759,74 2 24,7 101,764 10355,91 3 21,2 87,344 7628,974 4 33,2 136,784 18709,86 5 25,8 106,296 11298,84 S 46.68 keskmine summa Elk - t 127.308 - 2.57 73.65
n( n - 1) (2) tn-1,- Studenti tegur ("Füüsika praktikumi metoodiline juhend I", lk.17, tabel 1) - usaldatavus; füüsika praktikumides tavaliselt =0,95 Füüsika praktikumis saadud mõõtmistulemuste vea hindamisel oletatakse, et süstemaatiliseks veaks on põhiliselt mõõteriistaviga. Seejuures lähtutakse sellest, et iga mõõteriista jaoks määratakse riiklike standarditega lubatud. Usaldusvahemik mistahes usaldatavuse jaoks: x x s = t 3 (3) Kui mõõteriistaga tehakse seeria ühe ja sama suuruse mõõtmisi ning arvutatakse juhuslik viga, siis jääb lugemisviga juhusliku vea hulka ning seda ei ole tarvis eraldi arvestada. Veahinnangute liitmine: x = ( x ) + ( x ) + ( x ) j 2 s
x + x 2 + ... + x n 1 = E ( x1 + x 2 + ... + x n ) = (Ex1 + Ex 2 + ... + Ex n ) = nµ = µ 1 1 Ex = E 1 n n n n (Ex1=µ, Ex2=µ, ... ,Exn=µ) 4. Üldkogumi keskmise vahemikhinnang (usaldusnivoole 1a vastav usaldusvahemik ). 1- on ühele lähedane arv, mida nim usaldusnivooks ja vahemikku x - -1 1 - ; x + -1 1 - sellele usaldusnivoole vastavaks 2 n 2 n usaldusvahemikuks ehk usaldusintervalliks. Usaldusvahemik on hinnatava parameetri vahemikhinnang. Praktikas ei ole tavaliselt üldkogumi dispersioon teada ja parameetrit lähendatakse valimstandardhälbega s. 1 s 2 , kus s 2 =
95 Kvantiilid= t0.95(24)=1.71 1,710882 Keskväärtuse usaldusvahemiku poollaius= 1,71*26.56/ruutjuur25-st 44,15 < 9,09 < 62,33 dispersiooni usaldusvahemik: hii^2 0,05(25) hii^2 0,95(25) 13,848 36,42 465,10 < 13,848 36,415 3. 3,1 t= 0,609829 3,2 tkr > t
2 x i−´x ) = 25−1 =772,46 Standarhälve s x =√ s x 2 = √ 772,46 = 27,79 Mediaan Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 39 Haare Haare on suurima ja vähima elemendi vahe R = xmax – xmin R = 98-1 = 97 2. Keskväärtuse ja dispersiooni usaldusvahemik (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik: sx sx ( P ´x −t 1−α / 2,N −1 ∙ √N < μ < ´x + t 1−α /2, N−1 ∙ √N ) =1−α
s 2 ( y) 2, 08 s 2 (b1 ) = N = = 0, 23 9,19 ( xi - x ) 2 i =1 s 2 ( y) N xi2 s 2 (b0 ) = N = 0, 23 11,32 = 2, 60 N ( xi - x) 2 i =1 i =1 Kahepoolne usaldusvahemik: b0 = t1- (w - 1) s (b0 ) = 2, 4469 2, 60 = 6,36 2 b1 = t1- ( w - 1) s (b1 ) = 2, 4469 0, 23 = 0,56 2 Hinnangu b0 usaldusvahemik: P(-9,45<0<3,27)=0,95 Hinnangu b1 usaldusvahemik: P(1,47< 1<2,59)=0,95 11.3 Kontrollin mudeli liikmete olulisust Kui |bj|>bj, võib lugeda mudeli liikme bj olulisek; vastupidise võrratuse puhul loen liikme mitteoluliseks. Liikme b0 olulisus: -3,09<6,36 ja liikme b0 võib lugeda mitteoluliseks.
valimisse sattuda kui teistel. Nt küsitlused veebis Valimi suurusest on tähtsam valimi esinduslikkus. Valesti koostatud suur valim annab halvema tulemuse kui õigesti koostatud väike valim. Punkthinnang - parameetri hindamise tulemuseks on üks arv. Hinnang leitakse valimi põhjal. Valim on juhuvalim. Punkthinnang on juhuslik suurus. Vahemikhinnang - valimi põhjal määratud vahemik, mis katab parameetri tegeliku väärtuse etteantud (küllalt suure) tõenäosusega. Usaldusvahemik - Parameetri a usaldusvahemikuks usaldatavusega β nimetatakse vahemikku, mis katab parameetri a väärtuse tõenäosusega β: Üldkogumi keskväärtuse µ punkthinnanguks - valimi keskväärtus: Üldkogumi dispersiooni σ^2 punkthinnang: Tsentraalne piirteoreem: Küllalt suure valimi mahu n korral alluvad valimite keskväärtused normaaljaotusele keskväärtusega µ ja standardhälbega σ/ √n, kus σ on kogumi standardhälve.
2,87 21065 A i 1,28 n x 6 6164,83 2 i b t kr b a t kr A t kr (0,05;4) 2,78 Parameetri b usaldusvahemik: 0,524±0,061 Parameetri a usaldusvahemik: -0,920±3,558 10.3 Prameetrite a ja b olulisuse kontroll b 0,52 t EMP x 2 i 2,87 6164,8 24,27 a 0,92 t EMP x 2 i 2,87 6164,8 42,65
Dispersioon Dx=(ni(xi-xk)2)/n=49942,184/60=832,4 Standarthälbe S=Dx=832,4=28,85 Scor=(n/(n-1))*S)= =(60/(60-1))*28,85=29,09 Me=(45+46)/2=45,5 Mo=71 esines 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on =0,05, P=95% korral t=1,96 : 47,78-1,96(29,09/60) < < 47,78+1,96(29,09/60) 40,41 < < 55,14 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 29,09(1-0,21) < < 29,09(1+0,21) 22,98 < < 35,19 Dispersiooni usaldusvahemik (29,09 (1-0,21))² < D < (29,09(1+0,21))² 528 < D < 1238,3 3.Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3.1 H0: =50 alternatiiviga H1: 50 T-kriteerium tEMP=((47,78-50)* 60)/29,09= -0,59 tkr=2,01 tEMP < tkr -0,59<2,01 H0 kehtib
Dispersioon Dx=[ni(xi-xk)2]/n=1005,5 Standarthälbe S=Dx=1005,5=31,71 Scor=(n/(n-1))*S=(60/(60-1))*31,71=31,97 Me=(43+44)/2=43,5 Mo=25, Mo=96 esinesid 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : 47,48-1,96(31,97/60) < < 47,48+1,96(31,97/60) 39,39 < < 55,57 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 31,97(1-0,21) < < 31,97(1+0,21) 25,26 < < 38,68 Dispersiooni usaldusvahemik (31,97(1-0,21))² < D < (31,97(1+0,21))² 638 < D < 1496,1 3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3.1 H0: µ=50 alternatiiviga H1: µ50 T-kriteerium tEMP=((47,48-50)* 60)/31,97= -0,61 tkr=2,01 tEMP < tkr Ho kehtib
1. Rahvatervis- teadus ja kunst haiguste ennetamiseks, eluea Ekspositsioon kokkupuude teguriga, mis võib mõjutada inimese Tundlikkus=P(T+/H+) valenegatiivne=P(T-/H+) spetsiifilisus= pikendamiseks ning vaimse ja füüsilise tervise edendamiseks ja terviseseisundit. Risk- inimest või keskkonda iseloomustav tegur, mille P(T-/H-) valepositiivne= P(T+/H-) Valenegatiivne=1-tundlikkus tugevdamiseks ühiskonna organiseeritud jõupingutuste kaudu/ teadus olemasolul haiguse esinemise tõenäosus rahvastikurühmas on Valepositiivne= 1-spetsiifilisus ja praktika, mida viiakse ellu kas kogu rahvastiku või selle teatud suurenenud. Riskirahvastik rahvastiku osa, kellel võib haigus välja Tundlikkus= Spetsiifilisus= PPV= NPV= rühmadele suunatud tervist mõjutavate sekkumiste kaudu. kujuneda . ...
Nende põhjal saab analüüsida mõõtetehnikat ja mõõtmisviisi. Saab leida, miks tekkisid sellised vead ja kuidas neid järgmistes katsetes miinimumini viia 20. Mõõtemetoodikas muudaksin seda, et puhastaksin peale iga uut proovi anuma ja valaksin sinna iga kord uue värske proovi, mis ei oleks õhu käes seisnud. Teeksin nii, et tingimused igale proovile oleksid samad, siis võivad ka tulemused väiksemas vahemikus kõikuda ning usaldusvahemik oleks väiksem. Kristin Puusepp 179739 EACB21