68 88 1 88 7744 1748,91 68 95 1 95 9025 2383,39 70 97 1 97 9409 2582,67 71 98 1 98 9604 2685,31 73 99 1 99 9801 2789,95 73 Summa 50 2309 152315 45685,38 73 75 xk 46,18 Keskväärtuse usaldusvahemik: 37,80 usaldusvahemik: 24,12 << 86 S 30,23 88 Scor 30,53 Standardhälbe usaldusvahemik: 24,12 ² << 95 Me 49 97 Haare 0-99 t P q 98 Mo {13;66;73} 1,96 0,05 95% 0,21 99
Residual 33 44408828,2678 1345722,069 Total 34 441905065,649 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Lower 95,0%Upper 95,0% Intercept 429,600229 245,692413075 1,748528673 0,0896708332 -70,264741368 929,4651993 -70,26474 929,4651993 X Variable 1 0,73444368 0,0427336191 17,18655467 4,96971E-018 0,6475014786 0,821385881 0,647501 0,821385881 90% Usaldusvahemik Usaldusvahemik: Alumine piir Ülemine piir Tulu: 2 112,47 ; 4 663,98 Kulu: 1909,95705 ; 3885,80581 Palk: 3406,73204 ; 8467,7251 Lineaarse Regressiooni sirge võrrand: y = b0+b1*x kus Kulu = f(Tulu) 25 000 f(x) = 0,735478618x + 398,9824244106 20 000 15 000 Kulu
Excel: STDEV Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Haare: 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks =0,10. Keskväärtuse usaldusvahemik: ( ) = 0,10 t, N-1 on arvutatav Exceli TINV funktsiooniga: 1,711 (või leida Studenti tabelist) ( )
1) Üldkogumi keskmise µ hinnang on valimkeskmine: x tulu = 3 385,23 x kulu = 2 894,88 x palk = 5 937,23 , keskmiste saamiseks kasutatud valemit AVERAGE. 95% usaldusvahemik üldkogumi keskmisele: kus: n valimi maht valimstandardhälve Usaldusnivoo 0,95 puhul Tulu Kulu Palk (1842,85, 4927,61) (1700,49, 4089,27) (2877,88, 8996,58) Näiteks tulu puhul kasutatud valemit (AVERAGE(E2:E36) 1,96*(STDEV(E2:E36)/SQRT(COUNT(E2:E36)) , AVERAGE(E2:E36) + 1,96*(STDEV(E2:E36)/SQRT(COUNT(E2:E36)) NB
Usaldatavuse vahemik: 21,1 21,1 177,6− ∗2,23< E lk 0 <177,6+ ∗2,23 ⟹162,7< Elk 0 <192,4 √ 10 √ 10 4. TULEMUSTE ANALÜÜS Mõõtmiste käigus tutvusime lähemalt õlide elektriliste tugevustega, katseteks kasutati kahte tundmatute parameetritega isoleerõli. Mõõtetulemuste analüüsi põhjal saab järeldada joonise 2.1. alusel, et esimese 5 katse põhjal on õli läbilöögi usaldusvahemik 5,1-st 173,9 kV-ni ja keskmine läbilöögitugevus on 89,5kV/cm. Kuna kasutame tulemuste andmiseks ainult 5 mõõtetulemusi , siis selle põhjal on 10 määramatus väga suur. 10 mõõtmise põhjal jääb usaldusvahemik 60,5 kuni 160,3 kV vahele ja keskmine läbilöögi pinge on 110,4kV/cm. Kuna katsemõõtmise väärtused kõiguvad suures
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Keskväärtus =46,20 Dispersioon =867,91 Standardhäve =29,46 Mediaan Me=46 Haare R = xmax xmin = 99 0 = 99 2. Keskväärtuse usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 on arvutatav Exceli TINV funktsiooniga: 1,711 Dispersiooni usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja on arvutatav Exceli CHIINV funktsiooniga, ning on vastavalt: 36,415 ja 13,843 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > -0,645. Seega hüpotees H0 võetakse vastu. 3
algandmetes: 2 mittejuhusliku komponendi olemasolu, dispersioonanalüüs F-statistik. järeldus: homogeensus hüpotees ei kehti tulpades 5 ja 8 (vt. tabel 1 ) 4 Keskväärtus: dispersioon: Standardhälve: Mediaan: 37,5 0,069 0,262 37,48 Keskväärtuse Standardhälbe usaldusvahemik usaldusvahemik 37,44 < 37,50 < 0,224 < 0,262 < 0,299 37,55 5 Normaaljaotuse võimalikkuse hindamine, hii ruut-statistik Järeldus: 26, 11, tegemist ei ole normaaljaotusega, kuna leitud väärtus ületab kriitilise väärtuse (edaspidistes arvutustes arvestan, et on siiski tegemist normaaljaotusega)
9 6,8 19,3 13,1 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,4 3,2 6,4 4,2 7,1 5,5 4,9 Lahenduse kontrollelemendid 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 51 Haare: 2 Keskväärtuse usaldusvahemik: (9,09 ; 44,15) Dispersiooni usaldusvahemik: (464,93 ; 1223,02) 3. 3.1 t-statistik: t= 0,61 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 53,24 25,68 - statistik: Järeldus: lükatakse tagasi 4.2 0,019 - statistik:22,39 Järeldus:lükatakse tagasi 4
Vastavalt tabelile, antud sagedustele vastav arv on ,,6". Osa III Takistusmagasiniga Valimistoon I II III IV V Rvalimistoon kaob [] 6540 6557,4 6551,9 6559,4 6565,2 Rvalimistoon tagasi [] 6539,9 6557,3 6551,7 6559 6565,2 Rvalimistoon kaob []=R1 Rvalimistoon tagasi []=R2 Mõõtetulemustest arvutada mõõtetulemuse keskväärtus, hajuvus, mõõtmiste usaldatavus ja usaldusvahemik. Keskväärtus: R1: x = (6540+6557,4+6551,9+6559,4+6565,2)/5 = 6554,8 R2: x = (6539,9+6557,3+6551,7+6559+6565,2)/5 = 6554,6 Hajuvuse leidmiseks arvutan dispersiooni: R1: = = = = = 8,53 R2: = = = = = 8,53 Leian hajuvuse valemi järgi : v = *100 R1: v = = 0,13 R2: v = = 0,13 Leian mõõtmiste usaldusvahemiku, selleks kasutan usaldatavust 95% Valemi järgi usaldusvahemik : ( x 1,96 ; x +1,96 )
x=45, 04 Dispersioon: Excel: VAR Sx²=1164,123 Standardhälve: Sx=34,1193 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=38 Haare: R=97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,7268. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800
3-kvartiil 15236 10847 minimaalne väärtus 858 2029 maksimaalne väärtus 29320 46492 standardhälbe (S) 5678 8498 E(β=0,95) 1697 2540 min 10936 6893 max 14330 11973 Usaldusvahemik β=0,95 (10936;14330) (6893;11973) E(β=0,99) 2251 3369 min 10381 6064 max 14884 12803 Usaldusvahemik β=0,99 (10381;14884) (6064;12803) E(β=0,95) 1749 2618 min 10884 6815
x=46,20 Dispersioon: Excel: VAR Sx²=867,9167 Standardhälve: Sx=29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 Haare: R=99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,6449. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800 D=2
Standardhälve = 2 = 814,4 = 28,54 Mediaan Me = 41 Variatsioonirea keskmine arv (juhul kui on tegemist paarituarvutlise valimiga) või kahe keskmise elemendi poolsumma (kui on tegemist paarisarvulise valimiga) (Lisaks saadav kasutades Exceli funktsiooni MEDIAN) Haare Valimi suurima ning väikseima elemendi vahe R = x max - x min R= 97 - 0 = 97 2. Jaotuse analüüs Võtan olulisuse nivooks = 0,10 ning eeldan normaaljaotust. Keskväärtuse usaldusvahemik 1) Keskväärtuse ja standardhälbe hinnangud: 1 N 1 N µ^ = xi = xi = 44,8 N i =1 25 i =1 1 N 1 N ^ 2 = s 2 = i N - 1 i =1 ( x - µ ^ ) 2 = ( xi - 44,8) 2 = 814,4 24 i =1 s= s 2 = 814,4 = 28,54 2) Valitud usaldustõenäosuse p ja vabadusastmete arvu f = N-1 järgi leitakse t- jaotuse
xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: Me = 41 Haare: 2 Keskväärtuse usaldusvahemik: (35,08 ; 54,60) Dispersiooni usaldusvahemik: (536,45 ; 1410,64) 3. 3.1 t-statistik: t=0,90 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 44,84 27,97 - statistik: Järeldus: peab paika 4.2 0,022 - statistik:14,98 Järeldus:lükatakse tagasi 4
või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me = 41 Haare: R = 87 1 = 86 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja on arvutatavad Excel'i CHIIVN funktsiooniga ning on vastavalt: 33,196 ja 13,848 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1. H0: = 50 alternatiiviga H1: 50 1 Et hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,911
x = 46,20 Dispersioon: Excel: VAR Sx² = 867,92 Standardhälve: Sx = 29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 46 Haare: R= 99 - 0 = 99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 Dispersiooni usaldusvahemik: = 0,10 ja (leidsin need Exceli CHIINV funktsiooni abil) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > -0,645. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800
Kood_i Sugu Vanusgrupp V03C 9 1 55-64 18488.41757 71 1 55-64 918.57205 79 1 55-64 11932.76984 142 1 55-64 10495.1471 175 1 55-64 24310.46007 235 1 55-64 13219.25637 259 1 55-64 18466.35636 307 1 55-64 24702.85409 325 1 55-64 16699.7476 332 1 55-64 35186.76431 335 1 55-64 25016.02893 358 1 55-64 30108.05777 370 1 55-64 24414.22772 405 1 55-64 4599.90323 420 1 55-64 21796.51191 431 1 55-64 16129.14899 466 1 55-6...
Aritmeetiline keskväärtus:
xk=(xi*ni)/n= 53,07
Harmooniline keskväärtus:
Xk=n/(1/xi)= 26,39
Geomeetriline keskväärtus
xk=(x1*...*xn)^(1/n)= 39,43
Dispersioon
Dx=[ni(xi-xk)2]/n= 68,01
Standardhälve
S=Dx= 26,17
Mediaan: 55
Mood: arvud 32 ja 68 esinevad 3 korda
Haarde hinnangud: 99-0= 99
2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel,
et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks =0,05
Keskväärtuse usaldusvahemik: P=95% korral t=2
46,31 << 59,82
Standardhälbe usaldusvahemik:
q=0,3
18,48 < < 34,31
Dispersiooni usaldusvahemik:
q=0,3
341,34 < < 1177,26
3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on
normaaljaotus ja
olulisuse nivooks on =0,05
3.1 H0: = 50 alternatiiviga H1: 50
T-kriteerium
Sc= 26,39
tEMP= (53,06666667--50)* 60)/ 26,39= 0,90
tKR=2
tEMP
1. Matrikli viimane number – 3. Järelikult SUGU=2 ja AGE_GR=25-34 Koo Sug Vanus- V03C V27C V30C V34C V36C V37C V38C V41C V42C d_i u grupp 310 2 2534 9457,866 5669,58 0 4378,57 909,577 510,334 0 777,44 0 94 392 28 17 93 311 2 2534 10553,17 0 214,4133 10131,6 0 744,472 0 1962,6 2979,255 211 3 256 91 87 312 2 2534 7392,166 0 1738,630 5798,31 1483,31 2828,02 22246,05 3896,4 8468,680 55 66 72 376 537 789 55 313 2 2534 7348,636 2502,98 672,9768 8115,65 1266,28 1397,80 3459,408 8541,66...
Parandatud standardhälve (Scp) 26.26 Mood 48 ja 58 (tabelist) 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud (intervallhinnangud) eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks α=0,05 ehk P = 0,95 Keskväärtuse usaldusvahemik 𝑆𝑐 𝑆𝑐 ̅̅̅ − 𝑡 ∙ 𝑥𝑘 ̅̅̅ + 𝑡 ∙ ≤ 𝑥̂ ≤ 𝑥𝑘 √𝑛 √𝑛 t975=t(60; α=0,05; kahepoolne) =2,000 Keskväärtuse usaldusvahemik 44
Sx=32,75 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=74 Haare: =96-0=96 R=96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) (Arvutatud excelis väärtuste ümardusi rakendamata) Usaldusvahemiku poollaius: 11,2 Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1
x=53,24 Dispersioon: Excel: VAR Sx²=705,69 Standardhälve: Sx=26,56 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=51 Haare: R=94-9=85 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (olulisuse nivoo = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 0,61. Hüpotees võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800
Rühmadevaheline dispersioon: F-statistik kui rühmadevahelise ja rühmadesisese dispersiooni suhe: Nullhüpoteesi vastu võtmiseks peab . Seega võetakse nullhüpotees vastu. Keskväärtused on hüpoteesi põhjal homogeensed. Keili Kajava Osa B 9. keskmine x 2,2 2,7 4,8 0,9 4,1 2,94 y 7,1 9,8 10,2 2,1 11,1 8,06 9.1 9.2 Usaldusvahemiku leidmine: Keili Kajava Hinnangu b0 usaldusvahemik: Hinnangu b1 usaldusvahemik: 9.3 Kuna , siis seda mudeli liiget võib lugeda mitteoluliseks Kuna , siis seda mudeli liiget võib lugeda oluliseks. 9.4 Kuna (4,53 > 1,40), siis võib lugeda mudelit katseandmetega kooskõlas olevaks. 9.5 x=1 x=3 x=5 Keili Kajava 9.6 Regressioonisirge graafik
Rakendusstatistika arvestusharjutus. Osa A. N=25 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus Dispersioon Standardhälve Mediaan Me=49 Haare 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,71 Dispersiooni usaldusvahemik: = 0,10 ja 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > 0,6. Hüpotees võetakse vastu. H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,2< 36,42. Hüpotees võetakse vastu. 4
𝑦 − 𝜀𝛽 , 𝑦 + 𝜀𝛽 = (7800,8242-2259,7593 ; 7800,8242+2259,7593)= (5541,0649; 10060,5835) 𝑃(𝐸𝑋 ∈ 𝑦 − 𝜀𝛽 , 𝑦 + 𝜀𝛽 = 0.99 Tabelist F¯¹(0,99/2)=2,60 𝑠𝑥 −1 𝛽 𝜀𝛽 = Φ = 2997,639878 𝑛 2 𝑦 − 𝜀𝛽 , 𝑦 + 𝜀𝛽 = (7800,8242-2997,6399 ; 7800,8242+2997,6399)= (4803,1843 ; 10798,4640) Leitud usaldusvahemik näitab sisuliselt, et usaldusvahemik usaldusnivool vastavalt b=0,95 ja b=0,99, et keskväärtus langeb leitud piirkonda. 4. Kas toidukulude ja eluasemekulude vahel on seos? Arvutada korrelatsioonikordaja, joonistada hajusdiagramm ja kirjutada välja regressiooniserge. 𝑛 ∗ 𝐾𝑥,𝑦 ≈ 𝑐𝑜𝑣 𝑋, 𝑌 = 𝑥𝑦 − 𝑥 𝑦 = 4246086,872 ≠ 0
Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 62 Haare: R = 91 – 1 = 96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik: α = 0,10 t0,1; 24 = 1,7109 (Studenti tabelist) Dispersiooni usaldusvahemik: α = 0,10 ja on vastavalt: 13,8484 ja 36,4150 3. Kontrollida järgmisi hüpoteese (eeldades uldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10): 3.1. H0 : μ = 50 alternatiiviga H1 : μ 50 09 Et hüpotees vastu võetaks, peab tkr > t; 1,7109 > 0,2892.
¿ Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Mood tunnuse kõige sagedamini esinev väärtus Haare R = xmax xmin = 99 4 = 95 2. Leian keskväärtuse, dispersiooni ja standardhälbe usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,05 ehk P= 95% Keskväärtuse usaldusvahemik: sx sx ( P ´x -t , N-1 N < < ´x +t , N -1 N ) =1- s = t 0,95 ( 24 )
F-statistik kui rühmadevahelise ja rühmadesisese dispersiooni suhe: Nullhüpoteesi vastu võtmiseks peab . Seega võetakse nullhüpotees vastu. Keskväärtused on hüpoteesi põhjal homogeensed. 11 Keili Kajava Osa B 9. keskmine x 2,2 2,7 4,8 0,9 4,1 2,94 y 7,1 9,8 10,2 2,1 11,1 8,06 9.1 9.2 Usaldusvahemiku leidmine: 12 Keili Kajava Hinnangu b0 usaldusvahemik: Hinnangu b1 usaldusvahemik: 9.3 Kuna , siis seda mudeli liiget võib lugeda mitteoluliseks Kuna , siis seda mudeli liiget võib lugeda oluliseks. 9.4 13 Keili Kajava Kuna (4,53 > 1,40), siis võib lugeda mudelit katseandmetega kooskõlas olevaks. 9.5 x=1 x=3 x=5 14 Keili Kajava 9.6
68 88 1 88 7744 1748,91 68 95 1 95 9025 2383,39 70 97 1 97 9409 2582,67 71 98 1 98 9604 2685,31 73 99 1 99 9801 2789,95 73 Summa 50 2309 152315 45685,38 73 75 xk 46,18 Keskväärtuse usaldusvahemik: 37,80 usaldusvahemik: 24,12 << 86 S 30,23 88 Scor 30,53 Standardhälbe usaldusvahemik: 24,12 ² << 95 Me 49 97 Haare 0-99 t P q 98 Mo {13;66;73} 1,96 0,05 95% 0,21 99
yi 6,9 6,1 9,8 7,2 15,3 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 1,3 0,2 0,7 4,2 3,6 2,6 1,9 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 74 Haare: 2 Keskväärtuse usaldusvahemik: (47,38 ; 69,34) Dispersiooni usaldusvahemik: (679 ; 1791) 3. 3.1 t-statistik: t=1,3 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 58 30,5 - statistik: Järeldus: lükatakse tagasi 4.2 0,017 - statistik: 31,46 Järeldus:lükatakse tagasi 4
Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Uurimisprobleem, kust probleem tuleb, teooria, praktiline probleem, varasemad uurimused Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimal...
Keskväärtus N 1 ´x = N ∑ xi i=1 ´x =53,24 Dispersioon N 1 s x 2= ∑ N−1 i=1 ( x i−´x )2 s x 2 =705,69 Standardhäve s x =√ s x 2 s x =26,56 Mediaan Me=51 Haare R = xmax – xmin = 94 – 9 = 85 2. Keskväärtuse μ usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: sx s ( P ´x −t α , N−1 ∙ √N ) < μ< ´x +t α , N −1 ∙ x =1−α √N tα, N-1 on arvutatav Exceli TINV funktsiooniga: t=1,711 P ( 44,15< μ<62.33 ) =0 , 90
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Andmete kood: 248199 Osa A 1. Keskväärtus Dispersioon Standardhälve Mediaan Haare 2. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks leian usaldus- vahemikud. Keskväärtuse usaldusvahemik on arvutatud MS Exceli TINV-funktsiooniga: Dispersiooni usaldusvahemik ja on arvutatud MS Exceli CHIINV-funktsiooniga 3. Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks kontrollin hüpoteese 3.1 alternatiiviga Et hüpotees vastu võetaks peab seega hüpotees võetakse vastu. 3.2 alternatiiviga Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4
laiendatavad mingile suuremale kogumile; · kasutatav õppeeesmärkidel ja prooviuuringute juures. Tõenäosuslikud valimid - iga üldkogumi objekti jaoks on teada tema valimisse sattumise tõenäosus. · valimiobjekt valitakse juhuslikult; · tavaliselt peab igal üldkogumi objektil olema võrdne võimalus valimisse sattumiseks; · tõenäosusliku valiku korral on iga valimi andmete baasil arvutatud parameetri kohta võimalik leida usaldusvahemik, mis etteantud tõenäosusega (näit. 95%, 99%) sisaldab üldkogumi vastavat parameetrit; · valimiviga mõjutavad eelkõige valimi suurus ja üldkogumi homogeensus; · kasutatakse eelkõige suurtes uuringutes; · realiseerimiselt kallis (tuleb leida täpselt need objektid, millised juhusliku valiku teel tulid). Valimi suuruse määramine tõenäosuslike valimite korral · vajadus saada üldkogumi mingi parameetri
i=1 Dispersioon: N 1 s= 2 ∑ N−1 i=1 ( xi −´x ) 2 = 1073,2 Standardhälve: s= √ s2 = 32,8 Mediaan: Me = 44 (järjestatud arvurea keskmine arv) Haare: R=x max −x min =97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik P( ´x −∆ μ< μ< x´ + ∆ μ ) = P s t 0,95 ( 24 )❑=1,711 ∆ μ= ∙ t 0,95 ( 24 )=¿ √N 11,5 P= (45,8 – 11,5 ¿ μ<¿ 45,8 + 11,5) = P( 34,3 ¿ μ<57,3 ¿=0,9 Dispersiooni usaldusvahemik ( N −1 ) ∙ s x 2 ( N−1 ) ∙ s x 2 P ( χ 2α
Andmed mingi tunnus või omadus. Tunnus omadus, nt keskmine pikkus, kummas paralleelklassis läks matemaatika eksamitöö paremini jne. Arvuline tunnus väärtuseks on arvud, nt pikkus, palk, hinne jne. Mittearvuline tunnus väärtuseks ei ole arvud, nt sugu, rahvus, haridus, juuste värv. Järjestustunnus tunnus, mille väärtusi saab sisu põhjal järjestada, nt matemaatika kt hinne, skaala küsitluses. Nominaaltunnus tunnus, millel on rohkem kui kaks erinevat väärtust, kuid ei leidu ühtegi sisulist järjestust, mis haaraks kõik tunnuse väärtused, nt rahvus, silmade värv. Binaarne tunnus ainult kaks teineteist välistavat tunnust, nt sugu. Pidev tunnus võib omandada kõiki reaalarvulisi väärtusi mingist piirkonnast, nt kaal, kasv, aeg, temperatuur. Diskreetne tunnus - tunnus võib omandada vaid üksteisest eraldatud väärtusi, väärtused saadakse tavaliselt loendamise teel, nt elanike arv majas, õpilaste arv klassis vms. Statistiline rida ...
04 Mediaan (Me) 48 Haare (R) 98 Parandatud standardhälve (Scp) 26.26 Mood 48 ja 58 (tabelist) Ül.2 Usaldusvahemikud Suurus t Laplace tabelist _x0016_(t) = γ/2 = 0,95/2 = 0,47, tabelist Keskväärtuse usaldusvahemik xk -t (Sc/√n ) < x < xk + t (Sc/√n ) 44.83 Standardhälbe usaldusvahemik Scp*sqrt((n-1)/x^2(0,95)) < σ < Scp*sqrt((n-1)/x^2(0,05)) 22.68 x^2(0,05)=43,19 ; x^2(0,095)=79,08 Dispersiooni usaldusvahemik Scp^2*(n-1)/x^2(0,95) < D < Scp^2*(n-1)/x^2(0,05) 506.03 Ül.3 Hüpoteeside kontroll 3.1) H0: μ = 50 alternatiiviga H1: μ ≠ 50 temp =((xk- μ)*√n)/Sc= 0.461
o Nihe statistiku süstemaatiline erinevus üldkogumi vastavast parameetrist. Tekib kirjeldavas uuringus kui uuringupop ei esinda populatsiooni, mida me tahame kirjeldada. o Juhuslik valim ja uuringu hoolikas korraldamine väldib nihet üldkogumi parameetri hindamisel. o Juhuslik varieeruvus allub tõenäosusteooria reeglitele ja tema võimalikku ulatust saab hinnata. 7. KAHE VALIMI VÕRDLEMINE · Usaldusvahemik ja olulisuse tõenäosus vahendid juhuse ja seaduspära eristamiseks- · 95% usaldusvahemik teatud valiminäitajale vahemik, kuhu üldkogumi vastav parameeter jääb 95% tõenäosusega. · Olulisuse tõenäosus tõenäosus, et leitud või veel suurem erinevus kahe valimi näitajate saab tekkida vaid juhuslikult. · Nt vererõhkude erinevuseks 7mmHg, 95% Cl (0,5mmHg;13.5mmHg)ning olulisuse tõenäosuseks p=0,03.
i=1 i=1 S 46.68 n -1 5-1 Tabel 2. 5 esimese katse tulemused ja usaldusvahemik El. (Elk- Katse nr Pinge kV kV/cm El)^2 1 49,6 204,352 41759,74 2 24,7 101,764 10355,91 3 21,2 87,344 7628,974 4 33,2 136,784 18709,86 5 25,8 106,296 11298,84 S 46.68 keskmine summa Elk - t 127.308 - 2.57 73.65
3. Arvutused koos veaarvutusega. Mõõtmistulemuste aritmeetiline keskmine: 1 n x = xi n i =1 (1) Mõõtmisseeria lõppresultaadi x juhusiku vea hindamisvalem: n ( x - x) 2 i x j = t n -1, i =1 n( n - 1) (2) tn-1,- Studenti tegur ("Füüsika praktikumi metoodiline juhend I", lk.17, tabel 1) - usaldatavus; füüsika praktikumides tavaliselt =0,95 Füüsika praktikumis saadud mõõtmistulemuste vea hindamisel oletatakse, et süstemaatiliseks veaks on põhiliselt mõõteriistaviga. Seejuures lähtutakse sellest, et iga mõõteriista jaoks määratakse riiklike standarditega lubatud. Usaldusvahemik mistahes usaldatavuse jaoks: ...
Ex = E 1 n n n n (Ex1=µ, Ex2=µ, ... ,Exn=µ) 4. Üldkogumi keskmise vahemikhinnang (usaldusnivoole 1a vastav usaldusvahemik ). 1- on ühele lähedane arv, mida nim usaldusnivooks ja vahemikku x - -1 1 - ; x + -1 1 - sellele usaldusnivoole vastavaks 2 n 2 n usaldusvahemikuks ehk usaldusintervalliks. Usaldusvahemik on hinnatava parameetri vahemikhinnang. Praktikas ei ole tavaliselt üldkogumi dispersioon teada ja parameetrit lähendatakse valimstandardhälbega s. 1 s 2 , kus s 2 = n ( xi - x ) 2 on valimdispersioon n -1 i =1 Üldkogumi keskmise µ usaldusnivoole 1- vastav usaldusvahemik (ligikaudne): s s
95 Kvantiilid= t0.95(24)=1.71 1,710882 Keskväärtuse usaldusvahemiku poollaius= 1,71*26.56/ruutjuur25-st 44,15 < 9,09 < 62,33 dispersiooni usaldusvahemik: hii^2 0,05(25) hii^2 0,95(25) 13,848 36,42 465,10 < 13,848 36,415 3. 3,1 t= 0,609829 3,2 tkr > t
2 x i−´x ) = 25−1 =772,46 Standarhälve s x =√ s x 2 = √ 772,46 = 27,79 Mediaan Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 39 Haare Haare on suurima ja vähima elemendi vahe R = xmax – xmin R = 98-1 = 97 2. Keskväärtuse ja dispersiooni usaldusvahemik (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik: sx sx ( P ´x −t 1−α / 2,N −1 ∙ √N < μ < ´x + t 1−α /2, N−1 ∙ √N ) =1−α
s 2 ( y) 2, 08 s 2 (b1 ) = N = = 0, 23 9,19 ( xi - x ) 2 i =1 s 2 ( y) N xi2 s 2 (b0 ) = N = 0, 23 11,32 = 2, 60 N ( xi - x) 2 i =1 i =1 Kahepoolne usaldusvahemik: b0 = t1- (w - 1) s (b0 ) = 2, 4469 2, 60 = 6,36 2 b1 = t1- ( w - 1) s (b1 ) = 2, 4469 0, 23 = 0,56 2 Hinnangu b0 usaldusvahemik: P(-9,45<0<3,27)=0,95 Hinnangu b1 usaldusvahemik: P(1,47< 1<2,59)=0,95 11.3 Kontrollin mudeli liikmete olulisust Kui |bj|>bj, võib lugeda mudeli liikme bj olulisek; vastupidise võrratuse puhul loen liikme mitteoluliseks. Liikme b0 olulisus: -3,09<6,36 ja liikme b0 võib lugeda mitteoluliseks.
Lõpliku kasutada siis, kui n/N>0,05 Kogumi keskväärtuse usalduspiirid - Suure (n>30) valimi korral on üldkogumi keskväärtuse usalduspiirid usaldatavusega β Kogumi keskväärtuse usalduspiirid lõpliku kogumi mahu N korral Usaldatavus - β näitab, millise tõenäosusega jääb kogumi keskväärtus usaldusvahemikuga antud piiridesse Usaldatavuse valik – kõige sagedamini 0,95, mõnikord 0,90 või 0,99. Ühe ja sama valimi korral suurem usaldatavus = laiem usaldusvahemik (suurem määramatus). Usaldusvahemiku poollaiuse sõltumine – usaldatavust saame valida, valimi mahtu saab muuta, standardhälvet muuta ei saa Kattuvad ja mittekattuvad usaldusvahemikud - kui vahemikud ei kattu, siis saab väita, et esineb erinevus. Kui kattuvad, siis ei saa väita, et esineb erinevus. Usaldusvahemiku määramise täpsus: Suhteline viga E= Väikesed valimid t-jaotus - Väikeste valimite korral valimite keskväärtuste jaotus erineb normaaljaotusest
2,87 21065 A i 1,28 n x 6 6164,83 2 i b t kr b a t kr A t kr (0,05;4) 2,78 Parameetri b usaldusvahemik: 0,524±0,061 Parameetri a usaldusvahemik: -0,920±3,558 10.3 Prameetrite a ja b olulisuse kontroll b 0,52 t EMP x 2 i 2,87 6164,8 24,27 a 0,92 t EMP x 2 i 2,87 6164,8 42,65
1. Rahvatervis- teadus ja kunst haiguste ennetamiseks, eluea Ekspositsioon kokkupuude teguriga, mis võib mõjutada inimese Tundlikkus=P(T+/H+) valenegatiivne=P(T-/H+) spetsiifilisus= pikendamiseks ning vaimse ja füüsilise tervise edendamiseks ja terviseseisundit. Risk- inimest või keskkonda iseloomustav tegur, mille P(T-/H-) valepositiivne= P(T+/H-) Valenegatiivne=1-tundlikkus tugevdamiseks ühiskonna organiseeritud jõupingutuste kaudu/ teadus olemasolul haiguse esinemise tõenäosus rahvastikurühmas on Valepositiivne= 1-spetsiifilisus ja praktika, mida viiakse ellu kas kogu rahvastiku või selle teatud suurenenud. Riskirahvastik rahvastiku osa, kellel võib haigus välja Tundlikkus= Spetsiifilisus= PPV= NPV= rühmadele suunatud tervist mõjutavate sekkumiste kaudu. kujuneda . ...
Dispersioon Dx=(ni(xi-xk)2)/n=49942,184/60=832,4 Standarthälbe S=Dx=832,4=28,85 Scor=(n/(n-1))*S)= =(60/(60-1))*28,85=29,09 Me=(45+46)/2=45,5 Mo=71 esines 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on =0,05, P=95% korral t=1,96 : 47,78-1,96(29,09/60) < < 47,78+1,96(29,09/60) 40,41 < < 55,14 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 29,09(1-0,21) < < 29,09(1+0,21) 22,98 < < 35,19 Dispersiooni usaldusvahemik (29,09 (1-0,21))² < D < (29,09(1+0,21))² 528 < D < 1238,3 3.Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3.1 H0: =50 alternatiiviga H1: 50 T-kriteerium tEMP=((47,78-50)* 60)/29,09= -0,59 tkr=2,01 tEMP < tkr -0,59<2,01 H0 kehtib
Dispersioon Dx=[ni(xi-xk)2]/n=1005,5 Standarthälbe S=Dx=1005,5=31,71 Scor=(n/(n-1))*S=(60/(60-1))*31,71=31,97 Me=(43+44)/2=43,5 Mo=25, Mo=96 esinesid 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : 47,48-1,96(31,97/60) < < 47,48+1,96(31,97/60) 39,39 < < 55,57 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 31,97(1-0,21) < < 31,97(1+0,21) 25,26 < < 38,68 Dispersiooni usaldusvahemik (31,97(1-0,21))² < D < (31,97(1+0,21))² 638 < D < 1496,1 3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3.1 H0: µ=50 alternatiiviga H1: µ50 T-kriteerium tEMP=((47,48-50)* 60)/31,97= -0,61 tkr=2,01 tEMP < tkr Ho kehtib
Nende põhjal saab analüüsida mõõtetehnikat ja mõõtmisviisi. Saab leida, miks tekkisid sellised vead ja kuidas neid järgmistes katsetes miinimumini viia 20. Mõõtemetoodikas muudaksin seda, et puhastaksin peale iga uut proovi anuma ja valaksin sinna iga kord uue värske proovi, mis ei oleks õhu käes seisnud. Teeksin nii, et tingimused igale proovile oleksid samad, siis võivad ka tulemused väiksemas vahemikus kõikuda ning usaldusvahemik oleks väiksem. Kristin Puusepp 179739 EACB21