Kui soovitakse valimit suurusega n üldkogumist suurusega N, siis valimisse võib kuuluda iga N/n element üldkogumist Esimene valimi element valitakse juhuslikult ja seejärel valitakse iga N/n element Kuna esimene valimi element on valitud juhuslikult, siis süstemaatilise valiku puhul eeldatakse, et täidetakse juhusliku valiku põhimõtteid. 3.8 Kogumi usalduspiirid Suure (n>30) valimi korral on üldkogumi keskväärtuse usalduspiirid kus usaldusvahemiku poollaius x leitakse valimi statistiliste parameetrite põhjal järgmiselt. Normaaljaotuse korral jääb standardhälbega määratud vahemikku alati 68,3% kõikidest väärtustest. Seega jääb suvalise valimi keskväärtus tõenäosusega 68,3% vahemikku Praktikas pole meil kogumi keskväärtus ja standardhälve teada ja kasutatakse valimi põhjal saadud hinnanguid. Näiteks kui ostjate arv päevas on 550±125 usaldatavusega 0,95, siis 95% päevadest on ostjate arv vahemikus (425; 675).
Rakendusstatistika arvutusgraafiline töö 2010 Keili Kajava Osa A 1. Keskväärtus: Dispersioon: Standardhälve: Mediaani leidmiseks rivistan arvud tabelis kasvavasse järjekorda ja leian sealt valimi keskel oleva väärtuse ehk tabeli algusest või lõpust 13.-nda arvu (sest valimi maht on 25). Me=44 Haare: R=99-2=97 2. Keskväärtuse usaldusvahemiku leidmine (leitud t-jaotuse tabelist) Dispersiooni usaldusvahemiku leidmine (tuleb jaotuse tabelist) (tuleb jaotuse tabelist) Keili Kajava 3. 3.1 Kuna |t| < t0,95(24) (|-0,648| < 1,711), siis võib järeldada, et põhikogumi keskväärtus saab olla 25 valimi alusel. Seega H0 hüpotees vastu võetud. 3.2 Kuna 2 jääb ja vahele (13,85 < 32,1 < 36,4), siis hüpotees H0 vastu võetud. 4. 4.1
OSA 2: 1) Genereerisin lõigul [0,1] ühtlasest jaotusest 100 arvu. Valimkeskmine 0,4920 AVERAGE Valimdispersioon 0,0906 VAR Valimstandardhälve 0,3010 STDEV 2) 90% usalduspiirid tegelikule keskväärtusele =0,5 [0,4981 , 0,5019] ja tegelikule dispersioonile 2=0,083 [0,0667 , 0,1068] Valimkeskmine ei sisaldu arvutatud usaldusvahemikus kuid valimdispersioon sisaldub. Keskväärtuse usaldusvahemiku leidmine: Dispersiooni usaldusvahemiku leidmine: Kasutatud valemeid TINV, CHIINV 3) =0,01 H0: =0,5 Ha: 0,5 Teststatistik: > Z=0,003 Kriitiline prk: Za/2=2,575 Kuna |Z|< Za/2 võime lugeda nullhüpoteesi kehtivaks. Samas on näha, et leitud valimkeskmine ei lange määratud piiridesse =0,01 juures. P=0,7912.
2)Dispersioon =867,92 3)Standardhäve =29,46 4)Mediaan Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 5)Haare R = xmax xmin = 99 0 = 99 2. Leian keskväärtuse usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 arvutasin Exceli TINV funktsiooniga ( on ka leitav Studenti tabelist): 1,711 Leian dispersiooni usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja arvutasin Exceli CHIINV funktsiooniga, vastavalt: 36,415 ja 13,848 3
Keili Kajava Osa A 1. Keskväärtus: Dispersioon: Standardhälve: Mediaani leidmiseks rivistan arvud tabelis kasvavasse järjekorda ja leian sealt valimi keskel oleva väärtuse ehk tabeli algusest või lõpust 13.-nda arvu (sest valimi maht on 25). Me=44 Haare: R=99-2=97 2. Keskväärtuse usaldusvahemiku leidmine 1 Keili Kajava (leitud t-jaotuse tabelist) Dispersiooni usaldusvahemiku leidmine (tuleb jaotuse tabelist) (tuleb jaotuse tabelist) 3. 3.1 Kuna |t| < t0,95(24) (|-0,648| < 1,711), siis võib järeldada, et põhikogumi keskväärtus saab olla 25 valimi alusel. Seega H0 hüpotees vastu võetud.
usaldatavus ja usaldusvahemik. Keskväärtus: R1: x = (6540+6557,4+6551,9+6559,4+6565,2)/5 = 6554,8 R2: x = (6539,9+6557,3+6551,7+6559+6565,2)/5 = 6554,6 Hajuvuse leidmiseks arvutan dispersiooni: R1: = = = = = 8,53 R2: = = = = = 8,53 Leian hajuvuse valemi järgi : v = *100 R1: v = = 0,13 R2: v = = 0,13 Leian mõõtmiste usaldusvahemiku, selleks kasutan usaldatavust 95% Valemi järgi usaldusvahemik : ( x 1,96 ; x +1,96 ) R1: (6554,8 1,96 ; 6554,8 + 1,96 ) = ( 6547,3 ; 6562,3 ) R2: (6554,6 1,96 ; 6554,6 + 1,96 ) = ( 6547,1 ; 6562,1 ) Teades, et takistus sõltub juhi materjalist ja mõõtmetest sai välja arvutada suurima liinipikkuse: R=(p*l)/S > l = (R*S)/p Et suurimat liinipikkust arvutada, tuli arvesse võtta suurimat lubatud takistust
poissoni jaotus Test 7 kogum, klastervalik, kihtvalik, lihtne juhuvalik, süstemaatiline valik tõenäosuslik valikumeetod, empiiriline valik fikseeritud samm, süstemaatiline valik, punkthinnang nihketa, efektiivne, optimaalne keskväärtus, normaaljaotus, suur valim keskväärtuse standardviga standardhälve standardviga, keskväärtuse usalduspiirid valimvaatlus usaldatavus suur valim, usaldatavus suurem üldkogumi keskväärtuse usaldusvahemiku laius, vabadusastmete arv studenti jaotus mediaani usalduspiiride leidmisel kasutatakse binoomjaotust, loend on ülekaetud ankeetküsitluse läbiviimisel, mõõtmisvahendi viga Test nr 8 sisukas hüpotees, järeldus peale parameetri empiirilise väärtuse võrdlust kriitilisega z-testi parameetri kriitiline väärtus t-testi parameetri empiiriline väärtus sisukas hüpotees, sõltuv valim, sõltumatu valim
väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise tõenäosus. See tõepärasusfunktsioon kujutab endast valimi elementide kui sõltumatute juhuslike suuruste n-mõõtmelist jaotustihedust. Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel. Tõenäosust, et tegelik väärtus satub väljaspoole usaldusvahemikku, tähistatakse tavaliselt alfa ja nim olulisuse nivooks. Kahepoolse sümmeetrilise usaldusvahemiku arvutamiseks on järgmised: *leitakse keskväärtuse ja standardhälbe hinnangud *valitud usaldustõenäosuse p ja vabadusastmete arvu f=N-1 järgi leitakse t-jaotuse tabei või arvutiprogrammi abil vajalik t-jaotuse kvantiil *arvutatakse usaldusvahemiku poollaius delta müü *leitakse usaldusvahemik Tõenäosuse järgi sümmeetrilise kahepoolse usaldusvahemiku arvutamiseks on järgmised: *leitakse dispersiooni hinnang
Determinatsioonitegur: ( 0,89 ) z-statistik : z = 2,46 Järeldus:tagasi lukata 11 11.1 1,36 -3,25 Regressioonimudel: 11.2, 11.3 0,48 olulisus: oluline 1,58 olulisus: pole oluline 11.4 F-statistik: F = 4,01 Järeldus: võetakse vastu 11.5 Väljundi usaldusvahemiku poollaiused : : 1,876 : 1,614 Osa A Valim A mahuga N=25 variatsioonirida: 37 54 94 32 19 33 69 51 89 43 18 88 9 30 62 41 81 54 49 54 15 94 85 43 87 1.Leida keskvaartuse, dispersiooni, standardhalbe, mediaani ja haarde hinnangud.
t 0,975 ( 6 )=2,45 b j=t 0,975 ( 6 ) s ( b j ) b 0=3,9, b1 =1,2 11.3 H 0 : 2ad= 2 ( y ) , H 1 : 2ad > 2 ( y ) ^y i=b 0+ b1 x i N 1 2 s = ad N -d j=1 ( y i- ^y i )2=5,5 Joonis 5. Regressioonimudel 30 25 Katsepunktid y=3,96x+1,94 Usaldusvahemiku alampiir 20 y 15 10 Usaldusvahemiku ülempiir 5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 x s 2ad F= 2 =2,5 s ( y) 15
µ^ = xi = xi = 44,8 N i =1 25 i =1 1 N 1 N ^ 2 = s 2 = i N - 1 i =1 ( x - µ ^ ) 2 = ( xi - 44,8) 2 = 814,4 24 i =1 s= s 2 = 814,4 = 28,54 2) Valitud usaldustõenäosuse p ja vabadusastmete arvu f = N-1 järgi leitakse t- jaotuse kvantiil - Exceli funktsiooniga TINV(a;f) t = 1,711 3) Arvutatakse usaldusvahemiku poollaius s 28,54 µ = t = 1,711 9,77 N 25 4) Leitakse usaldusvahemik P ( µ^ - µ < µ < µ^ + µ ) = 1 - P ( 35,03 < µ < 54,57 ) = 0,9 Dispersiooni usaldusvahemik 1) Leitakse dispersiooni hinnang: 1 N 1 N ^ 2 = s 2 = i N - 1 i =1 ( x - µ ^ ) 2 = ( xi - 44,8) 2 = 814,42
Kogumi keskväärtuse usalduspiirid - Suure (n>30) valimi korral on üldkogumi keskväärtuse usalduspiirid usaldatavusega β Kogumi keskväärtuse usalduspiirid lõpliku kogumi mahu N korral Usaldatavus - β näitab, millise tõenäosusega jääb kogumi keskväärtus usaldusvahemikuga antud piiridesse Usaldatavuse valik – kõige sagedamini 0,95, mõnikord 0,90 või 0,99. Ühe ja sama valimi korral suurem usaldatavus = laiem usaldusvahemik (suurem määramatus). Usaldusvahemiku poollaiuse sõltumine – usaldatavust saame valida, valimi mahtu saab muuta, standardhälvet muuta ei saa Kattuvad ja mittekattuvad usaldusvahemikud - kui vahemikud ei kattu, siis saab väita, et esineb erinevus. Kui kattuvad, siis ei saa väita, et esineb erinevus. Usaldusvahemiku määramise täpsus: Suhteline viga E= Väikesed valimid t-jaotus - Väikeste valimite korral valimite keskväärtuste jaotus erineb normaaljaotusest. t-jaotuse kuju sõltub vabadusastmete arvust ν
See tõepärasusfunktsioon kujutab endast valimi elementide kui sõltumatute juhuslike suuruste n-mõõtmelist jaotustihedust. Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel. Usaldusvahemikud Tõenäosust, et tegelik väärtus satub väljaspoole usaldusvahemikku, tähistatakse tavaliselt ja nim olulisuse nivooks: = 1 - p. Sammud Kahepoolse sümmeetrilise usaldusvahemiku arvutamiseks on järgmised: leitakse keskväärtuse ja standardhälbe hinnangud valitud usaldustõenäosuse p ja vabadusastmete arvu f=N-1 järgi leitakse t-jaotuse tabei või arvutiprogrammi abil vajalik t-jaotuse kvantiil arvutatakse usaldusvahemiku poollaius leitakse usaldusvahemik Sammud Tõenäosuse järgi sümmeetrilise kahepoolse usaldusvahemiku arvutamiseks on järgmised: leitakse dispersiooni hinnang
Harmooniline keskmine 2 N ^ =s 2= 1 ( x - x´ )2 Dispersioon ¿ N -1 i=1 i ¿ Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Mood tunnuse kõige sagedamini esinev väärtus Haare R = xmax xmin = 99 4 = 95 2. Leian keskväärtuse, dispersiooni ja standardhälbe usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,05 ehk P= 95% Keskväärtuse usaldusvahemik: sx sx ( P ´x -t , N-1 N < < ´x +t , N -1 N ) =1- s
Variatsioonikordaja (v) 18,9 20,5 21,6 26,3 34,6 48,8 Standardviga (m) 8,7 5,6 10,1 6,5 12,9 7,6 Katsetäpsus (p) 2,7 2,9 3,0 3,7 4,9 6,9 Usalduse piirväärtus(∆) 17,5 11,2 20,2 13,0 25,9 15,1 Usaldusvahemiku ülemine piir 344,1 205,4 352,1 188,1 290,2 124,9 Usaldusvahemiku alumine piir 309,1 183,0 311,7 162,0 238,4 94,7 Tabel 2. Studenti´i kriteeriumid Studenti kriteerium (tx) Kõrgus Võrade läbimõõt I ja II katseala 0,4 2,2 I ja III katseala 4,0 9,0
992 5.930 5.970 5.950 5.960 Rvalimistoon tagasi [k] 5.990 5.928 5.950 5.940 5.950 Keskväärtus: R kesk.kaob = (5992 + 5930 + 5970 + 5950 + 5960)/5 = 29802 / 5 = 5960,4 oomi R kesk.tuleb = (5990 + 5928 + 5950 + 5940 + 5950)/5 = 29758/ 5 = 5951,6 oomi R kesk = (R kesk.kaob + R kesk.tuleb)/2 = 5956 oomi Hajuvus skaob=2,1 stagasi=2,1 Mõõtmise usaldatavus ja usaldusvahemik Kasutades usaldusnivood 95%, saame Rusaldusvahemik_kaob = 5889 kuni 6058 Rusaldusvahemik_tagasi = 5892 kuni 6052 (usaldusvahemiku arvutamiseks on kasutatud exceli Data Analysis funktsiooni) Suurim lubatav liini pikkus AWG 22 kaabli teoreetilised andmed Takistus sõltub telefoniliini pikkusest, telefoniliini ristlõike pindalast ja materjali eritakistusest. Valem: R = l × / S , kus R - liini takistus [] l - liini pikkus [m], S - liini ristlõike pindala [mm2], - eritakistus [mm2/m]. Seega l = R × S / Telefoniliin on AWG-22 ja tema juhtme läbimõõt: d = 0,644 mm.
80178 y(5) 21.71264 s(y1/x) 1.167342 delta(y1/x) 2.856486 s(y3/x) 0.662444 delta(y3/x) 1.620999 s(y5/x) 1.136495 delta(y5/x) 2.781004 Joonis 5. Regressioonimudel 30 25 20 Katsepunktid y=3,96x+1,94 15 y Usaldusvahemiku alampiir Usaldusvahemiku ülempiir 10 5 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 x
Ka keskmisest kaugel olevad väärtused on võimalikud, kuid vähetõenäosed. Kolme sigma reegel: 99,7% normaaljaotuse väärtustest asub arvude μ-3σ ja μ+3σ vahel. Seega 99,7% normaaljaotuse väärtustest asub keskmisest +/- 3 standardhälbe ulatuses. Kahe standardhälbe ulatuses keskmisest ühes ja teises suunas paikneb 95,5% väärtustest ja ühe standardhälbe kaugusel asub 68,3%. 8) Usalduspiirid- usaldusvahemiku puhul on tegemist tunnuse väärtuste piirkonnaga, kust teatud tõenäosusega asub üldkogumiku tegelik keskmine. 9) Hüpoteeside kontrollimine. 2 võimalust kontrollimiseks 1.Statistiliseks hüpoteesiks nimetatakse mis tahes oletust otseselt või kaudselt kas üldkogumi jaotuse kohta tervikuna või jaotuse mõne parameetri (näiteks keskmise) kohta, kusjuures seda oletust kontrollitakse valimi põhjal.
4) Logaritmiline normaaljaotus 5) Gram-charlier normaaljaotus 6) Weibulli jaotusseadus 7) Eksponentjaotus 8) Gammajaotus 9) Beetajaotus 10) Studenti jaotus 11) F-jaotus Diskreetsed: 1) Binoomjaotus 2) Hüpergeomeetriline jaotus 3) Poissoni jaotus 4) Pascali jaotus 17. Mis on usaldusnivoo? Usaldusnivoo näitab tulemuse sattumise tõenäosust mingisse vahemikku. 18. Mis on usalduspiirid? usalduspiirid, usaldusvahemiku alumine ja ülemine otspunkt. Usalduspiirkond on valimi põhjal arvutatud piirkond, millesse hinnatava parameetri tegelik väärtus kuulub teatava tõenäosusega. Selle tõenäosuse väikseimat lubatavat väärtust, milleks tavaliselt valitakse 0,99 või 0,95, nimetatakse usaldusnivooks. 19. Mis on nullhüpotees? Nullhüpotees, mis tavaliselt väljendab uurijat mittehuvitavat juhtu. Nullhüpoteesi ei ole võimalik tõestada. Selle vastuvõtmine tähendab, et kui uurija
standardmääramatuse koosmõjul. Ta on võrdne positiivse ruutjuurega summast, mille liikmed on sisendsuuruste dispersioonid või kahekordsed kovariatsioonid ja mida liitmisel kaalutakse vastavalt sellele, kuidas mõõtetulemus muutub sõltuvalt sisendsuuruste väärtuste muutumisest 18. Laiendmääramatus Kui hinnatavaks parameetriks on standardhälbe kordne või kindla, küllalt suure tõenäosusega usaldusvahemiku poollaius, siis saame laiendmääramatuse. 19. Juhusliku suuruse mõiste, diskreetne ja pidev juhuslik suurus, Klassikaline ja statistiline tõenäosus Juhuslik suurus on suurus, mille konkreetne väärtus sõltub juhusest. Suurus on objekt, mida saab iseloomustada kas ühe arvuga või arvude komplektiga. Vaatleme mingi mõõteriista osuti liikumist skaalal. Skaala on kõver, osuti langeb mingisse punkti, saame elementaarsündmuse. Juhuslik sündmus on näidu tekkimine
∆ b 1=t α (W −1 ) √ s 2 ( b 1 )=2,447 ∙ √ 0,20=1 , 09 1− 2 ∆ b 0=t α ( W −1 ) √ s 2 ( b0 )=2,447∙ √ 2,24=3 , 66 1− 2 Leian hinnangu b1 usaldusvahemiku: P ( b1−∆ b1 ≤ β 1 ≤ b1 +∆ b1 )=1−α P ( 3,16−1,09 ≤ β1 ≤3,16+ 1,09 )=1−0,05 P ( 2,07 ≤ β 0 ≤ 4 , 25 )=0 , 95 Leian hinnangu b0 usaldusvahemiku: P ( 2,37−3,66 ≤ β 0 ≤ 2,37+3,66 )=1−0,05 P ( −1,29 ≤ β1 ≤6,03 )=0 , 95 11.3 Kontrollin mudeli adekvaatsust (lugedes mõlemad mudeli liikmed olulisteks) Selleks leian F-statistiku, mis näitab selle mudeli poolt prognoositud ja tegelike y väärtuste erinevust.
1; 2; 5; 14; 18; 19; 25; 27; 31; 33; 37; 39; 39; 45; 46; 50; 56; 63; 65; 71; 74; 77; 83; 89; 98 Mediaan: 39 Haare: 98 1 = 97 2. Leian keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0.10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0.95(24) = 1.711 = 9.51 Keskväärtuse usaldusvahemik arvutatakse valemiga: P(34,77 < < 53,79) = 90% Dispersiooni usaldusvahemiku leidmiseks kasutatakse 2-statistikut f = N 1 = 24 P (509,10 < 2 < 1338,75) = 90% 3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24 Kriitiline t-statistiku väärtus t0.95(24) = 1.711 Kuna t < , siis võtame hüpoteesi H0 vastu. 3.2. H0: 2 = 800; H1: 2 800
kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me=74 Haare: =96-0=96 R=96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) (Arvutatud excelis väärtuste ümardusi rakendamata) Usaldusvahemiku poollaius: 11,2 Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli CHIINV funktsiooniga) 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10): 3.1 H0: = 50 alternatiiviga H1: 50 1 Et Hüpotees vastu võetaks, peab tkr > t; 1,711 > 1,28. Hüpotees H0 võetakse vastu. 3.2 H0: 2 = 800 alternatiiviga H2: 2 800
mingi väärtuse jaoks kumulatiivset osakaalu, st väärtuste osakaalu, mis on väiksemad etteantud väärtusest. Standardse normaaljaotuse jaotusfunktsiooni graafik näeb välja järgmine: Standardse jaotusfunktsiooni argumendile z vastavad kumulatiivsed osakaalud, tähistame a, esitatakse standardse normaaljaotuse jaotustabelis. Kuna iga normaaljaotus on standardiseeritav, siis on selline tabel alati kasutatav, edaspidi kasutame sarnast tabelit keskväärtuse usaldusvahemiku leidmisel ja keskväärtuse kohta hüpoteeside kontrollimisel. Arvutustes rakendatakse täiendkvantiile, mis on kumulatiivsele osakaalule 100%-a vastava argumendi z väärtus, tähistame seda z (kumulatiivsele osakaalule a vastavat väärtust z nimetame kvantiiliks). Täiendkvantiil on väärtus, millest suuremate väärtuste osakaal on a ehk väärtus, millest väiksemate väärtuste osakaal on 100%-a. Üldiselt on üldkogumile tulemuste andmisel kasutusel järgmised mõisted:
lambda= 0,0187829 s Standardhälve= 26,56 Mediaan= 51 Haare= 85 2. =0.10 p=0.90 f=N-1=24 Poollaius = t0.95 Kvantiilid= t0.95(24)=1.71 1,710882 Keskväärtuse usaldusvahemiku poollaius= 1,71*26.56/ruutjuur25-st 44,15 < 9,09 < 62,33 dispersiooni usaldusvahemik: hii^2 0,05(25) hii^2 0,95(25) 13,848 36,42 465,10 <
7 statistik: 0,29 Järeldus: lükatakse tagasi 8 F- statistik: F= 0,404 Järeldus: võetakse vastu 9 9.1 2,73 2,08 Regressioonimudel: 9.2, 9.3 3,89 olulisus: pole oluline 1,16 olulisus: on oluline 9.4 F-statistik: F=1,64 Järeldus: võetakse vastu 9.5 Väljundi usaldusvahemiku poollaiused : :: : Rakendusstatistika arvutusgraafiline töö nr. 1 OSA A 1. On antud valim A mahuga N = 25 Abistavad tehted on koondatud tabelisse jrk ni xi ni * xi ni 1 1 0 0 3405,89 41,19 3405,89 2 1 5 5 2847,29 29,36 2847,29
lukata Determinatsioonitegur: ( 0,56 ) z-statistik : z = 1,37 Järeldus:tagasi lukata 11 11.1 6,3 - 1.40 Regressioonimudel: 11.2, 11.3 1,101 olulisus: oluline 3,65 olulisus: oluline 11.4 F-statistik: F = 0,386 Järeldus: võetakse vastu 11.5 Väljundi usaldusvahemiku poollaiused : : : : Rakendusstatistika arvutusgraafiline töö nr. 1 OSA A 1. Küsimus On antud valim A mahuga N = 25 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1 8 8 Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus:
süstematiseerimin keskmise usalduspiirkonna; e. Statistilise 9) kogub andmestiku ja analüüsib andmestiku seda arvutil statistiliste analüüsimine ühe vahenditega. tunnuse järgi. Korrelatsiooniväli. Lineaarne korrelatsioonikorda ja. Normaaljaotus (näidete varal). Statistilise otsustuse usaldatavus keskväärtuse usaldusvahemiku näitel. Andmetöötluse projekt, mis realiseeritakse arvutiga (soovitatavalt koostöös mõne teise õppeainega). Funktsioonid Õpilane: Jada Funktsioonid I y = ax + b , 1) selgitab funktsiooni mõistet ja ülesanded Arvjadad
Kirjeldatud tõenäosust, mille uurija ise saab valida, nimetatakse usaldusnivooks (tähistatakse 1-), tavaliselt on piisavaks tõenäosuseks 0,95 (95%) või 0,99 (99%). Niisugust üldkogumi karakteristiku võimalike väärtuste vahemikku, millesse tegelik väärtus satub tõenäosusega 1- , nimetatakse usaldusvahemikuks ning otspunkte usalduspiirideks. Usaldusvahemik = valimi keskmine ± zkrit * st.viga VALIMI MAHU PLANEERIMINE Väikeste valimite korral on usaldusvahemiku laius suurem (määramatus on suurem). Valimi mahu suurenedes usaldusvahemiku laius ja seega ka määramatus väheneb. Määrates valimi mahtu, tahetakse vältida liiga väikese valimi võtmist, mille korral hinnang oleks liiga ebatäpne ja ei omaks väärtust. Samavõrd tahetakse vältida valimit, mis on liiga suur, sest see raiskaks väärtuslikke ressursse. Seetõttu on valimimahtude täpne määramine tähtis, kuid võib olla
· Järeldus olulisuse tõenäosusest p=0,03: kuna leitud erinevuse juhuslik tõenäosus on väike, siis otsustame, et keskmine diastoolne vererõhk vastavates üldkoguites on erinev ehk kuna leitud olulisuse tõenäosus jääb väiksemaks kui kokkuleppeline olulisuse nivoo 5%, otsustame, et võrreldavad üldkogumid on oluliselt erinevad erinevus on statistliselt oluline. · Seos olulisuse tõenäosusega ja 95% usaldusvahemiku vahel: kui 95% usaldusvahemik ei sisalda väärtust 0, siis jääb olulisuse tõenäosus väiksemaks kui 0,05. Kahe protsendi võrdlemine nn Z-test · Suure valimi (nsuurem50) korral kehtib: o Valimiprotsent on ligikaudu normaaljaotusega o Kahe valimiprotsendi pa ja pb vahe dp on ligikaudu normaaljaotusega o Kahe valimisprotsendi vahe standardviga on arvutatav valimi põhjal kui: · Paariviisiline võrdlus Wilcoxoni astakmärgitest
väärtustest (umbes keskmine +/- 2 standardhälvet). · Usaldusnivoo ei pea olema tingimata 95%, see võib uurija soovi korral olla ka laiem või kitsam. Usaldusvahemik on seda laiem, mida: · Suurem on tunnuse hajuvus · Väiksem on valimi maht · Suurem on usaldusnivoo Usaldusvahemik on seda kitsam, mida: · Väiksem on tunnuse hajuvus · Suurem on valimi maht · Väiksem on usaldusnivoo · Usaldusvahemiku puhul on tegemist tunnuse väärtuste piirkonnaga, kus teatud tõenäosusega asub üldkogumi tegelik keskmine. · Täpset üldkogumi keskmise asukohta me enamasti ei tea. · Kuidas saada teada, kas keskmised erinevad piisavalt palju, et kinnitada gruppide erinevust ka üldkogumil? 1. võimalus: vaadata, kas usalduspiirid kattuvad. Kui usaldusvahemikud ei kattu, siis võime öelda, et (valitud nivool) on tegemist statistiliselt olulise erinevusega.
lähtuvalt sellest, kas üldkogumi suurus on teada või ei ole.(valimi mahu võtmisel ei arvestata missing lahtrit) Piiresindusviga. Jälle kaks valemit lähtuvalt üldkogumist. Kasutatakse t-jaotuse täiendkvantiili (olulisusnivoo ja vabadusastmete arv). Piiresindusviga=keskmine esindusviga*t Usalduspiirid= x ±x Mõisted: · usaldusvahemik on see piirkond, kuhu meie üldkogumi karakteristik määratud tõenäosusega langeb · alumine ja ülemine usalduspiir on usaldusvahemiku otspunktid · usaldusnivoo on see tõenäosus, millega antud karakteristik sellesse vahemikku jääb HÜPOTEESIDE TESTIMINE Statistiliseks hüpoteesiks nimetatakse üldkogumi kohta esitatud üldistust. Hüpoteeside kontrollimiseks esitatakse statistiliste hüpoteeside paar(nullhüpotees ja altervatiiv- ehk sisukas hüpotees). Hüpoteeside paari moodustavad hüpoteesid peavad kindlasti üksteist välistama ning üks neist peab kindlasti kehtima. Näiteks:
tarbimine aastas 1,68 kWh võrra suurem. Kui sissetulek on 100 GBP võrra suurem, on tarbimine aastas 168 kWh võrra suurem. Parameetri b tõlgendus: kui sissetulek on 0, on tarbimine 274 kWh. NB! Ei pruugi olla õige, sest 0 lähedal andmed puuduvad. a sirge tõus - näitab, kui palju muutub y, kui x muutub ühiku võrra. b konstant ehk vabaliige - näitab, millega võrdub y, kui x=0. 25. Parameetrite hinnangute usalduspiirid, millest sõltub usaldusvahemiku laius Parameetrite hinnangute standardvead näitavad, kui täpsed on parameetrite hinnangud. Täpsemate hinnangute saamiseks peavad x väärtused võimalikult palju hajuma. Usalduspiiride leidmisel lähtutakse sellest, et parameetrite hinnangute standardiseeritud erinevused tegelikest väärtustest alluvad t jaotusele vabadusastmete arvuga. 26. Hüpoteeside testimine parameetrite jaoks ja parameetrite statistilise olulisuse kontrollimine (t-test).
lineaarse mudeli eeldused: Hinnangud on: 1) nihketa, 2) efektiivsed (vähima dispersiooniga kõigi nihketa lineaarsete hinnangute seas 3) lineaarsed vaatluse y suhtes 21) Lineaarse mudeli parameetrite tõlgendus üldjuhul: y=b+ax a sirge tõus. Näitab, kui palju muutub y, kui x muutub ühiku võrra. b konstant ehk vabaliige. Näitab, millega võrdub y, kui x=0 22) Parameetrite hinnangute usalduspiirid, millest sõltub usaldusvahemiku laius Usalduspiiride leidmisel lähtutakse sellest, et parameetrite hinnangute standardiseeritud erinevused tegelikest väärtustest alluvad t jaotusele vabadusastmete arvuga v= n -2 23) Hüpoteeside testimine parameetrite jaoks ja parameetrite statistilise olulisuse kontrollimine (t-test): Kas tunnused X ja Y omavahel seotud, kas tõusuparameeter a erineb oluliselt nullist. H0 seos puudub a=0 H1 seos on a ≠0 p
c. üldkogumi keskväärtus võib olla 20. 13. Ühe ja sama valimi põhjal teostasid arvutusi kaks erinevat analüütikut. Analüütiku A leitud usaldusvahemik: 23,4 ± 2,9 Analüütiku B leitud usaldusvahemik: 23,4 ± 4,9 Kumma analüütiku tulemuse usaldatavus on suurem? B 14. Usaldatavuse suurendamisel usalduspiirid lähevad laiemaks. 15. Kas on õige väide: Suurema valimi korral on usaldatavus suurem. Väär 16. Üldkogumi keskväärtuse usaldusvahemiku laius sõltub valimi standardhälbest, valimi mahust, usaldatavusest. 17. Vabadusastmete arv on sõltumatute muutujate arv. 18. Studenti jaotus kirjeldab valimite keskväärtuste jaotust väikeste valimite korral. 19. Mediaani usalduspiiride leidmisel kasutatakse binoomjaotust. 20. Loend on ülekaetud, kui loend sisaldab üldkogumisse mittekuuluvaid objekte. 21. Ankeetküsitluse läbiviimisel mõõtmisvahendi viga võib tulla küsimuse valesti sõnastamisest.
väärtuse asukoht määramatu Mõõtemääramatus iseloomustab mõõtmistulemustele omistatavate võimalike väärtuste hajusust : - võimaldab hinnata tulemuste usaldatavust - võimaldab võrrelda tulemusi. 33 Siiri Velling (Tartu Ülikool), 2011 Määramatust väljendatakse standardhälbe või usaldusvahemiku kaudu ja mõõtemääramatuse abil on võimalik anda tulemuste kvaliteedile ja usaldatavusele arvuline tähendus. Mõõtemääramatuse allikaid: · proovivõtt · säilitamistingimused · seadmete mõjud · reaktiivide puhtus · määramistingimused · proovi mõjud · nullproov · operaatori mõju 7.3 Mõõtmisvead Igasuguste suuruste kvantitatiivne määramine on seotud mõõtmisvigadega.
Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Harjumaa Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn Tallinn mine 1 - 1000 üle 1000 Leia keskväärtus tunnusele ,,Kliendi hinnang kaubale". Milline on usaldusvahemiku laius sellele tunnusele ü usaldatavusega 90% ? Kliendi hinnang Kliendi Esmakontakti Ettevõtte Ostude Ostude teenindu hinnang Tegevusvaldk kuupäev suurus arv summa kokku sele kaubale ond 25.01.2011 3 16 229,50 1 2 Haridus, teadus 18.01.1999 28 114 5 009,80 6 5 Haridus, teadus 1.01
● lineaarsed vaatluste yi suhtes. KUI Kehtivad klassikalise lineaarse mudeli eeldused Sellisel juhul annab vähimruutude meetod lineaarse regressioonmudeli jaoks parima lineaarse nihketa hinnangu (BLUE) 21. Lineaarse mudeli parameetrite tõlgendus üldjuhul. y = b + ax a - sirge tõus (näitab, kui palju muutub y, kui x muutub ühiku võrra) b - konstant ehk vabaliige (näitab, millega võrdub y, kui x=0) 22. Parameetrite hinnangute usalduspiirid, millest sõltub usaldusvahemiku laius Usalduspiiride leidmisel lähtutakse sellest, et parameetrite hinnangute standardiseeritud erinevused tegelikest väärtustest alluvad t jaotusele vabadusastmete arvuga v=n-2 Parameetrite hinnangute standardvead näitavad, kui täpsed on parameetrite hinnangud. Täpsemate hinnangute saamiseks peavad x väärtused võimalikult palju hajuma. Usalduspiiride leidmisel lähtutakse sellest, et parameetrite hinnangute standardiseeritud
tõenäosus) a = 5% (0,05) või 1% (0,01). F-kriteeriumi abil kontrollitakse regressioonimudeli kui terviku statistilist olulisust. Fkriitilise leidmiseks kasutada funktsiooni FINV. Kui F emp > F krit, siis on regressioonimudle kui tervik stat usaldusväärne c. mudeli parameetrite statistilise olulisuse kontrollimine; usalduspiiride leidmine; t-statistiku abil hinnatakse parameetri (regressioonikordaja usaldusväärsust). t- kriitilise leidmiseks kasutada funktsiooni TINV. Usaldusvahemiku alumine ja ülemine piir (Lower 95% ja Upper 95%) määravad vahemiku, millesse jääb 95% tõenäosusega regressioonikordaja. d. eespool toodud näitajate leidmine ja seoste analüüs Exceli regressioonanalüüsi tabeli põhjal. Vaata moodles regressiooni selgitused. 9. Mitmene regressioon. Klassikalise regressioonanalüüsi põhieeldused. Gauss-Markovi teoreemi olemus. Parim hinnang. Nihutamata hinnang. Efektiivne hinnang. MITMENE REGRESSIOON
110 9 40 31 40 1072 12 242 557 29 934 47 18 22 13 224 22 20 74 1196 28 183 348 13 20 487 31 26 1058 417 6 209 45 13 41 699 271 951 107 254 904 35 27 698 161 33 9 26 4 24 910 26 32 411 2 466 44 2 6 1189 275 198 697 1060 34 190 969 13 896 663 22 707 589 7 5 39 3 37 985 23 15 452 776 27 956 455 722 580 4 14 9 13 1104 248 Leia keskväärtus tunnusele ,,Kliendi hinnang teenindusele". Milline on usaldusvahemiku laius sellele tunnusele üldvalimile ning Tallnna ja Harjumaa klientidele eraldi võetuna usaldatavusega 90% ? ÜLDKOGUM keskväärtus tunnusele ,,Kliendi hinnang teenindusele": 4.44 usaldustase: 0.10 standardhälve: 1.51 valimi suurus: 248 populatsioonikeskmiste vahemik: 0.16