.......................................................................2 Sissejuhatus....................................................................................................................... 3 2. Diameetri usalduspiirid..................................................................................................4 3. Mitut puud tuleks mõõta?..............................................................................................4 3.1 Mitut puud tuleks mõõta et saada keskväärtuse hinnang veaga 0,3 cm..................4 3.2 Mitut puud tuleks mõõta, et saada keskväärtuse hinnang veaga 1%.......................4 4. Usaldusnivoo................................................................................................................. 5 5. Usalduspiirid..................................................................................................................5 6. Standardviga..................................................................................
Variatsioonirida - tunnuse väärtuste rida kasvavas või kahanevas järjekorras Mood - variatsioonirea kõige suurema esinemissagedusega liige (Mo) Mediaan - variatsioonirea keskmine liige (Me) Aritmeetiline keskmine - tunnuse keskväärtus ( x ) Hälve - variatsioonireas oleva tunnuse väärtuse ja keskväärtuste vahe Dispersioon - hälvete ruutude aritmeetiline keskmine ( 2) Standardhälve - ruutjuur dispersioonist ( ) Variatsioonikordaja - standardhälbe ja keskväärtuse suhe (V) Arvutusteks kasutan järgnevaid valemeid: N valemi suurus ( vaadluse all olevate objektide arv) N vahemike arv X max suurim väärtus X min väikseim väärtus X = X max - X min suurima ja väiksema väärtuse vahe 3 Mo tunnuse kõige sagedamini esinev väärtus - mood N Me = tunnuse väärtus, millest suurimaid või väiksemaid liikmeid on 2 variatsioonireas ühepalju - mediaan n
l 0 .. 100 m l a. l b Regressioonisrige 10 8 y i ml 6 4 2 0 50 100 x ,l i Leian usaldatavuspiirkonnad X ja Y keskväärtuse, dispersiooni ning standardhälbe hinnangutele. Olulisuse nivooks olgu =0.95. 0.95 Leian väärtuse e, mille korral hinnatav suuruse kuulub piirkonda (suurus-e;suurus+e) tõenäosusega . 1. X keskväärtuse hinnangu usaldatavuspiirkond Studenti jaotuse tegur kohal (n-1, ( +1)/2) t 2.160 s_x. _x t n _x = 14.44 Seega P(x_kesk - _x < EX < x_kesk + _x) = P(44.417 < EX < 73.297) = = 0.95 2. Y keskväärtuse hinnangu usaldatavuspiirkond s_y. _y t
Maksimaalne elemet tunnuse väärtuste hulgas suurim. Variatsioonrea ulatus maksimaalse ja minimaalse elemendi vahe. Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonreas 25%. Ülemine kvartiil tunnuse väärtus, milles suuremaid (või võrdseid) liikmeid on variatsioonras 25%. Dispersioon ja standardhälve Variatsioonrida: x1; x2; x3....xn Variatsioonreas oleva arvu ja keskväärtuse vahet nimetatakse selle arvu hälbeks. Dispersioon - juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus varieerub. Näiteks kui katseseerias on kõigi katsete tulemus sama, siis katsete dispersioon on null. Mida suurem aga dispersioon on, seda enam erinevad katsete tulemused üksteisest. Standardhälve ruutjuur dispersioonist. Variatsioonkordaja Kui uuritavate tunnuste mõõtühikud on erinevad, ei saa nende hajuvust hinnata standardhälbega
Arv > 0 iseloomustab hinnangu täpsust. Usalduspiirkonna leidmine p(a) S= 0 ã- ã+ a p(a) juhusliku suuruse a tihedusfunktsioon. Usalduspiirkonna (ã , ã + ) leidmiseks tuleb: 1. Arvutada valimi põhjal punkthinnang ã; 2. Ette anda usaldusnivoo (näiteks 95%; 99%); 3. Leida seosest P(|ã a| < ) = suurus , mis määrabki usalduspiirkonna. Normaaljaotuse keskväärtuse usalduspiirkond suure valimi korral Eeldame, et valimi maht on küllalt suur (n > 30) või standardhälve on eelnevalt teada (näiteks mõõteriista täpsus on teada). Olgu X ~ N(m, ). Leiame keskväärtuse punkthinnangu aritmeetilise keskmise abil: 1n x = xi n i =1 Normaaljaotusega juhusliku suuruse X antud vahemikku sattumise tõenäosuse võime leida Laplace'i funktsiooni abil:
Hinnangut nimetatakse efektiivseks, kui tema dispersioon on minimaalne: D[ã(x1., x2 , ... , xn)] = min. Efektiivsed hinnangud võimaldavad saavutada vajalikku täpsust kõige väiksema mahuga valimite korral. 3. Hinnangu konsistentus (mõjusus, sisukus). Hinnangut nimetatakse konsistentseks, kui ta koondub tõenäosuse järgi parameetriks a: lim P(|ã(x1., x2 , ... , xn) a| < ) = 1 n iga > 0 korral. Keskväärtuse hinnang (I) Üldkogumi keskväärtuse efektiivseks nihutamata ja konsistentseks hinnanguks on aritmeetiline keskmine: 1n x = xi n i =1 Kontrollime hinnangu nihutamatuse nõuet. Keskväärtuse omaduste põhjal: n·EX 1 n 1 n = 1 n Ex E x = E xi = E xi i n i =1 n i =1 n i =1 Kui valim on representatiivne, s.t
0 0 4 10 16 3.2 Matemaatika Hinne 1 Hinne 2 Hinne 3 Hinne 4 Hinne 5 0 0 14 9 7 2 4. Histogrammid Sagedustabelist graafilise ülevaate saamiseks kasutatakse histogramme(tulpdiagramme). 4.1 4.2 3 5. Füüsika 5.1.Leian keskväärtuse. Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. Valem: x + x + ... + x n x= 1 2 n Olgu x1 vaadeldava tunnuse väärtus esimese objekti korral, x2 teise objekti korral jne ning n olgu mõõdetud objektide arv. x=4,4 5.2. Leian standardhälve. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on tunnuse väärtuste hajuvus. Valem: n ( xi - x) 2
7 9 7 4 8 5 3 1 9 3 5 9 5 8 4 6 1 3 0 7 6 9 1. Valimi parameetrite hindamine. Kasutan järgmisi valemeid: Keskväärtus: 44,28 Dispersioon: 772,46 Standardhälve: 27,79 Mediaani ja haarde leidmiseks teeme valimi liikmete ümberjärjestust: 1; 2; 5; 14; 18; 19; 25; 27; 31; 33; 37; 39; 39; 45; 46; 50; 56; 63; 65; 71; 74; 77; 83; 89; 98 Mediaan: 39 Haare: 98 1 = 97 2. Leian keskväärtuse ja dispersiooni usaldusvahemikud (usaldusnivoo = 0.10), eeldades üldkogumi normaaljaotust Keskväärtuse jaoks kasutame t-statistikut f = N 1 = 24 t0.95(24) = 1.711 = 9.51 Keskväärtuse usaldusvahemik arvutatakse valemiga: P(34,77 < < 53,79) = 90% Dispersiooni usaldusvahemiku leidmiseks kasutatakse 2-statistikut f = N 1 = 24 P (509,10 < 2 < 1338,75) = 90% 3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi
Dispersioon: Standardhälve: Normaaljaotus Binoomjaotuse lähendamine normaaljaotusega ja Punktihinnangud Keskväärtuse hinnanguks on Dispersiooni hinnanguks on Standardhälbe hinnanguks on Normaaljaotuse keskväärtuse usalduspiirkond Kui on teada või n on suur, siis Juhusliku sündmuse tõenäosuse usalduspiirkond. Valimi mahu määramine ja ,
Sündmuse A x B korrutis on sündmus, mille toimumine seisneb mõlema (A ja B) toimumises. Sündmuse sagedus on sooritatud (n) katsete ja katseseeriate (m) arvu vahejagatis Sündmuse tõenäosus on juhuslik sündmuse konstant, mille ümber grupeerub selle sündmuse sageduse katsete arvu suurenedes (m- soodsate sündmuste arv, n- võrdvõimalike sündmuste arv) 3. Juhusliku suuruse keskväärtus ( EX ). Keskväärtuse punkthinnang (aritmeetiline keskmine x ). Diskreetse ja pideva juhusliku suuruse mood ja mediaan. Juhusliku suuruse keskväärtus grupeeritud juhuslike suuruse võimalikud väärtused. Juhuslike võrdvõimalike sündmuste arvu (N) soodsate sündmuste protsendilise tõenäosuse korrutis E(X) = n * p p=1q Võrdvõimalike sündmuste sageduse tiheduse ( ) korrutise summa ... *
Hajuvusmõõdud Tihti on vaja hinnata, kui palju andmed erinevad "tüüpilisest" väärtusest (ehk teisiti: kui palju andmed hajuvad). Enamasti vaadeldakse erinevust keskväärtusest. Saab tõestada, et tunnuse väärtused paiknevad kõige tihedamini keskväärtuse ümber. Kuidas hajuvust arvuliselt kirjeldada? Seda uurimegi. Vaatleme kahte erinevat valimit. Üks neist on esitatud sagedustabeliga, teine jaotustabeliga. Leiame kummagi valimi jaoks keskväärtuse, mediaani ja moodi. 1. valim: xi 7 8 9 10 11 12 13 fi 1 3 5 10 5 3 1 17 38 59 10 10 511 312 113 x 10 28 Me = 10 Mo = 10 2. valim: xi 7 8 9 10 11 12 13
varieerub. Näiteks kui katseseerias on kõigi katsete tulemus sama, siis katsete dispersioon on null. Mida suurem aga dispersioon on, seda enam erinevad katsete tulemused üksteisest. Standardhälve ruutjuur dispersioonist. 23. Kuidas leitakse standardhälve a) Variatsioonreast? b) Sagedustabelist? 24. Mis on variatsioonkordaja? Milleks läheb seda vaja? - Standardhälbe ja keskväärtuse suhe: V=sh/ksv. 25. Millist jaotust nimetatakse normaaljaotuseks? Milliste tingimiuste korral tekib normaaljaotus? Normaaljaotus kirjeldab tunnust, mille keskmise taseme lähedased väärtused esinevad tihti, aga suuri kõrvalekaldeid keskmisest väärtusest on harva. Mõlemasuunalised kõrvalekalded on võrdvõimalikud. Normaaljaotus tekib järgmise tingimuste korral: 1. Tunnuse väärtustel on olemas mingi fikseeritud keskmine tase. 2
Test 6 pidev, diskreetne, poissoni jaotus, jaotusseadus jaotusseadus, eksponentjaotus normaaljaotus, normaaljaotus normaaljaotus negatiivne väärtus poissoni jaotus Test 7 kogum, klastervalik, kihtvalik, lihtne juhuvalik, süstemaatiline valik tõenäosuslik valikumeetod, empiiriline valik fikseeritud samm, süstemaatiline valik, punkthinnang nihketa, efektiivne, optimaalne keskväärtus, normaaljaotus, suur valim keskväärtuse standardviga standardhälve standardviga, keskväärtuse usalduspiirid valimvaatlus usaldatavus suur valim, usaldatavus suurem üldkogumi keskväärtuse usaldusvahemiku laius, vabadusastmete arv studenti jaotus mediaani usalduspiiride leidmisel kasutatakse binoomjaotust, loend on ülekaetud ankeetküsitluse läbiviimisel, mõõtmisvahendi viga Test nr 8 sisukas hüpotees, järeldus peale parameetri empiirilise väärtuse võrdlust kriitilisega
Rakendusstatistika arvestusharjutus. Osa A. N=25 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus Dispersioon Standardhälve Mediaan Me=49 Haare 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,71 Dispersiooni usaldusvahemik: = 0,10 ja 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10) 3.1 H0: = 50 alternatiiviga H1: 50 Et Hüpotees vastu võetaks, peab tkr > t; 1,71 > 0,6. Hüpotees võetakse vastu. H0: 2 = 800 alternatiiviga H2: 2 800 Et hüpotees vastu võetaks peab jääme kahe kriitilise väärtuse vahele: 13,84 < 21,2< 36,42. Hüpotees võetakse vastu. 4
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 0 2 7 1 0 1 5 2 8 2 9 3 0 3 1 3 2 3 2 4 2 4 6 4 7 4 7 4 8 5 3 6 8 7 0 7 5 7 5 7 9 9 4 9 6 9 9 Valimi A mahuga N=25 variatsioonirida: 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 46,20 Dispersioon: Excel: VAR Sx² = 867,92 Standardhälve: Sx = 29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 46 Haare: R= 99 - 0 = 99 2
Ülemine kvartiil Kv = 8(leian sarnaselt variatsioonrea ülemise poole mediaani). Kontrollin: alumisest kvartiilist väiksemaid liimeid on 7 ehk ligikaudu 23 protsenti ülemisest kvartiilist suuremaid liikmeid on samuti 7 23 protsenti alumise ja ülemise kvartiili vahele jääb 14 liiget 46 protsenti 8) Keskväärtus(tunnuse väärtuste aritmeetiline keskmine) Leian keskväärtuse, liites kõik tunnuse väärtused ning jagades 30-ga: x= = 5,85 9) Sagedustabel näitab, mitmel korral antud tunnus saab antud väärtuse. Koostan sagedustabeli. Vaba 1 2 3 3,5 4 5 6 8 10 11 12 13 14 aega(h) Sagedus 1 3 4 1 6 3 4 1 2 1 2 1 1 Graafilise ülevaate saamiseks koostan tulpdiagrammi:
xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: Me = 41 Haare: 2 Keskväärtuse usaldusvahemik: (35,08 ; 54,60) Dispersiooni usaldusvahemik: (536,45 ; 1410,64) 3. 3.1 t-statistik: t=0,90 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 44,84 27,97 - statistik: Järeldus: peab paika 4.2 0,022 - statistik:14,98 Järeldus:lükatakse tagasi 4
Seega: R1 = = = 0,051282051 I 1 - I A 0,2 - 0,005 I R 0,005 2 R2 = A A = = 0,02020202 I 2 - I A 0,5 - 0,005 Mõõtemääramatus R = ± (t/100) p R1 = ± (0,5/100) 0,051282051 = 0,0002564 R2 = ± (0,5/100) 0,103600103 = 0,0001010 Vastus: Vastavad elemendid voolude mõõtmiseks on takistid R1 ja R2 järgmisete parameetritega: R1 = 0,05128 ± 0,00026 R2 = 0,02020± 0,00010 3.Ülesanne Antud: Arvutan keskväärtuse, mooduli keskväärtuse ning efektiivväärtuse. T=4 T4 3T 1 T 1 4 T -keskväärtus: U (t ) k = U (t )dt = - 1dt + 2dt + 3dt = 0,75V T 0 T 0 T 3T 2 4
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 12 6 11 62 20 62 7 98 10 1 52 27 80 25 94 46 38 74 95 33 71 15 96 4 87 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=45, 04 Dispersioon: Excel: VAR Sx²=1164,123 Standardhälve: Sx=34,1193 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=38 Haare: R=97 2
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 75 10 79 32 32 0 68 94 96 2 99 53 31 15 48 47 29 70 7 75 28 30 42 47 46 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=46,20 Dispersioon: Excel: VAR Sx²=867,9167 Standardhälve: Sx=29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 Haare: R=99 2
1. Baaspunkti arvutus. Jaotuse kujuparameetri S baasväärtusel S0 ja teisenduse parameetri T baasväärtusel T0 : a) koostada teisendusfunktsiooni graafik, D=2 , T0 =2, S0=0,5 y=D1-T|X|T x y -10 50,00 -9 40,50 -8 32,00 -7 24,50 -6 18,00 -5 12,50 -4 8,00 -3 4,50 -2 2,00 -1 0,50 0 0,00 1 0,50 2 2,00 3 4,50 4 8,00 5 12,50 6 18,00 7 24,50 8 32,00 9 40,50 10 50,00 d) leida saadud valimite {xi} ja {yi} järgi X ja Y keskväärtuse, dispersiooni, standardhälbe, asümmeetria ja ekstsessi hinnangud ning nende jaotuste histogrammide graafikud xi = 1,732 S ( 2U 1 - 1) + (1 - S ) N 1 X ja Y arvkarakteristikute hinnangud X Y keskväärtus 0,2479664 0,157100 4 dispersioon 0,2539834 0,032985 7 standardhälv 0,5039677 0,181619 e 6 asümmeetria 0,0430155 1,470564 5
Tähis Max · Variatsioonirea ulatus tunnuse maksimaalse ja minimaalse väärtuse vahe. Tähis U · Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on 4 variatsioonireas 25%. Tähis Kv · Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonireas 25%. Tähis Kv · Hälve variatsioonireas oleva tunnuse väärtuse ja keskväärtuse vahe. Kogu variatsioonirea hälvete summa on 0. · Dispersioon hälvete ruutude aritmeetiline keskmine. Tähis ² · Standardhälve ruutjuur dispersioonist. Tähis · Variatsioonikordaja standardhälbe ja keskväärtuse suhe. Esitatakse tavaliselt protsentides. Tähis V. · Hajuvusvahemik selle abil saab teada keskväärtuse standardvea. 5 3. Koondtabel sõiduaegade kohta
.......................................................................................................12 3.4. Lineaarne ühe argumendiga regressioonmudel................................................................. 13 4. Üldkogumile tulemuste leidmine (üldistamine)................................................................... 14 4.1. Normaaljaotus....................................................................................................................14 4.2. Keskväärtuse (keskmise) usaldusvahemik.........................................................................16 4.3. Statistiliste hüpoteeside kontrollimine...............................................................................16 4.3.1. Hüpoteesid ühe üldkogumi keskväärtusele.....................................................................17 4.3.2. Hüpoteesid ühe üldkogumi binaarse tunnuse väärtuse osakaalule ................................ 18 4.3.3
N x i=45 i=1 N 1 s 2= N-1 i=1 ( xi -´x )2=1170 s= s2=34 Mediaan: variatsioonrea 13. element 38 x max-x min =97 Haare: 2. =0,10 t 0,95 ( 24 )=1,71 t 0,95 ( 24 ) s = =12 N Keskväärtuse alumine piir: ´x - =33 Ülemine piir: ´x + 57 20,05 (24)=13,85 20,95 (24)=36,42 N-1 2 N -1 2 s =768 s =2020 Dispersiooni alumine piir: 20,95 ( 24 ) Ülemine piir: 2
xi 2,8 2,2 4,0 1,1 5,1 yi 6,9 6,1 9,8 7,2 15,3 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 1,3 0,2 0,7 4,2 3,6 2,6 1,9 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 74 Haare: 2 Keskväärtuse usaldusvahemik: (47,38 ; 69,34) Dispersiooni usaldusvahemik: (679 ; 1791) 3. 3.1 t-statistik: t=1,3 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 58 30,5 - statistik: Järeldus: lükatakse tagasi 4.2 0,017 - statistik: 31,46 Järeldus:lükatakse tagasi 4
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 69 10 76 79 84 41 15 87 44 49 38 16 58 7 24 19 82 1 40 38 35 87 51 1 69 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 44,80 Dispersioon: Excel: VAR Sx² = 814,417 Standardhälve: Excel: STDEV Sx = 28,538
Arvkarakteristikud kujutavad endast mingeid jaotusseaduse järgi leitavad funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus on juhusliku suuruse asendikarakteristik, mille abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta. Keskväärtuse geomeetriline tõlgendus: jaotuse raskuskeskme projektsioon x-teljele. Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile nim detsiilideks,
10. Indeks, mis mõõdab kahest koos toimivast tegurist ainult ühe muutumist, on teguriindeks 11. Milline valem võimaldab leida indeksit, mis kirjeldab ainult hindade muutumisest põhjustatud käibe muutust? p on hind ja q kogus. 12. Ettevõte toodab erinevaid tooteid. Toodangu kogumaksumuse muutuste analüüsimiseks kasutatakse indeksanalüüsi. Kui hinnad tõusid 8% ja toodangu maht 3,4%, siis mitu protsenti kasvas kogumaksumus? 11,7% 13. Kvalitatiivse suuruse keskväärtuse muutumist, mis on tingitud nii kvantitatiivse teguri muutustest, kui ka kvalitatiivse teguri enda muutustest, iseloomustab muutuva struktuuri indeks 14. Kvalitatiivse suuruse keskväärtuse muutumist, mis on tingitud ainult kvalitatiivse teguri enda muutustest, iseloomustab püsiva struktuuri indeks. 15. Keskmise hinna muutuse isloomustamiseks ja analüüsimiseks kasutatakse kolme indeksit: muutuva struktuuri indeks, püsiva struktruuri indeks ja struktuurinihete indeks
12. Aritmeetiline keskmine ehk tunnuse keskväärtus. Tähis x. 13. Hajuvusmõõdud näitavad kui palju erineb tunnuse väärtus keskväärtusest või mediaanist. 14. Tunnuse minimaalne väärtus esineva tunnuse vähim väärtus. Tähis MIN. 15. Tunnuse maksimaalne väärtus esineva tunnuse suurim väärtus. Tähis MAX. 16. Variatsioonirea ulatus tunnuse maksimaalse ja minimaalse väärtuse vahe. Tähis U. 17. Hälve variatsioonireas oleva tunnuse väärtuse ja keskväärtuse vahe. Kogu variatsioonirea hälvete summa on 0. 18. Dispersioon hälvete ruutude aritmeetiline keskmine. Tähis ². 19. Standardhälve on ruutjuur dispersioonist. Tähis . 20. Variatsioonikordaja standardhälve ja keskväärtuse suhe. Esitatakse tavaliselt protsentides. Tähis V. 21. Korrelatsioon - nähtuste vastastikune sõltuvus ehk suhe, mille tõttu muutused ühes nähtuses kutsuvad esile ka muutused teises nähtuses. 22
tulemuse kui õigesti koostatud väike valim. Punkthinnang - parameetri hindamise tulemuseks on üks arv. Hinnang leitakse valimi põhjal. Valim on juhuvalim. Punkthinnang on juhuslik suurus. Vahemikhinnang - valimi põhjal määratud vahemik, mis katab parameetri tegeliku väärtuse etteantud (küllalt suure) tõenäosusega. Usaldusvahemik - Parameetri a usaldusvahemikuks usaldatavusega β nimetatakse vahemikku, mis katab parameetri a väärtuse tõenäosusega β: Üldkogumi keskväärtuse µ punkthinnanguks - valimi keskväärtus: Üldkogumi dispersiooni σ^2 punkthinnang: Tsentraalne piirteoreem: Küllalt suure valimi mahu n korral alluvad valimite keskväärtused normaaljaotusele keskväärtusega µ ja standardhälbega σ/ √n, kus σ on kogumi standardhälve. Valimjaotusi standardhälve σ/sqrt n iseloomustab valimite (maht n) keskväärtuste hajuvust, see on valimi keskväärtuse valimjaotuse standardhälve. Kogumi standardhälbe hinnang. Iseloomustab
89 1 89 7921 1758,40444 95 1 95 9025 1843,27111 96 1 96 9216 4038,0088 9 98 2 196 19208 2109,8711 1 99 1 99 9801 513,93777 2239 60 3184 210064 41099,7333 1. Leida keskväärtuse (aritmeetiline, harmooniline, geomeetriline), dispersioon, standardhälbe, mediaani, moodi ja haarde hinnangud. Aritmeetiline keskväärtus: xk=(xi*ni)/n= 53,07 Harmooniline keskväärtus: Xk=n/(1/xi)= 26,39 Geomeetriline keskväärtus xk=(x1*...*xn)^(1/n)= 39,43 Dispersioon Dx=[ni(xi-xk)2]/n= 68,01 Standardhälve S=Dx= 26,17 Mediaan: 55 Mood: arvud 32 ja 68 esinevad 3 korda Haarde hinnangud: 99-0= 99 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel,
Standardhälve: = D = =73,08 ms Mõõtetulemustest 29 tükki langes vahemikku 2,269 0,1 s Tõenäosus, et ka järgmine katse satub sellesse vahemikku on P===0,58 Mõõtetulemustest 17 tükki langes vahemikku 2,269 0,05 s Tõenäosus, et ka järgmine katse satub sellesse vahemikku on P===0,34 Mõõtemääramatus t)=1,68=122,77 ms Mõõtevea hinnang tk-to=2269,78 ms 2328 ms= -58,22 ms Mõõtmisseeria tulemus on (2269,78 122,77) ms. Suhteline viga ==5,4 % Keskväärtuse hajumine ühel mõõtmisel 2=20,67 ms. Keskväärtus koos keskväärtuse hajumisega on (2269,78 20,67) ms.
Juhul kui pole vaja teada juhusliku suuruse omadusi täielikult/ammendavalt, vaid piisab juhusliku suuruse põhiomaduste teadmisest, võib neid juhusliku suuruse põhiomadusi kirjeldada juhusliku suuruse arvkarakteristikute abil: 1) Keskväärtus: enim kasutatav asendikarakteristik. Selle abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta 2) Dispersioon ja standardhälve: on enimkasutatavad arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks (keskväärtuse suhtes). Dispersioon on standardhälve ruudus ja standardhälve on vastavalt dispersiooni ruutjuur. 3) Kvantiilid: Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p (seejuures 0p1): P(X < xp) = F(xp) = p 4) Mediaan: oluliseim kvantiil, mediaan on jaotuse keskpunktiks tõenäosuse järgi: mediaanist nii vasakule kui paremale sattumise tõenaosus on võrdselt 0.5. Sümmeetrilise jaotuse korral on mediaan
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 22 96 91 75 74 75 25 79 12 38 95 10 71 0 79 24 86 91 96 5 40 85 69 82 39 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=58,36 Dispersioon: Excel: VAR Sx²=1072,74 Standardhälve: Excel: STDEV Sx=32,75 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral.
NORMAALJAOTUS Normaaljaotus on nii teoorias kui praktikas kõige sagedamini esinev jaotus. See jaotus eeldab, et nähtusel on mingi keskmine tase, mille ümbruses varieerub suurem osa väärtustest. Suuri kõrvalekaldeid esineb harva ja need toimuvad võrdvõimalikult mõlemale poole. Normaal- jaotus on määratud ja täielikult kirjeldatav kahe parameetriga keskväärtuse ja standardhälbe ehk dispersiooniga. Normaalajotust kujutav graafik on kellukese kujuline ja sümmeetriline keskväärtuse suhtes. Jaotust nimetatakse ka Gaussi-Laplaci kõveraks. Joonis 1. Normaaljaotus tekib siis, kui tunnuse väärtust mõjutavad väga paljud juhuslikud tegurid ja neist igaühe mõju on väga väike. Normaaljaotus on teoreetiline abstraktsioon. Eluslooduses ei ole ükski asi täpselt normaaljaotusega, kuid paljud tunnused on looduses normaaljaotusele väga lähedase jaotusega. Joonis 1. Normaaljaotuse graafik
Tihedusfunktsioon. 13. Diskreetse juhusliku suuruse tõenäosusjaotus. Diskreetse juhusliku suuruse X tõenäosusjaotuseks nimetatakse funktsiooni p(x), kus p(x) = P(X = x). See funktsioon omandab positiivseid väärtusi ainult nende argumentide korral, mis on juhusliku suuruse võimalikeks väärtusteks. Tõenäosusjaotust esitatakse kas valemina või tabeli abil, milles loetletakse juhusliku suuruse kõikvõimalikud väärtused ja nende omandamise tõenäosused. 14. Juhusliku suuruse keskväärtuse ja dispersiooni omadused. Juhusliku suuruse keskväärtuseks (matemaatiliseks ootuseks) nimetatakse arvu, mis on määratud eeskirjaga Keskväärtuse omadused: Olgu a ja b suvalised konstandid, siis E(aX+b)= aEX+b. Olgu X ja Y suvalised juhuslikud suurused, siis E(X+Y) = EX+EY. Dispersioon on juhusliku suuruse keskväärtuse suhtes arvutatud hälbe ruudu keskväärtus. See on arv, mis kirjeldab juhusliku suuruse hajutatust tema keskväärtuse suhtes.
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 54 32 30 54 89 54 9 94 51 69 19 15 33 88 37 87 94 49 18 85 43 43 41 62 81 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=53,24 Dispersioon: Excel: VAR Sx²=705,69 Standardhälve: Sx=26,56 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=51 Haare: R=94-9=85 2
Mo= 44 Mediaan on arv, millest suuremaid ja väiksemaid väärtusi on vartiatsioonreas ühepalju. Me= ( 40 + 40) : 2= 40 Keskväärtus ehk keskimne x on tunnuse kõigi väärtuste aritmeetiline keskmine. x = 900 : 22 40,91 Keskmine hälve on hälvete aritmeetiline keskmine. = 57,82 : 22 2,63 Dispersioon on variatsioonreas olevatele andmetele vastava hälvete ruutude keskväärtus. 2 =180,06 : 21 8,57 Standardhälve on variatsioonreas oleva arvu ja keskväärtuse vahe. = 8,57 2,93 Variatsioonkordaja on standardhälbe ja keskväärtuse suhe. V= 2,93 : 40,91 0,07 Variatsioonrea ulatus on maksimaalse ja minimaalse elemendi vahe. 46-37= 9 Alumine kvartiil on tunnuse väärtus, millest väiksemaid või võrdseid liikmeid on variatsioonreas 25%. (Kv ) = 38 Ülemine kvartiil on tunnuse väärtus, millest suuremaid või võrdseid liikmeid on variatsioonreas 25%. (Kv ) = 44 Kvartiilide vahe 44-38= 6 Tabel matemaatika hinnete kohta
Üldkogum tõenäosusega. Ka usaldusvahemik (confidence interval) · Ühe ja sama parameetri hindamiseks võib kasutada erinevaid hinnangfunktsioone. Demo: keskväärtuse usalduspiirid · Mõned sobivad paremini, mõned halvemini. 5 Kogumi keskväärtuse Mudeli parameetrite hindamismeetodid hindamismeetodid
Tähis Max · Variatsioonirea ulatus tunnuse maksimaalse ja minimaalse väärtuse vahe. Tähis U · Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioonireas 25%. Tähis Kv 3 · Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonireas 25%. Tähis Kv · Hälve variatsioonireas oleva tunnuse väärtuse ja keskväärtuse vahe. Kogu variatsioonirea hälvete summa on 0. · Dispersioon hälvete ruutude aritmeetiline keskmine. Tähis ² · Standardhälve ruutjuur dispersioonist. Tähis · Variatsioonikordaja standardhälbe ja keskväärtuse suhe. Esitatakse tavaliselt protsentides. Tähis V. 4 1. Hinnete tabel küsitluse põhjal Mitu aastat Jrk Nimi tantsinud 1 Silvia 11
4 4 4,48 neaarse korrelatsioonikordaja abil kontrolltööde hinded on omavahel seotud? Ei 6 5 4 3 2 1 0 1,5 2 2,5 3 3,5 4 4,5 5 5,5 5 5,5 Kasutage ülesande 1 andmeid ning arvutage matemaatika kontrolltöö hinnete keskväärtuse 95%- lised u Mate- maatika aritm. keskmine xk 3,4 5 st.hälve sx 1,041 2 olulisuse tõenäosus p 0,95 4 olulisuse nivoo 0,05 3 valimi maht N 25 2 vabadusastmete arv N-1 24
Lähteandmeteks on Teie proovitüki 1. rinde enamuspuuliigi keskmine diameeter (rühmitamata andmed). Kopeerige see tulp sellele samale töölehele. Punkthinnangud, vahemikhinnangud, valimi maht Eeldame, et teie proovitükil mõõdetud andmete põhjal tahame teha järeldusi samalaadse üldkogumi kohta Selleks arvuta järgmised statistikud oma proovitüki kohta 1) Leida 1. rinde enamuspuuliigi diameetri kohta (rühmitamata andmetest) järgmised suurused: keskväärtuse hinnang (aritmeetiline keskmine), 4.921 dispersioon, 7.352 standardhälve, 2.712 standardhälbe viga 0.183 valimi maht, 110
Arvkarakteristikud kujutavad endast mingeid jaotusseaduse järgi leitavad funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus(asendikarakteristik) iseloomustab juhusliku suuruse jaotuse keskkoha asukohta. Keskväärtuse geomeetriline tõlgendus: jaotus raskuskeskme projektsioon x-teljele Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. dispersioon on standardhälve ruudus ja standardhälve on vastavalt dispersiooni ruutjuur. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides
Mittearvuline tunnus Arvkarakteristikud Usalduspiirid Hüpoteeside kontroll http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/ (1 of 2)29.05.2006 15:08:49 Andmeanalüüs MS Exceli abil Üldskeem z-test (keskväärtuse võrdlemine konstandiga, kahe üldkogumi keskväärtuste võrdlemine teadaolevate dispersioonide korral) t-test (kahe üldkogumi keskväärtuste võrdlemine võrdsete ja mittevõrdsete dispersioonide, sõltuvate ja sõltumatute vaatluste korral)
8 4 Katseandmete keskmine (keskväärtus): 5704,28ms t== Dispersioon: D(t)==5441,87ms2 Mõõteseeria standardhälve: =D(t) = ±73,76 ms Leiame seeria mõõtemääramatuse. Studenti teguri tn-1,ß saame tabelist. Võtame ß=0.95 ja n=50, seega t49,ß=1.68 U(t) = t49,ß *=1,68*73.76=123.92 ms Mõõtmiste seeria tulemus on: 5704,28±123.92 ms, mis langeb täpse väärtuse piiridesse, seetõttu võib öelda, et süstemaatilist viga ei esinenud. Keskväärtuse hajumine: Ühel mõõtmisel on hajumine: = =10.43 ms Seega keskväärtus koos keskväärtuse hajumisega on: 5704,28 ± 10.43 ms Suhteline viga. == =0.002172.2% Mõõtevea hinnang: 0= 5704,28-5722= -17,72ms t= t-t
Õnnestugu katse k(n) ≤ n korda. ( ) P(A) = Suurte arvude seadus. Katsetame n korda sõltumatult sündmust A. Olgu k(n) ≤ n õnnestunud katsed ja P*(A) ( ) ( ) sündmuse A teoreetiline tõenäosus. Siis ( ) > 0: lim ( | ( )| < ) = 1 Suurtearvude seadus.Juhuslike nähtuste karakteristikute (näiteks keskväärtuse) omadus katsete arvu kasvades läheneda mingitele konstantidele -Tšebõševiteoreem- Bernoulli teoreem 6. Täistõenäosuse ja Bayes’i valemi tuletamine Sündmuse A täistõenäosus: ( ) = ∑ ( | ) ( ). Sündmuste süsteemi H={H1,…,Hn} nimetatakse tingimusteks ehk sündmuste täissüsteemiks, kui 1. i=1,…,n Hi≠0; 2. i,j=1,…,n (i≠j) HiHj=∅; 3. ∑Hi=Ω.
Alumine kvartiil 9260 Ülemine kvartiil 11409 Kvartiilide vahe 2149 Dispersioon 3780832,1571429 Standardhälve 1944,4 Üldkogumi keskväärtuse usaldusintervall (usaldusnivooga 95% Usaldusnivoo 1- 0,95 Olulisuse nivoo 0,05 Vabaduse aste n-1 20 T-jaotuse täiendkvantiil 2,1 Alumine usalduspiir 9112,33
tõenäosusega esinevat väärtust.Seega väärtus xmo on mood, kui x i. Vastavalt kas on üks või mitu moodi, on unimodaalne või multimodaalne. 29. Mis on juhusliku suuruse keskväärtus? Diskreetse juhusliku suuruse keskväärtuseks EX nimetatakse matemaatilist ootust ehk EX= ∑ x i p (x i) ooteväärtuseks ehk arvu x ∈X i 30. Keskväärtuse omadused. Ec=c; E(cX)=cEX; E(X+Y)=EX+EY; E(X-Y)=EX-EY; sõltumatute juhuslike suuruste korral ka E(XY)=EXEY 31. Mis on dispersioon? Diskreetse juhusliku suuruse dispersiooniks DX nimetatakse hälbe ruudu keskväärtust keskväärtuse suhtes ehk arvu DX=E(X-EX)2. Puuduseks on see, et hälbd mõõtmiseks kasutatav ühik on seega ruudus. Selle vältimiseks kasutatakse standardhälvet σ =√ DX . 32. Dispersiooni omadused koos tõestustega.
2003 549 150,0 1. Ül.9.1. 2003 561 150,0 (Points: 7) Kasutage eelmise ülesande faili hypoteesid.xls. Lah 2003 646 150,0 järgmised ülesanded: 2003 658 150,0 1. Leht2 - kontrollida t-testiga, kas üldkogumite keskväärtused on 2003 757 150,0 (NB! tegemist on samade ettevõtete andmetega erinevatel aasta 2003 790 150,0 2. Leht3 - kontrollida üldkogumite dispersioonide ja keskväärtuste 2003 792 150,0 3. Leht1 - leida kartuli saagikuse keskväärtuse 95% usalduspiirid 2003 823 150,0 Vastused vormistada tekstina lühidalt vastusekasti. 2003 661 154,8 4. Leht4 - leidke vastus esitatud küsimusele. Vastusekasti kirjuta 2003 718 155,0 küsimusele, hii-ruut-emp ja hii-ruut-teor. 2003 603 158,3 - leida kartuli saagikuse keskväärtuse 95% usalduspiirid. 2003 212 160,0 Vastused vormistada tekstina lühidalt vastusekasti. 2003 514 160,0 2003 596 160,0 Kartuli saagikus 2003 747 160,0
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 1 2 17 81 97 75 22 21 94 62 81 73 74 52 79 45 14 70 2 71 48 79 77 39 19 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: = 51,8 Dispersioon: s x² = 968,58 Standardhälve: s x = 31,12 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral.