68% kuulub piirkonda [EX - ; EX + ]; 95% kuulub piirkonda [EX - 2; EX + 2]; 99,7% kuulub piirkonda [EX - 3; EX + 3]. Ülesanne 1 · Mõõtmisvead on teaduses olnud alati probleemiks. Nende uurimisel selgus, et mõõtmisvead alluvad normaaljaotusele. (Reeglina tehakse väikseid vigu sageli, suuri vigu aga harva.) Järgmises tabelis on ühe toru läbimõõdu (mm) 20 mõõtmistulemust. Kontrollige, kas ka see jaotus on normaaljaotus. Milline arv tuleb võtta toru läbimõõduks? Läbimõõt X (mm) 19, 20,1 20,4 20,5 20,6 21, 8 0 Sagedus (f) 1 2 4 5 6 2 Ülesanne 2 · Teadmiste ja oskuste taset peegeldavad kontrolltöö eest saadud hinded või punktid. Kontrollige kas ühe üliõpilasrühma poolt tehtud kontrolltöö, mille eest võis saada kuni 100 punkti, tulemused alluvad normaaljaotusele
kõrvalekaldeid esineb harva ja need toimuvad võrdvõimalikult mõlemale poole. Normaal- jaotus on määratud ja täielikult kirjeldatav kahe parameetriga keskväärtuse ja standardhälbe ehk dispersiooniga. Normaalajotust kujutav graafik on kellukese kujuline ja sümmeetriline keskväärtuse suhtes. Jaotust nimetatakse ka Gaussi-Laplaci kõveraks. Joonis 1. Normaaljaotus tekib siis, kui tunnuse väärtust mõjutavad väga paljud juhuslikud tegurid ja neist igaühe mõju on väga väike. Normaaljaotus on teoreetiline abstraktsioon. Eluslooduses ei ole ükski asi täpselt normaaljaotusega, kuid paljud tunnused on looduses normaaljaotusele väga lähedase jaotusega. Joonis 1. Normaaljaotuse graafik Normaaljaotusega tunnuse väärtuste ulatust saab iseloomustada standardhälbe kaudu. Kolme sigma reegli kohaselt asub 99,7% normaaljaotuse väärtustest arvude x ± 3 vahel. 95,5% väärtustest paikneb kahe standardhälbe ulatuses keskväärtusest ühes ja teises suunas.
Pidevad jaotused Olgu meil mõõdetud kuusenoorendikus puude kõrgused sentimeetrites rühmitatud andmetena (ülesannete 1 kuni 4 algandmed). Kõrguse Kõrguse Sage- Aritm. Standard- Teoreet. Teoreet. ülemised keskmisedx dused keskmine hälve tõen.-d pi saged. Hii-ruut xü ni ni*xi ni*(xi-xkaet)2 N*pi statistik i Normj. F(xü) 215 210 8 1680 6940,1 0,045 0,045 8 0,0086284 225 220 19 4180 7190,4 0,158 0,113 21 0,1432402 235 230 43 9890 3842,9 0,379 0,220 40 0,1748117 245 240 55 ...
Andmetöötluse alused II kodune töö Juhendaja: lektor juhendaja Tartu aasta Sisukord Sisukord.............................................................................................................................2 Sissejuhatus....................................................................................................................... 3 2. Diameetri aritmeetiline keskmine ja standardhälve.......................................................4 3. Normaaljaotus................................................................................................................5 3.1 Normaaljaotuse graafik............................................................................................5 3.2 Normaaljaotuse eeldusel.........................................................................................6 4.2 Lognormaaljaotuse tabel..........................................................................................7 4.3
−∞ 2 12. Leida pideva ühtlase jaotuse dispersioon. 2 2 (a−b) Pideva ühtlase jaotuse dispersioon on DX =EX 2−( EX ) = 12 NORMAALJAOTUS 13. Defineerida normaaljaotus. Normaaljaotus on reaalarvulise juhusliku suuruse jaotus, mille tihedusfunktsioon avaldub 2 −(x−μ) 1 2σ 2 kujul φ ( x )= e , kus jaotuse parameeter σ > 0 (hajuvus) ja μ on σ √2 π reaalarv(keskväärtus). Tähistatakse X~N(μ,σ). 14. Kuidas avalduvad normaaljaotusega juhusliku suuruse keskväärtus ja dispersioon?
4 0,0189
5 0,0378
6 0,0631
P(A)= 0,1301
ül.4
Kui suur on tõenäosus, et sajast puust läheb kasvama 60 kuni 75, kui ühe puu kasvamaminemise tõenäosus on 0,7?
n= 100 Laplace´i teoreem, normaaljaotus
p= 0,7 a= 70 q= 0,3
sigma= 4,58
P(60
Praktikum nr 1. Normaaljaotuse kontrollimine. Erindite leidmine. Süstemaatiliste vigade leidmine ja eemaldamine. Ülesanne 1: hinda süstemaatiliste vigade olemasolu Tabelis 1 toodud edasi-tagasi nivelleeritud keskmiste kõrguskasvude erinevuste d põhjal mõlemat eeltoodud kriteeriumit kasutades. Esmalt kasutame süstemaatiliste vigade olemasolu hindamiseks märgikriteeriumi. See tähendab seda, et süstemaatiliste vigade puudumisel mõõtmisseerias peaks erimärgilisi vigu olema ligikaudu võrdselt. Märgikriteeriumi testi tegemiseks peab esmalt loendama valimis olevad nullist suuremad ja väiksemad vead. Exceli's on selleks käsklus (COUNTIF). Praktikumis loendasime kui palju on valimis nullist suuremaid vigu. Tulemuseks saime suuruse k, mis ühes valimi mahuga n, annab meile võimaluse arvutada statistik R (R= |2 k-n| ). Teststatistikut R võrreldakse kriteeriumiga 2 n . Süstemaatiliste vigade mitteesinemisel kehtib võrdus R<2...
Defineeri mõisted: Statistika Matemaatiline statistika Üldkogum. Näide. Üldkogu uurimisel on kaks võimalust: Valim. Kuidas on seotud üldkogu ja valim? Millised on nõuded valimile? Valimi moodustamise viisid. Statistiline rida. Variatsioonirida. Sagedustabel. Diagramm. Mood. Mediaan. Aritmeetiline keskmine. Variatsiooni ulatus. Hälve. Dispersioon. Standardhälve. Korrelatsiooniväli. Normaaljaotus. Statistika mõisted Andmete esitamine 1.Statistika - teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. 2.Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. 3.Statistikas on oluline uurimise objekt - üldkogum. 4.Üldkogum on kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Üldkogumi uurimisel on kaks võimalust:
19. 15, binoomjaotus, parameetrid, parameeter Test 6 pidev, diskreetne, poissoni jaotus, jaotusseadus jaotusseadus, eksponentjaotus normaaljaotus, normaaljaotus normaaljaotus negatiivne väärtus poissoni jaotus Test 7 kogum, klastervalik, kihtvalik, lihtne juhuvalik, süstemaatiline valik tõenäosuslik valikumeetod, empiiriline valik fikseeritud samm, süstemaatiline valik, punkthinnang nihketa, efektiivne, optimaalne keskväärtus, normaaljaotus, suur valim keskväärtuse standardviga standardhälve standardviga, keskväärtuse usalduspiirid valimvaatlus usaldatavus suur valim, usaldatavus suurem üldkogumi keskväärtuse usaldusvahemiku laius, vabadusastmete arv studenti jaotus mediaani usalduspiiride leidmisel kasutatakse binoomjaotust, loend on ülekaetud ankeetküsitluse läbiviimisel, mõõtmisvahendi viga Test nr 8 sisukas hüpotees, järeldus peale parameetri empiirilise väärtuse võrdlust
standardhälbe, mediaani, moodi ja haarde hinnangud. Aritmeetiline keskväärtus: xk=(xi*ni)/n= 53,07 Harmooniline keskväärtus: Xk=n/(1/xi)= 26,39 Geomeetriline keskväärtus xk=(x1*...*xn)^(1/n)= 39,43 Dispersioon Dx=[ni(xi-xk)2]/n= 68,01 Standardhälve S=Dx= 26,17 Mediaan: 55 Mood: arvud 32 ja 68 esinevad 3 korda Haarde hinnangud: 99-0= 99 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks =0,05 Keskväärtuse usaldusvahemik: P=95% korral t=2 46,31 << 59,82 Standardhälbe usaldusvahemik: q=0,3 18,48 < < 34,31 Dispersiooni usaldusvahemik: q=0,3 341,34 < < 1177,26 3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on =0,05 3.1 H0: = 50 alternatiiviga H1: 50 T-kriteerium Sc= 26,39 tEMP= (53,06666667--50)* 60)/ 26,39= 0,90 tKR=2
variatsioonreas 30%. Täiendkvantiiliks nimetatakse juhusliku suuruse q-täiendkvantiili suuruse sellist väärtust xq, millest võrdsete või suuremate väärtuste esinemise tõenäosus on q. 9. Mis on tihedusfunktsioon? Tihedusfunktsioon on jaotusfunktsiooni tuletis: F'(x) = f(x). 10. Normaaljaotuse skitseerimine (tihedus- ja jaotusfunktsioon). Graafikult lugemine (aritmeetiline keskmine, standardhälve, mood, mediaan). 11. Mis omadused on normaaljaotusel? 1) normaaljaotus on sümmeetriline keskväärtuse µ suhtes: tema keskväärtus, mood ja mediaan võrduvad parameetriga µ 2) normaaljaotuse tihedusfunktsioonil on kaks käänupunkti, mis asuvad mõlemal pool keskväärtust kaugusel 3) normaaljaotuse asümmeetriakordaja ja ekstsess on nullid (A=0, E=0). 12. Missugused on juhusliku suuruse hajuvuse karakteristikud (nimeta vähemalt 4). Definitsioonid. Dispersioon on juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus varieerub
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Keskväärtus =46,20 Dispersioon =867,91 Standardhäve =29,46 Mediaan Me=46 Haare R = xmax xmin = 99 0 = 99 2. Keskväärtuse usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 on arvutatav Exceli TINV funktsiooniga: 1,711 Dispersiooni usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja on arvutatav Exceli CHIINV funktsiooniga, ning on vastavalt: 36,415 ja 13,843 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10) 3
docstxt/129544194986833.txt
Juhuslik sündmus - sündmus, mis antud vaatluse või katse korral võib toimuda, aga võib ka mitte toimuda Kindel sündmus-sündmus, mis teatud tingimuste korral alati toimub Sõltumatu sündmus -Kaht sündmust nimetatakse sõltumatuteks, kui neist ühe toimumune ei muuda teise tõenäosust. Teineteist välistavad sündmused-Sündmusi, mille korrutiseks on võimatu sündmus, nimetatakse teineteist välistavateks. Kombinatsioonid-Katses osaleb m elementi, katse tulemuseks on k erineva elemendi välja valimine nende elementide hulgast. Permutatsioon-Kõikvõimalike erinevate järjestuste arv etteantud elementidest nimetatakse permutatsioonideks Variatsioonid-Katses osaleb m elementi, katse tulemuseks on k erineva elemendi kindlas järjekorras välja valimine nende elementide hulgast Tõenäosuse geomeetriline tähendus-Tõenäosuse geomeetriline tähendus ühemõõtmelises ruumis väljendub lõigu pikkusena, kahemõõtmelises ruumis pindalana ja kolmemõõtmelises ruumi...
8. Hüpergeomeetriline jaotus JS nimetatakse jaotunuks (hüper)geomeetriliselt, kui võimalikud väärtused 0, 1 ... n vötab ta tõenäosusega PN,M {n, m}, kus N, M, n on jaotuse parameetrid. Tagasipanekuta skeem 9. Poisson jaotus Jaotusseadus Pt(X=x) = () / x! = fP(x,a) 10. Ühtlane (ristkülik) jaotus f(x) = {1/(b-a)}, kui a x b JS nimetatakse ristkülikjaotusega intervallis [a; b] kui tema tõenäosuse tihedus on konstantne c vahemikus [a; b] ja väljaspool [a; b] võrdne 0. 11. Normaaljaotus. Normeeritud normaaljaotus Normaaljaotus, mille tihedus on normeeritud ja tsentreeritud (a =0 ja ,=1) on Gaussi kõver 12. Eksponentsiaalne jaotus. (Töö)kindlusfunktsioon 13. Gammajaotus. Beetajaotus. Logaritmiline jaotus = 0 kui t <0 14. 2 jaotus. F jaotus. Studenti jaotus 52 jaotuseks n vabadusastmega nimetatakse sõltumatute standardsete normaalsete suuruste n ruutude summa jaotust 20. Matemaatiline ootus ja tema omadused
=867,92 3)Standardhäve =29,46 4)Mediaan Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 5)Haare R = xmax xmin = 99 0 = 99 2. Leian keskväärtuse usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 arvutasin Exceli TINV funktsiooniga ( on ka leitav Studenti tabelist): 1,711 Leian dispersiooni usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja arvutasin Exceli CHIINV funktsiooniga, vastavalt: 36,415 ja 13,848 3. Kontrollin järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10)
dispersioon on null. Mida suurem aga dispersioon on, seda enam erinevad katsete tulemused üksteisest. Standardhälve ruutjuur dispersioonist. 23. Kuidas leitakse standardhälve a) Variatsioonreast? b) Sagedustabelist? 24. Mis on variatsioonkordaja? Milleks läheb seda vaja? - Standardhälbe ja keskväärtuse suhe: V=sh/ksv. 25. Millist jaotust nimetatakse normaaljaotuseks? Milliste tingimiuste korral tekib normaaljaotus? Normaaljaotus kirjeldab tunnust, mille keskmise taseme lähedased väärtused esinevad tihti, aga suuri kõrvalekaldeid keskmisest väärtusest on harva. Mõlemasuunalised kõrvalekalded on võrdvõimalikud. Normaaljaotus tekib järgmise tingimuste korral: 1. Tunnuse väärtustel on olemas mingi fikseeritud keskmine tase. 2. Tunnuse väärtus kujuneb paljude üksteisest sõltumatute nõrgalt mõjuvate faktorite toimel. 3
Seega H0 hüpotees vastu võetud. 3.2 2 Keili Kajava Kuna 2 jääb ja vahele (13,85 < 32,1 < 36,4), siis hüpotees H0 vastu võetud. 4. Empiiriline histogramm ni 8 7 6 5 4 3 2 1 0 0 - 20 20 - 40 40 - 60 60 - 80 80 - 100 Vahemikud 4.1 Üldkogumi jaotuseks on normaaljaotus 3 Keili Kajava k xm ui ni tabeli pi väärtus 1 20 -0,79 7 -0,2881 - 5,298 0,547 0,2119 2 40 -0,18 5 -0,071 0,217 5,418 0,032 3 60 0,44 5 0,170 0,241 6,035 0,178
Kahe juhusliku suuruse vahel on positiivne korrelatsioon. Kui esimese suuruse kasvades kasvab ka teine suurus. Tegemist on negatiivse korrelatsiooniga, kui I suuruse kasvades II suurus kahaneb. r = [ -1; 1 ] |r| > = 0,8 Tugev korrelatsioon 0,6<=|r|<=0,8 Märgatav korrelatsioon 0,3<=|r|<=0,6 Nõrk korrelatsioon |r|<0,3 Korrelatsioon puudub Normaaljaotus Normaaljaotus tekib järgmise tingimuste korral: 1. Tunnuse väärtustel on olemas mingi fikseeritud keskmine tase. 2. Tunnuse väärtus kujuneb paljude üksteisest sõltumatute nõrgalt mõjuvate faktorite toimel. 3. Tunnuse väärtuse suurenemine üle keskmise ja vähenemine alla keskmise on võrdvõimalik. Kolme sigma reegel: Keskväärtuse ja standardhälbe suurusest 68% kuulub lõiku (1 sigma)
2 21-40 7 0,28 33,00 3 41-60 4 0,16 49,25 4 61-80 5 0,2 70,00 5 81-100 3 0,12 90,00 Kokku 25 1 50,42 Historamm: Nüüd kontrollime kolm hüpoteesi pühikogumi jaotuse kohta Pearsoni 2 - testi abil; usaldusnivooks kasutame = 0.10 4.1 Põhikogumi jaotuseks on normaaljaotus Kuna tulemused on esitatud sagetustabelina, siis keskväärtuse hinnang on Kuna tulemused on esitatud sagedustabelina, siis dispersiooni hinnang on H0: põhikogumi jaotus on normaaljaotus (parameetrid ja peab hindama valimi põhjal); H1: põhikogumi jaotus ei ole normaaljaotus. Normaaljaotus t F(t) (t) hii-ruut 20 -0,87 0,19 0,19 0,012 40 -0,15 0,44 0,25 0,004
(leitud t-jaotuse tabelist) Dispersiooni usaldusvahemiku leidmine (tuleb jaotuse tabelist) (tuleb jaotuse tabelist) Keili Kajava 3. 3.1 Kuna |t| < t0,95(24) (|-0,648| < 1,711), siis võib järeldada, et põhikogumi keskväärtus saab olla 25 valimi alusel. Seega H0 hüpotees vastu võetud. 3.2 Kuna 2 jääb ja vahele (13,85 < 32,1 < 36,4), siis hüpotees H0 vastu võetud. 4. 4.1 Üldkogumi jaotuseks on normaaljaotus k xm ui ni tabeli pi väärtus 1 20 -0,79 7 -0,2881 - 5,298 0,547 0,2119 2 40 -0,18 5 -0,071 0,217 5,418 0,032 Keili Kajava 3 60 0,44 5 0,170 0,241 6,035 0,178
Kui a
ja b on võimalikud, on võimalik ka iga c, mis kuulub vahemikku a-st b-ni: c(a,b). Pideva
juhusliku suurusega saab esitada näiteks: Inimese pikkus, Välistemperatuur, Asjade kaal
Pideva juhusliku suuruse korral on iga üksiku väärtuse tõenäosus null. Seega leiame hoopis
tõenäosuse, et juhuslik suurus asub teatud vahemikus:
P(173,5
.....................................................................................4 1.4 Viiuli intonatsioon............................................................................................................5 1.5 Statistika...........................................................................................................................5 1.5.1 Juhuslik ja süstemaatiline kõrvalekalle..................................................................6 1.5.2 Normaaljaotus...........................................................................................................6 1.5.3 Aritmeetiline keskmine ja standardhälve...............................................................7 3. MEETOD................................................................................................................................8 3.1 Katseisik ja pill...............................................................................................................
Täistõenäosus Bayesi valem Bernoulli valem Keskväärtus: Geomeetriline jaotus Binoomjaotus Dispersioon: Standardhälve: Normaaljaotus Binoomjaotuse lähendamine normaaljaotusega ja Punktihinnangud Keskväärtuse hinnanguks on Dispersiooni hinnanguks on Standardhälbe hinnanguks on Normaaljaotuse keskväärtuse usalduspiirkond
n30 ja tõenäosus p5. m on antud arv. Poissoni jaotusega juhuslikuks suuruseks nimetame juhuslikku suurust, mille väärtuste hulgaks on täisarvud 0,1,2 .. ja m - P ( x = m) = e mille jaotus on määratud valemiga m! . Poissioni jaotusega juhuslikku suurust tähistame X~P(). Keskväärtus EX= =np, dispers DX= =np, standardälve DX= . 6. Normaaljaotus. Normaaljaotuse jaotustihedus f ( x ) ja selle graafik. Normaaljaotusega juhusliku suuruse antud vahemikku sattumise tõenäosuse P( X ) arvutuseeskiri. Laplace'i funktsiooni ( x) graafik ja omadusi. Kui pideva juhusliku suuruse tihedusfunktsiooniks on funktsioon ( x-m)2 1 - p( x) = e 2 2 2 siis öeldakse, et see suurus on normaaljaotusega e. Gaussi jaotusega.
4 80 0.988129 5 0.8389 0.1761 5 100 1.55342 5 0.9406 0.1017 Kokku 25 χ²=6,4367 χ² vabadusastemete arv k=m-1-r=5-1-2=2 (r=2, sest normaaljaotusel on 2 parameetrit) χ²kr (0,10;2) = 4.605 Et hüpotees vastu võetaks peab χ²kr>χ². Seega hüpoteesi vastu ei võeta ning võib järeldada, et üldkogumi jaotus ei ole normaaljaotus ül 4.2 Põhikogumi jaotuseks on ühtlane jaotus fikseeritud parameetritega a=0 ja b=100 k xm ni F0 pi ni' 1 20 9 0.2 0.2 5 2 40 4 0.4 0.2 5 3 60 2 0.6 0.2 5 4 80 5 0.8 0.2 5
võimete testis · Omandab veidi tõsikindlama väärtuse, kui testitud rühm on piisavalt suur ja esinduslik ja hõlmab väga suurt osa ühel ajaperioodil sündinud inimesi ühel maal Vaimsete võimete jaotus (äsja keskkooli lõpetanud Eesti noorte tulemused 150 küsimusega vaimse võimekuse testis) N=123 7 =83,9 =19,4 Normaaljaotus · Normaaljaotus tekib praktiliselt alati, kui juhuslikku suurust mõjutavad paljud tegurid ning iga üksiku teguri mõju on väike · http://www.bowri.co.uk/scripts/dice2.htm · Sõltub kahest parameetrist: keskväärtus , millele vastab kellukakõvera kõrgeim tipp ja standardhälve , mis iseloomustab jaotuse laiust ehk tulemuste hajumist keskväärtuse ümber (mida suurem hajuvus, seda laiem kellukas) Normaaljaotus http://en.wikipedia
n'i=N [ ( ui ) - ( ui-1 ) ] ' ni=N p i t=(Xm- ´x )/sx x2 = 44,486 x2kr= 9,488 (tabelist) 2 2 Et hüpotees vastu võetmiseks peab kr > . Seega hüpoteesi vastu ei võeta ning saan järeldada, et üldkogumi jaotus ei ole normaaljaotus. 6. Konstrueerime samas teljestikus nõutud graafikud Empiiriline jaotus Vahemi pi(ni/n ni k ) 0-14 9 0,150 15-29 7 0,117 1 30-44 3 0,217 1 45-59 3 0,217 60-74 6 0,100 75-89 5 0,083 90-104 7 0,117 Summa 6 : 0 1 Histogramm
Dispersioon ja standardhälve Juhusliku suuruse iseloomustamiseks ei piisa ainult keskväärtusest. Tähtsuselt järgmisteks karakteristikuteks on dispersioon ja standardhälve. Need iseloomustavad juhusliku suuruse hajuvust keskväärtuse ümber. Dispersiooniks nimetatakse juhusliku suuruse hälvete ruutude keskmist keskväärtusest: Normaaljaotus Igal juhuslikul suurusel on spetsiaalne jaotusseadus. Eristatakse paljusid jaotusseaduse tüüpe. Üks kõige enam levinud jaotusseaduseks on normaaljaotus: 1 ( x EX ) 2 f ( x) 2 exp( 2 2 ) dx . Normaaljaotus on määratud kahe arvkarakteristikuga – keskväärtusega ja standardhälve ehk dispersiooniga. Normaaljaotus on piirjaotusseadus. Seepärast on ta väga laialt levinud.
1 ´x = N ∑ xi i=1 ´x =53,24 Dispersioon N 1 s x 2= ∑ N−1 i=1 ( x i−´x )2 s x 2 =705,69 Standardhäve s x =√ s x 2 s x =26,56 Mediaan Me=51 Haare R = xmax – xmin = 94 – 9 = 85 2. Keskväärtuse μ usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: sx s ( P ´x −t α , N−1 ∙ √N ) < μ< ´x +t α , N −1 ∙ x =1−α √N tα, N-1 on arvutatav Exceli TINV funktsiooniga: t=1,711 P ( 44,15< μ<62.33 ) =0 , 90
Standardhälve ON ALATI varieeruvas kogumis keskmisest lineaarhälbest suurem. Normaaljaotuse üks parameetritest on standardhälve ehk sigma. Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe. NORMAALJAOTUS · Jaotuse püstakuse ehk ekstessi mõõtmisel tuginetakse neljandat järku normeeritud momendile ning jaotust võrreldakse normaaljaotusega (selle neljandat järku normeeritud moment on 3). · Normaaljaotus kirjeldab tunnust, mille käitumine on normaalne. Normaaljaotus on piirjaotus, millele lähenevad paljud teised jaotused. · Normaaljaotuse üks parameetritest on standardhälve ehk sigma. · Normaaljaotuse omadused: * normaaljaotus on pidev jaotus *normaaljaotus on täielikult kirjeldatav kahe parameetriga: keskväärtusega ja dispersiooniga 2 *normaaljaotusele vastav kõver on sümmeetriline keskväärtuse suhtes * normaaljaotuse keskväärtus, mood ja mediaan ühtivad.
2 Vahemikku sattumise tõenäosus 0.15 0.1 0.05 0 0-20 21-40 41-60 61-80 81-100 Valimi vahemikud Normaaljaotus x ¿0=0, x¿1 =20, x ¿2=40, x ¿3=60, x ¿4=80, x ¿5=100 ´x =45 s=34 ¿ ¿ xm -´x ¿ ¿ ¿ ¿ ¿ ¿ t m= t 0=- , t 1=-0,75, t 2 =-0,15,t 3=0,44, t 4=1,02, t 5 =+ s 0 ( t ¿0 )=1-1=0, 0 ( t ¿1 )=1-0,77=0,23, 0 ( t ¿2 ) =1-0,56=0,44, 0 ( t ¿3 )=0,67, 0 ( t ¿4 ) =0,85, 0 ( t ¿5 )=1 ~ p m= 0 ( t ¿m ) -0 ( t ¿m-1 ) ~ p1=0,23, ~
Haare (R) 98 Parandatud standardhälve (Scp) 26.26 Mood 48 ja 58 (tabelist) 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud (intervallhinnangud) eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks α=0,05 ehk P = 0,95 Keskväärtuse usaldusvahemik 𝑆𝑐 𝑆𝑐 ̅̅̅ − 𝑡 ∙ 𝑥𝑘 ̅̅̅ + 𝑡 ∙ ≤ 𝑥̂ ≤ 𝑥𝑘 √𝑛 √𝑛
5 100 1,78 7 0,9649 0,1118 2,795 25 31,3425 4,6051702 4,3 Et hüpotees vastu võetaks peab ²kr>². Seega hüpoteesi vastu ei v võib järeldada, et üldkogumi jaotus ei ole normaaljaotus k xm ni F0 pi ni' 1 20 4 0,2 0,2 5 2 40 4 0,4 0,2 5 3 60 8 0,6 0,2 5 4 80 2 0,8 0,2 5
60-80 1 0,04 62 80-100 7 0,28 90,9 Valimi histogramm 8 7 6 5 Tõenäosus 4 3 2 1 0 0-20 20-40 40-60 60-80 80-100 Intervall m 4.1 põhikogumi jaotuseks on normaaljaotus (mille parameetrid μ ja σ hinnatakse valimi järgi) k 1 ^μ= x´ = ∑ ni xi n i=1 7∗8,7+5∗31,6+5∗45,6+ 1∗62+7∗90,9 ^μ= = 45,8 25
60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese interval vahemi element tõenäos intervalli li nr k e us keskmine 1 0-20 9 0,36 9,55 2 20-40 4 0,16 30,75 3 40-60 2 0,08 49 4 60-80 5 0,2 69,8 5 80-100 5 0,2 94 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ni- k Xm ui ni (ui) pi ni' ni')^2/ni' - 1 20 0,70774 9 0,2389 0,2389 5,9725 1,5346599
8 7 6 nn 5 sagedus ni 4 sagedus ni' 3 2 1 0 1 2 3 4 5 6 7 8 9 10 intervalli nr. 6. Hinnata normaaljaotuse võimalikkust mõõtetulemust alusel Normaaljaotus on võimalik kui . (toodud eelmise punkti tabeli viimases veerus). = 9,5 (väärtus tabelist vastavalt intervallide arvule ning tõenäosusele). => 6,1 < 9,5 => normaaljaotus on võimalik. 7. Dispersioonanalüüs F1 F2 F3 F4 F5
4. Konstrueerime valimi histogrammi Vahemikud: 0-20, 20-40, 40-60, 60-80, 80-100 (konstrueerides võtan nii, et ülemine piir kuulub vahemikku, aga alumine mitte) m nm pm 0-20 6 0,24 20-40 5 0,2 40-60 8 0,32 60-80 4 0,16 80-100 2 0,08 Nüüd kontrollime kolme hüpoteesi põhikogumi jaotuse kohta Pearsoni 2 - testi abil; usaldusnivooks kasutame = 0.10 4.1 H0: põhikogumi jaotus on normaaljaotus (parameetrid ja peab hindama valimi põhjal); H1: põhikogumi jaotus ei ole normaaljaotus. Kuna jaotuse parameetrid on juba hinnatud punktis 1 (oletades et tegu on normaaljaotusega), siis saame kohe määrata intervalidesse sattumise teoreetilised tõenäosused. t F(x) (x) 20 -0,93 0,18 0,18 40 -0,16 0,44 0,26 60 0,61 0,73 0,29 80 1,38 0,92 0,19 100 2,15 0,98 0,07
Sagedustabel koosneb: · tunnuste üksikväärtuste või väärtuste vahemike loetelust · koos nende indiviidide arvuga, kelle puhul analüüsitava tunnuse väärtus ühtib vaadeldava konkreetse väärtusega või kuulub vastavasse väärtusvahemikku. Indiviidide hulka saame mõõta: · "tükiarvu" ehk sageduse ehk absoluutse sagedusega; · suhtelise sagedusega, mis tähendab absoluutse sageduse suhet indiviidide koguarvusse. 7) Normaaljaotus, selle kohta käivad reeglid. · Normaaljaotus on ühetipuline keskväärtuse (keskmise) suhtes sümmeetriline jaotus. · Normaaljaotuse standardtähistuseks on N(,²) · Keskväärtus () määrab jaotuse raskuskeskme asukoha, standardhälve () aga kõvera kuju. · Mida suurem on standardhälve, seda väiksema järsakusastmega on kõver. · Kõvera ja horisontaaltelje vahele jääva pinnaosa pindala näitab, kui tõenäone on
60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese interval vahemi element tõenäos intervalli li nr k e us keskmine 1 0-20 5 0,2 6,8 2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,2 73,4 5 80-100 3 0,12 96,3 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ni- k Xm ui ni (ui) pi ni' ni')^2/ni' - 1 20 0,70774 9 0,2389 0,2 5,9725 1,5346599
toimingud. Ülikooliharidus peab välja selekteerima. Üliõpilaste selekteerimisel võrdlemine eeldab, et ülikool on selekterimise vahend, mis eristab intellektuaalid, nagu seda tehti Hiinas, või bakalureseõppe eesmärgiks on väljavalida inimesed teadustööks. Sageli ei juhtu see veel ka magistris , et inimene hakkab tegelema teadustööga. Ainus, kus tuleks inimesi selkterivalt hinnata on sisseastumine. (Lk 179-180) Hindamiskõver. Hindamiskõver ehk normaaljaotus sisaldab juba endas oreooli, et väike rühm õpilasi saab eesrindlikult kõige paremad tulemused. Paljud inimesed on, isegi juhtkond on arusaamisel, et hindamisel saavad väaid vägavähesed väga hea hinde ja suurem osa on keskpärane. Selline arusaam tuleneb, at võimed määravad inimese saavutatuse ja saavutatus on määrtlketav. (lk 181) Miks kasutatakse jätkuvalt mõõtmismudelit? Traditsiooniline harjumus. Bürokraatlik mugavus: Arvude illusionistlik täpsus
normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud normaaljaotuse kohaselt: kui juhuslik suurus Y on jaotunud normaaljaotuse järgi, siis juhuslik suurus X=expY on jaotunud lognormaalse jaotusseaduse järgi
h n zMe 15 19 n Me 6 2 2 Me X me 41 57,25 57 h 15 hMe 6 5. Põhikogumiku normaaljaotuse võimalikus A. Kasutades normeeritud tihedusfunktsiooni Tabel 3 normaaljaotus Χ2 järgi xi ui φ(ui) n´i n´i/n´ ni ni-n´i (ni-n ((ni-n ´i)2 ´i)2) /n´i 3,50 -1,76 0,084 2,30 0,05 5 2,70 7,30 3,18 18,50 -1,21 8 5,20 0,11 10 4,80 23,04 4,43 0,191
1 0-20 7 0,28 8,7 2 21-40 5 0,20 31,6 3 41-60 5 0,20 45,6 4 61-80 2 0,08 71,0 5 81-100 6 0,24 92,5 4.1 Põhikogumi jaotuseks on normaaljaotus Kuna tulemused on esitatud sagetustabelina, siis keskväärtuse hinnang on Kuna tulemused on esitatud sagedustabelina, siis dispersiooni hinnang on 1 20 -0,787 7 -0,285 0,263 6,583 0,026 2 40 -0,176 5 -0,071 0,214 5,345 0,022 3 60 0,435 5 0,170 0,241 6,035 0,178
3 2 1 0 0-20 20-40 40-60 60-80 80-100 2 Arvutusgraafiline töö | Mihkel Heinmaa | 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis (arvutatud Excelis ümardusi kasutamata) Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis ( )
........................................................................................................12 3.3. Korrelatiivne sõltuvus........................................................................................................12 3.4. Lineaarne ühe argumendiga regressioonmudel................................................................. 13 4. Üldkogumile tulemuste leidmine (üldistamine)................................................................... 14 4.1. Normaaljaotus....................................................................................................................14 4.2. Keskväärtuse (keskmise) usaldusvahemik.........................................................................16 4.3. Statistiliste hüpoteeside kontrollimine...............................................................................16 4.3.1. Hüpoteesid ühe üldkogumi keskväärtusele....................................................................
2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,2 73,40 5 80-100 3 0,12 96,33 KOKKU 25 1 Kontrollin -testi järgi olulisuse nivool = 0,10 järgmisi jaotushüpoteese: 2 4.1 põhikogumi jaotuseks on normaaljaotus. Keskväärtuse hinnang: 1 k µ^ = x = ni xi = 46, 2 n i =1 Dispersiooni hinnang: 1 k ^ = s 2 = ( xi - x) 2 ni = 854,88 n - 1 i =1 Teststatistiku arvutamise valemid: k (nm - nm~ ) 2 2 = m =1 nm~ nm~ = N pm~ pm~ = (tm ) - (tm -1 )
60 2867 186937 84 1. Keskväärtuse, dispersiooni, standarthälbe, mediaani, moodi ja haarde hinnangud Keskväärtus xkesk =(xini)/n=2867/60=47,78 Dispersioon Dx=(ni(xi-xk)2)/n=49942,184/60=832,4 Standarthälbe S=Dx=832,4=28,85 Scor=(n/(n-1))*S)= =(60/(60-1))*28,85=29,09 Me=(45+46)/2=45,5 Mo=71 esines 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on =0,05, P=95% korral t=1,96 : 47,78-1,96(29,09/60) < < 47,78+1,96(29,09/60) 40,41 < < 55,14 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 29,09(1-0,21) < < 29,09(1+0,21) 22,98 < < 35,19 Dispersiooni usaldusvahemik (29,09 (1-0,21))² < D < (29,09(1+0,21))² 528 < D < 1238,3 3.Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3.1 H0: =50 alternatiiviga H1: 50
27 60 2849 195025 60332.7 1. Keskväärtuse, dispersiooni, standarthälbe, mediaani, moodi ja haarde hinnangud Keskväärtus xk=(xini)/n=2849/60=47,48 Dispersioon Dx=[ni(xi-xk)2]/n=1005,5 Standarthälbe S=Dx=1005,5=31,71 Scor=(n/(n-1))*S=(60/(60-1))*31,71=31,97 Me=(43+44)/2=43,5 Mo=25, Mo=96 esinesid 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : 47,48-1,96(31,97/60) < < 47,48+1,96(31,97/60) 39,39 < < 55,57 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 31,97(1-0,21) < < 31,97(1+0,21) 25,26 < < 38,68 Dispersiooni usaldusvahemik (31,97(1-0,21))² < D < (31,97(1+0,21))² 638 < D < 1496,1 3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3
Me = = 55 2 Haare: R = xmax - xmin = 99 - 0 = 99 Mo = {94} Mood: 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : X -t < µ < X +t n n 30,90 30,90 53,92 -1,96 < µ < 53,92 +1,96 50 50 45,36 < µ < 62,48 Tõene standardhälve P=95% q=0,21 : Enne leida korrigeeritud standardhälve n ( x ) 2 i i -X 47735,68