68% kuulub piirkonda [EX - ; EX + ]; 95% kuulub piirkonda [EX - 2; EX + 2]; 99,7% kuulub piirkonda [EX - 3; EX + 3]. Ülesanne 1 · Mõõtmisvead on teaduses olnud alati probleemiks. Nende uurimisel selgus, et mõõtmisvead alluvad normaaljaotusele. (Reeglina tehakse väikseid vigu sageli, suuri vigu aga harva.) Järgmises tabelis on ühe toru läbimõõdu (mm) 20 mõõtmistulemust. Kontrollige, kas ka see jaotus on normaaljaotus. Milline arv tuleb võtta toru läbimõõduks? Läbimõõt X (mm) 19, 20,1 20,4 20,5 20,6 21, 8 0 Sagedus (f) 1 2 4 5 6 2 Ülesanne 2 · Teadmiste ja oskuste taset peegeldavad kontrolltöö eest saadud hinded või punktid. Kontrollige kas ühe üliõpilasrühma poolt tehtud kontrolltöö, mille eest võis saada kuni 100 punkti, tulemused alluvad normaaljaotusele
See jaotus eeldab, et nähtusel on mingi keskmine tase, mille ümbruses varieerub suurem osa väärtustest. Suuri kõrvalekaldeid esineb harva ja need toimuvad võrdvõimalikult mõlemale poole. Normaal- jaotus on määratud ja täielikult kirjeldatav kahe parameetriga keskväärtuse ja standardhälbe ehk dispersiooniga. Normaalajotust kujutav graafik on kellukese kujuline ja sümmeetriline keskväärtuse suhtes. Jaotust nimetatakse ka Gaussi-Laplaci kõveraks. Joonis 1. Normaaljaotus tekib siis, kui tunnuse väärtust mõjutavad väga paljud juhuslikud tegurid ja neist igaühe mõju on väga väike. Normaaljaotus on teoreetiline abstraktsioon. Eluslooduses ei ole ükski asi täpselt normaaljaotusega, kuid paljud tunnused on looduses normaaljaotusele väga lähedase jaotusega. Joonis 1. Normaaljaotuse graafik Normaaljaotusega tunnuse väärtuste ulatust saab iseloomustada standardhälbe kaudu. Kolme
teoreetilised sagedused (ülaltoodud tühjadesse lahtritesse) 3,756273 3. Et kontrollida, kas antud empiiriline jaotus võiks pärineda normaaljaotusega 4 üldkogumist, leia 2-statistik, vabadusastmete arv ja P-väärtus 0,4399943 4. Kas toodud empiiriline ja teoreetiline jaotus (normaaljaotus) on sobivad või sobimatud? sobivad Olgu proovitüki andmeil leitud männi diameetri aritmeetiline keskmine 35,2 cm ja standardhälve 5,1 cm (ülesannete 5 kuni 8 algandmed) 5. Eeldades männi diameetri normaaljaotust, leida mitu protsenti diameetritest on jämedamad, kui 28 cm P(X>28)= 92,0990 6. Eeldades männi diameetrite korral normaaljaotust, x0,7= 37,9
Andmetöötluse alused II kodune töö Juhendaja: lektor juhendaja Tartu aasta Sisukord Sisukord.............................................................................................................................2 Sissejuhatus....................................................................................................................... 3 2. Diameetri aritmeetiline keskmine ja standardhälve.......................................................4 3. Normaaljaotus................................................................................................................5 3.1 Normaaljaotuse graafik............................................................................................5 3.2 Normaaljaotuse eeldusel.........................................................................................6 4.2 Lognormaaljaotuse tabel..........................................................................................7 4.3
−∞ 2 12. Leida pideva ühtlase jaotuse dispersioon. 2 2 (a−b) Pideva ühtlase jaotuse dispersioon on DX =EX 2−( EX ) = 12 NORMAALJAOTUS 13. Defineerida normaaljaotus. Normaaljaotus on reaalarvulise juhusliku suuruse jaotus, mille tihedusfunktsioon avaldub 2 −(x−μ) 1 2σ 2 kujul φ ( x )= e , kus jaotuse parameeter σ > 0 (hajuvus) ja μ on σ √2 π reaalarv(keskväärtus). Tähistatakse X~N(μ,σ). 14. Kuidas avalduvad normaaljaotusega juhusliku suuruse keskväärtus ja dispersioon?
4 0,0189
5 0,0378
6 0,0631
P(A)= 0,1301
ül.4
Kui suur on tõenäosus, et sajast puust läheb kasvama 60 kuni 75, kui ühe puu kasvamaminemise tõenäosus on 0,7?
n= 100 Laplace´i teoreem, normaaljaotus
p= 0,7 a= 70 q= 0,3
sigma= 4,58
P(60
Praktikum nr 1. Normaaljaotuse kontrollimine. Erindite leidmine. Süstemaatiliste vigade leidmine ja eemaldamine. Ülesanne 1: hinda süstemaatiliste vigade olemasolu Tabelis 1 toodud edasi-tagasi nivelleeritud keskmiste kõrguskasvude erinevuste d põhjal mõlemat eeltoodud kriteeriumit kasutades. Esmalt kasutame süstemaatiliste vigade olemasolu hindamiseks märgikriteeriumi. See tähendab seda, et süstemaatiliste vigade puudumisel mõõtmisseerias peaks erimärgilisi vigu olema ligikaudu võrdselt. Märgikriteeriumi testi tegemiseks peab esmalt loendama valimis olevad nullist suuremad ja väiksemad vead. Exceli's on selleks käsklus (COUNTIF). Praktikumis loendasime kui palju on valimis nullist suuremaid vigu. Tulemuseks saime suuruse k, mis ühes valimi mahuga n, annab meile võimaluse arvutada statistik R (R= |2 k-n| ). Teststatistikut R võrreldakse kriteeriumiga 2 n . Süstemaatiliste vigade mitteesinemisel kehtib võrdus R<2...
Defineeri mõisted: Statistika Matemaatiline statistika Üldkogum. Näide. Üldkogu uurimisel on kaks võimalust: Valim. Kuidas on seotud üldkogu ja valim? Millised on nõuded valimile? Valimi moodustamise viisid. Statistiline rida. Variatsioonirida. Sagedustabel. Diagramm. Mood. Mediaan. Aritmeetiline keskmine. Variatsiooni ulatus. Hälve. Dispersioon. Standardhälve. Korrelatsiooniväli. Normaaljaotus. Statistika mõisted Andmete esitamine 1.Statistika - teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. 2.Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. 3.Statistikas on oluline uurimise objekt - üldkogum. 4.Üldkogum on kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Üldkogumi uurimisel on kaks võimalust:
sõltumatud statistiline tõenäosus, klassikaline tõenäosus, täielik süsteem teoreetiline tõenäosus, tinglik tõenäosus välistavad juhuslik suurus, jaotusfunktsioon pidev juhuslik suurus, jaotusseadus, jaotusfunktsioon keskväärtus diskreetne juhuslik suurus, dispersioon, integraal, mediaan, ülemine rada 19. 15, binoomjaotus, parameetrid, parameeter Test 6 pidev, diskreetne, poissoni jaotus, jaotusseadus jaotusseadus, eksponentjaotus normaaljaotus, normaaljaotus normaaljaotus negatiivne väärtus poissoni jaotus Test 7 kogum, klastervalik, kihtvalik, lihtne juhuvalik, süstemaatiline valik tõenäosuslik valikumeetod, empiiriline valik fikseeritud samm, süstemaatiline valik, punkthinnang nihketa, efektiivne, optimaalne keskväärtus, normaaljaotus, suur valim keskväärtuse standardviga standardhälve standardviga, keskväärtuse usalduspiirid valimvaatlus usaldatavus
standardhälbe, mediaani, moodi ja haarde hinnangud. Aritmeetiline keskväärtus: xk=(xi*ni)/n= 53,07 Harmooniline keskväärtus: Xk=n/(1/xi)= 26,39 Geomeetriline keskväärtus xk=(x1*...*xn)^(1/n)= 39,43 Dispersioon Dx=[ni(xi-xk)2]/n= 68,01 Standardhälve S=Dx= 26,17 Mediaan: 55 Mood: arvud 32 ja 68 esinevad 3 korda Haarde hinnangud: 99-0= 99 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks =0,05 Keskväärtuse usaldusvahemik: P=95% korral t=2 46,31 << 59,82 Standardhälbe usaldusvahemik: q=0,3 18,48 < < 34,31 Dispersiooni usaldusvahemik: q=0,3 341,34 < < 1177,26 3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on =0,05 3.1 H0: = 50 alternatiiviga H1: 50 T-kriteerium Sc= 26,39 tEMP= (53,06666667--50)* 60)/ 26,39= 0,90 tKR=2
variatsioonreas 30%. Täiendkvantiiliks nimetatakse juhusliku suuruse q-täiendkvantiili suuruse sellist väärtust xq, millest võrdsete või suuremate väärtuste esinemise tõenäosus on q. 9. Mis on tihedusfunktsioon? Tihedusfunktsioon on jaotusfunktsiooni tuletis: F'(x) = f(x). 10. Normaaljaotuse skitseerimine (tihedus- ja jaotusfunktsioon). Graafikult lugemine (aritmeetiline keskmine, standardhälve, mood, mediaan). 11. Mis omadused on normaaljaotusel? 1) normaaljaotus on sümmeetriline keskväärtuse µ suhtes: tema keskväärtus, mood ja mediaan võrduvad parameetriga µ 2) normaaljaotuse tihedusfunktsioonil on kaks käänupunkti, mis asuvad mõlemal pool keskväärtust kaugusel 3) normaaljaotuse asümmeetriakordaja ja ekstsess on nullid (A=0, E=0). 12. Missugused on juhusliku suuruse hajuvuse karakteristikud (nimeta vähemalt 4). Definitsioonid. Dispersioon on juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus varieerub
MHT0030 RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Keskväärtus =46,20 Dispersioon =867,91 Standardhäve =29,46 Mediaan Me=46 Haare R = xmax xmin = 99 0 = 99 2. Keskväärtuse usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 on arvutatav Exceli TINV funktsiooniga: 1,711 Dispersiooni usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja on arvutatav Exceli CHIINV funktsiooniga, ning on vastavalt: 36,415 ja 13,843 3. Kontrollida järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10) 3
docstxt/129544194986833.txt
nimetatakse diskreetseks Juhuslik suurus-Juhuslikuks suuruseks nimetatakse suurust X, kui iga x R korral eksisteerib tõenäosus P(X < x) Pidev juhuslik suurus-Juhuslikku suurust, mille võimalike väärtuste hulk on mitteloenduvalt lõpmatu (st väärtuste hulgaks on teatav(ad) arvude intervall(id)), nimetatakse pidevaks Poissoni jaotus-Diskreetse juhusliku suuruse X esinemise tõenäosus ajaühikus on Poissoni jaotuse järgi. Normaaljaotus-Normaaljaotus on pidev jaotus, mis võib omandada kõiki reaaltelje väärtuseid, teda kirjeldavad kaks parameetrit µ ja s 2. Tähistatakse N(µ, s 2). Tihedusfunktsioon-Pideva juhusliku suuruse jaotusfunktsiooni tuletist nimetatakse juhusliku suuruse tihedusfunktsiooniks,tähistatakse tähega f(x). Tihedusfunktsioonil on järgmised omadused, mis vahetult tulenevad jaotusfunktsiooni omadustest: 1) Tihedusfunktsioon on mittenegatiivne f(x) >= 0. 2) Tihedusfunktsiooni alune pindala on võrdne ühega.
8. Hüpergeomeetriline jaotus JS nimetatakse jaotunuks (hüper)geomeetriliselt, kui võimalikud väärtused 0, 1 ... n vötab ta tõenäosusega PN,M {n, m}, kus N, M, n on jaotuse parameetrid. Tagasipanekuta skeem 9. Poisson jaotus Jaotusseadus Pt(X=x) = () / x! = fP(x,a) 10. Ühtlane (ristkülik) jaotus f(x) = {1/(b-a)}, kui a x b JS nimetatakse ristkülikjaotusega intervallis [a; b] kui tema tõenäosuse tihedus on konstantne c vahemikus [a; b] ja väljaspool [a; b] võrdne 0. 11. Normaaljaotus. Normeeritud normaaljaotus Normaaljaotus, mille tihedus on normeeritud ja tsentreeritud (a =0 ja ,=1) on Gaussi kõver 12. Eksponentsiaalne jaotus. (Töö)kindlusfunktsioon 13. Gammajaotus. Beetajaotus. Logaritmiline jaotus = 0 kui t <0 14. 2 jaotus. F jaotus. Studenti jaotus 52 jaotuseks n vabadusastmega nimetatakse sõltumatute standardsete normaalsete suuruste n ruutude summa jaotust 20. Matemaatiline ootus ja tema omadused
3)Standardhäve =29,46 4)Mediaan Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 5)Haare R = xmax xmin = 99 0 = 99 2. Leian keskväärtuse usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: t, N-1 arvutasin Exceli TINV funktsiooniga ( on ka leitav Studenti tabelist): 1,711 Leian dispersiooni usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10 ning põhikogumit moodustavate mõõdiste arv n = 25: ja arvutasin Exceli CHIINV funktsiooniga, vastavalt: 36,415 ja 13,848 3. Kontrollin järgmisi hüpoteese (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0,10)
dispersioon on null. Mida suurem aga dispersioon on, seda enam erinevad katsete tulemused üksteisest. Standardhälve ruutjuur dispersioonist. 23. Kuidas leitakse standardhälve a) Variatsioonreast? b) Sagedustabelist? 24. Mis on variatsioonkordaja? Milleks läheb seda vaja? - Standardhälbe ja keskväärtuse suhe: V=sh/ksv. 25. Millist jaotust nimetatakse normaaljaotuseks? Milliste tingimiuste korral tekib normaaljaotus? Normaaljaotus kirjeldab tunnust, mille keskmise taseme lähedased väärtused esinevad tihti, aga suuri kõrvalekaldeid keskmisest väärtusest on harva. Mõlemasuunalised kõrvalekalded on võrdvõimalikud. Normaaljaotus tekib järgmise tingimuste korral: 1. Tunnuse väärtustel on olemas mingi fikseeritud keskmine tase. 2. Tunnuse väärtus kujuneb paljude üksteisest sõltumatute nõrgalt mõjuvate faktorite toimel. 3
Seega H0 hüpotees vastu võetud. 3.2 2 Keili Kajava Kuna 2 jääb ja vahele (13,85 < 32,1 < 36,4), siis hüpotees H0 vastu võetud. 4. Empiiriline histogramm ni 8 7 6 5 4 3 2 1 0 0 - 20 20 - 40 40 - 60 60 - 80 80 - 100 Vahemikud 4.1 Üldkogumi jaotuseks on normaaljaotus 3 Keili Kajava k xm ui ni tabeli pi väärtus 1 20 -0,79 7 -0,2881 - 5,298 0,547 0,2119 2 40 -0,18 5 -0,071 0,217 5,418 0,032 3 60 0,44 5 0,170 0,241 6,035 0,178
Kahe juhusliku suuruse vahel on positiivne korrelatsioon. Kui esimese suuruse kasvades kasvab ka teine suurus. Tegemist on negatiivse korrelatsiooniga, kui I suuruse kasvades II suurus kahaneb. r = [ -1; 1 ] |r| > = 0,8 Tugev korrelatsioon 0,6<=|r|<=0,8 Märgatav korrelatsioon 0,3<=|r|<=0,6 Nõrk korrelatsioon |r|<0,3 Korrelatsioon puudub Normaaljaotus Normaaljaotus tekib järgmise tingimuste korral: 1. Tunnuse väärtustel on olemas mingi fikseeritud keskmine tase. 2. Tunnuse väärtus kujuneb paljude üksteisest sõltumatute nõrgalt mõjuvate faktorite toimel. 3. Tunnuse väärtuse suurenemine üle keskmise ja vähenemine alla keskmise on võrdvõimalik. Kolme sigma reegel: Keskväärtuse ja standardhälbe suurusest 68% kuulub lõiku (1 sigma)
2 21-40 7 0,28 33,00 3 41-60 4 0,16 49,25 4 61-80 5 0,2 70,00 5 81-100 3 0,12 90,00 Kokku 25 1 50,42 Historamm: Nüüd kontrollime kolm hüpoteesi pühikogumi jaotuse kohta Pearsoni 2 - testi abil; usaldusnivooks kasutame = 0.10 4.1 Põhikogumi jaotuseks on normaaljaotus Kuna tulemused on esitatud sagetustabelina, siis keskväärtuse hinnang on Kuna tulemused on esitatud sagedustabelina, siis dispersiooni hinnang on H0: põhikogumi jaotus on normaaljaotus (parameetrid ja peab hindama valimi põhjal); H1: põhikogumi jaotus ei ole normaaljaotus. Normaaljaotus t F(t) (t) hii-ruut 20 -0,87 0,19 0,19 0,012 40 -0,15 0,44 0,25 0,004
(leitud t-jaotuse tabelist) Dispersiooni usaldusvahemiku leidmine (tuleb jaotuse tabelist) (tuleb jaotuse tabelist) Keili Kajava 3. 3.1 Kuna |t| < t0,95(24) (|-0,648| < 1,711), siis võib järeldada, et põhikogumi keskväärtus saab olla 25 valimi alusel. Seega H0 hüpotees vastu võetud. 3.2 Kuna 2 jääb ja vahele (13,85 < 32,1 < 36,4), siis hüpotees H0 vastu võetud. 4. 4.1 Üldkogumi jaotuseks on normaaljaotus k xm ui ni tabeli pi väärtus 1 20 -0,79 7 -0,2881 - 5,298 0,547 0,2119 2 40 -0,18 5 -0,071 0,217 5,418 0,032 Keili Kajava 3 60 0,44 5 0,170 0,241 6,035 0,178
Kui a
ja b on võimalikud, on võimalik ka iga c, mis kuulub vahemikku a-st b-ni: c(a,b). Pideva
juhusliku suurusega saab esitada näiteks: Inimese pikkus, Välistemperatuur, Asjade kaal
Pideva juhusliku suuruse korral on iga üksiku väärtuse tõenäosus null. Seega leiame hoopis
tõenäosuse, et juhuslik suurus asub teatud vahemikus:
P(173,5
....................................................................................4 1.4 Viiuli intonatsioon............................................................................................................5 1.5 Statistika...........................................................................................................................5 1.5.1 Juhuslik ja süstemaatiline kõrvalekalle..................................................................6 1.5.2 Normaaljaotus...........................................................................................................6 1.5.3 Aritmeetiline keskmine ja standardhälve...............................................................7 3. MEETOD................................................................................................................................8 3.1 Katseisik ja pill..............................................................................................................
Täistõenäosus Bayesi valem Bernoulli valem Keskväärtus: Geomeetriline jaotus Binoomjaotus Dispersioon: Standardhälve: Normaaljaotus Binoomjaotuse lähendamine normaaljaotusega ja Punktihinnangud Keskväärtuse hinnanguks on Dispersiooni hinnanguks on Standardhälbe hinnanguks on Normaaljaotuse keskväärtuse usalduspiirkond
n30 ja tõenäosus p5. m on antud arv. Poissoni jaotusega juhuslikuks suuruseks nimetame juhuslikku suurust, mille väärtuste hulgaks on täisarvud 0,1,2 .. ja m - P ( x = m) = e mille jaotus on määratud valemiga m! . Poissioni jaotusega juhuslikku suurust tähistame X~P(). Keskväärtus EX= =np, dispers DX= =np, standardälve DX= . 6. Normaaljaotus. Normaaljaotuse jaotustihedus f ( x ) ja selle graafik. Normaaljaotusega juhusliku suuruse antud vahemikku sattumise tõenäosuse P( X ) arvutuseeskiri. Laplace'i funktsiooni ( x) graafik ja omadusi. Kui pideva juhusliku suuruse tihedusfunktsiooniks on funktsioon ( x-m)2 1 - p( x) = e 2 2 2 siis öeldakse, et see suurus on normaaljaotusega e. Gaussi jaotusega.
4 80 0.988129 5 0.8389 0.1761 5 100 1.55342 5 0.9406 0.1017 Kokku 25 χ²=6,4367 χ² vabadusastemete arv k=m-1-r=5-1-2=2 (r=2, sest normaaljaotusel on 2 parameetrit) χ²kr (0,10;2) = 4.605 Et hüpotees vastu võetaks peab χ²kr>χ². Seega hüpoteesi vastu ei võeta ning võib järeldada, et üldkogumi jaotus ei ole normaaljaotus ül 4.2 Põhikogumi jaotuseks on ühtlane jaotus fikseeritud parameetritega a=0 ja b=100 k xm ni F0 pi ni' 1 20 9 0.2 0.2 5 2 40 4 0.4 0.2 5 3 60 2 0.6 0.2 5 4 80 5 0.8 0.2 5
võimete testis · Omandab veidi tõsikindlama väärtuse, kui testitud rühm on piisavalt suur ja esinduslik ja hõlmab väga suurt osa ühel ajaperioodil sündinud inimesi ühel maal Vaimsete võimete jaotus (äsja keskkooli lõpetanud Eesti noorte tulemused 150 küsimusega vaimse võimekuse testis) N=123 7 =83,9 =19,4 Normaaljaotus · Normaaljaotus tekib praktiliselt alati, kui juhuslikku suurust mõjutavad paljud tegurid ning iga üksiku teguri mõju on väike · http://www.bowri.co.uk/scripts/dice2.htm · Sõltub kahest parameetrist: keskväärtus , millele vastab kellukakõvera kõrgeim tipp ja standardhälve , mis iseloomustab jaotuse laiust ehk tulemuste hajumist keskväärtuse ümber (mida suurem hajuvus, seda laiem kellukas) Normaaljaotus http://en.wikipedia
^ =s 2= 1 ( x - x´ )2 Dispersioon ¿ N -1 i=1 i ¿ Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Mood tunnuse kõige sagedamini esinev väärtus Haare R = xmax xmin = 99 4 = 95 2. Leian keskväärtuse, dispersiooni ja standardhälbe usaldusvahemiku eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,05 ehk P= 95% Keskväärtuse usaldusvahemik: sx sx ( P ´x -t , N-1 N < < ´x +t , N -1 N ) =1- s
arvkarakteristik, mis näitab juhusliku suuruse kaalutud keskmist, mida sageli ka ette prognoositakse. Dispersioon ja standardhälve Juhusliku suuruse iseloomustamiseks ei piisa ainult keskväärtusest. Tähtsuselt järgmisteks karakteristikuteks on dispersioon ja standardhälve. Need iseloomustavad juhusliku suuruse hajuvust keskväärtuse ümber. Dispersiooniks nimetatakse juhusliku suuruse hälvete ruutude keskmist keskväärtusest: Normaaljaotus Igal juhuslikul suurusel on spetsiaalne jaotusseadus. Eristatakse paljusid jaotusseaduse tüüpe. Üks kõige enam levinud jaotusseaduseks on normaaljaotus: 1 ( x EX ) 2 f ( x) 2 exp( 2 2 ) dx . Normaaljaotus on määratud kahe arvkarakteristikuga – keskväärtusega ja standardhälve ehk dispersiooniga
1 ´x = N ∑ xi i=1 ´x =53,24 Dispersioon N 1 s x 2= ∑ N−1 i=1 ( x i−´x )2 s x 2 =705,69 Standardhäve s x =√ s x 2 s x =26,56 Mediaan Me=51 Haare R = xmax – xmin = 94 – 9 = 85 2. Keskväärtuse μ usaldusvahemik eeldusel, et põhikogumi jaotus on normaaljaotus ja olulisuse nivoo = 0,10: sx s ( P ´x −t α , N−1 ∙ √N ) < μ< ´x +t α , N −1 ∙ x =1−α √N tα, N-1 on arvutatav Exceli TINV funktsiooniga: t=1,711 P ( 44,15< μ<62.33 ) =0 , 90
· Standardhälve ehk hälvete keskmine on leitud ruutkeskmise abil. Standardhälve ehk ruutkeskmine hälve on ruutjuur dispersioonist. Standardhälve on seotud tõenäosusteooria rakendustega, lineaarhälve ei ole. Standardhälve ON ALATI varieeruvas kogumis keskmisest lineaarhälbest suurem. Normaaljaotuse üks parameetritest on standardhälve ehk sigma. Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe. NORMAALJAOTUS · Jaotuse püstakuse ehk ekstessi mõõtmisel tuginetakse neljandat järku normeeritud momendile ning jaotust võrreldakse normaaljaotusega (selle neljandat järku normeeritud moment on 3). · Normaaljaotus kirjeldab tunnust, mille käitumine on normaalne. Normaaljaotus on piirjaotus, millele lähenevad paljud teised jaotused. · Normaaljaotuse üks parameetritest on standardhälve ehk sigma. · Normaaljaotuse omadused: * normaaljaotus on pidev jaotus *normaaljaotus on
2 Vahemikku sattumise tõenäosus 0.15 0.1 0.05 0 0-20 21-40 41-60 61-80 81-100 Valimi vahemikud Normaaljaotus x ¿0=0, x¿1 =20, x ¿2=40, x ¿3=60, x ¿4=80, x ¿5=100 ´x =45 s=34 ¿ ¿ xm -´x ¿ ¿ ¿ ¿ ¿ ¿ t m= t 0=- , t 1=-0,75, t 2 =-0,15,t 3=0,44, t 4=1,02, t 5 =+ s 0 ( t ¿0 )=1-1=0, 0 ( t ¿1 )=1-0,77=0,23, 0 ( t ¿2 ) =1-0,56=0,44, 0 ( t ¿3 )=0,67, 0 ( t ¿4 ) =0,85, 0 ( t ¿5 )=1 ~ p m= 0 ( t ¿m ) -0 ( t ¿m-1 ) ~ p1=0,23, ~
Haare (R) 98 Parandatud standardhälve (Scp) 26.26 Mood 48 ja 58 (tabelist) 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud (intervallhinnangud) eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks α=0,05 ehk P = 0,95 Keskväärtuse usaldusvahemik 𝑆𝑐 𝑆𝑐 ̅̅̅ − 𝑡 ∙ 𝑥𝑘 ̅̅̅ + 𝑡 ∙ ≤ 𝑥̂ ≤ 𝑥𝑘 √𝑛 √𝑛
5 100 1,78 7 0,9649 0,1118 2,795 25 31,3425 4,6051702 4,3 Et hüpotees vastu võetaks peab ²kr>². Seega hüpoteesi vastu ei v võib järeldada, et üldkogumi jaotus ei ole normaaljaotus k xm ni F0 pi ni' 1 20 4 0,2 0,2 5 2 40 4 0,4 0,2 5 3 60 8 0,6 0,2 5 4 80 2 0,8 0,2 5
60-80 1 0,04 62 80-100 7 0,28 90,9 Valimi histogramm 8 7 6 5 Tõenäosus 4 3 2 1 0 0-20 20-40 40-60 60-80 80-100 Intervall m 4.1 põhikogumi jaotuseks on normaaljaotus (mille parameetrid μ ja σ hinnatakse valimi järgi) k 1 ^μ= x´ = ∑ ni xi n i=1 7∗8,7+5∗31,6+5∗45,6+ 1∗62+7∗90,9 ^μ= = 45,8 25
60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese interval vahemi element tõenäos intervalli li nr k e us keskmine 1 0-20 9 0,36 9,55 2 20-40 4 0,16 30,75 3 40-60 2 0,08 49 4 60-80 5 0,2 69,8 5 80-100 5 0,2 94 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ni- k Xm ui ni (ui) pi ni' ni')^2/ni' - 1 20 0,70774 9 0,2389 0,2389 5,9725 1,5346599
7 6 nn 5 sagedus ni 4 sagedus ni' 3 2 1 0 1 2 3 4 5 6 7 8 9 10 intervalli nr. 6. Hinnata normaaljaotuse võimalikkust mõõtetulemust alusel Normaaljaotus on võimalik kui . (toodud eelmise punkti tabeli viimases veerus). = 9,5 (väärtus tabelist vastavalt intervallide arvule ning tõenäosusele). => 6,1 < 9,5 => normaaljaotus on võimalik. 7. Dispersioonanalüüs F1 F2 F3 F4 F5
4. Konstrueerime valimi histogrammi Vahemikud: 0-20, 20-40, 40-60, 60-80, 80-100 (konstrueerides võtan nii, et ülemine piir kuulub vahemikku, aga alumine mitte) m nm pm 0-20 6 0,24 20-40 5 0,2 40-60 8 0,32 60-80 4 0,16 80-100 2 0,08 Nüüd kontrollime kolme hüpoteesi põhikogumi jaotuse kohta Pearsoni 2 - testi abil; usaldusnivooks kasutame = 0.10 4.1 H0: põhikogumi jaotus on normaaljaotus (parameetrid ja peab hindama valimi põhjal); H1: põhikogumi jaotus ei ole normaaljaotus. Kuna jaotuse parameetrid on juba hinnatud punktis 1 (oletades et tegu on normaaljaotusega), siis saame kohe määrata intervalidesse sattumise teoreetilised tõenäosused. t F(x) (x) 20 -0,93 0,18 0,18 40 -0,16 0,44 0,26 60 0,61 0,73 0,29 80 1,38 0,92 0,19 100 2,15 0,98 0,07
Sagedustabel koosneb: · tunnuste üksikväärtuste või väärtuste vahemike loetelust · koos nende indiviidide arvuga, kelle puhul analüüsitava tunnuse väärtus ühtib vaadeldava konkreetse väärtusega või kuulub vastavasse väärtusvahemikku. Indiviidide hulka saame mõõta: · "tükiarvu" ehk sageduse ehk absoluutse sagedusega; · suhtelise sagedusega, mis tähendab absoluutse sageduse suhet indiviidide koguarvusse. 7) Normaaljaotus, selle kohta käivad reeglid. · Normaaljaotus on ühetipuline keskväärtuse (keskmise) suhtes sümmeetriline jaotus. · Normaaljaotuse standardtähistuseks on N(,²) · Keskväärtus () määrab jaotuse raskuskeskme asukoha, standardhälve () aga kõvera kuju. · Mida suurem on standardhälve, seda väiksema järsakusastmega on kõver. · Kõvera ja horisontaaltelje vahele jääva pinnaosa pindala näitab, kui tõenäone on
60-80 ja 80-100 ning kontrollida - testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese interval vahemi element tõenäos intervalli li nr k e us keskmine 1 0-20 5 0,2 6,8 2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,2 73,4 5 80-100 3 0,12 96,3 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis Teststatistik: (ni- k Xm ui ni (ui) pi ni' ni')^2/ni' - 1 20 0,70774 9 0,2389 0,2 5,9725 1,5346599
toimingud. Ülikooliharidus peab välja selekteerima. Üliõpilaste selekteerimisel võrdlemine eeldab, et ülikool on selekterimise vahend, mis eristab intellektuaalid, nagu seda tehti Hiinas, või bakalureseõppe eesmärgiks on väljavalida inimesed teadustööks. Sageli ei juhtu see veel ka magistris , et inimene hakkab tegelema teadustööga. Ainus, kus tuleks inimesi selkterivalt hinnata on sisseastumine. (Lk 179-180) Hindamiskõver. Hindamiskõver ehk normaaljaotus sisaldab juba endas oreooli, et väike rühm õpilasi saab eesrindlikult kõige paremad tulemused. Paljud inimesed on, isegi juhtkond on arusaamisel, et hindamisel saavad väaid vägavähesed väga hea hinde ja suurem osa on keskpärane. Selline arusaam tuleneb, at võimed määravad inimese saavutatuse ja saavutatus on määrtlketav. (lk 181) Miks kasutatakse jätkuvalt mõõtmismudelit? Traditsiooniline harjumus. Bürokraatlik mugavus: Arvude illusionistlik täpsus
lubatud muutumisvahemiku sees kõik juhusliku suuruse väärtused on tekke mõttes samaväärsed. Jaotuse parameetriteks on juhusliku suuruse muutumisintervalli alumine piir a ja ülemine piir b. Eksponentjaotus (pidev) kirjeldab mingi sündmuse toimumisaja jaotust eeldusel, et sündmuse tekkimise jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt
h n zMe 15 19 n Me 6 2 2 Me X me 41 57,25 57 h 15 hMe 6 5. Põhikogumiku normaaljaotuse võimalikus A. Kasutades normeeritud tihedusfunktsiooni Tabel 3 normaaljaotus Χ2 järgi xi ui φ(ui) n´i n´i/n´ ni ni-n´i (ni-n ((ni-n ´i)2 ´i)2) /n´i 3,50 -1,76 0,084 2,30 0,05 5 2,70 7,30 3,18 18,50 -1,21 8 5,20 0,11 10 4,80 23,04 4,43 0,191
1 0-20 7 0,28 8,7 2 21-40 5 0,20 31,6 3 41-60 5 0,20 45,6 4 61-80 2 0,08 71,0 5 81-100 6 0,24 92,5 4.1 Põhikogumi jaotuseks on normaaljaotus Kuna tulemused on esitatud sagetustabelina, siis keskväärtuse hinnang on Kuna tulemused on esitatud sagedustabelina, siis dispersiooni hinnang on 1 20 -0,787 7 -0,285 0,263 6,583 0,026 2 40 -0,176 5 -0,071 0,214 5,345 0,022 3 60 0,435 5 0,170 0,241 6,035 0,178
3 2 1 0 0-20 20-40 40-60 60-80 80-100 2 Arvutusgraafiline töö | Mihkel Heinmaa | 4.1 Põhikogumi jaotiseks on normaaljaotus Keskväärtuse hinnang: et tunnused on esitatud sagedustabelina, siis (arvutatud Excelis ümardusi kasutamata) Dispersiooni hinnang: et tunnused on esitatud sagedustabelina, siis ( )
........................................................................................................12 3.3. Korrelatiivne sõltuvus........................................................................................................12 3.4. Lineaarne ühe argumendiga regressioonmudel................................................................. 13 4. Üldkogumile tulemuste leidmine (üldistamine)................................................................... 14 4.1. Normaaljaotus....................................................................................................................14 4.2. Keskväärtuse (keskmise) usaldusvahemik.........................................................................16 4.3. Statistiliste hüpoteeside kontrollimine...............................................................................16 4.3.1. Hüpoteesid ühe üldkogumi keskväärtusele....................................................................
2 20-40 6 0,24 30,33 3 40-60 6 0,24 47,17 4 60-80 5 0,2 73,40 5 80-100 3 0,12 96,33 KOKKU 25 1 Kontrollin -testi järgi olulisuse nivool = 0,10 järgmisi jaotushüpoteese: 2 4.1 põhikogumi jaotuseks on normaaljaotus. Keskväärtuse hinnang: 1 k µ^ = x = ni xi = 46, 2 n i =1 Dispersiooni hinnang: 1 k ^ = s 2 = ( xi - x) 2 ni = 854,88 n - 1 i =1 Teststatistiku arvutamise valemid: k (nm - nm~ ) 2 2 = m =1 nm~ nm~ = N pm~ pm~ = (tm ) - (tm -1 )
60 2867 186937 84 1. Keskväärtuse, dispersiooni, standarthälbe, mediaani, moodi ja haarde hinnangud Keskväärtus xkesk =(xini)/n=2867/60=47,78 Dispersioon Dx=(ni(xi-xk)2)/n=49942,184/60=832,4 Standarthälbe S=Dx=832,4=28,85 Scor=(n/(n-1))*S)= =(60/(60-1))*28,85=29,09 Me=(45+46)/2=45,5 Mo=71 esines 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on =0,05, P=95% korral t=1,96 : 47,78-1,96(29,09/60) < < 47,78+1,96(29,09/60) 40,41 < < 55,14 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 29,09(1-0,21) < < 29,09(1+0,21) 22,98 < < 35,19 Dispersiooni usaldusvahemik (29,09 (1-0,21))² < D < (29,09(1+0,21))² 528 < D < 1238,3 3.Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3.1 H0: =50 alternatiiviga H1: 50
27 60 2849 195025 60332.7 1. Keskväärtuse, dispersiooni, standarthälbe, mediaani, moodi ja haarde hinnangud Keskväärtus xk=(xini)/n=2849/60=47,48 Dispersioon Dx=[ni(xi-xk)2]/n=1005,5 Standarthälbe S=Dx=1005,5=31,71 Scor=(n/(n-1))*S=(60/(60-1))*31,71=31,97 Me=(43+44)/2=43,5 Mo=25, Mo=96 esinesid 3 korda Haare xmax-xmin=98-0=98 2. Keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : 47,48-1,96(31,97/60) < < 47,48+1,96(31,97/60) 39,39 < < 55,57 Standardhalbe usaldusvahemik q = (0,95;60)=0,21 31,97(1-0,21) < < 31,97(1+0,21) 25,26 < < 38,68 Dispersiooni usaldusvahemik (31,97(1-0,21))² < D < (31,97(1+0,21))² 638 < D < 1496,1 3. Kontrollida järgmisi hüpoteese eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks on P=95% 3
Me = = 55 2 Haare: R = xmax - xmin = 99 - 0 = 99 Mo = {94} Mood: 2. Leida keskväärtuse, dispersiooni ja standardhälbe usaldusvahemikud eeldusel, et põhikogumi jaotuseks on normaaljaotus ja olulisuse nivooks P = 95 %. Tõene keskväärtus on µ=0,05, P=95% korral t=1,96 : X -t < µ < X +t n n 30,90 30,90 53,92 -1,96 < µ < 53,92 +1,96 50 50 45,36 < µ < 62,48 Tõene standardhälve P=95% q=0,21 : Enne leida korrigeeritud standardhälve n ( x ) 2 i i -X 47735,68