2003 18 ve 96 ve 2008 21 eh 79 eh Ülikooli õppima tulnud üliõpilaste matemaatika eksami punktisummad on väga varieeruvad, 179 tulemust 288-st jääb vahemikku 45-80. Selle põhjal võib öelda, et ülikooli astunute matemaatika teadmised on keskmisest paremad. Tunnuse eksam jaotus ei lähene normaaljaotusele (vt. Tabel 13). Matemaatika keskkooli hinne Tunnuse hinne vaatlused on tehtud aastatel 2000, 2002, 2003 ja 2008 ning väärtused on vahemikus ühest viieni. Loenduses on arvesse võetud 171 õpilase tulemust. Eelnevalt nimetatud aastate matemaatika keskmine hinne on 3,5 (vt. Tabel 15). Kõige enam esineb hinnet "4" (39,18%) ja "3" (36,26%), mille esinemise sagedused on ligilähedased. Hinnet "5" on saanud ainult 12,28% andmestikus toodud õpilastest.
2. Keskväärtus, mood ja mediaan ühtivad 3. Dispersiooni suurenedes muutub graafik madalamaks ja lamedamaks 4. Graafiku alune pindala on 1 (tõenäosuste summa on 1) 5. Juhusliku suuruse väärtustest ligikaudu 68% kuulub piirkonda [EX - ; EX + ]; 95% kuulub piirkonda [EX - 2; EX + 2]; 99,7% kuulub piirkonda [EX - 3; EX + 3]. Ülesanne 1 · Mõõtmisvead on teaduses olnud alati probleemiks. Nende uurimisel selgus, et mõõtmisvead alluvad normaaljaotusele. (Reeglina tehakse väikseid vigu sageli, suuri vigu aga harva.) Järgmises tabelis on ühe toru läbimõõdu (mm) 20 mõõtmistulemust. Kontrollige, kas ka see jaotus on normaaljaotus. Milline arv tuleb võtta toru läbimõõduks? Läbimõõt X (mm) 19, 20,1 20,4 20,5 20,6 21, 8 0 Sagedus (f) 1 2 4 5 6 2 Ülesanne 2 · Teadmiste ja oskuste taset peegeldavad
x F(x) 75 0,86238324 62 0,0404278 0,82195544 ... läheb kasvama 61-75 x F(x) 75 0,86238324 61 0,02476731 0,83761593 ... läheb kasvama 63-75 x F (x) 75 0,86238324 63 0,06331523 0,79906801 ül. 5. Kahe objekti vahelise kauguse mõõtmisel tekkiv mõõtmisviga allub normaaljaotusele. Keskväärtus a= 5 sigma= 10 x F(x) 13 0,7881446 -13 0,03593032 0,75221428 Kahe objekti vahelise kauguse mõõtmisel tekkiv mõõtmisviga allub normaaljaotusele. Keskväärtus on 5 x F(x) 12 0,75803635 -12 0,04456546 0,71347089 viskel on vastavalt 0,6 ja 0,7. Leida tõenäosus, et mõlemal on võrdne arv tabamusi.
(3+2, või 4+2, 5+4 süsteemi järgi, sh integreeritud bakalaureuse- ja magistriõpe), arstiõpe, enne 1992. a Kategooriad tulid enamvähem võrdse täituvusega. 4. Immigrantide mõju elukeskkonnale (Immigrants make country worse or better place to live) – 10 väärtusega arvuline järjestustunnus, alates muudavad halvemaks (1) kuni muudavad paremaks (10). Tunnuse keskmine väärtus oli 4,37 ja standardhälve 2,1. Tunnuse väärtuste jaotus on lähedane normaaljaotusele, asümeetriakordaja on 0,046 ja järskuskordaja 0,074 (vaata ka Joonis 1). 5. Homoseksuaalide õigus elada nii, nagu nad soovivad (Gays and lesbians free to live as they wish) – 5 väärtusega arvuline järjestustunnus, alates tugevast nõusolekust (1) kuni tugeva mittenõustumiseni (5). Kuna immigrantide mõju väärtused olid sallivuse suhtes teistpidises järjekorras, siis pöörasin ka siin skaala ümber. Uus skaala kulgeb seega
..6 kHz. Joonis 1. Sinc signaali kuju ühe perioodi ulatuses. Joonis 2. Sinc signaali spekter vahemikus 0...6 kHz. 2. Valge müra genereerimine ja kasutamine. Mürasignaali tekitamiseks samuti kasutasime Open Office Calc'it. Mürasignaali koostamiseks: Avasime tühi tööleht ja kirjutasime lahtrisse A1valem: ,,=2*RAND()-1".Kopeerisime valem kõigisse m-i lahtrisse. Valisime m = 1350. Nüüd on meil sobiliku pikkusega ühtlasele jaotusele U[-1,1] alluv vektor, kuid tarvis on saada normaaljaotusele alluvat vektorit. Selle saamiseks Kirjutasime lahtrisse B1 valemi: ,,=SIGN(A1)*NORMDIST(A1;0;0.33;FALSE)/1.209".Kopeerisime valem kõigisse m-i lahtrisse. Tulemuseks on pikkusega m massiiv mis allub tsentreeritud normaaljaotusele standardhälbega = 0,33 ja mille väärtused jäävad vahemikku ±1. Kopeerisime kõiki B tulba lahtrite sisu ning avasime Calc'is uus tööleht. Valisime uuel töölehel lahter A1, kasutasime ,,Paste Special...", pärast seda valisime ,,Paste Values"
Kui suur on tõenäosus, et sajast istutatud puust läheb kasvama 63 kuni 75, kui ühe puu kasvamamine p= 0.7 n= 100 q= 0.3 a= 70 sigma= 4.582575695 F(x)= x2= 75 0.862383238 x1= 63 0.063315229 P(A)= 0.7991 Kahe objekti vahelise kauguse mõõtmisel tekkiv mõõtmisviga allub normaaljaotusele. Keskväärtus on Leida tõenäosus, et mõõdetud kauguse väärtus erineb tõelisest väärtusest mitte rohkem kui 15 meetr a= 5 sigma= 10 F(x)= x2= 15 0.8413447461 x1= -15 0.0227501319 P(A)= 0.8186 Tehas saadab lattu 500 kõrgekvaliteedilist toodet. Tõenäosus, et toode rikneb teel, on 0,02. Kui suur o
0 0,049787068 P(a) 0,42319 1 0,149361205 2 0,224041808 summa: 0,423190081 4. (5) Rahakotis on 6 münti, 2 20-sendilist ja 4 50-sendilist. Juhuslikult võeti kolm münti. Saadus raha juhuslik suurus. Leida selle keskväärtus ja dispersioon ning joonistada jaotusfunktsiooni graafik. Graa märkida ära oluliste punktide väärtused. 5. (3) Teatud automudeli läbisõit allub normaaljaotusele keskväärtusega 180000 km ja standardhälbe tõenäosus, et: a) ostetud auto läbisõit on piirides 160000 km kuni 220000km. b) ostetud auto sõidab läbi rohkem kui 250000km. c) ostetud auto ei sõida läbi rohkem kui 100000km. a) keskv. 180000 sigma 35000 x F(x) 220000 0,873451 160000 0,283855 P(A) 0,589596 B) X F(x) 360000 1 250000 0,97725
sigma 4.582576 x1 61 0.0247673 x2 75 0.8623832 pa 0.8376 ühe puu kasvamaminemise tõenäosus on 0,7? (Arvutada 4 kohta peale koma.) ühe puu kasvamaminemise tõenäosus on 0,7? (Arvutada 4 kohta peale koma.) Kahe objekti vahelise kauguse mõõtmisel tekkiv mõõtmisviga allub normaaljaotusele. Keskväärtus on . Leida tõenäosus, et mõõdetud kauguse väärtus erineb tõelisest väärtusest mitte rohkem kui 12 mee standardhälve 10 keskväärtus 5 abs väärtus 12 kuni -12 x2 12 0.758036 x1 -12 0.044565 pa 0.7135 õige vastus testitud
tegelikuks väärtuseks. Valimi mahu kasvades tõenäosus, et hinnangu ja parameetri tegeliku väärtuse erinevus oleks väiksem kui mistahes positiivne arv, läheneb ühele. Iseloomustab koondumist suurte valimite korral. 10) Hinnangu asümptootiline jaotus – Asümptootiline jaotus näitab, millisele klassikalisele jaotusele läheneb hinnangu valimjaotus valimi mahu kasvamisel. Asümptootiliselt normaaljaotusega, kui hinnangu valimjaotus läheneb valimi mahu kasvamisel normaaljaotusele. Kasutatakse usalduspiiride leidmisel, testimisel. Sellest leitakse kriitilised väärtused, olulisuse tõenäosus. 11) Hinnangu asümptootiline efektiivsus – Mõjus hinnang on asümptootiliselt efektiivne, kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. 12) Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiiriline ja kriitiline väärtus:
sündmuse tekkimise jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega.
119,999 0,2 0,0 120 0,6 0 30 60 149,999 0,6 r 150 1,0 180 1 5. (3) Teatud automudeli läbisõit allub normaaljaotusele keskväärtusega 180000 km ja standardhälbe tõenäosus, et: a) ostetud auto läbisõit on piirides 160000 km kuni 220000km. b) ostetud auto sõidab läbi rohkem kui 250000km. c) ostetud auto ei sõida läbi rohkem kui 100000km. a) keskv. 180000 sigma 35000 x F(x) 220000 0,873451 160000 0,283855 P(A) 0,589596
hinnang tegelikust väärtusest päris palju erineda. Valimi mahu suurenedes läheneb hinnang tegelikule väärtusele. Järelikult on valimi keskmine kogumi keskväärtuse jaoks mõjus hinnang. 10. Hinnangu asümptootiline jaotus. ● Asümptootiline jaotus näitab, millisele klassikalisele jaotusele läheneb hinnangu valimjaotus valimi mahu kasvamisel. ● Hinnang on asümptootiliselt normaaljaotusega, kui hinnangu valimjaotus läheneb valimi mahu kasvamisel normaaljaotusele ● Asümptootilist jaotust kasutatakse parameetrite usalduspiiride leidmisel, testimisel. Sellest leitakse kriitilised väärtused, olulisuse tõenäosus 11. Hinnangu asümptootiline efektiivsus. Mõjusat hinnangut nimetatakse asümptootiliselt efektiivseks (asymptotically efficient), kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. Näiteks mõningad suurima tõepära meetodil leitud hinnangud.
jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega
tegeliku väärtuse erinevus oleks väiksem kui mistahes positiivne arv, läheneb ühele. Hinnangu mõjusus on asümptootiline omadus. Mõjusus iseloomustab koondumist suurte valimite korral. 10. Hinnangu asümptootiline jaotus. Asümptootiline jaotus näitab, millisele klassikalisele jaotusele läheneb hinnangu valimjaotus valimi mahu kasvamisel. Hinnang on asümptootiliselt normaaljaotusega, kui hinnangu valimjaotus läheneb valimi mahu kasvamisel normaaljaotusele. Asümptootilist jaotust kasutatakse parameetrite hinnangute standardvigade leidmisel. 11. Hinnangu asümptootiline efektiivsus. Mõjusat hinnangut nimetatakse asümptootiliselt efektiivseks (asymptotically efficient), kui selle asümptootilise jaotuse dispersioon on väiksem suvalise mõjusa asümptootiliselt normaaljaotusega hinnangu dispersioonist. 12. Hüpoteeside kontrollimine: otsuse vastuvõtmine, kui on antud teststatistiku empiiriline ja kriitiline väärtus
n= 100 Laplace´i teoreem, normaaljaotus
p= 0,7 a= 70 q= 0,3
sigma= 4,58
P(60
ehk dispersiooniga. Normaalajotust kujutav graafik on kellukese kujuline ja sümmeetriline keskväärtuse suhtes. Jaotust nimetatakse ka Gaussi-Laplaci kõveraks. Joonis 1. Normaaljaotus tekib siis, kui tunnuse väärtust mõjutavad väga paljud juhuslikud tegurid ja neist igaühe mõju on väga väike. Normaaljaotus on teoreetiline abstraktsioon. Eluslooduses ei ole ükski asi täpselt normaaljaotusega, kuid paljud tunnused on looduses normaaljaotusele väga lähedase jaotusega. Joonis 1. Normaaljaotuse graafik Normaaljaotusega tunnuse väärtuste ulatust saab iseloomustada standardhälbe kaudu. Kolme sigma reegli kohaselt asub 99,7% normaaljaotuse väärtustest arvude x ± 3 vahel. 95,5% väärtustest paikneb kahe standardhälbe ulatuses keskväärtusest ühes ja teises suunas. 68,3% väärtustest asub ühe standardhälbe kaugusel. Joonis 1. Normaaljaotuse keskväärtus, mood ja meridiaan on võrdsed. Joonis 4. Ebasümmeetrilise
Käesolevas töös kasutan mitmest lineaarset regressioonimudelit, eesmärgiga uurida sõltumatute muutujate seost matemaatika ärevusega (kodeeritud: suurem väärtus tähendab suuremat ärevust) ja näha, kas vastaja sool on mõju matemaatika ärevusele. Andmebaasiks on PISA testis osalenud 15-aastased õpilased. Kokku vastas testidele 3162 õpilast, kellest 1619 olid tüdrukud (51%) ja 1543 poisid (49%). Joonisel 1 on näha, et uuritava tunnuse jaotus on lähedane normaaljaotusele Viieks sõltumatuks muutujaks käesolevas töös on: matemaatika õpetaja toimetulek klassiruumis (kategooriad:“nõustun täielikult”, “nõustun”, “ei nõustu” ja “üldse ei nõustu”. Suurem väärtus näitab paremat toimetulekut klassiruumis), huvi matemaatika vastu (kategooriad: “nõustun täielikult”, “nõustun”, “ei nõustu” ja “üldse ei nõustu”. Suurem
erinevustest. Nii on k õik kase lehed iseloo muliku kujuga, kuid lehelaba pikkus ja laisu v õivad varieeruda. Se e sõltub lehtede asupaigast puul ning nende valgustatuse ja toitainete varustatuse erinevusest . Hüpotees Antud uurimuse hüpotees on, et arukase lehelaba pikkuse muutuvus vastab normaaljaotusele. Hüpoteesi kontrolliks viidi läbi katse. Selleks korjati 0,25 m2 suuruselt maaalalt kõik langenud lehed, mõõdeti need ning kanti tulemused tabelisse. Järeldus Tabelist on näha, et keskmiste suurustega lehti on kõige rohkem. Saadud tulemuste alusel saame teha järelduse, et hüpotees leidis kinnitust. Kasutatud kirjandus: http://et.wikipedia.org/wiki/Arukask http://bio.edu.ee/taimed/oistaim/arukask.htm
tunnust. Kuna võrdleb keskväärtusi, siis tunnuseks peab olema intervalltunnus. Sõltumatud valimid – erinevad objektid, sama tunnus. (Nt meeste ja naiste üldine rahulolu, kus mehed ja naised on 2 erinevat gruppi ja rahulolu on intervalltunnus). ANOVA-Nagu sõltumatute v. T-test 3 või enama grupiga. Sõltuv tunnus peab olema intervalltunnus. Võrreldavad grupid (3 või enam gruppi!) sõltumatud. Hajuvused peavad olema gruppides sarnased (Levens test). Tulemuste jaotus vastab normaaljaotusele (loetakse kehtivaks ilma kontrollimata). Kui ANOVA eeldused ei ole täidetud, siis MPAR (mitteparameetrilised väärtused) test Kruskal-Wallis või Games-Howell. Kui H1, siis Post-Hoc testid, et välja selgitada, milliste gruppide vahel on erinevused. Tukey – gruppide suurused sarnased. Bonferroni – gruppide suurused erinevad. Korrelatsioon näitab seost kahe tunnuse vahel. Korrelatsiooni koefitsent on alati -1…1 ja näitab kahte asja: seose suunda ja tugevust
2000 1 100,00% 0 0,00% 400 600 800 1000 1200 1400 1600 1800 2000 klassipiirid H0 tunnuse lehmade arv jaotus läheneb normaaljaotusele p>0,05 H1 tunnuse lehmade arv jaotus ei lähene normaaljaotusele Normaalja tegelik otuse fn oodatav klassipiirid sagedus punktid Tõenäosus sagedus 400 2 0,084269 0,084269 5,224678 600 13 0,225284 0,141015 8,742937 p= 0,021781
2) jääkliimete dispersioon on konstantne (esineb homoskedastiivsus) ja heteroskedastiivsus puudub; 3) jääkliikmed ei korrelleeru omavahel, st nende kovaratsioon on null (autokorrelatsioon puudub); 4) juhuslikud liikmed ei korrelleeru seletavate tunnustega – mudelis puudub multikollineaarsus; 5) jääkliikmed alluvad normaaljaotusele. Klassikalise lineaarse regressioonimudeli esimene eeldus, et juhuslike liikmete keskväärtus on 0 on täidetud, kuna mudelis on konstant ja sellest tulenevalt on see eeldus automaatselt täidetud ja seda eraldi testida ei ole vaja (Brooks 2008, 131). Täiendavalt kinnitavad seda ka teise ja viienda klassikalise eelduse täidetus, mida autorid järgnevalt tõestavad. Heteroskedastiivsuse testimiseks viisid autorid läbi White’i testi. Testiti hüpoteesi, kas
hälbimissuhtarv (indeks) - uuritava nähtuse tunnuse väärtuse hälbimist/kõrvalekaldumist võrdlussuhtarv - kogumi M maht jagatud kogumi N mahuga Suhtarve väljendatakse kas kordades või protsentides. KESKMISED Aritmeetilist keskmist kasutatakse: 1. kui tulemused on koontunud sümmeetriliselt keskpunkti ümber 2. kui tulemus nõuab seostamist teiste meetoditega 3. interval kui suhte skaalal saadud andmete korral eeldusel et tulemus vastab normaaljaotusele Mediaani kasutatakse: 1. kui on vaja leida täpset keskpunkti 2. kui erandlikult tulemused moonutavad keskmist 3. et kui on palju hälbivaid tulemusi ja vähe madalaid tulemusi, siis tuleb kasutada mediaani valemit Moodi kasutatase: 1. kui on vaja kiiresti määrata keskmist 2. kui keskmine näitab tüüpilist juhtumit/nähtust INDEKS MEETOD Indeks (i, I) - on üldistav näitaja, iseloomustab statistika teooria kõige nooremaid harusid.
BMAX=12.17 4 · Leian B keskväärtuseintervallhälve tõenäosusastmel P=0.95 ehk =0.05 Studenti tabelist kriitiline t (=0,05; n=50; kahepoolne) = 2,01 B-(t* B+(t* 12.0996818 Bmin 4 12.1055981 Bmax 6 · Teha mõõtme B histogramm ja sellele vastav teoreetilise normaaljaotuse tihedusfunktsiooni graafik f(x). Intervallide arvuks valida 8 kuni 10. Samm h=(MaxMin)/intervallide arv. Normaaljaotusele vastav mõõtetulemuste arv ni" intervallis i on leitav valemiga: ni"= n*h*f( zi) n- on mõõtetulemuste koguarv, h - on intervalli samm f(zi) - on normaaljaotuse tihedusfunktsiooni väärtus kohal zi f(zi) = NORMDIST(xi;X ,s, FALSE), kus s on standardhälve ja X keskväärtus. Intervall tabel Intervall
Cov(ui, uj)=0 testida. Seda eeldust saab testida. 9. eeldus: juhuslike liikmed peavad alluma 6.-8. eeldus kokkuvõetuna normaaljaotusele Eeldused juhuslike liikmete jaoks: · Kui juhuslikud liikmed alluvad normaaljaotusele, siis parameetrite 6. E[ui ] 0 keskväärtus 0 hinnangud on mõjusad: valimi mahu kasvamisel koonduvad nad parameetrite tegelikeks väärtusteks. 7
(5 ja 0,199) 23. Kindlustusagendil on üksikkliendiga lepingu sõlmimise tõenäosus 0,4. Agent kohtus 5 kliendiga. Koostada sõlmitud lepingute arvu jaotustabel. Leida vaadeldava juhusliku suuruse keskväärtus, dispersioon ja jaotusfunktsiooni graafik. (2 ja 1,2) 24. Sõiduki remondiks kuluv aeg (tundides) allub eksponentsiaalsele jaotusele parameetriga = 0,25. Kui suur on tõenäosus, et ühe sõiduki remondiaeg on alla kuue tunni? (0,777) 25. Tehase toodangu maht allub ligikaudselt normaaljaotusele keskväärtusega 134786 eset nädalas ja standardhälbega 13000 eset nädalas. 1) Leida tõenäosus, et nädala toodang ületab 150000 eset. (0,121) 2) Leida tõenäosus, et nädala toodang on väiksem kui 100000 eset. (0,0037) 28. Normaaljaotusega juhusliku suuruse X keskväärtus a = 168 ja standardhälve = 5,9. Kui tõenäone on, et juhusliku suuruse väärtused asuvad vahemikus 160-st 180-ni? (0,8915) 29. Poisslapse sündimise tõenäosus on 0,515
kasvamisel. asümptootilise jaotuse dispersioon on väiksem suvalise · Hinnang on asümptootiliselt normaaljaotusega, kui mõjusa asümptootiliselt normaaljaotusega hinnangu hinnangu valimjaotus läheneb valimi mahu kasvamisel dispersioonist. normaaljaotusele. Näiteks valimite keskmiste jaotus läheneb valimite mahu n kasvamisel normaaljaotusele keskväärtusega ja dispersiooniga Näiteks mõningad suurima tõepära meetodil leitud 2/n, kus ja 2 on vastavalt kogumi keskväärtus ja dispersioon. hinnangud. · Asümptootilist jaotust kasutatakse parameetrite usalduspiiride leidmisel, testimisel. Sellest leitakse kriitilised väärtused, olulisuse tõenäosus. Demo: valimite keskmiste valimjaotus Hinnangute omadused, kokkuvõte · Nihe (bias)
võrdub ühega. Normaaljaotusega juhusliku suuruse keskväärtus on EX=μ 2 Normaaljaotusega juhusliku suuruse dispersioon on DX =σ 15. Tulenevalt tihedusfunktsiooni omadustest visandada tema graafik. Tihedusfunktsiooni graafik on sümmeetriline sirge x=μ suhtes, moodiks on punkt x=μ ja asumptoodiks on x-telg. Nimetatakse ka Gaussi kõveraks. 16. Üleminek standardiseeritud normaaljaotusele ja mida see sisuliselt tähendab. Üleminekul standardiseeritud normaaljaotusele teeme integraalis muutujavahetuse x−μ z= σ , mis sisuliselt tähendab koordinaattelgede alguspunkti nihutamist juhusliku suuruse keskväärtusele vastavasse punkti μ ja jagamine σ-ga muudab skaalat võttes kasutatavaks ühikuks standardhälbe. 2 x z −z
Normaaljaotuse puhul paikneb kõigist mõõtetulemustest 68,27% ±1SD, 95,45% ±2SD ja 99,73% ±3SD kaugusel keskmisest. Kaugus keskmisest (indiv. tulemusest lahutada keskmine) jagatud standardhälbega; z-skoor Iga z-skooriga on seotud teatud tõenäosus, mille järgi on võimalik hinnata selle väärtuse esinemissagedust. Andmeanalüüsimeetodeid välja töötades on kasutatud eeldusi: Kui tunnus on arvuline ja ligilähedane normaaljaotusele, saab sellele rakendada parameetrilist statistikat. Järjestustunnuste või mitte-normaaljaotuslike tunnuste puhul tuleks kasutada mitteparameetrilisi teste. Statistilised momendid Mõningaid jaotuse kirjeldamiseks kasutatud kirjeldavaid statistikuid nimetatakse ka momentideks. Esimest järku moment on aritmeetiline keskmine, teiseks momendiks on hajuvus, kolmandaks asümmeetria ja neljandaks järsakus.
vahel. Ajavahemik kahe järjestikuse: kliendi saabumise vahel, telefonikõne vahel, veebilehelt tehtud päringu vahel. Mõnikord ka mingi tegevuse aeg: kliendi teenindamine, detaili eluiga. Eksponentjaotuse jaotustihedus – Eksponentjaotuse keskväärtus - µ=1/ λ POISSONI JA EKSPONENTJAOTUSE KASUTAMINE: Järjekorrateoorias (massteeninduse teooria), Logistikas, Kaubavarude juhtimisel, Infotehnoloogias Normaaljaotus - Juhuslik suurus allub normaaljaotusele, kui see on mõjutatud paljude faktorite poolt, iga üksikfaktori mõju on väike, puudub domineeriv faktor. Normaaljaotuse jaotustihedus - Määratud ära kahe parameetriga: Keskväärtus µ määrab ära jaotuskõvera asukoha, standardhälbest σ sõltub, kui lai on jaotuskõver. Valem: Normaaljaotuse keskmised: aritmeetiline keskmine = mood = median 6. Valikuuringud Statistiline uuring võib olla: kõikne – uuritakse läbi terve üldkogum või valikuline – uuritakse läbi
juhuslikud suurused X i ~ N (0; 1) . Siis nimetatakse juhuslikku suurust k (k ) = X i2 2 i =1 2 jaotusega juhuslikuks suuruseks vabadusastmete arvuga k. (loetakse: hii-ruut-jaotus) Sellise nimetuse andis jaotusele tema uurija, inglise statistik Karl Pearson 1900. aastal. Kui vabadusastmete arv k kasvab, siis 2 jaotus läheneb aeglaselt normaaljaotusele parameetritega m = k ja = 2k . 2 jaotuse tihedusfunktsioon p(2) k=2 0,3 k= 4 0,2 k = 10 N (10, 20 ) 0,1 2 0 0 5 10 15 20 25 30 35 2 jaotusega juhuslik suurus Osutub, et 2 jaotusega on ka mittenormeeritud
(xi-xkesk)^2 0,00011 0,000081 0,00004489 0,00002116 0,00000025 Leian B keskväärtuseintervallhä Keskmine hälve 18,1007 Min 18,027 Studenti tabelist kriitiline t (=0, Standardhälve 0,00720639 Max 18,166 B intervallhälve tõenäosustasemel P=0.95 Normaaljaotusele vastav mõõtetulemus t 2,01 Bmin 18,098652 n- on mõõtetulemuste koguarv, Bmax 18,102748 h - on intervalli samm f(zi) - on normaaljaotuse tihedusfunktsio 5. Histogramm ja tihedusfunktsioon f(zi) = NORMDIST(xi;X ,s, FALSE), kus
keskmine tase, mille ümber varieerub suurem osa väärtustest. Standardiseeritud normaaljaotus: Tähistus N (0,1); Parameetriteks μ (xkesk)= 0 (keskväärtus) ja σ (S)= 1 (standardhälve). Standardiseerimine - erinevatel skaaladel mõõdetud suuruseid saab võrrelda omavahel. Tunnuse z jaoks võib vahemike osakaale hinnata juba standardse jaotusfunktsiooni Φ(t) abil. Standartne jaotusfunktsioon: Φ(0) 0.5 50% pooled kõigist standardiseeritud normaaljaotusele alluva üldkogumi väärtustest on väiksemad kui 0 (ja pooled suuremad kui 0) Φ(-0.674) 0.25 25% "25% kõigist standardiseeritud normaaljaotusele alluva üldkogumi väärtustest on väiksemad kui -0.674" Φ(0.674) 0.75 75% "75% kõigist standardiseeritud normaaljaotusele alluva üldkogumi väärtustest on väiksemad kui 0.674" 23. Empiiriline - ja teoreetiline kestuskõver. Voolukestuse kõver näitab vooluhulkade ja nende esinemise tõenäosuse suhet. Näiteks Q 25 esitab vooluhulka, mis
Üks kasulikumaid võtteid selleks on kontrollkaardid. Kaardi kasutaja saab kaardile märkida hoiatusnivood nii, et need toimiksid ,,häirekelladena" juhuks, kui süsteem hakkab kontrolli alt väljuma, s.t. kui metoodika antavad tulemused hakkavad mingist ajahetkest tavapärasest tugevalt erinema. Kontrollkaart on graafik, mille peale on pandud suurused paigutatud ajalisse järjestusse, näiteks järjestikused kvaliteedikontrolli proovi mõõtmise väärtused. Normaaljaotusele alluvate väärtuste korral on statistiliselt vähe tõenäoline (5% tõenäosusega), et kogumi liige oleks keskväärtusest kaugemal kui kaks standardhälvet ja väga vähe tõenäoline (0,3% tõenäosusega), et see oleks keskväärtusest kaugemal kui kolm standardhälvet. Mõõtmised peaksid käituma samal moel ja asuma nende piiride vahel. Kui nad seda ei tee, siis on metoodikaga midagi juhtunud ja kutsunud esile keskväärtuse nihke või standardhälve suurenemise
are andthis needed to see a picture. B-(t* ) B B+(t* ) 18.09865153 B 18.10274847 Bmi 18.0986515 n 3 Bma 18.1027484 x 7 · Teha mõõtme B histogramm ja sellele vastav teoreetilise normaaljaotuse t ihedusfunktsiooni graafik f(x). Intervallide arvuks valida 8 kuni 10. Samm h=(MaxMin)/intervallide arv. Normaaljaotusele vastav mõõtetulemuste arv ni" intervallis i on leitav valemiga: ni"= n*h*f( zi) n- on mõõtetulemuste koguarv, h - on intervalli samm f(zi) - on normaaljaotuse tihedusfunktsiooni väärtus kohal zi f(zi) = NORMDIST(xi;X ,s, FALSE), kus s on standardhälve ja X keskväärtus. Intervall tabel Intervalli Intervall Intervalli Kogus Teor. kogus kesk-
4. Kui objektide valik loendist toimub fikseeritud sammuga, siis see on süstemaatiline valik. 5. Kas on õige väide: kogumi keskväärtuse punkthinnang on juhuslik suurus. Tõene 6. Kui parameetri hinnangu keskväärtus võrdub tegeliku väärtusega, siis hinnang on nihketa. 7. Joonisel on toodud tunnuse X jaotuskõver kolmes erinevas kogumis. Millisel juhul alluvad vastavast kogumist võetud valimite keskväärtused normaaljaotusele? kõigi kogumite korral, kui valimid on piisavalt suured. 8. Mis on keskväärtuse standardviga? keskväärtuse valimjaotuse standardhälve. 9. Tsentraalne piirteoreem ütleb, et küllalt suure valimite mahu n korral alluvad valimite keskväärtused normaaljaotusele. Kui on üldkogumi standardhälve, siis milline on valimite keskväärtuste jaotuse standardhälve? . 10
Lähenemine kehtib aegridade jaoks. Teooriat ei püüta ümber lükata, vaid analüüsitakse teooria ja andmete kooskõla. 40. Tjaotus, lk 2728. Üks kasutatavamaid jaotusi. Sümmeetriline jaotus. Keskväärtus 0, dispersioon k/(k2). Defineeritav vaid juhul kui vabadusastmete arv on suurem kui 2. Mida suurem on vabadusastmete arv, seda enam läheneb tjaotus normaaljaotusele. 41. Vabadusastmete arv vt reg.mudeli statistiline analüüs. 42. Vabaliige lülitatakse mudelisse selleks, et vealiikme tinglik keskväärtus oleks null. Kui mudelisse mittelülitatud sõltumatute muutujate keskmine mõju sõltuvale muutujale Y on 0, siis vabaliige on nihketa. 43. Valim andmete alusel hinnatud mudel on valimi põhine mudel, mille alusel testitakse hüpoteese üldkogumi e maj.protsessi kohta. 44
regulaarse lugemise) puudumine või väga vähene esinemine, 2.skaalapunkt vähene, 3.skaalapunkt keskmine, 4.skaalapunkt suur, 5.skaalapunkt - väga suur esinemine. 5. Indeksite lühendamine ja normeerimine võib toimuda teatud püsivast tõlgendusskeemist lähtudes (absoluutne lühendamine) või vastajate reaalse jaotumise alusel (suhteline lühendamine). Tavaliselt on kasutusel suhteline lühendamine, mille puhul püütakse saavutada vastajate normaaljaotusele lähenevat jaotumist lõppskaalal 1. ja 5.skaalapunktis 10-15 % vastajaid, 2. ja 4.skaalapunktis 15-20 % vastajaid, 3.skaalapunktis 30-40 % vastajaid. 6. Edasises analüüsis on sageli kasutusel 4. ja 5. skaalapunkt, tavaliselt summeerituna - vastajate hulk, keda iseloomustab antud koondtunnuse suur (keskmisest suurem) intensiivsus. Juhul kui 1.skaalapunkt tähendab antud koondtunnuse puudumist (mittelugemist,
0,254 1 0,129 5 ∑ ∑ 1,00 ∑ 50 ∑ 9,92 47,19 x´ i−´x ui= Sc n∙h n ´ i= ∙ φ ( ui ) Sc Χ2emp=9,92 Χ2kr(α;k)-> Χ2kr(0,05;4)=9,5 Järeldus: Χ2emp> Χ2kr, järelikult alamvalim ei vasta normaaljaotusele B. Kasutades kasutades normeeritud normaaljaotuse jaotusfünktsiooni Φ(x) Tabel 4 jaotusfunktsiooni normaaljaotus xi xi+1 xi-X xi+1-X zi zi+1 Φ(zi) Φ(zi+1 pi n´i ) -4,00 11,00 -56,12 -41,12 2,03 1,49 0,48 0,43 -0,05 -2,35
Ida-eesti on jällegi kuivem. Sademetehulgas on palju juhuslikkust, mis võib trende põhjustada. Lumikate. Muutlikkus on mandril palju väiksem. Pilvisus Hinnatakse 10 palli süsteemis. Keskmise pilvisuse näitajad: aastane üldpilvisus on 6,7-7,2; madalpilvisus on 4,7-6,0 palliku, rannikul vähem; aastases käigus on maksimum nov ja dets (8,3-8,6, madal 7,5-8,1), miimum mais, juunis (üld 5,4-6,2, madal 2,6-4,3). Pilvisuse andmete statistiline eripära: andmestik ei vasta normaaljaotusele keskmisi näitajaid on harva. Kõige sagedamini on kas täiesti pilves või selget ilma. Seega eripära! Eriti selgelt tuleb kevadel ja suvel välja, et rannikul on pilvisus väiksem. Põhjuseid on kaks: temperatuur ja aluspinna ebaühtlus. Meri on jahedam ja tasasem. Aastas on keskmiselt 30 päeva selget ilma, pilves päevi on umbes 3 korda rohkem (umbes 150). Kevadel võib iga 3. päev selge olla. Mais on pilves päevi kuni 3. Detsembris on selgeid kuni 2 ja
1) jäägid olgu normaaljaotusega (Normaaljaotuse testimiseks, analyze-descriptive stat explore panin Jääkide andmed ehk RES_1 esimesse kasti ja ok - Output aknas vaatad Shapiro-Wilk'i sig'i kui valim on 50-2000 inimest - normaaljaotusega on tegu siis, kui sig väiksem kui 0,05) 2) jääkide dispersioon peab olema sõltumatu (ehk siis x-telje) muutuja väärtusest sõltumatu. Kuidas kontrollida kas regressiooni jäägid jaotuvad normaaljaotusele lähedaselt? Laseme arvutada mudelikohased sõltuva muutuja väärtused ja jäägid: Analyze -> Regression -> Linear - Save - Linnuke kasti Predicted values (unstandardized) ja Residuals (unstandardized). Järgneb jääkide täpsem diagnostika (kas on normaaljaotusega jne). Logistiline regressioon Logistiline regressioon või üldisemalt logistiline mudel ehk logit-mudel prognoosib uuritava
parameeter on sündmuste voo intensiivsusena/sagedusena. 3) Normaaljaotus: Normaaljaotus on domineerivalt kõige olulisem jaotus (nimetatakse ka Gaussi jaotuseks). Tekkemehhanism on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Sellel teoreemil on tingimuste poolest veidi erinevaid variante, ent üldistatult võib öelda, et suvalise ühtmoodi jaotunud sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Kokkuvõtvalt võib seega öelda, et normaaljaotuse teke on väga sagedane ning seotud esmajoones juhuslike suuruste mõju liitumisega (sh süsteemitehnikas nt summaatoritega või lineaarsete süsteemidega, kvaliteeditehnikas hajuvuse nn jõemudeliga, metroloogias mõõtemääramatuste /halvete liitumisega jm). Normaaljaotusel on kaks parameetrit, mis ühtivad vastava juhusliku suuruse keskväärtuse ja standardhälbega ning mida seetõttu tähistataksegi ja .
Kuna iga valim, mis me üldkogumist võtame annab tunnuse keskmiseks erineva tulemuse, siis ei saa anda üldkogumi keskmisele hinnanguks ühte konkreetset arvu. Saame leida konkreetse vahemiku, kuhu üldkogumi keskmine kuulub mingi tõenäosusega. Keskväärtuse usaldusvahemik on vahemik, kuhu tõenäosusega 100%- kuulub üldkogumi keskväärtus (keskmine) ehk tõenäosusega üldkogumi keskväärtus ei kuulu leitud vahemikku. Usaldusvahemiku leidmisel kasutame t-jaotust, mis on sarnane normaaljaotusele, kuid väärtused on laialivalguvamad (graafiliselt ,,kelluke" on madalam) ehk arvestame, et väikese valimi korral võib valimi keskmine olla ebatäpne normaaljaotuse kasutamiseks (kui n>60 võime kasutada ka normaaljaotust, sest sel juhul t-jaotus ja normaaljaotus praktiliselt kattuvad). T-jaotuse täiendkvantiile (loengus antud tabelis) kasutades saame üldkogumi keskväärtuse usaldusvahemiku alumise ja ülemise usalduspiiri järgmiselt:
342; standardiseeritud jääkliikmete minimaalne väärtus oli -2.784 ning maksimaalne väärtus 1.456. Analüüsige diagnostiliste testide tulemusi (t-statistiku kriitiline väärtus olulisuse nivool 0.05 on 2.01). Lahendus. White’I heteroskedastiivsuse testi põhjal mudelis puudub heteroskedastiivsus olulisuse nivool 0.05, kuid näiteks olulisuse nivool 0.06 heteroskedastiivsus esineb . Jarque-Bera test näitab, et jääkliikmete jaotus vastab normaaljaotusele. Kuna standardiseeritud jääkliikmete väärtused jäävad -3 ja 3 vahele, siis ebaharilikke vaatlusi (erindeid) valimis ei esine. NB! Meeldetuletus hüpoteesipaaride kohta mudelite diagnostika puhul: H0: on normaaljaotus H1: ei ole normaaljaotus Või H0: on homoskedastivsus H1: ei ole homoskedastiivus, tegemist heteroskedastiivsusega. Seega diagnostika puhul tahame reeglina jääda nullhüpoteesi juurde. Ülesanne 14
nullhüpotees vastu. 4. Kontrollimaks Pearsoni 2-testi järgi olulisuse nivool = 0,10, et kogumi jaotuseks on normaaljaotus, koostasin võrdlaiade vahemikega histogrammi (joonis 1) vahemikus 0- 100, viie jaotusega, tulpade kõrguseks suhteline sagedus ehk vahemikku sattumise tõenäosus. Valitud intervallipiirideks said siis 20, 40, 60, 80 ja 100, mis normeerisin, jagades intervallipiiri ja valimi keskväärtuse hinnangu vahe standardhälbe hinnanguga. Normaaljaotusele vastavad intervallidesse sattumise tõenäosused leidsin tabelist ning arvutasin normaaljaotuse korral vahemikesse jäävate vaatluste arvu, korrutades valimi mahu vastavate tõenäosustega. Valemi järgi arvutatud 2-statistiku väärtus on peaaegu võrdne tabelist võetud kriitilise väärtusega 21-(f), kus f=k-3 (k-intervallide arv), seega ei ole saa kindlalt väita, et jaotus on normaaljaotus.
Normeeritud JS dispersioon ja standardhälve =1. DJS standardiseerimine on tema tsentreerimine ja normeerimine. Standardiseeritud juhuslik suurus X0=(X-)/. Standardiseeritud normaaljaotuse juhusliku suuruse jaotusf-ni tähistame (x) ja tihedusf- ni (x). Normaaljaotusega juhuslik suurus tekib olukordades, kus on tegemist paljude sõltumatute tegurite koosmõjuga, kusjuures kõigi nende tegurite mõjud on samas suurusjärgus. Näiteks kultuuride saagikus, inimese pikkus jpm. Nii on rakendusi normaaljaotusele palju. Kolme sigma reegel: Normaalse (normaal-)jaotuse jaotuskõvera alusest pindalast jääb vahemikku keskväärtus pluss-miinus standardhälve, 68,3%; keskväärtus pluss-miinus kahekordne standardhälve, jääb 95,4%; keskväärtus pluss-miinus kolmekordne standardhälve, jääb 99,7%. Lisaks sellele saab normaaljaotust kasutada Bernoulli jaotuse asemel, kui n ja m suured. Kui n aga p 0 saab binoomjaotust lähendada normaaljaotusega 1
keskväärtus EX = µ ja dispersioon on s 2. kujutada mingi pinnana (vt joonis), mida Normaaljaotuse on oma keskpunkti suhtes nimetame jaotuspinna sümmeetriline jaotus, seetõttu ühtivad mediaan ja keskväärtus. · Sümmeetrilisuse tõttu on asümmeetriakordaja võrdne nulliga. · Normaaljaotuse järskus on samuti võrdne nulliga. Kindlate tingimuste korral Poissoni ja binoomjaotus lähenevad normaaljaotusele. Standardiseerimine Seda on vaja, et saaks võrrelda erinevate jaotusparameetritega juhuslikke suurusi, standardiseerimine viib need ühesugusele võrreldavale skaalale. Z=(x - µ)/ s . Tihedusfunktsioon Pideva juhusliku suuruse jaotusfunktsiooni tuletist nimetatakse juhusliku suuruse tihedusfunktsiooniks, tähistatakse tähegaf(x). Tihedusfunktsioonil on järgmised omadused, mis vahetult tulenevad jaotusfunktsiooni omadustest: 1) Tihedusfunktsioon on mittenegatiivne f(x) >= 0.2)
organismi eksistentsi (kasv ,sigimine), samal ajal, kui teised organismile mõjuvad ökoloogilised tegurid seda võimaldaksid.) 34.Mis on konkurentsi sümmeetria?- Enamasti on konkurentsed suhted tugevasti ebasümmeetrilised mingi isend kasutab suuremat osa ressursist kui on tema enda osakaal antud suhtepaaris.Mida tugevam on konkurents looduslikus situatsioonis, seda ebasümmeetrilisem on konkurentsi suhe, mis väljendub selles, et isendite massi jaotus ei vasta normaaljaotusele 35.Ökoniss (sh võrdlus ökoloogilise amplituudiga)- on ökoloogiline termin, mis iseloomustab liigi või populatsiooni suhtumuslikku positsiooni ökosüsteemis ehk lühidalt öeldes on niss see, kuidas organism oma elupaigas elab ja hakkama saab.Ökoloogiline niss kirjeldab organismirühma reageerimist ressurssidele ja konkurentidele (näiteks ressursside olemasolul toimub organismi kiire kasv, eriti veel, kui kiskjaid, parasiite ja
momendile ning jaotust võrreldakse normaaljaotusega (selle neljandat järku normeeritud moment on 3). · Normaaljaotus kirjeldab tunnust, mille käitumine on normaalne. Normaaljaotus on piirjaotus, millele lähenevad paljud teised jaotused. · Normaaljaotuse üks parameetritest on standardhälve ehk sigma. · Normaaljaotuse omadused: * normaaljaotus on pidev jaotus *normaaljaotus on täielikult kirjeldatav kahe parameetriga: keskväärtusega ja dispersiooniga 2 *normaaljaotusele vastav kõver on sümmeetriline keskväärtuse suhtes * normaaljaotuse keskväärtus, mood ja mediaan ühtivad. · Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe!!! · Mediaan jaotab normaaljaotuse tagurpidi U kaheks osaks. Artitmeetiline keskmine on samas kohas kus mediaan kuna äärmused on normaaljaotusel võrdsed. Mood on samuti keskel ehk seal kus mediaan ja aritmeetiline keskmine kuna kõige suurem sagedus on seal (tipp)
- SPSS'is on selleks kaks testi: Shapiro Wilki test (väiksemate valimite puhul, kuni 2000) ja Kolmogorov Smirnov (n > 2000) - Analyze -> Descriptive Statistics - > Explore -> Plots - Kui p > .05 siis on normaaljaotusega (st nullhüpotees on normaaljaotusega) - NB! kui asümmeetriakordaja (ingl. k. skewness) ja ekstsess (ingl. k. kurtosis) on vahemikus -1 kuni 1, siis võib pidada andmeid normaaljaotusele vastavaks ANOVA vs T-test - Esimest liiki viga tekib siis, kui võetakse vastu alternatiivne hüpotees, aga tegelikult on õige nullhüpotees (raske viga; näidatakse erinevuse või seose olemasolu, mida tegelikult pole). - Teist liiki viga tekib siis, kui jäädakse nullhüpoteesi juurde, ehkki tegelikult on õige alternatiivne hüpotees. See on kergem viga, mis tihti tähendab, et alternatiivse hüpoteesi tõestamiseks tuleb andmeid juurde koguda.
Milline on geenide koostoime iseloom kvantitatiivse koostoime korral? Tunnus on määratud väga paljude erinevate geenide poolt ja üksiku geeni toime tunnusele on vaevumärgatav, samasuunaline ehk kokkuvõttes summeeriv. Geneetiliselt on määratud tunnuse potensiaal, kuid keskkonnast sõltub, millisel määral potensiaal saab rakenduda. Kvantitatiivsed tunnused on mõõdetavad arvtunnused ja populatsioonis jaotuvad loomad selle tunnuse alusel vastavalt normaaljaotusele esineb mistahes tunnuse väärtusega isendeid. Anomaaliate puhul tähendab seda et esinevad erinevad raskusastmed (silmanägemine – näeb väga hästi kuni väga halvasti). 34. Mis on lävitunnus, haiguse soodumus ja haiguse lävi? Selliseid fenotüübi tunnuseid, mis kujunevad aditiivsete geenide kumuleerumisel teatud piirini nimetatakse lävitunnusteks (threshold trais). HAIGUSE LÄVI on patogeense(te) teguri(te) mõju selline tase, mille esinemisel haigus avaldub e