docstxt/129544216586833.txt
Meie arvutuste tulemusena saime etteantud valimi põhjal otsitavatele suurustele järgnevad väärtused: k= 11; n=12; R=10; 2 n =6,9. Vastavalt võrdusele R<2 n näeme, et statistik R on etteantud kriteeriumist suurem. See tähendab seda, et meie valimis esineb süstemaatilisi vigu. Teiseks süstemaatiliste vigade olemasolu kontrolli kriteeriumiks on vigade keskmise nulli kriteerium, mis oma olemuselt tähendab seda, et kui vaadeldavas valimis esinevad ainult normaaljaotusega juhuslikud vead, siis vigade aritmeetiline keskmine on null. Kriteeriumi kontrolliks tuleb valimi põhjal leida vigade aritmeetiline keskmine y , 1 Sy standardhälve S ja aritmeetilise keskmise standardhälve e. standardviga. Lisaks Sy veel kahekordne standardviga 2 .
Seega leiame hoopis
tõenäosuse, et juhuslik suurus asub teatud vahemikus:
P(173,5
4. Normaaljaotus pideva tunnuse jaotu, mille korral histogrammi kuju on sümmeetriline ja nn kellukesekujuline. · Normaaljaotuse kirjeldab ära 2 parameetrit: keskmine (asukoht) ja standardhälve (järsakus). · · 95% valimist jääb ligikaudu 2 standardvea kaugusele keskmisest. · Ligikaudu 2/3 valimist jääb vahemikku keskmine +-SD · Normaaljaotus on nii oluline, sest: o Valimi keskväärtus on informatiivne eelkõige ligikaudse normaaljaotusega valimite korral (valimist ülevaade keskväärtuse ja standardhälbe põhjal; sobilik on keskväärtusel põhinevad analüüsimeetodid). o Enamik klassikalisi statistilisi analüüsi meetodeid pidevate tunnuste jaoks on kasutatavad vaid ligikaudse normaaljaotusega valimi korral. o Kui aga valim pole normaaljaotusega, ei anna keskväärtus ja standardhälve enam piisavat informatsiooni valimi jaotuse kohta
Keskväärtuse Standardhälbe usaldusvahemik usaldusvahemik 37,44 < 37,50 < 0,224 < 0,262 < 0,299 37,55 5 Normaaljaotuse võimalikkuse hindamine, hii ruut-statistik Järeldus: 26, 11, tegemist ei ole normaaljaotusega, kuna leitud väärtus ületab kriitilise väärtuse (edaspidistes arvutustes arvestan, et on siiski tegemist normaaljaotusega) 7 Detaili mõõtmetolerants: h15 (vt. joonis 3) 8 Detaili partii mõõtemääramatus: 0,0263, 0,0038 9 Modelleeritud mõõtetulemused: vt. tabel 2 Detaili partii läbimõ õt, mm 37,73 37,18 37,95 37,02 37,57 37,47 37,58 37,72 37,62 37,91
jaotuse keskpunktiks tõenäosuse järgi: mediaanist nii vasakule kui paremale sattumise tõenäosus on võrdelt 0.5 Asümmeetria näitab jaotuse sümmeetrilisust. Sümmeetriliste jaotuste puhul iga x asümmeetria võrdub nulliga. Kui erineb nullist, siis tema märkr näitab, kumb jaotuse saba on suhteliselt väljavenitatum: negatiivne asümmeetria puhul on pikem vasakpoolne saba, positiivse puhul parempoolne saba. Ekstsess näitab jaotuse sabade suhtelist väljavenitatust võrreldes normaaljaotusega. Normaajaotuse korral ekstsess võrdub nulliga. Kui jaotuse sabad kahanevad kiiremini kui normaaljaotuse korral, on ekstsess negatiivne.Kui aeglasemalt, siis positiivne. Moodiks nim diskreetse juhusliku suuruse puhul suurima tõenäosusega juhusliku suuruse väärtust, pideva jaotuse korral jaotustiheduse graafiku maksimumkohta. Positiivsete juhuslike suuruste korral kasutatakse juhusliku suuruse suhtelise hajuvuse iseloomustamiseks variatsioonitegurit, mis defineeritakse standardhälbe ja
..........................................................................................6 5. Jaotushistogramm, jaotusfunktsioon...................................................................................7 6. Kvantiil, täiendkvantiil .......................................................................................................8 7. Karakteristikud....................................................................................................................9 8. Lähendamine normaaljaotusega........................................................................................10 9.Normaaljaotuse graafik......................................................................................................11 10. Normaaljaotuse ülesanded.............................................................................................. 11 3
Ülemiseks kvartiiliks nimetatakse tunnuse väärtust, millest suuremaid (või võrdseid) liikmeid on variatsioonreas ¼ ehk 25%. Enamasti kui räägitakse kvartiilidest, peetaksegi silmas alumist ja ülemist kvartiili, teise kvartiili kohta kasutatakse mediaani nimetust. Ka kvartiile mõõdetakse samades ühikutes, mis tunnustki. ) Ekstsess = Kurtosis - Ekstsess iseloomustab jaotuskõvera suhtelist teravust või lamedust võrreldes normaaljaotusega. Uue muutuja kodeerimine: Transform - transform into different variables - sealt paned vahemikud ja vahemiku väärtuse new value alla ja siis Add ja olemas. Kui sugu on defineeritud kui F=naine ja M=mees, siis F'st saab N'i teha kui lähed transform - recode into same variables - Old value=F , new value=N ja OK. Siis variable view's lähed soo lahtris kolmele punktikesele, teed lahti, ja muudad et N=naine Muutuja standardiseerimine:
3. Leida seosest P(|ã a| < ) = suurus , mis määrabki usalduspiirkonna. Normaaljaotuse keskväärtuse usalduspiirkond suure valimi korral Eeldame, et valimi maht on küllalt suur (n > 30) või standardhälve on eelnevalt teada (näiteks mõõteriista täpsus on teada). Olgu X ~ N(m, ). Leiame keskväärtuse punkthinnangu aritmeetilise keskmise abil: 1n x = xi n i =1 Normaaljaotusega juhusliku suuruse X antud vahemikku sattumise tõenäosuse võime leida Laplace'i funktsiooni abil: P (| X - m |< ) = P (m - < X < m + ) = ( / ) - (- / ) = 2 ( / ) Kui X on normaaljaotusega, siis on ka X normaaljaotusega: P (| X - m |< ) = 2( / ( X )). Normaaljaotuse keskväärtuse usalduspiirkond Leiame D(X): 1 n = 1 D n 1 D X = D x i x i = DX . n i =1 n i =1 n
Võrdlusülesanded andmeanalüüsis Üks v mittu tunnust? Jaotuse võrdlus v mingi parameetri võrdlus Kuidas jaotusi võrrelda? Millega võrrelda? Mille alusel võrrelda? Milliseid jaotusparameetreid võrrelda? Nt: -mood, mediaan, kvantiilid -keskmine, standardhälve, dispersioon - kujuparameetrid (ekstsess ja järsakuskordaja) Tunnuse jaotus Jäotus üldarvudena v protsentidena Segadustabel, risttabel Jaotus joonisel Võrdlus normaaljaotusega Parameetrite võrdlus Mood- kõige sagedasem väärtus v väärtusklass Mediaan- punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks Kvantiilid Aritmeetiline keskmine e keskväärtus Standardhälve kui kaugel on keskmine inimene keskmisest Dispersioon standardhälbe ruut Võrdlusülesanded
Sagedusintervallide leidmiseks hakkame valimi kõige väiksemale liikmele intervalli väärtust juurde liitma seni kuni saame tulemuseks valimi suurima väärtuse. Saame 8 sagedusintervalli, mille 2 saame nüüd Excel’ile lisaks andmeveerule histogrammi koostamiseks ette anda (Bin Range). Vastav histogramm on näha joonisel 2. Histogrammi vaadates näeme, et antud valimi puhul ei ole tegemist normaaljaotusega. Näeme, et palju tulemusi asetseb keskmisest kaugel. Noraamljaotuse puhul asetseksid enamuses tulemustest aga keskmise läheduses ning kaugel olevate tulemuste osakaal oleks väike. Histogrammilt ilmnebki, et palju tulemusi ei paikne arvutatud keskmise tulemuse ligiduses, seega on alust arvata, et tegu ei ole normaaljaotusega. Samuti on Tabelis 1 leitud järsakuse kordaja väärtusega -0,9. Normaaljaotuse korral peaks see olema 0.
võrdelt 0.5. Sümmeetrilise jaotuse korral mediaan võrdub keskväärtusega. Asümmeetria näitab jaotuse sümmeetrilisust. Sümmeetriliste jaotuste puhul iga x asümmeetria võrdub nulliga. Kui erineb nullist, siis tema märkr näitab, kumb jaotuse saba on suhteliselt väljavenitatum(raskem): negatiivne asümmeetria puhul on pikem vasakpoolne saba, positiivse puhul parempoolne saba. Ekstsess näitab jaotuse sabade suhtelist väljavenitatust võrreldes normaaljaotusega. Normaajaotuse korral ekstsess võrdub nulliga. Kui jaotuse sabad kahanevad kiiremini kui normaaljaotuse korral, on ekstsess negatiivne.Kui aeglasemalt, siis positiivne. Asümmetria ja ekstsess on dimensioonivabad arvkarakteristikud. Moodiks nim diskreetse juhusliku suuruse puhul suurima tõenäosusega juhusliku suuruse väärtust, pideva jaotuse korral jaotustiheduse graafiku maksimumkohta.
265 260 17 4420 7176,7 0,962 0,102 19 0,1609069 275 270 10 2700 9330,9 0,993 0,038 7 1,2525871 Summa 183 43820 37945,355 4,045873 1,000 183,000 3,756 Keskmine 239,45 14,44 1. Soovides lähendada toodud empiirilist jaotust normaaljaotusega, 239,45355 leia antud valimi andmeil normaaljaotuse parameetrite hinnangud µ ja 14,439216 2. Leia antud valimi andmeil ja eelmises ülesandes leitud parameetrite hinnanguid kasutades teoreetilised sagedused (ülaltoodud tühjadesse lahtritesse) 3,756273 3
NORMAALJAOTUS 13. Defineerida normaaljaotus. Normaaljaotus on reaalarvulise juhusliku suuruse jaotus, mille tihedusfunktsioon avaldub 2 −(x−μ) 1 2σ 2 kujul φ ( x )= e , kus jaotuse parameeter σ > 0 (hajuvus) ja μ on σ √2 π reaalarv(keskväärtus). Tähistatakse X~N(μ,σ). 14. Kuidas avalduvad normaaljaotusega juhusliku suuruse keskväärtus ja dispersioon? Normaaljaotusega juhusliku suuruse tihedusfunktsioon on positiivne ning integraal temast võrdub ühega. Normaaljaotusega juhusliku suuruse keskväärtus on EX=μ 2 Normaaljaotusega juhusliku suuruse dispersioon on DX =σ 15. Tulenevalt tihedusfunktsiooni omadustest visandada tema graafik.
korrutatud 1000ga Erikordaja-elussündide arv jagatud fertiilses eas toimumise tõenäolisuse mõõtu skaalas 0-st 1-ni. Võimatu 0, kindel 1. on sümmeetriline; kellukesekujuline ·Valimi keskväärtus on naiste aasta keskmise arvuga korrutades 1000ga. Vanuskordaja- Tinglik tõenäosus mingi sündmuse tõenäosus teatud eelinfo korral informatiivne eelkõige ligikaudse normaaljaotusega valimite korral. · elusalt sündinud laste arv mingis vanuserühmas naistel jagatud samas seda kasutatakse ka diag.testide omaduste uurimisel. Diagnostiliste Enamik klassikalisi statistilise analüüsi meetodeid pidevate tunnuste vanuserühmas naiste aasta keskmise arvuga korrutades 1000ga. testide omadused: Tundlikkuseks (ingl. sensitivity) nimetame jaoks on kasutatavad vaid ligikaudse normaaljaotusega valimi korral.
µ + -x -x µ + = - xe | + e µ dx = 0 - µ e | =µ 0 0 0 Dispersioon D(X)=µ2 6. Normaaljaotusega juhuslik suurus: jaotustihedus, jaotusfunktsioon, keskväärtus, dispersioon, väärtuse lõiku või vahemikku sattumise tõenäosuse arvutamine. Standardse normaaljaotusega juhuslik suurus ja selle jaotusfunktsioon (x) . (x) tabeli kasutamine tõenäosuste leidmiseks. Kvantiilid ja kvantiilide leidmine (x) tabelist. Mistahes normaaljaotusega juhusliku suuruse tõenäosuste arvutamise taandamine standardse normaaljaotusega juhusliku suuruse tõenäosuste
· usaldusnivoo on see tõenäosus, millega antud karakteristik sellesse vahemikku jääb HÜPOTEESIDE TESTIMINE Statistiliseks hüpoteesiks nimetatakse üldkogumi kohta esitatud üldistust. Hüpoteeside kontrollimiseks esitatakse statistiliste hüpoteeside paar(nullhüpotees ja altervatiiv- ehk sisukas hüpotees). Hüpoteeside paari moodustavad hüpoteesid peavad kindlasti üksteist välistama ning üks neist peab kindlasti kehtima. Näiteks: H0: tunnus on jaotunud normaaljaotusega H1: tunnus ei ole jaotunud normaaljaotusega H0:sig>=0,05 H1:sig<0,05 Nullhüpoteesi ei tõestata. Otsus langetatakse valimi põhjal. Kuna valim on juhuslik, siis võib meie otsus ka olla juhuslik. Hüpoteeside testimisel võib esineda kaht liiki vigu- esimest ja teist liiki. 1. Liiki viga on raske viga, 2. liiki viga ei peeta nii raskeks. Kui tahame vähendada esimest liiki vea tekkimise tõenäosust alfa, siis suureneb kohe teist liiki vea tekkimise tõenäosus beeta
Keskväärtus: Geomeetriline jaotus Binoomjaotus Dispersioon: Standardhälve: Normaaljaotus Binoomjaotuse lähendamine normaaljaotusega ja Punktihinnangud Keskväärtuse hinnanguks on Dispersiooni hinnanguks on Standardhälbe hinnanguks on Normaaljaotuse keskväärtuse usalduspiirkond Kui on teada või n on suur, siis
. ja m - P ( x = m) = e mille jaotus on määratud valemiga m! . Poissioni jaotusega juhuslikku suurust tähistame X~P(). Keskväärtus EX= =np, dispers DX= =np, standardälve DX= . 6. Normaaljaotus. Normaaljaotuse jaotustihedus f ( x ) ja selle graafik. Normaaljaotusega juhusliku suuruse antud vahemikku sattumise tõenäosuse P( X ) arvutuseeskiri. Laplace'i funktsiooni ( x) graafik ja omadusi. Kui pideva juhusliku suuruse tihedusfunktsiooniks on funktsioon ( x-m)2 1 - p( x) = e 2 2 2 siis öeldakse, et see suurus on normaaljaotusega e. Gaussi jaotusega. Tähistus: X~N(m;) Normeeritud normaaljaotus on juhul kui m=0 ja =1.
jaotus on määratud ja täielikult kirjeldatav kahe parameetriga keskväärtuse ja standardhälbe ehk dispersiooniga. Normaalajotust kujutav graafik on kellukese kujuline ja sümmeetriline keskväärtuse suhtes. Jaotust nimetatakse ka Gaussi-Laplaci kõveraks. Joonis 1. Normaaljaotus tekib siis, kui tunnuse väärtust mõjutavad väga paljud juhuslikud tegurid ja neist igaühe mõju on väga väike. Normaaljaotus on teoreetiline abstraktsioon. Eluslooduses ei ole ükski asi täpselt normaaljaotusega, kuid paljud tunnused on looduses normaaljaotusele väga lähedase jaotusega. Joonis 1. Normaaljaotuse graafik Normaaljaotusega tunnuse väärtuste ulatust saab iseloomustada standardhälbe kaudu. Kolme sigma reegli kohaselt asub 99,7% normaaljaotuse väärtustest arvude x ± 3 vahel. 95,5% väärtustest paikneb kahe standardhälbe ulatuses keskväärtusest ühes ja teises suunas. 68,3% väärtustest asub ühe standardhälbe kaugusel. Joonis 1.
Kasutatakse erinevate valimite võrdlemiseks. Median - Mediaan - väärtused, millest pooled on suuremad ja pooled väiksemad e 50% punkt. Mode - Mood - väärtus, mida esineb kõige rohkem. Standard Deviation - Standardhälve - iseloomustab tunnuse väärtuste hajumist. Sample Variance - Dispersioon - standardhälve ruudus e s2. Rohkem teoreetilise statistika abivahend. Kurtosis - Ekstsess e järsakuskordaja (e) - iseloomustab jaotuse kuju võrreldes normaaljaotusega. Kui e=0 , siis on tegemist normaaljaotusega; e>0, siis on jaotus kõrge tipuga; e<0, sel juhul jaotuvad vaatlused ühtlaselt kogu jaotuse ulatuses ja jaotus on platookujuline. Jaotuse märkimisväärsest erinevusest normaaljaotusest on mõtet rääkida siis, kui kordaja on absoluutväärtuselt 1-st suurem. Praks 4 Keskmise võrdlemine konstandiga. Kahe grupi dispersioonide ja keskmiste võrdlemine, F- ja t-test.
· suhtelise sagedusega, mis tähendab absoluutse sageduse suhet indiviidide koguarvusse. 7) Normaaljaotus, selle kohta käivad reeglid. Kolme sigma reegel · Kui valim oli moodustatud juhuvaliku teel, siis peaks ka mõõtmisvead olema juhuslikud, sest mõõtmise käigus kombineeruvad mitmed üksteisest sõltumatud juhuslikud tegurid. · Tõenäosusteoorias on leitud, et suure arvu juhuslike sõltumatute ühetaolise jaotusega tegurite summat saab pidada normaaljaotusega juhuslikuks suuruseks. · Seega: mõõtmisviga võiks olla tüüpiliseks normaaljaotusega juhusliku suuruse näiteks. · Normaaljaotuse ehk Gaussi jaotuse graafik on kellukakujuline (inglise keeles ,,bell curve") ja seda nimetatakse ka Gaussi kõveraks. · Normaaljaotus on ühetipuline keskväärtuse (keskmise) suhtes sümmeetriline jaotus. · Normaaljaotuse standardtähistuseks on N(,)
t Laplace funktsioonist ! t @. 36. Dispersiooni ja standardhälbe intervallhinnang s (1 q) s (1 + q) kui q < 1; q tabelist n ja alusel. 37. Statistilise hüpoteesi põhimõte Parameetrite või jaotuste vastavuse kontrollimine teoreetiline ja empiiriline. Kontrollkriteerium. Olulisustase (tõenäosustase) . Hüpoteesid Y0 ja Y1. 38. Hüpoteesi t-kriteerium (Z-kriteerium suurte valimite korral) Kasutatakse kahe keskväärtuse võrdluseks normaaljaotusega kogumist eeldusel, et dispersioonid { ja Y on võrdsed kuigi mitteteada. Y0 % MX=MY. X Y n1n2 n1 n2 2 T & k = n1+n2-2 n 1 S 2 n 1 S 2 1 X 2 Y n1 n2 39. Hüpoteesi F-kriteerium Kasutatakse kahe dispersiooni { ] Y võrdlemiseks normaaljaotusega kogumist. Y0 % { ] Y F = s2X / s2Y; m1 = n1-1; m2 = n2-1. 40
suuruseid, s.t nende võimalikud väärtused paiknesid eraldi (täringu silmade arv) · Juhuslik suurus on pidev, kui ta võib saavutada kõikvõimalikke väärtusi (mõistlikust vahemikust) · Näiteks vastsündinud laste kaal on pidev juhuslik suurus Normaaljaotuse teke · Looduses tekkivad tunnused jaotuvad sageli normaaljaotuse järgi · Palju on objekte, mille väärtus on keskmisele lähedal, vähe objekte, mis keskmisest väga erinevad · Normaaljaotusega on näiteks Inimeste pikkus ja kaal Inimeste pea ümbermõõt ... Normaaljaotuse graafik e Gaussi kõver Esinemise tõenäosus Tunnuse suurus Normaaljaotuse omadusi 1. Sümmeetriline keskväärtuse suhtes 2. Keskväärtus, mood ja mediaan ühtivad 3. Dispersiooni suurenedes muutub graafik madalamaks ja lamedamaks 4. Graafiku alune pindala on 1 (tõenäosuste summa on 1) 5
Haare: valimi suurima ja vähima elemendi vahe Statistika põhiteoreem: Empiiriline jaotusfunktsioon FN(x) on teoreetilise (üldkogumi) jaotusfunktsiooni F(x) nihutamata ja mõjus hinnang. Histogramm: Histogramm on enimkasutatav (üldkogumi) jaotustiheduse hinnang. Histogrammi kasutatakse ettekujutuse saamiseks üldkogumi jaotusseadusest ning ta kujutab endast tulpdiagrammi, mille tulpade kõrgused näitavad vastavasse vahemikku sattumise sagedust. 2-jaotus on kasutusel normaaljaotusega juhusliku suuruse dispersiooni hinnangu jaoks usaldusvahemike arvutamisel. t-jaotus (Studenti jaotus) on kasutusel normaaljaotusega juhusliku suuruse keskvaartuse hinnangu jaoks usaldusvahemike arvutamisel. F-jaotus (Fisheri jaotus) on kasutusel kahe normaaljaotusega juhusliku suuruse dispersioonide hinnangute võrdlemisel osana mitmetes hüpoteeside kontrolli skeemides. Momentide meetod: Meetodi põhimote seisneb selles, et üldkogumile vastavad seosed jaotuse
Et prognoosida sõltumatute muutujate seost testi keele õppimiseks kuluva ajaga (normaaljaotusega, arvtunnusega minutites) sisaldab regressioonianalüüsi mudel kolme sõltumatut muutujat: õpetaja toetus (a four-point scale with the response categories ‘never’, ‘some lessons’, ‘most lessons’ and ‘every lesson’ was used), kodused õppimist toetavad vahendid ja distrsiplineeriv keskkond (A four-point scale with the response categories ‘never’, ‘some lessons’, ‘most lessons’ and ‘every lesson’ was used. This index was inverted
Piiresindusviga - n , üldkogumi teadmisel n N 2 t 2 2 t t22N n= = n = Valmi suuruse määramine - 2 Kui üldkogum on teada - 2 N + t 2 2 Dispersioonanalüüs (DA) Uuritav tunnus peab olema arvtunnus. Tunnused on normaaljaotusega. Rohkem kui 2 võrreldavat kogumit. Analüüsitakse reklaami asukoha mõju toote ostmisele. Valitakse 30 sarnast kauplust, kus ühe ja sama kauba reklaam paigutatakse erinevalt: 10 kaupluses aknale, 10 poe sissekäigu juurde, 10 vahetult kauba müügileti juurde. Tulemusi fikseeritakse müüdud kauba koguse (tükkide) järgi. Meie näites müügikogus on tulemus ehk funktsioonitunnus, millele oletuste kohaselt avaldab mõju reklaami asukoht kui argumenttunnus.
Osa A 1. Keskväärtuse hinnangu ´x leidsin valimi elementide aritmeetilise keskmise arvutamisega. Dispersiooni hinnanguks s2 on katsetulemuste hälvete ruutude summa jagatud N-1-ga, kus N on valimi maht; standardhälve s on ruutjuur dispersioonist. Mediaan oli elementide järjestatud rea 13. element ning haare on suurima ja väikseima elemendi vahe. 2. Eeldades, et üldkogum on normaaljaotusega ja et =0,10, leidsin t-jaotuse tabelist kvantiili t1-/2(N-1) ning keskväärtuse poollaiuse arvutasin, korrutades kvantiili standardhälbe hinnanguga ning jagades korrutise ruutjuurega valimi mahust. Alumiseks piiriks sai seega keskväärtuse hinnangu ja poollaiuse vahe ning ülemiseks piiriks keskväärtuse hinnangu ja poollaiuse summa. Dispersiooni usaldusvahemiku leidmiseks leidsin tabelist väärtused kvantiilidele 2/2(f) ja 21-/2(f), f=N-1
Variatsioonikordaja 32,47 33,07 % Asümmeetriakordaja 0,48 % Ekstsess -0,17 cm 0.1 kvatniil 6,27 6,3 cm 0.75-kvantiil 12,40 12,5 cm 8. Lähendamine normaaljaotusega µ= 10,14 = 3,4 di dü Emp ni F(dü) Norm ni pi 5,8 4,8 14 0,056 9,7 0,056 7,8 6,8 35 0,160 18,2 0,104 9,8 8,8 35 0,345 32,4 0,185
empriiline väärtus, kriitiline, nullhüpotees, sisukas hüpotees t-testi parameetri empiiriline väärtus mittekehtiv nullhüpotees, I liiki viga, ii liiki viga, teststatistiku empiiriline väärtus olulisuse nivoo olulisuse nivoo vähendamine sisukas hüpotees, olulisuse nivoo, liiki vea, tõke analüüsimeetod hüpoteesi statistilisel kontrollimisel saadi olulisuse tõenäosuseks uuritava tunnuse jaotuse võrdlemisel normaaljaotusega Test 9 ühefaktoriline dispersioonanalüüs anova nullhüpoteesi dispersioonanalüüs, teststatistik, faktori poolt põhjustatud seletatud hajumine suurem, seletamata hajumine teststatistiku f väärtus toodud anova tabeli korral funktsioontunnus faktor korrelatsioonimaatriks negatiivne kovariatsioon, autokorrelatsioon, spearmani korrelatsioon summaarne dispersioon arvutusvalemis, kovariatsioon õige hajumisdiagramm
Tegemist on seega segatüüpi disainiga faktor ,,sõnade tüüp" on kõikidel katseisikutel sama, faktor ,,sugu" jaotab katseisikud kahte gruppi. Normaaljaotuse kontroll - Enne parameetrilise testi tegemist tuleks kontrollida muutujate normaaljaotust - SPSS'is on selleks kaks testi: Shapiro Wilki test (väiksemate valimite puhul, kuni 2000) ja Kolmogorov Smirnov (n > 2000) - Analyze -> Descriptive Statistics - > Explore -> Plots - Kui p > .05 siis on normaaljaotusega (st nullhüpotees on normaaljaotusega) - NB! kui asümmeetriakordaja (ingl. k. skewness) ja ekstsess (ingl. k. kurtosis) on vahemikus -1 kuni 1, siis võib pidada andmeid normaaljaotusele vastavaks ANOVA vs T-test - Esimest liiki viga tekib siis, kui võetakse vastu alternatiivne hüpotees, aga tegelikult on õige nullhüpotees (raske viga; näidatakse erinevuse või seose olemasolu, mida tegelikult pole).
suur. Mudelis arvestatakse temperatuurisõltuvuse inertsi, mittelineaarsust ja ajalisi muutusi; sõltuvus talitlusparameetritest, mis avaldub koormuse pinge ja sagedustundlikkusena; juhuslikkus, mis on eriti märgatav väikestes, jaotusvõrgu koormustes. Selliste koormuste ruuthälbe suhe matemaatilisse ootusesse on suhteliselt suur. Ka võib väikestes koormustes esineda suuremaid kõrvalekaldeid, mis ei sobi kokku normaaljaotusega; juhitavus. Koormust juhitakse enamasti kaudselt elektritariifide abil. Esineb ka otsest juhtimist elektrivõrgu operatiivpersonali poolt. Juhitavuseks võib lugeda põhivõrgu sõlmekoormuste muutusi, mis on tingitud ümberlülitustest jaotusvõrgus. 3.Koormuse põhilised seaduspärasused Koormuse matemaatilise modelleerimise ideest tuleneb, et mudeli struktuur ei sõltu koormuse kohta olemasolevatest andmetest. Modelleeritakse koormust, mitte andmeid;
Ülesanne1 Mis tüüpi tunnus on lehmade arv. Leia tunnuse lehmade arv jaoks: 1) Leia statistikud ja kirjelda nende abil tunnuse jaotust. 2) Kas tunnus on normaaljaotusega? 3) Tee histogramm 4) Leia üldkogumi keskväärtuse 95% usaldusintervall Valimi põhjal Lehmade arv Lehmade arv on diskreetne tunnus. 667 Lehmade arv 722 1339 Mean 842,4194 Keskväärtust ja mediaani võib lugeda ligilähedaseks, mi 1636 Standard Error 40,80659 Järsakus on väike. 1048 Median 832,5
8,5 9,5 22 0,228 21 10,5 11,5 36 0,422 32 12,5 13,5 43 0,637 35 14,5 15,5 22 0,816 29 16,5 17,5 11 0,926 18 18,5 19,5 9 0,977 8 20,5 21,5 7 1,000 4 3.1 Normaaljaotuse graafik Joonis 1. Diameeter lähendatav normaaljaotusega 5 3.2 Normaaljaotuse eeldusel Tabel 4. Normaaljaotuse eeldusel 1) leida, mitu protsenti diameetritest on väiksemad kui 9 cm, 19% 2) leida, mitu protsenti diameetritest on suuremad kui 11 cm, 63% 3) leida diameetri mediaan, 12,2 cm 4) leida diameetri 0,4-kvantiil, 11,3 cm
standardhälve= =1) normaaljaotuse jaoks. Juhusliku suuruse tsentreerimine on tema lineaarteisendus valemiga Y = X-EX. Tsentreeritud JS keskväärtus =0. Normeerimine on JS lineaarteisendus valemiga Y=X/. Normeeritud JS dispersioon ja standardhälve =1. DJS standardiseerimine on tema tsentreerimine ja normeerimine. Standardiseeritud juhuslik suurus X0=(X-)/. Standardiseeritud normaaljaotuse juhusliku suuruse jaotusf-ni tähistame (x) ja tihedusf- ni (x). Normaaljaotusega juhuslik suurus tekib olukordades, kus on tegemist paljude sõltumatute tegurite koosmõjuga, kusjuures kõigi nende tegurite mõjud on samas suurusjärgus. Näiteks kultuuride saagikus, inimese pikkus jpm. Nii on rakendusi normaaljaotusele palju. Kolme sigma reegel: Normaalse (normaal-)jaotuse jaotuskõvera alusest pindalast jääb vahemikku keskväärtus pluss-miinus standardhälve, 68,3%; keskväärtus pluss-miinus
kui suur võib mõõteviga olla. Mõõteviga pole võimalik küll ära kaotada, kuid seda on võimalik vähendada, korrigeerides mõõtevahendeid. Normaaljaotus on pideva juhusliku suuruse jaotus. Normaaljaotuse laiust iseloomustab standarhälve. Jaotuse laius iseloomustab mõõtemääramatust. Kui me mõõdame näiteks oksa pikkust, siis saame erinevaid pikkuseid. Kui me saame palju ühte pikkust ehk kui üks pikkus kerkib esile kõige rohkem, siis on tegemist normaaljaotusega. Normaaljaotuse laiust, ehk kui palju on pikkuse erinevaid variante iseloomustab standarhälve. Ja see kui on palju erinevaid pikkuseid iseloomustab mõõtemääramatust. Ehk seda, et me ei saa kunagi täpset tulemust. Füüsikalised mudelid on looduslike objektide ja nähtuste mudelid, millega kirjeldatakse füüsika maailma. Mudelid ei kopeeri kunagi originaali viimse detailini täpselt ja on lihtsustatud. Neid mudeleid on kaks: ainelised ja abstraktsed mudelid.
T – kahe sündmuse vaheline aeg. Leiame juhusliku suuruse T jaotusfunktsiooni P(X=k) ( ) = . A – vahemikus (t;t+τ) toimub vähemalt 1 sündmus. Ā – vahemikus (t;t+τ) toimub 0 sündmust. 1 = P(A) + P(Ā) = P(T≤τ) + P(T>τ) = P(T≤τ) + P(X=0) = P(T≤τ) + e-ντ => F(τ) = P(T≤τ) = 1 – e-ντ. f(τ) = F’(τ) = νe-ντ, kui τ 0; 0, kui τ<0. Saadud eksponentjaotus näitabki sündmuste vahelist aega lihtsa sündmuste voo korral. 21. Normaaljaotusega juhusliku suuruse keskväärtuse ja dispersiooni leidmine. Tihedusfunktsioon on ette antud Keskväärtus: ( ) = ( )= ∫ = [ = + ]= ∫ ( + ) = ∫ + √ √ √ =
tunnuseid on variatsioonireas ligikaudu võrdselt. Alumine kvartiil e. 1. kvartiil e. 25- protsentiil ehk 0,25 kvantiil (lühendid LQ ja Q1) on tunnuse väärtus, millest väiksemaid või võrdseid tunnuseid on ligikaudu 25% .Ülemine kvartiil e. 3. kvartiil e 75-protsentiil ehk 0,75 kvantiil (lühendid UQ ja Q3) on tunnuse väärtus, millest suuremaid või võrdseid tunnuseid on ligikaudu 25% Ekstsess iseloomustab jaotuskõvera suhtelist teravust või lamedust võrreldes normaaljaotusega. Positiivne ekstsess näitab, et jaotuskõver on suhteliselt terav. Negatiivne ekstsess näitab, et jaotuskõver on suhteliselt lame. Tõus on arvsuurus, millega iseloomustatakse sirge kallet. Mida suurem on tõusu absoluutväärtus, seda järsem on sirge. Puutuja abil saab defineerida joone tõusu mõiste Negatiivne tõus näitab siis langust. Asümeetria näitab erinevust sümmeetriast. Asümeetriline joonis näitab kui palju kaldub kõrvale keskpunktist.
Kvantiilid- juh.su. p-kvantiil väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. ka protsentiilid (detsiil, kvartiil). Mediaan- jaotuse keskpunkt, sümmeetmediaan=keskv Moment- nende põhjal saab konstr eri momentkarakt, nt asümmeetria ja ekstsess. Asümmeetria näitab jaotuse sümmeetrilisust, kui sümm, siis võrdub 0. Kui pole 0, siis märk näitab, kumb saba väljavenitatum. Neg vasak, pos parem Ekstsess näitab sabade väljavenitatust võrreldes normaaljaotusega. Normaaljekstsess=0. Saba kahaneb kiiremini=neg, kahanev aeglasemini=pos Mood- diskr:suurima tõenäosusega juh. Su. Väärtus, pidev: jaotustiheduse graafiku maxkoht. Variatsioonitegur: hajuvuse iseloomust, positiivsete korral, standardhäve/keskväärtus Diskr jaotus.s: 1)Binomiaal: tehakse järjest n sõltumatut katset, tulemusel võib toimuda s A, tõenäosus igas katses on p ja mittetoimumine q=1-p. m- katsete arv, milles toimub A, siis m on juh. Su., igas katseseerias erinev
m nm pm 0-20 6 0,24 20-40 5 0,2 40-60 8 0,32 60-80 4 0,16 80-100 2 0,08 Nüüd kontrollime kolme hüpoteesi põhikogumi jaotuse kohta Pearsoni 2 - testi abil; usaldusnivooks kasutame = 0.10 4.1 H0: põhikogumi jaotus on normaaljaotus (parameetrid ja peab hindama valimi põhjal); H1: põhikogumi jaotus ei ole normaaljaotus. Kuna jaotuse parameetrid on juba hinnatud punktis 1 (oletades et tegu on normaaljaotusega), siis saame kohe määrata intervalidesse sattumise teoreetilised tõenäosused. t F(x) (x) 20 -0,93 0,18 0,18 40 -0,16 0,44 0,26 60 0,61 0,73 0,29 80 1,38 0,92 0,19 100 2,15 0,98 0,07 2 = 0,046 f = k h 1 = 5 2 (hindasime ja ) 1 = 2 2kr = 20,90(2) = 4,605 Kuna 2 < 2kr, siis võtame hüpoteesi H0 vastu. 4
· Normaaljaotuse keskväärtusest ka kui tahes kauged väärtused on võimalikud, kuid vähetõenäosed. 8) Usalduspiirid, millal kasutada ja mis nende laiust mõjutab. · Eksimist tulemuste üldistamisel valimilt üldkogumile me täielikult vältida ei saa. Seepärast kehtestatakse lubatava eksimise piir ehk usaldusnivoo. · Näiteks usaldusnivoo 95% tähendab, et lubame endale järeldustes eksimist maksimaalselt 5%. Sel juhul on 5%. · Normaaljaotusega tunnuse puhul on teada, milliste punktide vahel on 95% tunnuse väärtustest (umbes keskmine +/- 2 standardhälvet). Usaldusvahemik on seda laiem, mida: · Suurem on tunnuse hajuvus · Väiksem on valimi maht · Suurem on usaldusnivoo Usaldusvahemik on seda kitsam, mida: · Väiksem on tunnuse hajuvus · Suurem on valimi maht · Väiksem on usaldusnivoo 9) Hüpoteeside kontrollimine. · 2. võimalus: Hüpoteeside kontrollimine
(2 ja 1,2) 24. Sõiduki remondiks kuluv aeg (tundides) allub eksponentsiaalsele jaotusele parameetriga = 0,25. Kui suur on tõenäosus, et ühe sõiduki remondiaeg on alla kuue tunni? (0,777) 25. Tehase toodangu maht allub ligikaudselt normaaljaotusele keskväärtusega 134786 eset nädalas ja standardhälbega 13000 eset nädalas. 1) Leida tõenäosus, et nädala toodang ületab 150000 eset. (0,121) 2) Leida tõenäosus, et nädala toodang on väiksem kui 100000 eset. (0,0037) 28. Normaaljaotusega juhusliku suuruse X keskväärtus a = 168 ja standardhälve = 5,9. Kui tõenäone on, et juhusliku suuruse väärtused asuvad vahemikus 160-st 180-ni? (0,8915) 29. Poisslapse sündimise tõenäosus on 0,515. Kui tõenäone on, et iga 1000 vastsündinu hulgas on poisslaste arv 455 ja 555 vahel? (0,9942) 30. Mis on tõenäosem, kas võrdse vastasega maletades 1) võita üks partii kahest või kaks partiid neljast; (üks kahest)
n i =1 n i =1 n i =1 Kui valim on representatiivne, s.t.kõigil üldkogumi objektidel on võrdne võimalus valimisse sattuda, siis peavad kõigi üksikmõõtmiste keskväärtused ühtima üldkogumi keskväärtusega: 1 E(x1) = E(x2) = ... E(xn) = EX ja E x = n EX = EX n Osutus, et aritmeetiline keskmine on nihutamata hinnang. Keskväärtuse hinnang (II) Kui üldkogum on normaaljaotusega, siis aritmeetiline keskmine osutub ka efektiivseks (minimaalse dispersiooniga) hinnanguks. See, et aritmeetiline keskmine on ka konsistentne hinnang, järeldub Tsebõsevi suurte arvude seadusest. Seega rahuldab aritmeetiline keskmine kõiki statistilisele hinnangutele esitatavaid põhinõudeid ja meil on täielik alus kasutada seda üldkogumi iseloomustamiseks. Dispersiooni hinnang valimi keskväärtuse kaudu Nihkega hinnang: 1n
jaotusele läheneb hinnangu valimjaotus valimi mahu efektiivseks (asymptotically efficient), kui selle kasvamisel. asümptootilise jaotuse dispersioon on väiksem suvalise · Hinnang on asümptootiliselt normaaljaotusega, kui mõjusa asümptootiliselt normaaljaotusega hinnangu hinnangu valimjaotus läheneb valimi mahu kasvamisel dispersioonist. normaaljaotusele. Näiteks valimite keskmiste jaotus läheneb valimite mahu n kasvamisel normaaljaotusele keskväärtusega ja dispersiooniga Näiteks mõningad suurima tõepära meetodil leitud 2/n, kus ja 2 on vastavalt kogumi keskväärtus ja dispersioon. hinnangud. · Asümptootilist jaotust kasutatakse parameetrite
6 Koostada regressioonimudeli graafik koos katsepunktidega ja p.11.5 leitud usaldusvahemikega. 12. Koostada osade A ja B lahenduste kohta lühike kokkuvõte. Andmete valimi A keskväärtuseks on 45,76 (usaldusvahemikuga 34,57...56,95), dispersiooniks 1070,27 (usaldusvahemikuga 705,38...1854,89), standarhälbeks 32,72, mediaan on 44 ja haare 97. Valimi A normaaljaotuse kontrollimiseks testisin kahte hüpoteesi ( ja ) ning mõlemast selgus, et tegemist on normaaljaotusega. Jagasin valimi A võrdlaiadeks vahemikeks 0-20, 20-40, 40-60, 60-80, 80-100. Valimi järgi hinnatud parameetrite järgi leidsin, et põhikogu jaotuseks ei ole normaaljaotus ega eksponentjaotus. Fikseeritud parameetritega a=0 ja b=100 selgus, et jaotuseks on ühtlane jaotus. Kolmogorovi-Smirnovi testi abil testisin hüpoteesi, et fikseeritud parameetritega a=0 ja b=100 on kogu valim A ühtlane jaotus, mis osutus tõeseks.
0,99+0,01=1 Otsus (olulisuse nivoo 0,05): H0 7. Hüpoteeside statistiline testimine II Siin suht palju arusaamatut asja ja raskeid valemeid, loodame, et ta ei küsi :D Mure z-testiga Populatsiooni standardhälve pole enamasti teada.... Asendades valimi standardhälbega s pole esitatud väited enam (täiesti) korrektsed... T-testi eeldused Uuritav tunnus on kas normaaljaotusega või on valim suur Tegemist on esindava juhusliku valimiga (sõltumatud nopped uuritavast populatsioonist, kõigil on võrdsed võimalused...) R'i KÄSUD 1) dbinom(4, 12, 0.5) 4- soovitav tulemus,12-katsete arv, 0.5- katse õnnestumise tõenäosus 2) dpois(3, 2) - kui tõenäoliselt omandab Poissoni jaotusega juhuslik suurus (parameetriga 2) väärtuse 3. 3) dpois(0:10, 2) - leiab kui tõenäoliselt omandab Poissoni jaotusega juhuslik suurus
N 1 1 Hinnang: σ^ =s = N −1 ∑ ( x i− x´ ) = 24 ∙ 19537,36 ¿ 814,057 2 2 2 i=1 Standardhälve: S= √ s = √ 814,056=28,53 2 Mediaan: Me = 41 – järjestatud arvukogumi keskmine arv Haare: R=x max −x min =87−1=86 2. Keskväärtuse ja dispersiooni usaldusvahemikud: Eeldan, et üldkogum on normaaljaotusega ning võtan olulisuse nivooks α = 0,10. Olulisuse nivoo ehk tõenäosus, et tegelik väärtus satub väljapoole usaldusvahemikku on 0,1. Seega usaldustõenäosus p = 1 – α = 1 – 0,1 = 0,9 ehk 90% Vabadusastmete arv k = n-1 = 24 2.1 Keskväärtuse usaldusvahemikud: t 0,95 ( 24 )=t ∝ ( k )=1,7109 1− 2 s 28,53 ∆ μ= ∙ t 0,95 ( 24 )= ∙1,7109=9,76 √N √25
75-89 82 5 410 33620 0,1 90-104 97 4 388 37636 0,08 k=7 ∑ 50 2315 151685 1 5. ui=(Xi-X)/Scor ui→(tabelist)→φ(ui) ni’=nhφ(ui)/Scor χ2emp=∑((ni-ni’)2/ni’)=81,58 α=0,05 k=7-3=4 χ2kr(α;k)=χ2kr(0,05;4)=9,49 χ2emp>χ2kr → tegu ei ole normaaljaotusega Xi ui φ(ui) ni' ni'/h' ni ni-ni' (ni-ni’)2 (ni-ni’)2/ ni’ 7 -1,304 0,1736 2,0 0,095 11 9,0 81,00 40,50 22 -0,806 0,2920 3,3 0,155 8 4,7 22,09 6,69 37 -0,309 0,3814 4,4 0,208 5 0,6 0,36 0,08
5 100 4 1,897 0,9699 0,0830 2,075 1,785843 Kokku 25 24,248 3,287724 vabadusastmete arv k = m 1 r = 5 1 2 = 2. (r = 2, sest normaaljaotusel on kaks parameetrit) Et hüpotees vastu võetaks peab ²kr > ², antud juhul 4,605 > 3,288, seega hüpoteesi võib vastu võtta ning järeldada, et tegemist on normaaljaotusega. 4.2. Põhikogumi jaotuseks on eksponentjaotus Eksponentjaotuse parameeter: = = 0,022 k xm ni F0(m) pi 1 20 7 0,356 0,143 3,568 3,301 2 40 5 0,585 0,229 5,731 0,093 3 60 5 0,733 0,148 3,691 0,464
Lähteandmed 2. Struktuurskeemi osade lühikirjeldused 2.1 Modelleerimise struktuurskeem SIMULINKis Kogu ülesande lahendamisel kasutasin ühte ja sama struktuurskeemi: Joonis 2. Struktuurskeem SIMULINKis 2.2 Edastuskanal -> AWGN AWGN (Additive White Gaussian Noise) aditiivse valge Gaussi müraga kanal on laialdaselt kasutatav kanali mudel: Joonis 3. AWGN kanali struktuurskeem Kanalis liitub edastavale infosignaalile gaussi normaaljaotusega valge müra, kusjuures müra spektraaltihedus on kõikidel sagedustel konstantne. Väljundis saadakse liitunud signaal. AKF Rv(), mis sisaldab kaalutud deltafunktsiooni. AWGN mudel on ka sageli piisavalt hea, et seda kasutatakse ka satelliitsides juhul kui saatja ning vastuvõtja üksteist näevad. 2.3 Modulatsioonimeetod -> 2-FSK Frequency-shift keying (FSK) ehk BFSK (Binary Frequency-shift keying) on üks modulatsiooni meetoditest