väärtused. Küsimus 2 Millised väited käivad pildil esitatud jaotuse kohta? Õige Hindepunkte 1.00/1.00 Valige üks või mitu: a. Jaotuse asümmeetriakordaja on positiivne b. Jaotuse asümmeetriakordaja on negatiivne c. Jaotuse asümmeetria- ja ekstsessi (järsakuse) kordajad võrduvad nulliga d. Jaotuse ekstsessi (järsakuse) kordaja on positiivne e. Jaotuse ekstsessi (järsakuse) kordaja on negatiivne Sinu vastus on õige. Küsimus 3 Järgmine sagedustabel näitab 90 fänni rockkontserdi piletiostu järjekorras ootamisaegade jaotust (tunni täpsusega): Õige
Jaotuse kujuparameetri S baasväärtusel S0 ja teisenduse parameetri T baasväärtusel T0 : a) koostada teisendusfunktsiooni graafik, D=2 , T0 =2, S0=0,5 y=D1-T|X|T x y -10 50,00 -9 40,50 -8 32,00 -7 24,50 -6 18,00 -5 12,50 -4 8,00 -3 4,50 -2 2,00 -1 0,50 0 0,00 1 0,50 2 2,00 3 4,50 4 8,00 5 12,50 6 18,00 7 24,50 8 32,00 9 40,50 10 50,00 d) leida saadud valimite {xi} ja {yi} järgi X ja Y keskväärtuse, dispersiooni, standardhälbe, asümmeetria ja ekstsessi hinnangud ning nende jaotuste histogrammide graafikud xi = 1,732 S ( 2U 1 - 1) + (1 - S ) N 1 X ja Y arvkarakteristikute hinnangud X Y keskväärtus 0,2479664 0,157100 4 dispersioon 0,2539834 0,032985 7 standardhälv 0,5039677 0,181619 e 6 asümmeetria 0,0430155 1,470564 5 ekstsess - 1,538760 0,9966979 9 2. Korrata p
Variatsiooniamplituud 3 3 Mood 4 5 Alumine kvartiil 2 4 Mediaan 4 4 Ülemine kvartiil 4 5 Aritmeetiline keskmine 3,4 4,24 Dispersioon 1,08 0,69 Standardhälve 1,04 0,83 Asümmeetria kordaja -0,19 -0,97 Ekstsessi kordaja -1,22 0,63 Variatsioonikoefitsiendid variatsiooniamplituudi järgi 88% 71% standardhälbe järgi 31% 20% Koostage ülesande 1 andmetega ja funktsiooni frequency abil matemaatika ja füüsika kontrolltöö hinnete saged Tehke mõlema tunnuse jaoks eraldi korrektselt vormistatud diagrammid. Matemaatika Sagedus 1,1 - 2 7
4 Harmooniline keskmine 181.94 Geomeetriline keskmine 182.17 Miinimum 165 Maksimum 199 Variatsiooniamplituud 34 Mood 169 Mediaan 183.5 Alumine kvartiil 175 Ülemine kvartiil 189 Dispersioon 83.68 Standardhälve 9.15 Asümmeetria kordaja -0.005 Ekstsessi kordaja -1.05 Variatsioonikoefitsiendid variatsiooniamplituudi järgi 18.64 standardhälbe järgi 5.02 dke tunnuse pikkus järgmised arvkarakteristikud: average harmean geomean min max max-min mode quartile(2) või median quartile(1) quartile(3) var stdev skew kurt var.amplituud / aritm. keskmine (väljenda %)
959495 181 78 169 72 Standardhälve 9.1475006 stdev Standardhälve 5.9126555 188 72 170 72 Asümmeetria kordaja -0.004702 skew Asümmeetria kordaja 0.1251388 196 81 171 73 Ekstsessi kordaja -1.047574 kurt Ekstsessi kordaja -1.064565 172 73 172 73 Variatsioonikoefitsiendid Variatsioonikoefitsiendid 168 89 172 73 variatsiooniamplituudi järgi 18.640351 var.amplituud / aritm. keskmine (väljenda %) variatsiooniamplituudi järgi 25.160398
dispersiooni ruutjuurega, mistõttu läheb ka erinevus väiksemaks. Tartus oli vastav näitaja 26,63 ning Tallinnas 26,15. Variatsioonikordaja näitab, kui suure osa moodustab standardhälve aritmeetilisest keskmisest. Antud juhul on mõlema linnal vastavaks kordajaks sarnane väärtus. Väikese erinevuse tingivad erinevad standardhälbed ning aritmeetiline keskmine. Olgugi, et tegelikult on asümmeetriakordaja ning ekstsessi väärtusi pole väiksemate valimite puhul eriti mõtet leida, kuna see ei ole väga täpne, siis autor otsustas neid siiski analüüsida, et saaks kas või mingigi ülevaate. Vaadates joonist 6 ning analüüsides asümmeetria kordajat, võib öelda, et Tartu elanikkonna puhul, mida iseloomustab vastava kordaja väärtus 0,03, on tegu peaaegu täiesti sümmeetrilise jaotusega, mis tähendab omakorda seda, et mood ei ole sümmeetriateljest (mediaan) kõrvale kaldunud, vaid peaaegu kattub sellega
Mood puudub 1 Mediaan: Me = ba . 2.8 Juhusliku suuruse asümmeetriategur ja ekstsess Asümmeetriategur: E ( X EX ) 3 ASX= 3(X ) . Kui asümmetriategur on 0, siis juhuslik suurus on jaotatud sümmeetriliselt keskväärtuse ümber. E ( X EX ) 4 Ekstsess: ExX = 4(X ) . Negatiivse ekstsessi korral on jaotustiheduse graafik lamedam ja positiivse ekstsessi korral järsema ekstreemumiga. Ülesanded 1. Üliöpilased õpivad üheksat erinevat ainet. 2. septembril on ettenähtud 4 loengut. Mitu erinevat võimalust on tunniplaani koostamiseks, kui sel päeval peab olema 4 erinevat õppeainet? Vastus: 3024 2. Mitmel viisil on võimalik valmistada kolmevärvilist kolmest horisontaalvöödist koosnevat lippu. Kui üks vööt peab olema
standardhälve- 1 k sx = N - 1 i =1 ni ( x i - x ) 2 variatsioonikordaja- V x = 100 * s x x kvartiilhälve- ülemine kvartiil-alumine kvartiil c) Leian ainult rühmitamata andmetest asümmeetriakordaja (=skew(d)) ja ekstsessi (=kurt(d)). Jaotus on paremale väljaveninud sabaga ning lamedatipuline. Arvutuste tulemused on tabelis 6. Tabel 6. Karakteristikud Rühmita- Rühmi- mata tatud 9 andmed andmed Vaatluste arv 63 63 Rühmade arv 6
mõõtühikutes. Nt mis varieerub rohkem, kas inimese pikkus v kaal. 9. Asümmeetria koefitsient (asümmeetria kordaja) – vasakkaldeline siis on väiksema väärtusega variante rohkem. Paremkaldeline siis on suurema väärtusega variante rohkem. Täiesti sümmeetrilistes ridades on K=0, Paremkaldelistes K väiksem kui 0 ja vasakkaldelistel K suurem kui 0. 10.Ektsessiks – nim tegeliku püstakuse hälbimist normaaljaotuse kõvera suhtes. Positiivse ekstsessi korral on tunnuse väärtuste esinemissageduse kõver teravatipulise, negatiivse ekstsessi korral laugjam kui etaloniks võetaval normaaljaotuse kõveral. Normaaljaotuskõvera ekstsess on 0. 11.Juhuslikuks – nim sündmust, mis teatud tingimuste olemasolu korral võib toimuda ja võib ka mitte toimuda. 12.Kahe sündmuse A JA B summaks – nimetatakse keerulist sündmust, mis seisneb kas ühe või teise või mõlema toimumises. Tähistatakse A+B.
Soo defineerimine: Variable view - soolahtrist Values... - 1=mees, 2=naine - data view - ülevalt view - value labels ette linnuke Kasvavas järjekorras järjestamine: Teed lahtri aktiivseks mida järjestada soovid - ülevalt Data - Sort cases - valid mida soovid sortida - linnuke ascending lahtri ees kindlalt ja OK Mingi väärtuse minimaalse ja maksimaalse väärtuse leidmine, standardhälve, keskmine: Analyze - descriptive statistics - descriptives/frequencies (kui vaja ekstsessi, histogrammi kellukat jn) - valid mille puhul tahad uurida - Options - valid milliseid väärtusi leida tahad ja ok, vastused ilmuvad OutPuti aknasse. Charts all on võimalik kasutada histogrammi joonistamise võimalust. Joonisel olev küsimärk käib osutatud linnukese kohta. Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel. Küsimärk on juurde tehtud, et uurida, kas sellise tabeli koostamine on vajalik. Uue muutuja arvutamine:
mõlemad testid on üsna tundlikud äärmuslike väärtuste ning valimi suuruse suhtes, mistõttu teatud olukordades ei pruugi nende testi alusel tehtud otsustused olla täpsed! Järgnevalt tuleb vaadata Sig.-i (olulisuse tõenäosus). Kui Sig on väiksem kui 0.05, siis ei ole testi(de) kohaselt andmed normaaljaotuslikud. Praktikas aga on omajagu harv normaaljaotustestide põhjal leida normaaljaotuslikkust levinud on asümmeetriakordaja (skewness) ning ekstsessi (kurtosis) vaatamine. Nii K-S kui ka S-W testidel on omad probleemid; üheks neist on liigne tundlikkus äärmuslikele väärtustele ehk erinditele (outliers). Andmeid peetakse normaaljaotuslikult siis, kui nii asümmeetriakordaja kui ka järsakusaste/ekstsess on vahemikus (-0.5;0.5); liberaalsemalt on aga levinud ka vahemike (-1; 1) kasutamine 4) GRUPPIDE KESKMISED JA USALDUSPIIRID Käsklusrida: Analyze - Compare Means Vaatame andmeid ka graafiliselt
asümmeetria kordaja A. Sümmeetrilise jaotuse korral on asümmmetria kordaja null. Excelis on asümmeetria kordaja leidmiseks funktsioon SKEW. 8 Jaotuse järskust ehk püstakust iseloomustab juhusliku suuruse ekstsess E (kurtosis) Ekstsess on null normaaljotuse korral. Kui püstakus on suurem, on keskkoht on kitsam. Väikese püstakuse korral "sabad" kaovad. Excelis on asümmeetria kordaja leidmiseks funktsioon KURT. Asümmeetriakordaja ja ekstsessi väärtusi on mõtet arvutada vaid suurte valimite korral (N > 50). Uuritavat jaotust kirjeldavate statistiliste parameetrite leidmiseks võib Excelis kasutada ka andmeanalüüsi vahendit Descriptive Statistics (Tools, Data Analysis). Näiteks on toodud ühe poe läbimüüki kirjeldava andmekogumi statistilised parameetrid, saadud vastava Exceli andmeanalüüsivahendiga 9 3 VALIKUURINGUD 3.1 Valimid ja nende moodustamine
x analüütiline rühmitamine, eksperthinnangud, graafiline analüüs x tegurite arvu ja mõõtühikute määramine x kvalitatiivsete (atributiivsete) näitajate kodeerimine kvantitatiivseteks. 3. Uuritava kogumi kvantitatiivne ja kvalitatiivne analüüs (lähteandmete esmane statistiline töötlus) x leitakse statistilised parameetrid ( keskmine, standardhälve, variatsioonikoefitsient, asümmeetria ja ekstsessi koefitsiendid jm) x lähteandmete homogeensuse hindamine ja anomaalsete elimineerimine x andmete vastavus normaaljaotusele x valimi vea hindamine ja kogumi suurendamise võimalused. 4. Resultaatnäitajate ja tegurite korrelatsioonanalüüs x korrelatsioonimaatriksite (lineaarse ja mittelineaarse) analüüs x determinatsioonikoefitsientide hindamine Determinatsioonikordaja iseloomustab mudeli headust.