Majandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
Selle tõestuseks
jagame vaadeldavad arvuvahemikud sündmustega: A, et X≤a; B, et a
funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus on juhusliku suuruse asendikarakteristik, mille abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta. Keskväärtuse geomeetriline tõlgendus: jaotuse raskuskeskme projektsioon x-teljele. Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile nim detsiilideks, 25%kordseid protsentiile nim kvartiilideks, 50% korral mediaaniks. Mediaan on
mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud
valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X).
kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle
tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima
väärtuse vahel
dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2=
standardhälve - Standardhälve on ruutjuur dispersioonist
7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
x vastavusse tõenäosuse, et Xx. Tähistame F-ga
F(x )=P(Xx ) tõenäosus, et JS kuulub paljude väärtuste korral
0 0
teatavasse piirkonda P(a
opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus(asendikarakteristik) iseloomustab juhusliku suuruse jaotuse keskkoha asukohta. Keskväärtuse geomeetriline tõlgendus: jaotus raskuskeskme projektsioon x-teljele Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. dispersioon on standardhälve ruudus ja standardhälve on vastavalt dispersiooni ruutjuur. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile
rühmitades võimalikud väärtused klassidesse. Näiteks kaalukategooriad maadlusvõistlustel. Tulemuste statistilise töötlemisvõimaluste laiendamise huvides kasutatakse ka ordinaalskaala kodeerimist arvuliseks (kvantitatiivseks) tunnuseks (näiteks keskmise hinde leidmiseks). Nii saadud statistiliste tulemuste tõlgendamisel tuleb olla ettevaatlik (ei või näiteks väita, et keskmine hinne 4,0 on kaks korda parem kui 2,0). Üldkogum ja valim Üldkogum on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi. Valim on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Nõuded valimile: 1. Valimi maht peab olema küllalt suur. 2. igal üldkogumi indiviidil peab olema võrdne võimalus sattuda valimisse. Neid kaht nõuet rahuldavat valimit nimetatakse representatiivseks e. esindavaks.
Binoomjaotus: DJS jaotus, mille korral jaotustabel defineeritakse valemiga (Bernoulli valem) P ( X = k ) = C nk p k (1 - p ) n-k , k=0,1,...,n. Juhuslik suurus X on sündmuse A toimumiste arv n sõltumatul katsel, kui sündmuse toimumise tõenäosus igal katsel on p. Sündmuse mittetoimumise tõenäosus igal katsel on siis q=1-p. Binoomjaotusega on näiteks praakdetailide arv korduval võtmisel, läbipõlevate pirnide arv. Keskväärtus: EX=np, dispersioon DX=npq, standardhälve npq Poisson'i jaotus: DJS jaotus, mille korral jaotustabel defineeritakse valemiga k - P( X = k ) = e , k=0,1,... k! Sarnaselt binoomjaotusele juhuslik suurus tekib n katsel toimuvast k sündmusest, lisaks n ja p0. Näiteks kirjavigade arv masinakirjutajal/sekretäril. Rikete arv seadmes. Tööõnnetuste arv. Keskväärtus: EX= , dispersioon DX= . Poissoni piirteoreem: kui katste arv n ja p0 nii, et np= , siis koondub k -
( ) = . A – vahemikus (t;t+τ) toimub vähemalt 1 sündmus. Ā – vahemikus (t;t+τ) toimub 0 sündmust. 1 = P(A) + P(Ā) = P(T≤τ) + P(T>τ) = P(T≤τ) + P(X=0) = P(T≤τ) + e-ντ => F(τ) = P(T≤τ) = 1 – e-ντ. f(τ) = F’(τ) = νe-ντ, kui τ 0; 0, kui τ<0. Saadud eksponentjaotus näitabki sündmuste vahelist aega lihtsa sündmuste voo korral. 21. Normaaljaotusega juhusliku suuruse keskväärtuse ja dispersiooni leidmine. Tihedusfunktsioon on ette antud Keskväärtus: ( ) = ( )= ∫ = [ = + ]= ∫ ( + ) = ∫ + √ √ √ = ∫ = √
Seega usaldustõenäosus p = 1 – α = 1 – 0,1 = 0,9 ehk 90% Vabadusastmete arv k = n-1 = 24 2.1 Keskväärtuse usaldusvahemikud: t 0,95 ( 24 )=t ∝ ( k )=1,7109 1− 2 s 28,53 ∆ μ= ∙ t 0,95 ( 24 )= ∙1,7109=9,76 √N √25 x alumine=´x −μ=44,84−9,76=35,08 x ülemine= x´ + μ=44,84 +9,76=54,6 Keskväärtuse 90%-line usalduspiirkond on (35,08 ; 54,6) P (35,08< μ <54,6 )=0,90 2.2 Dispersiooni usaldusvahemikud: Leian χ 2 - jaotuse täiendkvantiilid. ( 1− p ) χ 2 ( 2 ) ; n−1 → chiinv ( 0,05 ; 24 )=36,415 χ2 ( ( 1+2 p ) ; n−1) → chiinv ( 0,95 ; 24) =13,848 k ∙ σ^ 2 24 ∙ 814,056 σ 2alumine = = =536,52 36,415
vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi Assümeetria - Asümmeetria on jaotuskõvera maksimumi kõrvalekaldumine sümmeetriateljest. Kui jaotuskõvera maksimum (mood) on sümmeetriateljest (mediaan) paremal pool, on tegemist on negatiivse ehk vasakkaldelise asümmeetriaga. Kui maksimum on sümmeetriateljest vasakul, on tegemist positiivse ehk paremkaldelise asümmeetriaga
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1 8 8 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5
^y |¿=1,2, s ¿ s¿ x ^y|¿ ^y |( x=1 )=2,9, ^y |( x=3 ) =1,6, ^y |( x=5 )=2,8 ^y| x =t 0,975 ( 6 ) s ¿ Osa A 1. Keskväärtuse hinnangu ´x leidsin valimi elementide aritmeetilise keskmise arvutamisega. Dispersiooni hinnanguks s2 on katsetulemuste hälvete ruutude summa jagatud N-1-ga, kus N on valimi maht; standardhälve s on ruutjuur dispersioonist. Mediaan oli elementide järjestatud rea 13. element ning haare on suurima ja väikseima elemendi vahe. 2. Eeldades, et üldkogum on normaaljaotusega ja et =0,10, leidsin t-jaotuse tabelist kvantiili t1-/2(N-1) ning keskväärtuse poollaiuse arvutasin, korrutades kvantiili standardhälbe hinnanguga ning jagades korrutise ruutjuurega valimi mahust.
Sündmuste väli P(A/B) = P(A), P(AB) = P(A)P(B) 3. Sündmuste algebralised operatsioonid. Sündmuste summa ja korrutis. C = F D> C =F D> F> 4. Juhuslik suurus X = X(e) 5. Jaotusseadus ja selle esitamine. Jaotusfunktsioon F(x) ja tema põhiomadused. Väärtus x ja tema tõenäosus p. F(x) juhuslikule suurusele X on tõenäosus, et X võtab väärtuse vähem kui antud arvul x. F(x) = P(Xx). P(x´ X x´´) = F(x´´) - F(x´); 0 F(x) 1; F(x1) F(x2) 6. Tõenäosuse tihedusfunktsioon f(x) ja tema põhiomadused. f(x) = lim P(xXx+x) / x; F(x) = f(x) dx x0 f(x) 0; f ( x ) dx 1 7. Binomiaalne jaotus. PXn =m= Cmn pmqn-m , kus P( F) = 1- p = q ja m = 0, 1, ...., n Sündmuste järgnevus ei= A F A F A, tagasipanekuga skeem 8. Hüpergeomeetriline jaotus PN,M n, m = CmM Cn-mN-M / CnN. Tagasipanekuta skeem 9. Poisson jaotus Pt(X=x) = (axe-a) / x! = fP(x,a) 10. Ühtlane (ristkülik) jaotus f(x) = 1/(b-a)}, kui a x b 11
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
A – vahemikus (t;t+τ) toimub vähemalt 1 sündmus. Ā k! – vahemikus (t;t+τ) toimub 0 sündmust. 1 = P(A) + P(Ā) = P(T≤τ) + P(T>τ) = P(T≤τ) + P(X=0) = P(T≤τ) + e-ντ => F(τ) = P(T≤τ) = 1 – e-ντ. f(τ) = F’(τ) = νe-ντ, kui τ≥0; 0, kui τ<0. Saadud eksponentjaotus näitabki sündmuste vahelist aega lihtsa sündmuste voo korral. 20. Normaaljaotusega juhusliku suuruse keskväärtuse ja dispersiooni leidmine. Tihedusfunktsioon on ette antud Keskväärtus: [ ] x−μ u= 2 ∞ − ( x−μ ) ∞ −u 2
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 3 9 7 4 7 7 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: 3.2.2011 Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 91 96 79 95 10 39 69 38 40 5 0 96 24 22 75 79 82 86 91 74 75 25 12 71 85 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 2,8 2,2 4,0 1,1 5,1 yi 6,9 6,1 9,8 7,2 15,3 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5)
Statistika teooria I 1. Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare. Esitada definitsioonid ja osata antud andmeväärtuste puhul neid mõisteid rakendada N x + x 2 + ... + x N xi Aritmeetiline keskmine: µ = 1 = i =1 N N N-üldkogumi maht Aritmeetilise keskmise erijuht on kaalutud keskmine:
maht ja k mudeli parameetrite arv) ja olulisuse nivool a2, siis saab vastu võtta sisuka (alternatiivse hüpoteesi) H1, mille kohaselt parameetri hinnang erineb statistiliselt oluliselt nullist (või cst). Kui hüpoteesi H1 vastu võtta ei saa (jäädakse 0hüpoteesi juurde), siis etteantud olulisuse nivool puudub statistiliselt oluline seos muutujate Y ja X vahel . 38. Standardhälve so ruutjuur dispersioonist. Mida suurem on standardhälve, seda suurem on tunnuse kui juhusliku suuruse hajuvus. Seda suurem on tunnuse erinevus keskväärtusest. 39. Statistilistel seostel baseeruv modelleerimine, hõlmab üldiselt üksikule lähenemist. Lähenemine kehtib aegridade jaoks. Teooriat ei püüta ümber lükata, vaid analüüsitakse teooria ja andmete kooskõla. 40. Tjaotus, lk 2728. Üks kasutatavamaid jaotusi
57 15 11.77 10.84 10 7.73 6.59 5 3.67 1.84 0 0-14 15-29 30-44 45-59 60-74 75-89 90-104 ni´ Tihedusfunktsioon 0.02 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.010 0 0 0 0 0-14 15-29 30-44 45-59 60-74 75-89 90-104
Osa A Valim A mahuga N=25 variatsioonirida: 69 10 76 79 84 41 15 87 44 49 38 16 58 7 24 19 82 1 40 38 35 87 51 1 69 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x = 44,80 Dispersioon: Excel: VAR Sx² = 814,417 Standardhälve: Excel: STDEV Sx = 28,538 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Excel: MEDIAN Me = 41 Haare: R = 87 1 = 86 2
................................................................ 9 2. Tõeline väärtus ja mõõdis. Viga ja määramatus ........................................................................ 11 3. Mõõtetulemus kui juhuslik suurus ............................................................................................. 13 3.1. Histogramm ....................................................................................................................... 14 3.2. Dispersioon ja standardhälve............................................................................................. 16 3.3. Ekse ................................................................................................................................... 17 3.4. Aritmeetilise keskmise standardhälve ja Atüüpi määramatus ......................................... 18 3.5. Usaldusnivoo leidmine histogrammi alusel....................................................................... 19 4
vea mõistet) 14. Mõõtemääramatus: allikad, käsitlus, hindamise meetodid Mõõtemääramatus on mõõtetulemusega seonduvparameeter, mis iseloomustab mõõtesuurusele põhjendatud omistavate väärtuste tõenäosust. Praktika näitab, et ühtki mõõtmist ei saa teha absoluutselt täpselt. Ja seda vahemikku, kuhu mõõdetava suuruse tõeline väärtus jääb, nimetataksegi mõõtemääramatuseks. Parameetriks võib olla näiteks standardhälve, mida nimetatakse standardmääramatuseks. Mõõtemääramatus sisaldab üldjuhul palju omponente. Mõnda neist saab hinnata määramatuse A-tüüpi(statistilisel viisil) hindamismeetodil mõõdiste seeriate statistilise jaotusega ja iseloomustada standardhälbega. Teisi komponente, mida saab hinnata määramatuse B- tüüpi(muul viisil) hindamismeetodil, saab samuti iseloomustada standardhälvetega, hinnatud tõenäosusjaotuste alusel, mis põhinevad kogemusel või täiendaval infol
1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Jr x i− ´x i ¿2 k N x i−´x i ¿ nr 1 1 -43,28 1873,158 2 2 -42,28 1787,598 3 5 -39,28 1542,918 4 14 -30,28 916,8784 5 18 -26,28 690,6384 6 19 -25,28 639,0784 7 25 -19,28 371,7184 8 27 -17,28 298
rohkem) või siis arvutada. Kui Dn on suurem kui Dkr siis jaotus ei ole ühtlane (hüpotees ei pea paika). Kuna graafikult ei ole väga hästi välja näha siis arvutan: DN = max(abs ( Femp ( xi ) - Füht ( xi ))) DN = 0,24 Arvutasin Excelis, kuna seal on korralikud tabelid olemas ning valemit saab otse sisestada (ülemine ongi Excelis kasutatud valem). Näeme, et DN on suurem kui kriitiline lubatav (Dkr ) seega jaotus ei ole ühtlane. 8. Jagada valim viieks võrdse mahuga osaks ... (võttes osaks/rühmaks 1.-5.arvu, 6.-10.arvu, ... , 21.-25.arvu). Osa yi s2 1.-5. 27 1 98 25 56 41, 1381 4 6.-10 39 5 63 71 19 39, 789 4 11
17 62 0,68 0,62 0,06 18 69 0,72 0,69 0,03 19 81 0,76 0,81 0,05 20 85 0,8 0,85 0,05 21 87 0,84 0,87 0,03 22 88 0,88 0,88 0 23 89 0,92 0,89 0,03 24 94 0,96 0,94 0,02 25 94 1 0,94 0,06 8. Jagada valim viieks võrdse mahuga osaks. Kontrollida nii moodustatud rühmade keskväärtuste homogeensushüpoteesi H0: µ1 = µ2 = µ3 = µ4 = µ5 (kasutades dispersioonanalüüsi metoodikat ja võttes olulisuse nivooks = 0.05). Üldine rühmasisene dispersioon: Üldkeskmine: Rühmadevaheline dispersioon: 1 2 3 4 5 Yi Yi- (Yi- dispersio keskv keskv)^2 on 1.-5
punktiirjoontega keskväärtuse hinnangu usaldatavuspiirkond l = 0.95korral. Siit on näha, et väikese katsete arvu tõttu saame keskväärtuste usaldatavuspiirkonnaks suhteliselt pika vahemiku teljel. See näitab, et punktide hulga sama trendi kohaselt kasvades võib keskväärtuse hinnang omandada suhteliselt erinevaid väärtusi. 3. Leian X dispersiooni hinnangu usalduspiirkonna = 0.95 1 = 0.975 2 1 = 0.025 2 Hii-ruut-jaotuse kvantiil kohal (n-1,(1-)/2) _1 24.736 Hii-ruut-jaotuse kvantiil kohal (n-1,(1+)/2) _2 5.009 2 n 1 . s_x usaldatavus_s_x_1 _1 usaldatavus_s_x_1 = 18.133 2 n 1 . s_x usaldatavus_s_x_2 _2 usaldatavus_s_x_2 = 40.297 P(18.133 < DX < 40.297) = 0.95 4. Leian Y dispersiooni hinnangu usalduspiirkonna 2
3) normeeritus 4) lõigu tõenäosus Juhusliku suuruse arvkarakteristikud Juhul kui pole vaja teada juhusliku suuruse omadusi täielikult/ammendavalt, vaid piisab juhusliku suuruse põhiomaduste teadmisest, võib neid juhusliku suuruse põhiomadusi kirjeldada juhusliku suuruse arvkarakteristikute abil: 1) Keskväärtus: enim kasutatav asendikarakteristik. Selle abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta 2) Dispersioon ja standardhälve: on enimkasutatavad arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks (keskväärtuse suhtes). Dispersioon on standardhälve ruudus ja standardhälve on vastavalt dispersiooni ruutjuur. 3) Kvantiilid: Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p (seejuures 0p1): P(X < xp) = F(xp) = p 4) Mediaan: oluliseim kvantiil, mediaan on jaotuse keskpunktiks tõenäosuse järgi: mediaanist nii
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Valim mahuga N = 25 jrk ni xi ni * xi ni * 2088, 1 1 2 2 2089,25 49 1909, 2 1 4 4 1910,42 69 1656, 3 1 7 7 1657,17 49 1576, 4 1 8 8 1576,75 09
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
y^ | x = 2, 4469 1,12 = 2, 73 P((7, 06 - 2, 73) < µ y ( x) < (7,06 + 2, 73)) = 1 - 0, 05 P(4,33 < µ y ( x) < 9, 79) = 0,95 11.6 Regressioonimudeli graafik koos katsepunktidega KOKKUVÕTE Rakendusstatistika arvestusharjutuses AGT-1 leidsin erinevaid valimit iseloomustavaid parameetreid, kontrollisin hüpoteese ja esitasin mitmeid graafikuid. Osa A Ülesandes 1 on toodud põhilised valimit A iseloomutavad arvkarakteristikud: keskväärtus 46,2, dispersioon 867,9, standardhälve 29,46. Samuti on välja toodud mediaan 46 (valimi keskelement) ja haare 99 (valimi suurima ja vähima elemendi vahe). Ülesandes 2 on leitud keskväärtuse ja dispersiooni usaldusvahemikud, ehk piirkonnad, kus normaaljaotuse puhul paiknevad keskväärtus ja dispersioon 90% juhtudest. Keskväärtus asub vahemikus 35,91<<56,49 ja dispersioon vahemikus 572,0<2<1504,2. Ülesandes 3 on kontrollitud kahte hüpoteesipaari vastavalt keskväärtuse ja dispersiooni kohta.
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 12 6 11 62 20 62 7 98 10 1 52 27 80 25 94 46 38 74 95 33 71 15 96 4 87 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=45, 04 Dispersioon: Excel: VAR Sx²=1164,123 Standardhälve: Sx=34,1193 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=38 Haare: R=97 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exc
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valimi A mahuga N=25 variatsioonirida: 75 10 79 32 32 0 68 94 96 2 99 53 31 15 48 47 29 70 7 75 28 30 42 47 46 1.Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: Excel: AVERAGE x=46,20 Dispersioon: Excel: VAR Sx²=867,9167 Standardhälve: Sx=29,46 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me=46 Haare: R=99 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks = 0.10). Keskväärtuse usaldusvahemik: = 0,10 t0,1; 24= 1,711 (Studenti tabelist) Dispersiooni usaldusvahemik: = 0,10 ja (leitud Exceli
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................