1 9 10,8 % 2 22 26,5 % 3 25 30 % 4 10 12 % 5 5 6% 6 9 10,8 % 8 3 3,6 % 7. Aritmeetiline keskmine = = 3,27 = 3,27 8. Standard hälve = 1,69 Enamik tunnuseid jääb [3,27 1,69 ; 3,27 + 1,69] = [1,58 ; 4,96] 9. Kvartiilid Ülemine kvartiil = 4 Alumine kvartiil = 2 10. Varjatsioonkordaja v= v = 0,52 11. Diagramm
3.1 Aritmeetiline keskmine n x 1 +x 2 +. ..+x n 1 n x i = x= n i=1 3.2 Mediaan Me X = x0,5 Mediaan on variatsioonrea keskmine liige. Kui liikmeid on paaritu arv, siis keskmine liige. Kui liik 3.3 Kvartiilid Kv - alumine kvartiil ehk tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioon Kv - ülemine kvartiil ehk tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonr Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendik
KOLLOKVIUM 3 20. mai 2012. a. 14:25 1.Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare, kovariatsioon, korrelatsioonikordaja. Definitsioonid ja arvutamine. Aritmeetiline keskmine: AVERAGE Mediaan: MEDIAN Kui N is paaritu, siis on mediaan järjestatud statistilise rea ehk variatsioonrea keskmine liige. Kui N on paaris, siis on mediaan variatsioonrea kahe keskmise liikme poolsumma. Kvartiilid: QUARTILE 25-protsentiili nimetatakse esimeseks kvartiiliks.
M 25-34 11451,13076 22707,036 131128395,7 515609483,9 260021238,4 M 25-34 6165,83562 24843,54 38017528,89 617201479,7 153181183,9 M 25-34 11890,29348 26364,6 141379079 695092133,2 313482831,5 2. Leian toidukulude ja eluaseme kulude aritmeetilised keskmised, mediaanid, kvartiilid, minimaalne ja maksimaalne väärtus, ja standrardhälve selles valimis. x̅= 10389,5525 y̅= 7800,824171 MeX= 9899,71287 MeY= 5779,0024 Toidukulude haare= 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 17019,29821 Eluaseme kulude haare = 𝑦𝑚𝑎𝑥 − 𝑦𝑚𝑖𝑛 = 25896,552 Kvartiilid X Keskmine kvartiil Q= 9899,71287
Sagedustabel- võtab andmebaasist kokku mitmel objektil esineb antud väärtus ehk esitab vastava sageduse Diagramm- andmete esitamise graafiline viis 2) Asendit kirjeldavad Mood- tunnuse kõige enam esinev väärtus Mediaan- tunnuse väärtus, mille väiksemaid ja suuremaid väärtusi on võrdne arv Aritmeetiline keskmine- arvusuuruste summa jagatis nende suuruste koguarvuga 3) Hajuvust iseloomustavad Variatsiooni ulatus- tunnuse suurim ja vähim väärtus Kvartiilid- tunnuse väärtused variatsioonireas, mis jagavad variatsioonirea neljaks ligikaudseks võrdseks osaks Dispersioon- hälvete ruutude keskväärtus Standardhälve-iseloomustab tunnuse hajuvust. Mida suurem see on, seda suurem on hajuvus. Keskmine hälve- hälvete aritmeetiline keskmine Variatsioonireakordaja- standardhälbe ja keskväärtuse suhe. Esitatakse tavaliselt protsentides. 4)Tunnused a) arvtunnused ehk kvantitatiivsed tunnused
Mirjam hall eeskujulik 37 49 Nimi Silmade värv Käitumishinne Jalatsi suurusnr Kaal 5 Suurte andmehulkade puhul on kasulik vaatlusandmed grupeerida 6 7 Suuruse järgi järjestatud eksamitulemused 8 9 Mediaan jagab vaatlusandmed kahte võrdsesse ossa KVARTIILID jaotavad andmestiku nelja võrdsesse ossa, igaühesse 25% 10 MOOD Mood on variatsioonireas kõige sagedamini esinev liige, see väärtus, mille sagedus on kõige suurem Tabelarvutusprogrammis MS Excel on moodi leidmiseks funktsioon MODE. 11 12 13 14 15
kasvavas või kahanevas järjekorras. Sagedustabeli esimeses reas on tunnus x, teises sagedus f. Jaotustabeli esimeses reas on tunnus x, teises suhteline sagedus W. Jaotushulknurk e. jaotuspolügoon on jaotustabelile vastav sirglõikdiagramm. Statistilise vahemiku e. klassi optimaalse arvu määrab N . Jooniseks saadakse tulpidagramm e. histogramm. Karakteristikud jagunevad kohakarakteristikuteks (keskmine, mediaan, mood) ja hajuvuse karakteristikuteks (muutumispiirkond, kvartiilid, hälve, dispersioon, variatsioonikordaja). Aritmeetiline keskmine x on tunnuse kõigi väärtuste summa ja väärtuste (objektide) arvu jagatis. Mood Mo on tunnuse kõige sagedamini esinev väärtus. Moode võib olla ka rohkem kui üks. Kui kõik väärtused on võrdsed, siis mood puudub. Mediaan Me on tunnuse väärtus, millest variatsioonireas jääb vasakule ja paremale võrdne arv liikmeid.
1 variatsioonreas 25% ( ). Tähis Kv . 4 Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on 1 variatsoonnreas 25% ( ). Tähis Kv . 4 Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendikeskmised, mis iseloomustavad tunnuse paiknevust. Alumise ja ülemise kvartiili vahele jäävad pooled tunnuse väärtustest. Kvartiilide erinevus näitab tunnuse hajuvust (st kvartiilihaare on ühtlasi hajuvuse karakteristikuks) . Vahel kasutatakse statistikas ka detsiile. Detsiilide abil jaotatakse variatsioonrida kümneks osaks
Ülesanne 3 Töölehel Personal on mingi ettevõtte töötajate (osaline) nimekiri. Arvutada iga töötaja vanus (täisaastates). Leida töötajate sünnipäevad jooksval aastal ja sünnipäev Arvutada iga ameti keskmine palk. Leida, mitu protsenti moodustab iga töötaja palk tema ameti ke Leida iga osakonna töötajate arv ja palkade summa. Arvutada, mitu protsenti moodustab iga osako Leida palkade mediaan (asendikeskmine) ja kvartiilid ning mitu inimest saab igast leitud väärtuses Viitamisvariandid (viimane nr) NB! Selle ülesande juures kasutage viitamisel lahtritele ainult 123 231 321 132 312 213 132 213 321 213 Ül. 1 variandid (eelviimane nr) Leida valemi(te) abil, mitmel Eesti Keskerakonna fraktsiooni liikmel on kogu nimekirjas unikaalsed Leida valemi(te) abil, mitmel Eesti Keskerakonna fraktsiooni liikmel on mitteunikaalsed initsiaalid (n
Pidev juurdekasv: K=k(1+r/m)astmel mt, m-intresse arvestatakse m korda aastas, Intresside pideva juurdearvestusemeetodi korral lõppkapital: K(t)=ke astmel rt, k-algkapital, r- aastane intressimäär, t- arvestatavate aastate arv. Pidevat kasvu kirjeldab funktsioon: y(x)=y0e astmel kx, Y0 ja k on parameetrid, Suhteline sagedus: pi=fi/f (kõik f-id kokku) Aritmeetiline keskmine: x(kriips)= x1+x2+....xn/N N-kogumi maht, Kaalutud aritmeetiline keskmine: x=f1x1+f2x2+fnxn/fi (kõik fi-d kokku), Kvartiilid: kui jaotada rida 4 võrdseks osaks (Q), Mood on variatsioonireas kõige sagedamini esinev number (Mo), Harmooniline keskmine: xharm=n/1/x1*1/x2..., Kaalutud harmooniline keskmine: xharm=f1+f2+f3/f1/x1+f2/x2..., Kaalutud ruutkeskmine: xrk=x1 ruudus*f1+x2 ruudus*f2/fi, Variatsioonamplituud: X=x max-x min, Dispersioon e. Keskmine ruuthälve: s ruudus=(x1- x(keskmine)ruudus+(x2-x)ruudus/n-1, Standardhälve: s=ruutjuur(x1-x)ruudus*f1...../fi summa, Variatsioonikoefitsent: on standardhälbe ja
329 2 2534 3368,888 128,102 55,56386 7186,19 1062,33 0 8070,120 3401,70 2321,692 37 883 46 63 6 82 330 2 2534 7744,091 0 0 968,954 1602,02 304,075 0 2195,42 0 03 88 429 2 4 2. Aritmeetilied keskmised, mediaanid, kvartiilid, minimaalne ja maksimaalne väärtus, standarthälve. V03C V34C Keskmine 10920,1 6197,09 4 Mediaan 9976,65 5798,32 Kvartiil (alumine) 7392,17 4205,52 Kvartiil (keskmine) 9976,65 5798,32 Kvartiil (ülemine) 13500,2 7510,58 9
Keskväärtus Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. _ Tunnuse keskväärtus: x = 56,64 Mood Mood on tunnuse kõige sagedamini esinev väärtus. Mo= 54 Mediaan Mediaan on arv, millest suuremaid ja väiksemaid väärtusi on variatsoonreas ühepalju. Me= 55 Kvartiilid Alumine kvartiil on tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas 25%. Kv= 52 Ülemine kvartiil on tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsoonreas 25%. _ Kv= 62 Standarthälve Standardhälve on ruutjuur dispersioonist. Mõõdetava suuruse standardhälbe ühikuks on selle sama mõõdetava suuruse ühik. = 6,75 Max-Min= 80 42= 38
selle poisi järjekorranumbrit, kellest paremale jääb 4 poissi selle poisi järjekorranumbrit, kellest vasemale jääb 75% kogu reast selle poisi pikkust, kellest vasemale jääb 75% kogu reast selle poisi pikkust, kellest vasemale jääb 3 poissi selle poisi pikkust, kellest paremale jääb 75% kogu reast Kvartiilid jagavad rea neljaks võrdseks osaks. Kui koolipoisid olid järjestatud pikkuse järgi kasvavalt (kõige lühem alguses ja kõige pikem lõpus), siis kolmas kvartiil näitab selle poisi pikkust , kellest vasemale jääb 75% või paremale 25% kogu reast. The correct answer is: selle poisi pikkust, kellest vasemale jääb 75% kogu reast,
1) – paiknemise karakteristikud ehk keskmised ja 2) – hajuvuse karakteristikud) 16. Paiknemise karateristikud – annavad informatsiooni tunnuse väärtuste paiknemise kohta arvteljel ja iseloomustavad tunnust keskmise väärtuse seisukohalt. (aritmeetiline keskmine, mediaan, mood) 17. Hajuvuse karakteristikud – näitavad, mil määral erinevad tunnuse väärtused üksteisest, hajuvad keskmise ümber. (kvartiilid, dispersioon, standardhälve, variatsioonikordaja) 18. Aritmeetiline (kaalutud) keskmine – keskväärtus – tunnuse kõigi väärtuste summa ja kogumi mahu (objektide arvu) jagatis. a1 a2 ... a N 1 N x N N a i 1 i
K.Kiviste kodulehte (Kiviste K., 2009) ja A. Kiviste raamatut (Kiviste A., 2007). Töö eesmärgiks oli antud proovitüki andmete rühmitamine ja analüüs kasutades selleks MS Exceli keskkonda ning statistilise analüüsi metoodikat ning valemeid. Töös on esitatud proovitüki üldiseloomustus, tunnuste liigid, koostatud risttabel, rühmitatud andmed enamuspuuliigi keskmise diameetri järgi, esitatud jaotushistogramm ning jaotusfunktsiooni graafik, leitud kvantiilid ja kvartiilid ning esitatud põhilised karakteristikud. 3 1. Proovitüki üldiseloomustus Proovitüki 710 kvartaliks on RO203, eralduse number on 9, kasvukohatüübiks on jõnesekapsa-mustika. Peapuuligiks on mänd, peapuuliigi vanuseks on 65 aastat. Proovitüki raadius 1 rinde puude jaoks on 25 cm, raadius 2 rinde puude jaoks on 10 cm. Reljeef on lainjas, mikroreljeef on matlik. Andmed mõõdeti 1. Juunil 2002. aastal. 2. Tunnuste liigid
Nominaalskaala =/≠ Ordinaalskaala =/≠ ; > Intervallskaala =/≠ ; > ; +/− Suhteskaala =/≠ ; > ; +/− ; ×/÷ 2 Ühe tunnuse analüüs 2.1 Kvantiilid - kirjuta välja kvartiilide 1,2 ja 3 väärtused Kvantiilid on korrastatud statistilise rea liikmed, mis jagavad rea n-ks võrdse liikmete arvuga osaks. Nt kvartiilid on 25%, 50% ja 75%. 2.2 Millised on keskmised Mahukeskmised: Aritmeetiline kekmine Harmooniline keskmine Astmekeskmine Geomeetriline keskmine Asendikeskmised: 3 / 10 Mood Mediaan Kvantiilid 2.3 Millised on variatsiooninäitarvud Variatsiooniulatus Keskmine lineaarhälve Dispersioon Standardhälve Kvartiilhälve 2.4 Mis on mood?
2. Konstant tuuakse dispersiooni märgi ette koos ruutu tõstmisega 3. Sõltumatute JS summa dispersioon on võrdne dispersioonide summaga 4. Dispersiooni korrutis on võrdne positiivse ja negatiivse väljatuleku tõenäosuste korrutisega. 22. Momendid. Algmomendid Moment on variandi individuaalväärtuse ja määratletud väärtuse keskmine erinevus mingis astmes. Algmomendid 23. Momendid. Keskmomendid 24. Momente tootev (genereeriv) funktsioon 25. Mediaan, mood, kvartiilid, detsiilid Mediaan, piir millest paremal ja vasakul asub JS tõenäosusega 0,5. Mood, tihedusfunktsiooni max koht. Kvartiil, jaotab tõenäosusvälja neljaks võrdseks osaks 26. Asümmeetria ja ektsessi 29. Tsebõsevi seos ja teoreem. Moivre-Laplace lokaalne ja integraalteoreem Annab võimaluse hinnata tõenäosust, et hälve JS X või mat ootusest on suurem/väiksem kui arv 30. Valim. Empiiriline jaotusfunktsioon Valimi maht n on kogumi tulemus, n sõltumatut vaatlust.
mistahes liikme väärtuses. (aritmeetiline keskmine- saab kasutada vaid intervallskaala korral, võimaldab võrrelda üksikväärtuste suurusi aritmeetilise keskmisega, võimaldab arvutada teisi statistilisi nähtusi, harmooniline keskmine, geomeetriline keskmine, ruutkeskmine, kronoloogiline keskmine). Asendi ehk struktuurikeskmised reageerivad ainult niisugustele muutustele rea üksikliikmete väärtuses, millega kaasneb olulisi nihkeid ka rea struktuuris. (mood, mediaan, kvartiilid). Mediaan- jaotuse keskmine liige, millest mõlemale poole jääb võrdne arv elemente. Jaotab järjestatud statistilise rea kaheks. (võib kasutada järjestiskaala ja intervallskaala puhul, ei ole tundlik ekstremaalsetele väärtustele). Mood- Variatsioonireas kõige sagedamini esinev liige. (nt keskmised hinnad maailmaturul jne). Kui kogumi liikmetel ühe ja sama tunnuse arvväärtused erinevad siis tema väärtus varieerub.
(2 klõpsu graafikul) Arvjoonis 2 tunnust Mediaan Jaotuse keskel paiknev väärtus, mis jagab vaatlustulemused kahte ossa nii, et pooled vaatlustulemused on meidiaanist väiksemad ja pooled suuremad. Aritmeetiline keskmine Keskväärtus Mood Väärtus, mis esines teistest väärtustest kõige rohkem Hajuvus ehk variatiivsus Kui suur on punktirea ulatus, nii saab leida kui laiali valgunud ehk hajus on meie vastuste rida. Kvartiilid Q3-Q1 Kvartiilide vahe määrab ära vahemiku, milles asuvad pooled valimi keskmisele lähedamal asuvad väärtused ning ulatuse ja kvartiilide vahe oavaheline võrdlemine annab meile pildi sellest, kui õrd tugev on jaotuses keskele koondumise tendents. Standardhälve Võtab arvesse kõik vaatlustulemused, võimaldab meil öelda, kui palju üksikud tulemused grupi aritmeetilisest keskmisest erinevad.
väärtusest. Näiteks kui on kaks aktsiaportfelli, mis mõlemad on keskmiselt teeninud kasumit 10 % aastas ning kui portfelli A standardhälve on väiksem kui portfelli B oma, siis see tähendab, et esimene portfell on olnud stabiilsem ning vastupidiselt teise portfelli väärtus on rohkem kõikunud. Suurem kõikuvus viitab suuremale riskisusele. Seega kui portfellide tootlus on sama, siis tasub eelistada väiksema standarhälbega portfelli A. Kvartiilid on kirjeldavas statistikas tunnuse väärtused variatsioonireal, mis jagavad variatsioonirea neljaks ligikaudu võrdseks osaks.Keskmine kvartiil ehk 2. kvartiil e. 50- protsentiil e 0,5 kvantiil ehk mediaan on tunnuse väärtus, millest suuremaid ja väiksemaid tunnuseid on variatsioonireas ligikaudu võrdselt. Alumine kvartiil e. 1. kvartiil e. 25- protsentiil ehk 0,25 kvantiil (lühendid LQ ja Q1) on tunnuse väärtus, millest väiksemaid või võrdseid tunnuseid on ligikaudu 25%
..-le - valid nt ainult meeste tulemuste saamiseks vasakult Sugu, siis = ja 1 (sest 1=mees ja tahan ainult meeste tulemusi) ja continue. Kui valid samas aknas (Select cases) alumisest osast Filter Out Unselected cases, siis on naiste andmed jätkuvalt näha aga nendega ei arvestata, kui valid Delete unselected cases, siis kustutab süsteem kõikide naiste andmed ära. Asümmeetriakordaja = skewness (Asümmeetriakordaja iseloomustab jaotuse asümmeetriat keskmise suhtes.) Kvartiilid = quartiles (Kvartiilid jaotavad rea neljaks võrdsete liikmete arvuga osaks. Kvartiile on kolm: esimene ehk alumine kvartiil Q1, teine kvartiil Q2, mis on võrdne mediaaniga ja kolmas ehk ülemine kvartiil Q3. Alumiseks kvartiiliks nimetatakse tunnuse väärtust, millest väiksemaid (või võrdseid) liikmeid on variatsioonreas ¼ ehk 25%. Ülemiseks kvartiiliks nimetatakse tunnuse väärtust, millest suuremaid (või võrdseid) liikmeid on variatsioonreas ¼ ehk 25%
Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks. Kvantiilid- jagunevad alumine kvartiil- punkt, millest väiksemaid väärtusi on kogumis üks neljandik osa. Ülemine kvartiil- punkt millest suuremaid väärtusi on kogumis üks neljandik osa. Kvantiilid jagavad tunnuse väärtuste järjestatud rea teatud arvuks võrdseteks osadeks. Sagedamini kasutatavad kvantiilid on detsiilid, kvintiilid ja kvartiilid. Keskmine- õenäoliselt kõige sagedamini kasutatav näitaja statistilisel andmete analüüsis on aritmeetiline keskmine ehk keskväärtus. Selle saamiseks liidetakse kokku kõigi vastajate antud tunnuste väärtused ja jagatakse saadud summa vastajate arvuga. Tulemuseks on näitaja, mida võib käsitleda kui tüüpilist või läbilõikelist vastust vaatlusalusele küsimusele. Standardhälve- iseloomustab vastuste hajuvust keskmise ümber
6) Mediaan – korrastatud statistilise rea keskliige (50% liimetest väiksemad ja 50% n 1 2 suuremad). Kui reas on n liiget, siis mediaani järjekorra number on . Kui n on paaritu, siis mediaan on rea konkreetne element, millest kummalegi poole jääb võrdne arv elemente. Kui n on paarisarv, siis mediaan on kahe keskmise liikme poolsumma. Kvartiilid – jagavad statistilise rea neljaks osaks, milles igas on võrdne arv liikmeid. Esimene kvartiil on mediaan rea esimesest poolest; teine on mediaan; kolmas on mediaan rea teisest poolest. Detsiilid – jaotavad statistilise rea kümneks osaks (D1,D2…, D9). Tsentiilid – (ka protsentiilid) jaotavad statistilise rea 100 võrdse liikmete arvuga osaks. 7) Mood – statistilises reas kõige sagedamini korduv tunnuse väärtus. Intervallitud variatsioonireas on moodi leidmine:
60 100 7 10 100 200 9 12 200 500 12 15 Intervalli laiuse saame, kui valimi suurima ja vähima väärtuse vahe jagame valitud intervallide arvuga. Sagedusjaotus näitab kui palju vaatlusi langeb igasse intervalli. Mahukeskmised aritmeetiline keskmine, harmooniline keskmine, geomeetriline keskmine jt. i ( n + 1) ( Qi ) = 4 Asendi- ehk struktuurikeskmised mediaan, mood, kvantiilid (kvartiilid, detsiilid jt) Mood kõige sagedamini esinev liige kogumis Kvartiilid jagavad kogumi neljaks võrdseks osaks, detsiilid 10-ks. Hajuvuskarakteristikud jagunevad: Absoluutsed variatsiooninäitarvud variatsiooniamplituud, keskmine lineaarhälve, dispersioon, standardhälve jt. Suhtelised variatsiooninäitarvud erinevad variatsioonikoefitsiendid Variatsiooniamplituud - Näitab variatsiooni ulatust kogumis (R = X X )
filtreerimine, sünkroniseerimine, interpoleerimine 2) Andmete kirjeldamine – kirjeldav statistika – arvutatakse liigutustegevusele iseloomulikud näitajad Andmete sagedusjaotus – kuidas andmed jaotuvad; normaaljaotus Kirjaldav statistika- keskväärtused: - Aritmeetiline keskmine - Mediaan: jaotuse keskmine liige, millest mõlemale poole jääb 50% elementide koguarvust - Mood: variatsiooniteas kõige sagedamini esinev väärtus - Miinimum - Maksimum - Variatsiooniamplituud (max-min) - Kvartiilid Kirjeldav statistika -variatsiooni tunnused: - Hälve - tunnuse üksikväärtuse erinevus väärtuste aritmeetilisest keskmisest (võib olla neg. või pos.) - Keskmine lineaarhälve – üksikute hälvete absoluutväärtuste keskmine - Dispersioon (VARP)– keskmine ruuthälve ehk ruuthälvete aritmeetiline keskmine - Standard hälve (STDEV) – ruutjuur dispersioonist – mõõtühik sama, mis mõõdetaval parameetril
29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 29 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 31 32 32 32 32 32 32 32 32 32 32 32 32 32 32 33 33 33 33 33 33 33 33 33 33 33 33 34 34 34 34 34 34 34 34 34 34 34 35 35 35 35 35 35 35 35 35 36 36 36 36 36 36 36 36 36 36 37 37 37 38 38 38 38 38 40 40 41 42 43 43 44 47 47 47 48 NÄIDE Ajad, min Kvartiilid 40,5 50 inimese korral mõõdeti kümnest ülesandest koosneva testi sooritamise 25,8 aega. Ajad on toodud veerus F. Leitud on vastava andmekogumi kvartiilid. 48,7 ÜLESANNE 64,1 1. Leia uuesti kvartiilid uuesti veergu F 2
Assümmeetriakordaja: istika funktsioonid kasutage AINULT vastuste kontrollimiseks. utamiste arv oli vastavalt (täitke tühjad lahtrid kasutades funktsiooni RANDBETWEEN(0;9)): 5 6 7 8 9 10 11 9 9 0 1 9 0 0 ng koostage jaotustabel koos tulpdiagrammiga. rtus, mediaan, mood, kvartiilid ja variatsioonikordaja. a variatsioonikordaja põhjal. ide arvutamise meetodiga, mida kasutab Excel (vt. pt. Arvkarakteristikud, slaid nr 21) esimeses kümnendikus; 2) viimases kümnendikus. ahelise paiknevuse järgi teha otsus jaotuse kuju kohta, st otsustada kas antud variatsioonirida on triakordaja abil (arvutage Excel'is funktsiooniga SKEW(...)). as) ning osakondade järgi (töötajate arvud genereerige funktsiooniga RANDBETWEEN(0;15)):
DX 22. Algmomendid x i A k f i mk & A=0; k = MXk, k = 1, 2, .... i f 23. Keskmomendid A= X; k = M(X- X)k 24. Momente tootev (genereeriv) funktsioon Sisaldab endas andmeid kõikidest algmomentidest: m'(0) = MXetX t=0 = MX = 1 mk'(0) = MXetX t=0 = MXk = k 25. Mediaan, mood, kvartiilid, detsiilid Mediaan, piir millest paremal ja vasakul asub JS tõenäosusega 0,5. Mood, tihedusfunktsiooni maksimaalkoht. Kvartiil, jaotab tõenäosusvälja neljaks võrdseks osaks 26. Asümmeetria ja ektsessi koefitsiendid 3 3& (4 4) 3 27. Kriitilised piirid Vasakpoolne kriitiline piir, millest vasakul JS asumise tõenäosus . Parempoolne kr piir. Kahepoolne kriitiline piir, mille sees JS tõenäosusega 1 - . 28. Suurte arvude seadus. Keskpiirteoreem
Statistika teooria I 1. Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare. Esitada definitsioonid ja osata antud andmeväärtuste puhul neid mõisteid rakendada N x + x 2 + ... + x N xi Aritmeetiline keskmine: µ = 1 = i =1 N N N-üldkogumi maht
hangitud andmete põhjal Statistiline rida, - rida, mille moodustavad valimi kõigi objektide sama tunnuse X väärtused variatsioonrida. - Järjestades objektide tunnuse X väärtused saame tunnuse X variatsioonrea. (=järjestatud statistiline rida) Mood, - tunnuse enim esinev väärtus mediaan, - tunnuse variatsioonrea (tunnuse järjestatud väärtused) keskmine liige, paarisarvulise valimi korral kahe liikme poolsumma. Alumine (ülemine) kvartiil - Kvartiilid koos mediaaniga jaotavad variatsioonirea neljaks võrdsel arvul liikmeid sisaldavaks osaks, kusjuures väikeseim (p = 0,25) kannab nimetust alumine kvartiil ja suurim (p = 0,75) kannab nime ülemine kvartiil p-kvantiil - arvväärtus, mis jaotab järjestatud statistilise rea (variatsioonrea) osadeks suhteliste mahtudega p ja 1-p, kus p on murdarv vahemikus 0...1. (kvantiil - JS väärtus, millest väiksemaid on osakaaluga p ja suuremaid 1-p. ) 17. (Kirjeldav statistika)
1. Kirjeldava statistika põhimõisted: Aritmeetiline keskimine X=(x1+x2+...+xN)/N=( i=1N xi)/N Kaalutud keskmine- keskmiste keskmine. On teada rühmade keskmised ja objektide arvud. Mediaan Kui N on paaritu, siis on mediaan järjestatud statistilise rea keskmine liige. Kui N on paaris, siis on mediaan järjestatud arvrea kahe keskmise liikme poolsumma. Kvartiilid p-protsentiil on arv, millest p protsenti andmetest on temast väiksem või võrdne ja (100-p) protsenti suurem või võrdne. 25- protsentiili nim. esimene kvartiil. Mediaan on 50-protsentiil e. teine kvartiil. 75-protsentiil nim. kolmas kvartiil. Mood arvrea suurima sagedusega liige. Dispersioon 2= ((x1-x)2+(x2-x)2+...+(xN-x)2)/N =(i=1N(xi-x)2)/N Standardhälve =2
väljendatud osatähtsus. Kordaja ehk koefitsient on eriline suhtarvu haigestumuskordajate suhe (Standardised rate ratio: SRR) · kvartiil (Q3) on tunnuse selline väärtus, millest väiksemaid väärtusi on liik, mida kasutatakse mingi sündmuse esinemise suhtelise sageduse Standarditud haigestumuskordajaid saab omavahel võrrelda: · SRR: valimis 75%. Kvartiilid jagavad järjestatud valimi 4 võrdseks osaks. väljendamiseks rahvastikus või selle rühmas teatud ajavahemiku, SIR (A) / SIR(B). Suurte erinditega valimis kasutatakse varieeruvuse iseloomustamiseks tavaliselt aasta jooksul. Rahvastikutihedus ehk asustustihedus on tihti kvartiilide vahet (ingl
Statistika valdamine rakendustasemel tähendabki oskust valida olukorrale vastav test (neid on väga plaju erinevaid) ja selle tulemusi õigesti interpreteerida. Seletav tunnus ehk kirjeldav tunnus ehk argumenttunnus ehk sõltumatu tunnus. Prognoositav tunnus ehk funktsioontunnus ehk sõltuv tunnus. Sõltuv tunnus sõltub sõltumatust. Vabadusastmete arv (degree og freedom, df) – sõltumatute muutujate arv. SAGEDUS- JA JAOTUSTABELID Keskmised – Mediaan - Mood - Kvartiilid - Dispersioon - Standardhälve - Variatsioonikoefitsient - Standardviga - Usalduspiirid keskmisele - 4.LOENG STATISTILISED TESTID Hii-ruut test - Võimaldab otsustada juhuslike suuruste jaotuste erinevuse ja sarnasuse üle. Annab vastuse küsimustele: kas erinevus (kahe) grupi sagedusjaotuses on statistiliselt oluline või mitte. T-testid – kõige lihtsam meetod uurida pidev tunuse keskmiste erinevust rühmiti. T-tesi puhul on neid rühmi kaks või üks
· Standardhälve leitakse kui ruutjuur dispersioonist vt valemit. · Standardviga · Mediaan ehk teine kvartiil- järjestatud valimi keskpunkt väärtus, millest nii suuremaid kui väiksemaid väärtusi on valimis 50%. Kui valimi suurus on paaritu, siis on mediaaniks keskmine vaatlus järjestatud valimis. Kui tegu on paarisarvulise suurusega valimis, siis on mediaaniks kahe keskmise väärtuse aritm kesk. · Kvartiilid saab hinnata valimi varieeruvust. Alumine kvartiil on tunnuse selline väärtus, millest väiksemaid väärtusi on valimis 25% ja suuremaid 75%. Ülemine kvartiil e 3.kvartiil tunnuse selline väärtus, millest väiksemaid väärtusi on valimis 75% ja suuremaid 25%. · Miinimum lihtsaimad statistikud · Maksimum lihtsaimad statistikud · Sagedus mittearvulised või diskreetsed tunnused (erinevaid väärtusi suht vähe).
võivad oluliselt mõjutadada ekstremaalsed väärtused, siis mediaani need oluliselt ei mõjuta. Mediaani omadusi 1) mediaani võib kasutada järjestikskaala ja intervallskaala korral; 2) mediaan ei ole tundlik ekstremaalsetele väärtustele. Tabelarvutusprogrammis MS Excel on mediaani leidmiseks funktsioon MEDIAN. 7 Asendikeskmisi, mis jaotavad korrastatud statistilise rea võrdseteks osadeks, nimetatakse kvantiilideks. MS Excel -is leiab kvartiilid funktsioon QUARTILE, protsentiilid funktsioon PERCENTILE. Aritmeetiline keskmine ehk keskväärtus, kus N on kogumi maht ja x kogumi element. Aritmeetilise keskmise omadusi: 1) saab kasutada vaid intervallskaal korral; 2) võimaldab võrrelda üksikväärtuste suurusi aritmeetilise keskmisega; 3) võimaldab arvutada teisi statistilisi näitajaid (hajuvust iseloomustavaid suurusi); 4) sõltub igast üksikust elemendist; 5) on tundlik ekstremaalsetele väärtustele.
Mediaan – variatsioonirea keskel paiknev väärtus, mis jagab vaatlustulemused kahte ossa, pooled on mediaanist suuremad ja pooled väiksemad. Aritmeetiline keskmine (keskväärtus) kirjeldab jaotuse keskmist taset. Moonutatud pilti keskmisest tasemest näitab siis kui jaotusel esinevad erandlikud väärtused. Sel juhul tuleks koos keskväärtusega keskmise taseme kirjeldamiseks kasutada ka mediaani. 1.2. Andmete paiknemist kirjeldavad arvnäitajad. Kvartiilid - jagavad vaatlustulemused nelja võrdsesse ossa. Standardhälve – hajuvuse näitaja, mis arvestab kõiki vaatlustulemusi ning näitab kui palju üksikud tulemused erinevad keskmisest. Mida suurem on hajuvus, seda rohkem nad erinevad ning seda suurem on standardhälve. Kui kõik vaatlustulemused on ühesugused (Nt. kõik tudengid said kontrolltööl 15 palli), siis hajuvust ei ole ja standardhälve on 0. (standardhälve ei ületa tavaliselt poolt jaotuse ulatusest) 2
( xi - EX ) 2 , Excelis funktsioon VAR. Valimi standardhälbe hinnangut tähistame s = s2 Excelis funktsioon STDEV. Mood leitav Excelis MODE(). Mediaan leitav Excelis MEDIAN(). P-kvartiil arv, mis jaotab järjestatud statistilise rea osadeks suhteliste mahtudega p ja 1- p, kus p on murdarv vahemikus 0...1. (mediaan, kvatriilid, detsiilid jne.). Kvartiilid koos mediaaniga jaotavad variatsioonirea neljaks võrdsel arvul liikmeid sisaldavaks osaks, kusjuures väikeseim (p = 0,25) kannab nimetust alumine kvartiil ja suurim (p = 0,75) kannab nime ülemine kvartiil. Detsiilid jaotavad rea kümneks võrdsel arvul liikmeid sisaldavaks osaks. Normaaljaotuse keskväärtuse usalduspiirkond Kuidas hinnata üldkogumi keskväärtust µ , kui on teada valimi keskväärtus x ja dispersioon s. Kui valim on suur (>30) kasutame valemit P( x -µ <) =1 -.
jaotusfunktsiooni tuletis c. integraal jaotusfunktsioonist Õige Selle esituse hinded: 1/1. Question 2 Hinded: 1 Millest ei sõltu normaaljaotuse jaotustihedus? Vali üks vastus. a. standardhälve b. keskväärtus c. katsete arv Õige Selle esituse hinded: 1/1. Question 3 Hinded: 1 Aritmeetiline keskmine on Vali üks vastus. a. 1. järku keskmoment b. 2. järku keskmoment c. 1. järku algmoment Õige Selle esituse hinded: 1/1. Question 4 Hinded: 1 Kvartiilid jagavad statistilise rea Vali üks vastus. a. kolmeks b. kaheks c. neljaks Õige Selle esituse hinded: 1/1. Question 5 Hinded: 1 Kinnisvarahindade analüüsil saadi regressioonmudel y=0,48x + 0,52, kus y on korteri hind milj kroonides ja x tubade arv. Selle mudeli järgi Vali üks vastus. a. 1-toalise korteri hind on 0,52 milj kr b. iga lisatuba suurendab hinda 0,48 milj kr c. 1-toalise korteri hind on 0,48 milj kr Õige Selle esituse hinded: 1/1. Question 6
Õige Selle esituse hinded: 1/1. Question 2 Hinded: 1 Millest ei sõltu normaaljaotuse jaotustihedus? Vali üks vastus. a. standardhälve b. keskväärtus c. katsete arv Õige Selle esituse hinded: 1/1. Question 3 Hinded: 1 Aritmeetiline keskmine on Vali üks vastus. a. 1. järku keskmoment b. 2. järku keskmoment c. 1. järku algmoment Õige Selle esituse hinded: 1/1. Question 4 Hinded: 1 Kvartiilid jagavad statistilise rea Vali üks vastus. a. kolmeks b. kaheks c. neljaks Õige Selle esituse hinded: 1/1. Question 5 Hinded: 1 Kinnisvarahindade analüüsil saadi regressioonmudel y=0,48x + 0,52, kus y on korteri hind milj kroonides ja x tubade arv. Selle mudeli järgi Vali üks vastus. a. 1-toalise korteri hind on 0,52 milj kr b. iga lisatuba suurendab hinda 0,48 milj kr c
Rea maht ei ole otseselt rea liikmete arv. Ritta kuuluvate elementide väärtuste summa. Reageerivad igale muutusele, väga tundlikud. Mahukeskmised: aritmeetiline keskmine, harmooniline keskmine, geomeetriline keskmine, ruutkeskmine ja teised astmekeskmised, kronoloogiline keskmine. · Asendi ehk struktuurikeskmised kuuluvad keskmised mis ei reageeri igale muutusele elementide väärtuste osas. Oluline on struktuur. Asendi ehk struktuurikeskmised: mood, mediaan, kvartiilid, pentiilid, sekstiilid, oktiilid (teoorias), detsiilid protsentiilid. · Harmooniline keskmine on mitmese tähendusega. Sõltuvalt andmete iseloomust võib ta tähendada kas mingi suuruse aritmeetilise keskmise leidmist kaudselt antud andmete abil... Teiseks võib harmooniline keskmine tähendada lihtsalt samade andmete sama majandusnähtust iseloomustavat teist keskmist. Aritmeetilist keskmist kasutame me hästi sageli eelkõige tema interpreteeritavuse mugavuse pärast
Kasutatakse siis, kui tunnuse väärtuseks on kordarvud, millest iga järgnev näitab seda, mitu korda on ta eelmisest suurem. Ruutkeskmine – rakenduslik tähtsus on suur dispersioonanalüüsis, korrelatsioonikordajate leidmisel ja muudes statistliste protseduurides. 6. Mediaan – korrastatud statistilise rea keskliige, millest mõlemale poole jääb võrdne arv liikmeid. Ühele poole jäävad on väiksemad ja teisele poole jäävad suuremad. Kvartiilid –Jagavad stat rea neljaks osaks, millel igas on võrdne arv liikmeid. Esimene kvartiil on mediaan rea esimesest poolest, teine kv. on mediaan, kolmas mediaan rea teisest poolest. Detsiilid jaotavad stat rea kümneks osaks (D1..D9).Tsentiilid jaotavad stat rea 100 võrdse liikmete arvuga osaks(T1..T99) 7. Mood – kõige sagedamini korduv tunnuse väärtus. Seda kasutatakse siis, kui soovitakse kogumit iseloomustada temas kõige sagedamini esineva nähtuse alusel
Kui objekte on paarisarv, siis on mediaaniks variatsioonrea keskel asuvate liikmete poolsumma (nende vahel asuv väärtus). Mediaan jaotab variatsioonrea kaheks osaks: alumiseks (siia kuuluvad mediaanist väiksemad väärtused) ja ülemiseks (kuhu kuuluvad mediaanist suuremad väärtused). Variatsioonrea alumise poole mediaani nimetatakse alumiseks ehk esimeseks kvartiiliks, variatsioonrea ülemise poole mediaani ülemiseks ehk kolmandaks kvartiiliks. Mediaan ja kvartiilid jaotavad variatsioonrea neljaks osaks, millest igasse kuulub (ligikaudu) neljandik kõigist variatsioonrea liikmetest. Lisaks kvartiilide kasutatakse (põhiliselt majanduses) ka kvintiile ja detsiile, kvintiilid jagavad variatsioonrea viieks võrdseks osaks, detsiilid jagavad variatsioonrea kümneks võrdseks osaks. Aritmeetilise keskmise leidmisel liidetakse kõikide objektide tunnuse väärtused ning jagatakse objektide arvuga
United Kingdom 122 109 Iceland 130 119 Norway 153 186 Switzerland 139 163 Montenegro 40 Former Yugoslav Republic of Macedonia 26 36 Albania 28 Serbia 37 Turkey 35 53 Bosnia and Herzegovina 29 Kvartiilid 2002 2013 53 64 #NAME? #NAME? #NAME? #NAME? 48 73 1. neljandik 2. neljandik Riik Tel./100 el. kvartiilid Algeria 4.75 Aafrika 1 Angola 0.54 2 Benin 0.64 3 Botswana 5.51 Burkina Faso 0.33 Eesti
Finantssuhtarv on kahe või enama aruandelise näitaja jagatis, mida väljendatakse kordades, protsentides, päevades või kroonides. Saadud suhtarve võrreldakse normidega. Normideks võivad olla antud tootmisharu keskmised näitajad, konkurentide keskmised näitajad jne. Andmeid normide kohta on võimalik hankida Eesti Statistikaameti väljaannetest nagu: · "Ettevõtte majanduslikud näitajad" aasta bülletään; · "Rahandussuhtarvud", milles tuuakse ära suhtarvude kvartiilid ja mediaan; · "Ettevõtte finantsnäitajad" kvartaalne bülletään Suhtarvuanalüüsi abil on võimalik tuua välja finantsnäitajate seoseid ja teha nende alusel võrdlevat analüüsi. Ettevõtte finantssuhtarve võrreldakse möödunud perioodi vastavate suhtarvudega, et välja selgitada finantsseisukorra muutumine ja muutumise põhjused. Saadud tulemusi võrreldakse teiste selle haru ettevõtete finantssuhtarvudega. Võrdluse tulemusel on võimalik välja tuua
Finantssuhtarv on kahe või enama aruandelise näitaja jagatis, mida väljendatakse kordades, protsentides, päevades või kroonides. Saadud suhtarve võrreldakse normidega. Normideks võivad olla antud tootmisharu keskmised näitajad, konkurentide keskmised näitajad jne. Andmeid normide kohta on võimalik hankida Eesti Statistikaameti väljaannetest nagu: · "Ettevõtte majanduslikud näitajad" aasta bülletään; · "Rahandussuhtarvud", milles tuuakse ära suhtarvude kvartiilid ja mediaan; · "Ettevõtte finantsnäitajad" kvartaalne bülletään Suhtarvuanalüüsi abil on võimalik tuua välja finantsnäitajate seoseid ja teha nende alusel võrdlevat analüüsi. Ettevõtte finantssuhtarve võrreldakse möödunud perioodi vastavate suhtarvudega, et välja selgitada finantsseisukorra muutumine ja muutumise põhjused. Saadud tulemusi võrreldakse teiste selle haru ettevõtete finantssuhtarvudega. Võrdluse tulemusel on võimalik välja tuua
Finantssuhtarv on kahe või enama aruandelise näitaja jagatis, mida väljendatakse kordades, protsentides, päevades või kroonides. Saadud suhtarve võrreldakse normidega. Normideks võivad olla antud tootmisharu keskmised näitajad, konkurentide keskmised näitajad jne. Andmeid normide kohta on võimalik hankida Eesti Statistikaameti väljaannetest nagu: · "Ettevõtte majanduslikud näitajad" aasta bülletään; · "Rahandussuhtarvud", milles tuuakse ära suhtarvude kvartiilid ja mediaan; · "Ettevõtte finantsnäitajad" kvartaalne bülletään Suhtarvuanalüüsi abil on võimalik tuua välja finantsnäitajate seoseid ja teha nende alusel võrdlevat analüüsi. Ettevõtte finantssuhtarve võrreldakse möödunud perioodi vastavate suhtarvudega, et välja selgitada finantsseisukorra muutumine ja muutumise põhjused. Saadud tulemusi võrreldakse teiste selle haru ettevõtete finantssuhtarvudega. Võrdluse tulemusel on võimalik välja tuua
Finantssuhtarv on kahe või enama aruandelise näitaja jagatis, mida väljendatakse kordades, protsentides, päevades või kroonides. Saadud suhtarve võrreldakse normidega. Normideks võivad olla antud tootmisharu keskmised näitajad, konkurentide keskmised näitajad jne. Andmeid normide kohta on võimalik hankida Eesti Statistikaameti väljaannetest nagu: · "Ettevõtte majanduslikud näitajad" aasta bülletään; · "Rahandussuhtarvud", milles tuuakse ära suhtarvude kvartiilid ja mediaan; · "Ettevõtte finantsnäitajad" kvartaalne bülletään Suhtarvuanalüüsi abil on võimalik tuua välja finantsnäitajate seoseid ja teha nende alusel võrdlevat analüüsi. Ettevõtte finantssuhtarve võrreldakse möödunud perioodi vastavate suhtarvudega, et välja selgitada finantsseisukorra muutumine ja muutumise põhjused. Saadud tulemusi võrreldakse teiste selle haru ettevõtete finantssuhtarvudega. Võrdluse tulemusel on võimalik välja tuua
Kahanevalt järjestatult: 25, 23, 23, 22, 21, 15, 10, 7, 6, 5 , 5, 2. Mediaan on: 15 + 10 = = 12,5 2 NB! Erinevalt aritmeetilisest keskmisest ei ole mediaan tundlik ekstremaalsete väärtuste suhtes! Kui jaotada rida neljaks võrdseks osaks liikmete arvu järgi, saadakse kvartiilid. Kvartiile on kolm: Q1, Q2, Q3, kusjuures Q2 = Me. Esimene kvartiil on sisuliselt võrdne mediaaniga rea esimesest poolest ning kolmas kvartiil on võrdne mediaaniga rea teisest poolest. =QUARTILE(piirkond;kvartiili number) Mood (Mo)on variatsioonreas kõige sagedamini esinev liige. =MODE(piirkond)
1.2.2. Psühholoogilised mõõteskaalad ja statistika Mõõtmisskaala tüübist sõltub kasutatava statistilise töötluse võimalik tase. Nominaalskaala puhul saab kasutada ainult mitteparameetrilist statistikat, tsentraalse tendentsi mõõduks saab kasutada ainult moodi, hälbivuse mõõduks sagedusjaotust. Järjestusskaala puhul saab samuti kasutada ainult mitteparameetrilist statistikat. Tsentraalse tendentsi mõõduks on mediaan, hälvete mõõduks kvartiilid. Intervallskaala puhul on võimalik valida tinglik nullpunkt (näiteks tulemuste keskmine väärtus) ja mõõteühik (intervall) - näiteks tulemuste standardhälve. Tänu nullpunkti kasutuselevõtule saab kasutada kõiki statistilise töötluse võtteid, ent seda kõike ainult mööndusega, kuna niiviisi loodud skaala on pseudosuhteskaala. Üheks eeltingimuseks tingliku suhteskaala loomisel on