Tähis Me. _ · Aritmeetiline keskmine ehk tunnuse keskväärtus. Tähis x. · Hajuvusmõõdud näitavad kui palju erineb tunnuse väärtus keskväärtusest või mediaanist: · Tunnuse minimaalne väärtus esinev tunnuse vähim väärtus. Tähis Min · Tunnuse maksimaalne väärtus esinev tunnuse suurim väärtus. Tähis Max · Variatsioonirea ulatus tunnuse maksimaalse ja minimaalse väärtuse vahe. Tähis U · Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioonireas 25%. Tähis Kv · Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonireas 25%. Tähis Kv · Hälve variatsioonireas oleva tunnuse väärtuse ja keskväärtuse vahe. Kogu variatsioonirea hälvete summa on 0. · Dispersioon hälvete ruutude aritmeetiline keskmine. Tähis ² · Standardhälve ruutjuur dispersioonist
Tartu Kutsehariduskeskus Ärinduse ja kaubanduse osakond Hanka Merila STATISTILINE UURIMUSTÖÖ uurimustöö Juhendaja Reet Saarep Tartu 2016 SISSEJUHATUS Statistilise uurimustöö eesmärgiks on välja selgitada ühe kooli gümnaasiumisastmes õppivate noormeeste jalanumbrid. Leida nende keskmine jalanumbri suurus, standardhälve, mediaan, mood, alumine- ja ülemine kvartiil. Leida hajuvusnäitajad. Võrrelda tulemusi. Statistiline rida 43, 41, 42, 43, 44, 44, 40, 43, 42, 43, 44, 42, 43, 46, 44, 40, 45, 42, 43, 41, 42, 43, 44, 43, 41, 42, 41, 43, 42, 44, 41, 42, 43, 45, 44, 46, 40, 41, 43, 44 Variatsioonirida 46, 46, 45, 45, 44, 44, 44, 44, 44, 44, 44, 44, 43, 43, 43, 43, 43, 43, 43, 43, 43, 43, 43, 42, 42, 42, 42, 42, 42, 42, 42, 41, 41, 41, 41, 41, 41, 40, 40, 40, Sagedustabel Saapa number 40 41 42 43 44 45 46
Statistilne uurimus Mitu korda päevas sa keskmiselt läbi hoone ukseava käid? Lisa vastavalt kas M/N. (Uurimuse viisin läbi paberilehel oleva küsitluse ja internetiküsitluse abil). Statistilised read: M: 50, 45, 100, 70, 65, 60, 80, 75, 40, 90, 100, 100, 30, 55, 60, 70, 80, 80, 95, 40, 50, 60, 66, 55, 76, 100, 78, 80, 60, 85, 55, 58, 69, 50. N: 100, 80, 85, 85, 85, 70, 80, 55, 50, 70, 60, 65, 75, 80, 90, 90, 110, 100, 100, 60, 70, 75, 85, 90, 75, 55, 70, 80, 55, 80, 60, 75, 100, 70, 65, 75, 75, 80, 90, 70, 60, 55, 70, 80, 90, 100, 55, 60, 40, 60, 45, 80, 68, 80. Variatsiooniread: M: 30, 40, 40, 45, 50, 50, 50, 55, 55, 55, 58, 60, 60, 60, 60, 65, 66, 69, 70, 70, 75, 76, 78, 80, 80, 80, 80, 85, 90, 95, 100, 100, 100, 100. N: 40, 45, 50, 55, 55, 55, 55, 55, 60, 60, 60, 60, 60, 60, 65, 65, 68, 70, 70, 70, 70, 70, 70, 70, 75, 75, 75, 75, 75, 75, 80, 80, 80, 80, 80, 80, 80, 80, 80, 85, 85, 85, 85, 90, 9...
=450 :15=30a ; Mo = 20a ; Me = xi ; i= N 1 ; i = 8 ; Me = 23. X 2 =476 : 29,7530a ; Mo = 20a ; Me= x i xi 1 i= N ; i=8 1 X 2 2 1 Me= 2324=23,5 2 Hajuvuse karakteristikud iseloomustavad tunnuse hajuvust. Variatsiooni ulatus [max min = 75 - 18 = 57 (*ülesanne 05)] Alumine ja ülemine kvartiil q ; q Dispersioon ja standarthälve Variatsiooni kordaja Alumine kvartiil on tunnuse väärtus, millest väiksemaid väärtusi on variatsioonireas 25% ja ülemine kvartiil on tunnuse väärtus, millest suuremaid väärtusi on variatsioonireas 25%. 1 N Me= x i x i1 i= =4 N = 8 2 2 1 Me= 2020=20 <- q 2 1 Me= 2729=28 <- q (*ülesanne 05) 2 Hälve näitab kui suur on Xi erinevus aritmeetilisest keskmisest (hälve); X i- X
Valimi maht N - uuritavate objektide koguarv. Aritmeetiline keskmine - tunnuse kõigi väärtuste summa ja objektide arvu jagatis. Keskväärtus - tunnuste väärtuste aritmeetiline keskmine. Mood - tunnuse kõige sagedamini esinev väärtus Mediaan - arv, millest on suuremaid ja väiksemaid väärtusi variatsioonireas on ühepalju. Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil, - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon andmetele vastav hälvete keskväärtus. 2 Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse.
.................................................................................................. 7 11. Tunnuse minimaalne väärtus......................................................................................... 7 12. Tunnuse maksimaalne väärtus...................................................................................... 7 13. Variatsioonirea ulatus.................................................................................................... 7 14. Alumine kvartiil............................................................................................................... 8 15. Ülemine kvartiil.............................................................................................................. 8 16. Kvartiilide vahe.............................................................................................................. 8 17. Dispersioon...................................................................................................
Aritmeetiline keskmine x on tunnuse kõigi väärtuste summa ja väärtuste (objektide) arvu jagatis. Mood Mo on tunnuse kõige sagedamini esinev väärtus. Moode võib olla ka rohkem kui üks. Kui kõik väärtused on võrdsed, siis mood puudub. Mediaan Me on tunnuse väärtus, millest variatsioonireas jääb vasakule ja paremale võrdne arv liikmeid. Tunnuse muutumispiirkond on piirkond minimaalsest väärtusest maksimaalse väärtuseni (xmax - xmin). Alumine kvartiil Q (Kv ) on tunnuse väärtus, millest väiksemaid või võrdseid väärtusi on 25%. Ülemine kvartiil Q (Kv ) on tunnuse väärtus, millest suuremaid või võrdseid väärtusi on 25%. Mida suurem on kvartiilide vahe, seda suurem on hajuvus. Hälve on tunnuse väärtuse ja keskmise vahe ( x i -x ) . Dispersiooniks 2 nimetatakse hälvete ruutude keskmist. Variatsioonikordaja V näitab standardhälbe suhet keskmisse. Valemid: f W = 100% N n
Miinimum 4,00 cm Aritmeetiline keskmine 10,22 10,1 cm Ruutkeskmine diameeter 10,74 10,7 cm Mediaan 9,85 10 cm Mood 10,8 cm Alumine kvartiil (0,25-kvantiil) 7,63 7,8 cm 0,9-kvantiil 14,48 15 cm 0,3-täiendkvantiil(0.7 kvantiil) 11,74 12 cm Kvartiilhälve 4,78 4,700 cm Haare 15,70 cm
määravad polaarfrondi vonklemise. Mediaan on variatsioonirea keskmise liikme väärtus. Näiteks variatsioonirea {3, 3, 5, 9, 11} mediaan on 5. Kui reas on paarisarv liikmeid, loetakse mediaaniks tavaliselt kahe keskmise liikme aritmeetiline keskmine, näiteks {3, 5, 7, 9} mediaan on (5 + 7) / 2 = 6. Kui rea keskel on mitu sama väärtusega liiget, ei identifitseeri mediaan neist ühte liiget, vaid peegeldab nende igaühe väärtust. Mediaan on 2. kvartiil ehk keskmine kvartiil. Moodiks nimetatakse vaadeldava suuruse kõige sagedamini esinevat väärtust. Standardhälve on statistiline väärtus, mis näitab, kui palju väärtused erinevad keskmisest väärtusest. Näiteks kui on kaks aktsiaportfelli, mis mõlemad on keskmiselt teeninud kasumit 10 % aastas ning kui portfelli A standardhälve on väiksem kui portfelli B oma, siis see tähendab, et esimene portfell on olnud stabiilsem ning vastupidiselt teise portfelli väärtus on rohkem kõikunud
19% 17% 17% 9…12 13…16 17…20 olid paremad, kui kursuse A tulemused 12 13 14 15 16 17 167 169 178 145 165 144 178 189 149 189 145 165 176 190 148 177 189 129 178 188 146 169 156 127 165 167 144 200 177 168 166 168 178 178 179 178 167 159 155 149 149 148 Kvartiil 0 123 Kvartiil 1 149 Kvartiil 2 167 Kvartiil 3 178 Kvartiil 4 206 18 19 20 177 168 176 178 173 128 Keskväärtus 164.6 134 145 156 Geom. Keskmine 163.5 174 178 144 Valimi maht 63 128 154 190 Maksimaalne element 206 189 178 206 Minimaalne element 123 123 155 167 Mediaan 167
kvartiilid, minimaalne ja maksimaalne väärtus, ja standrardhälve selles valimis. x̅= 10389,5525 y̅= 7800,824171 MeX= 9899,71287 MeY= 5779,0024 Toidukulude haare= 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛 = 17019,29821 Eluaseme kulude haare = 𝑦𝑚𝑎𝑥 − 𝑦𝑚𝑖𝑛 = 25896,552 Kvartiilid X Keskmine kvartiil Q= 9899,71287 Alumine kvartiil Q₁= 6687,011055 Ülemine kvartiil Q₃= 13973,20753 Kvartiilid Y Keskmine kvartiil Q= 5779,0024 Alumine kvartiil Q₁= 4623,659 Ülemine kvartiil Q₃= 7681,409 xmin= 2514,24023 xmax= 19533,53844 ymin= 468,048 ymax= 26364,6
Tähis Me. _ · Aritmeetiline keskmine ehk tunnuse keskväärtus. Tähis x. · Hajuvusmõõdud näitavad kui palju erineb tunnuse väärtus keskväärtusest või mediaanist: · Tunnuse minimaalne väärtus esinev tunnuse vähim väärtus. Tähis Min · Tunnuse maksimaalne väärtus esinev tunnuse suurim väärtus. Tähis Max · Variatsioonirea ulatus tunnuse maksimaalse ja minimaalse väärtuse vahe. Tähis U · Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioonireas 25%. Tähis Kv · Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonireas 25%. Tähis Kv · Hälve variatsioonireas oleva tunnuse väärtuse ja keskväärtuse vahe. Kogu variatsioonirea hälvete summa on 0. · Dispersioon hälvete ruutude aritmeetiline keskmine. Tähis ² · Standardhälve ruutjuur dispersioonist
7) Ülemine(tunnuse väärtus, millest väiksemaid liimeid on variatsioonreas ligikaudu 25 %) ja alumine kvartiil(tunnuse väärtus, millest suuremaid liimeid on variatsioonreas ligikaudu 25 %) 1; 2; 2; 2; 3; 3; 3; 3; 3,5; 4; 4; 4; 4; 4; 4; 5; 5; 5; 6; 6; 6; 6; 8; 10; 10; 11; 12; 12; 13; 14 7 liiget 14 liiget 7 liiget 9 Alumine kvartiil Kv = 3(leian variatsioonrea alumise poole mediaani, mis ongi ühtlasi alumine kvartiil) Ülemine kvartiil Kv = 8(leian sarnaselt variatsioonrea ülemise poole mediaani). Kontrollin: alumisest kvartiilist väiksemaid liimeid on 7 ehk ligikaudu 23 protsenti ülemisest kvartiilist suuremaid liikmeid on samuti 7 23 protsenti alumise ja ülemise kvartiili vahele jääb 14 liiget 46 protsenti
x = 900 : 22 40,91 Keskmine hälve on hälvete aritmeetiline keskmine. = 57,82 : 22 2,63 Dispersioon on variatsioonreas olevatele andmetele vastava hälvete ruutude keskväärtus. 2 =180,06 : 21 8,57 Standardhälve on variatsioonreas oleva arvu ja keskväärtuse vahe. = 8,57 2,93 Variatsioonkordaja on standardhälbe ja keskväärtuse suhe. V= 2,93 : 40,91 0,07 Variatsioonrea ulatus on maksimaalse ja minimaalse elemendi vahe. 46-37= 9 Alumine kvartiil on tunnuse väärtus, millest väiksemaid või võrdseid liikmeid on variatsioonreas 25%. (Kv ) = 38 Ülemine kvartiil on tunnuse väärtus, millest suuremaid või võrdseid liikmeid on variatsioonreas 25%. (Kv ) = 44 Kvartiilide vahe 44-38= 6 Tabel matemaatika hinnete kohta Tunnuse Absoluutne x*f d= | x - x | |x- x |*f | x- x |² | x- x |² *f väärtus x sagedus f
keskväärtust. Keskväärtust kasutatakse küllalt sageli, sest ta on aluseks teiste statistiliste näitajate määramisele. 19. Miks läheb lisaks keskmistele vaja ka hajuvusmõõte? Milliseid hajuvusmõõte tead? Hajuvusmõõdud iseloomustavad tunnuse väärtuste hajuvust (ehk kas väärtused erinevad üksteisest palju või mitte). Enimkasutatavad: min ja max element, variatsioonrea ulatus, alumine ja ülemine kvartiil, dispersioon ja standardhälve, variatsioonikordaja. 20. Kuidas leitakse variatsioonrea ulatus? Maksimaalse ja minimaalse elemendi vahe. 21. Mis on alumine kvartiil ja ülemine kvartiil? Mis on detsiilid? Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonreas 25%. Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonras 25%.
24, 15, 28, 12, 13, 29, 13, 24, 10, 30, 20, 13 Leia aritmeetiline keskmine, mediaan ja mood. Võrdle neid ja mida järeldad saadud suurustest. Mida peaks veel kindlasti teadma 26 Numbe 40 41 42 43 44 45 46 r Saged 2 6 8 9 5 1 1 us Leia aritmeetiline keskmine, mediaan ja mood. 27 Hajuvusmõõdud: 1) minimaalne ja maksimaalne element 2) variatsioonirea ulatus 3) alumine kvartiil, ülemine kvartiil 4) dispersioon, standardhälve 5) variatsioonikordaja 28 Minimaalne element tähis Min Variatsioonirea kõige väiksem element. Maksimaalne element tähis Max Variatsioonirea kõige suurem element. 29 Variatsioonirea ulatus on maksimaalse ja minimaalse väärtuse vahe. d = Max - Min 30 Alumine kvartiil tähis Kv on tunnuse väärtus, millest väiksemaid
sagedus Suhteline 10% 40% 30% 10% 10% sagedus Sektordiagramm: Statistilise rea karakteristikud: Me : 2,5 Mo : 2 Keskväärtus: = = 2,7 Kaalutud aritmeetiline keskmine: 2,7 Hajuvuse karakteristikud: a) minimaalne element: xmin= 1 maksimaalne element: xmax= 5 b)variatsioonrea ulatus: xmax xmin = 4 c) alumine kvartiil : : 1, 2, 2, 2, 2 ülemine kvartiil: 3, 3, 3, 4, 5 d) dispersioon: 2 = 1,344 e)standardhälve: == 1,159 f) variatsioonikordaja: V= = = =0,429 Viljandi Paalalinna Gümnaasium Laste arv peres Statistiline uuring Viljandi 2011
Tähis Me. _ · Aritmeetiline keskmine ehk tunnuse keskväärtus. Tähis x. · Hajuvusmõõdud näitavad kui palju erineb tunnuse väärtus keskväärtusest või mediaanist: · Tunnuse minimaalne väärtus esinev tunnuse vähim väärtus. Tähis Min · Tunnuse maksimaalne väärtus esinev tunnuse suurim väärtus. Tähis Max · Variatsioonirea ulatus tunnuse maksimaalse ja minimaalse väärtuse vahe. Tähis U · Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on 4 variatsioonireas 25%. Tähis Kv · Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonireas 25%. Tähis Kv · Hälve variatsioonireas oleva tunnuse väärtuse ja keskväärtuse vahe. Kogu variatsioonirea hälvete summa on 0. · Dispersioon hälvete ruutude aritmeetiline keskmine. Tähis ²
1. Matrikli viimane number – 3. Järelikult SUGU=2 ja AGE_GR=25-34 Koo Sug Vanus- V03C V27C V30C V34C V36C V37C V38C V41C V42C d_i u grupp 310 2 2534 9457,866 5669,58 0 4378,57 909,577 510,334 0 777,44 0 94 392 28 17 93 311 2 2534 10553,17 0 214,4133 10131,6 0 744,472 0 1962,6 2979,255 211 3 256 91 87 312 2 2534 7392,166 0 1738,630 5798,31 1483,31 2828,02 22246,05 3896,4 8468,680 55 66 72 376 537 789 55 313 2 2534 7348,636 2502,98 672,9768 8115,65 1266,28 1397,80 3459,408 8541,66...
Keskväärtust kasutatakse sageli, sest ta on aluseks teiste statistiliste näitajate määramiseks. Puudus-Arvutamise tulemusena saadud väärtus ei pruugi ise olla üks tunnuse väärtustest. Hajuvusmõõdu vajalikkus- tunnuste iseloomustamiseks ainult keskimiste abil annab liiga vähe informatsiooni. Hajuvusmõõdud:* min/max element*variatsioonrea ulatus*alumine/ülemine kvartiil*disepersioon/standarhälve*variatsioonikordaja. Variatsioonirea ulatus=Xmax-Xmin. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioonreas 25% Kv . Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsoonnreas 25% Kv . Detsiilide abil jaotatakse variatsioonrida kümneks osaks. Dispersioon on juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus ( ) . Standardhälve on ruutjuur dispersioonist. = ( ) = ( )
1 9 10,8 % 2 22 26,5 % 3 25 30 % 4 10 12 % 5 5 6% 6 9 10,8 % 8 3 3,6 % 7. Aritmeetiline keskmine = = 3,27 = 3,27 8. Standard hälve = 1,69 Enamik tunnuseid jääb [3,27 1,69 ; 3,27 + 1,69] = [1,58 ; 4,96] 9. Kvartiilid Ülemine kvartiil = 4 Alumine kvartiil = 2 10. Varjatsioonkordaja v= v = 0,52 11. Diagramm
Mehed: 1; 1; 1; 0; 2; 7; 5; 3; 11; 5; 0; 0; 2 1.2. Variatsioonrida Naised: 0; 0; 0; 1; 1; 2; 3; 4; 7 Mehed: 0; 0; 0; 1; 1; 1; 2; 2; 3; 5; 5; 7; 11 Kõik: 0; 0; 0; 0; 0; 0; 1; 1; 1; 1; 1; 2; 2; 2; 3; 3; 4; 5; 5; 7; 7; 11 1.2.1.Variatsiooni ulatus Naised 7-0=7 Mehed 11-0=11 Kõik 11-0=11 1.3. Mood Naised Mo=0 Mehed Mo=0; 1 Kõik Mo=0 1.4. Mediaan Naised Me=1 Mehed Me=2 Kõik Me=2 1.5. Alumine kvartiil Naised Kv=0 Mehed Kv=0,5 Kõik Kv=0 5 1.6. Ülemine kvartiil Naised ülemine Kv=3,5 Mehed ülemine Kv=5 Kõik ülemine Kv=4,5 1.7. Aritmeetiline keskmine Naised:=(30+21+12+13+14+17):9=2 Mehed:=(30+31+22+13+25+17+111):13=2,9 Kõik =(60+51+32+23+14+25+27+111):22=2,5 1.8. Sagedusjaotustabel k- kõik m- mehed n- naised 1.9. Standardhälve Naised: = Mehed: = Kõik: = 6 1.10. Keskmine hälve Naised: d=16/9 Mehed: d=32,7/13 Kõik: d=49/22 1.11. Dispersioon
Kasutatavad andmed Kogus Kogus 120 15 Aritmeetiline keskmine 350 20 Geomeetriline keskmine 120 30 Harmooniline keskmine 300 35 Mediaan 250 35 Mood 370 40 Väikseim 500 45 Suurim 300 45 (Arvude) loendamine 30 50 Alumine kvartiil 15 50 Asümmeetriakordaja 65 60 Keskmine hälve 60 60 35 60 50 65 Nominaaltunnuse sagedustabel 60 75 COUNTIF 120 75 20 120 40 120 45 120 Vahemiktunnuse sagedustabel 60 120 FREQUENCY 35 120
STATISTIKA-teadus, mis käsitleb arvandmete kogumist, töötelmist ja analüüsimistMATEMAATILINE STAT-matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeidÜLDKOGUM-looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldus. VALIM-mõõtmiseks võetud üldkogumi osaPLANEERITUD VALIM-uurimisele kuluvat aega ja raha saab kokku hoida, aga tulemused võivad ikkagi tulla vajaliku täpsusegaJUHUSLIK VALIM-saame, kui koostame üldkogumist mingi nimekirja ja võtame sealt juhuslikult välja uuritavad objektidKÕIKNE VALIM-kui valim langeb kokku üldkogumigaARVTUNNUS- kvantitatiivne tunnus; tunnus mille väärtuseks on arvudMITTEARVULISED- kvalitatiivsed tunnused, tunnus mille väärtuseks ei ole arvudPIDEV TUNNUS-võib omandada kõiki reaalarvulisi väärtusi mingist piirkonnast(KAAL, KASV)DISKREETNE TUNNUS-võib omandada vais üksteisest eraldatud väärtusi(pereliikmete arv)JÄRJESTUSTUNNUS-vää...
d esmased karakteristikud 20,15 valimi maht 149 diameetrit 19,7 miinimum 4,85 cm 17,35 maksimum 25,2 cm 15,6 Haare 20,35 cm 11,75 1. klassi ülemine piir 7,6 cm 15,75 klassi samm 2,8 cm 18,45 viimase klassi ülemine piir 27,2 cm 17,3 rühmade arv 8 20,15 Pool sammu 1,4 cm 23,45 Rühma Klassi Klassi kuulumise Jaotus- 21,7 tsenter Rühma ülem. piir sagedus tõenäosus funktsioon 8,8 xi xüi ni pi F(xüi) 21,15 6,2 7,6 5 0,03 0,03 18,85 ...
Valimi maht N - uuritavate objektide koguarv. Aritmeetiline keskmine - tunnuse kõigi väärtuste summa ja objektide arvu jagatis. Keskväärtus - tunnuste väärtuste aritmeetiline keskmine. Mood - tunnuse kõige sagedamini esinev väärtus Mediaan - arv, millest on suuremaid ja väiksemaid väärtusi variatsioonireas on ühepalju. Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon 2 andmetele vastav hälvete keskväärtus. Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse.
= n x1 x 2 ... x n , kusjuures x geom. x arit . Ruutkeskmine ruutjuur antud arvude ruutude aritmeetilisest keskmisest. x12 + x 22 + ... + x n2 x ruutk . = n Hajuvuse karakteristikud Hajuvusmõõdud on a) minimaalne element xmin ja maksimaalne element xmax; b) variatsioonrea ulatus xmax - xmin; c) alumine kvartiil ja ülemine kvartiil; d) dispersioon; e) standardhälve; f) variatsioonikordaja. Minimaalne element xmin - tunnuse väärtuste hulgast vähim väärtus. Maksimaalne element xmin - tunnuse väärtuste hulgast suurim väärtus. Variatsioonrea ulatus xmax xmin. Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on 1
EX = p1x1 + p2x2 + .... + pnxn 2) Mediaan arv, millest suuremaid ja väiksemaid väärtusi on variatsioonreas ühe palju. 3) Mood tunnuse kõige sagedamini esinev väärtus. Bimodaalne kui on kaks moodi. Hajuvusmõõdud Minimaalne element tunnuse väärtuste hulgas vähim. Maksimaalne elemet tunnuse väärtuste hulgas suurim. Variatsioonrea ulatus maksimaalse ja minimaalse elemendi vahe. Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonreas 25%. Ülemine kvartiil tunnuse väärtus, milles suuremaid (või võrdseid) liikmeid on variatsioonras 25%. Dispersioon ja standardhälve Variatsioonrida: x1; x2; x3....xn Variatsioonreas oleva arvu ja keskväärtuse vahet nimetatakse selle arvu hälbeks. Dispersioon - juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus varieerub
r= n x y Dispersioon andmetele vastav hälvete keskväärtus. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda ( x - x1 ) 2 + ( x - x 2 ) 2 + ( x - x3 ) 2 + ... + ( x - x n ) 2 = suurem on tunnuse väärtuste hajuvus. n - 1/ n Alumine kvartiil Kv tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas 4 ehk 25%. Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas 4 ehk 25%. Üldkogum kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järelduse. Sissejuhatus Kuna tegelen ise väga palju spordiga siis otsustasin uurida, kui populaarne on sport Nõo Reaalgümnaasiumis (edaspidi: NRG)
Variatsioonirea ulatus u maksimaalse ja minimaalse elemendi vahe. Sagedustabel näitab, mitmel korral saab antud tunnus antud väärtuse. Korrelatsioon kasutatakse statistikas võrdlemisel. Näitab, kas uuritavate objektide puhul on tegemist mingite sarnaste ilmingutega või mitte. Dispersioon andmetele vastav hälvete keskväärtus. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on tunnuse väärtuste hajuvus. Alumine kvartiil Kv - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas 4 ehk 25%. Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas 4 ehk 25%. Üldkogum - kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järelduse. Sissejuhatus Statistilise uurimistöö teemaks valisin ,,Kui tervislikud on teie eluviisid?". Uurisin kui palju tegeleb NRG õpilane
N - 1 i =1 ni ( x i - x ) 2 standardhälve- 1 k sx = N - 1 i =1 ni ( x i - x ) 2 variatsioonikordaja- V x = 100 * s x x kvartiilhälve- ülemine kvartiil-alumine kvartiil c) Leian ainult rühmitamata andmetest asümmeetriakordaja (=skew(d)) ja ekstsessi (=kurt(d)). Jaotus on paremale väljaveninud sabaga ning lamedatipuline. Arvutuste tulemused on tabelis 6. Tabel 6. Karakteristikud Rühmita- Rühmi- mata tatud 9
Kood_i Sugu Vanusgrupp V03C 9 1 55-64 18488.41757 71 1 55-64 918.57205 79 1 55-64 11932.76984 142 1 55-64 10495.1471 175 1 55-64 24310.46007 235 1 55-64 13219.25637 259 1 55-64 18466.35636 307 1 55-64 24702.85409 325 1 55-64 16699.7476 332 1 55-64 35186.76431 335 1 55-64 25016.02893 358 1 55-64 30108.05777 370 1 55-64 24414.22772 405 1 55-64 4599.90323 420 1 55-64 21796.51191 431 1 55-64 16129.14899 466 1 55-6...
Keskväärtus Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. _ Tunnuse keskväärtus: x = 56,64 Mood Mood on tunnuse kõige sagedamini esinev väärtus. Mo= 54 Mediaan Mediaan on arv, millest suuremaid ja väiksemaid väärtusi on variatsoonreas ühepalju. Me= 55 Kvartiilid Alumine kvartiil on tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas 25%. Kv= 52 Ülemine kvartiil on tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsoonreas 25%. _ Kv= 62 Standarthälve Standardhälve on ruutjuur dispersioonist. Mõõdetava suuruse standardhälbe ühikuks on selle sama mõõdetava suuruse ühik. = 6,75 Max-Min= 80 42= 38 Variatsioonikordaja
Registreerimata aktsiakapital 308 308 Ülekurss 3,212,841 3,212,841 Eelmiste per jaotamata kasum -1,972,428 -2,600,924 Aruandeaasta kasum (kahjum) -628,496 -334,982 Kokku omakapital 637,917 302,935 Kokku kohustused ja omakapital 1,144,271 1,244,425 Nõuded ostjate vastu 9134 10257 Statistikaameti võlakordaja hinnangud 1 kvartiil 0.16 mediaan 0.29 3 kvartiil 0.48 . Efektiivsus arade käibekordaja 2011 2012 0.55 0.47 3. Arvutused. Arvtulemus (tabelis) epitoorse võlgnevuse käibevälde 5.19 6.29 . Ligviidsus iire maksevalmiduse kordaja 0.02 0.03 . Maksevõime õlakordaja 0.44 0.76 . Rentaablus äiberentaablus -99% -57% -99% -111%
Miinimum 17,85 cm Aritmeetiline keskmine 27,71630435 29,81 cm Ruutkeskmine diameeter 28,2678195 29,40 cm Kaalutud keskmine diameeter 30,00065942 30,17 cm Mediaan 27,15 19,5 cm Mood 29,55 20,5 cm 0,1-kvantiil 21,375 11,5 cm Alumine kvartiil (0,25- kvantiil) 23,8 15,5 cm 0,9-kvantiil 35,59 21,5 cm ülemine kvartiil (0,75- kvantiil) 30,9 21,5 cm 0,3-täiendkvantiil 29,5 17,5 cm Kvartiilhälve 7,1 6,0 cm Haare 24,25 cm Absoluuthälve 4,325333333 cm
protsentides. b. Tunnuse erinevate väärtuste esinemissagedust absoluutarvudes, suhtarvudes ning protsentides. c. Tunnuse erinevate väärtuste esinemissagedust ainult absoluutarvudes Väär Selle esituse hinded 0/1. Question 5 Punktid: 1 Millised järgmistest karakteristikutest on asendikarakteristikud? Vali üks või enam vastust. a. Mood b. Mediaan c. Keskväärtus d. Standardhälve e. Dispersioon f. Alumine kvartiil Osaliselt õige Selle esituse hinded 0.67/1. Question 6 Punktid: 3 Järgmine tabel näitab ühe väikese riigi nafta ostukogust ja hinda kolmes erinevas kohas ühe nädala jooksul: Allikas Mehhiko Kuveit Sularahaturg (Spot Market) Kogus (barrel) 1000 200 100
Kood_i Sugu Vanusgrupp V03C V27C V30C V34C 17 2 45-54 26654 10777.39 0 17559.74 18 2 45-54 14138.94 391.0772 389.3519 12355.13 39 2 45-54 15984.97 10809.5 0 4956.993 57 2 45-54 11514.2 0 3897.66 3221.711 73 2 45-54 20280.35 572.1838 0 20077.37 77 2 45-54 857.7497 326.17 0 6116.338 84 2 45-54 15278.4 0 490.7205 9179.957 88 2 45-54 8189.979 462.347 2322.699 7176.859 92 2 45-54 12823.93 11974.15 0 9915.389 106 2 45-54 7414.769 646.8166 0 6266.34 107 2 45-54 24619.25 2276.556 809.0897 2028...
7. Sagedusjaotustabel, hälve x f w X=0 1 1,25% -2,1125 X=1 28 35% -1,1125 X=2 24 30% -0,1125 X=3 17 21,25% 0,8875 X=4 8 10% 1,8875 X=5 2 2,5% 2,8875 8. Mood: M= 1 9. Mediaan: M= 2 10. Kvartiil: 3 Q= 1 Q= 11. Arihmeetiline keskmine: 12. Standard hälve: = ²» 1,107 13. Enamik tunnuseid on lõigus: [1,0055 ; 3,2195] 14. Variatsioon kordaja: v= 15. Diagramm:
4 5 4 4 Leidke eraldi hinnete järgmised arvkarakteristikud: Mate- Füüsika maatika Maksimum 5 5 Miinimum 2 2 Variatsiooniamplituud 3 3 Mood 4 5 Alumine kvartiil 2 4 Mediaan 4 4 Ülemine kvartiil 4 5 Aritmeetiline keskmine 3,4 4,24 Dispersioon 1,08 0,69 Standardhälve 1,04 0,83 Asümmeetria kordaja -0,19 -0,97 Ekstsessi kordaja -1,22 0,63 Variatsioonikoefitsiendid variatsiooniamplituudi järgi 88% 71%
176 70 198 90 187 80 199 90 169 87 199 90 Leidke tunnuse pikkus järgmised arvkarakteristikud: Aritmeetiline keskmine 182.4 Harmooniline keskmine 181.94 Geomeetriline keskmine 182.17 Miinimum 165 Maksimum 199 Variatsiooniamplituud 34 Mood 169 Mediaan 183.5 Alumine kvartiil 175 Ülemine kvartiil 189 Dispersioon 83.68 Standardhälve 9.15 Asümmeetria kordaja -0.005 Ekstsessi kordaja -1.05 Variatsioonikoefitsiendid variatsiooniamplituudi järgi 18.64 standardhälbe järgi 5.02 dke tunnuse pikkus järgmised arvkarakteristikud: average harmean geomean min max max-min mode
192 84 169 70 Mood 169 mode Mood 73 179 84 169 71 Mediaan 183.5 quartile(2) või median Mediaan 79 180 80 169 71 Alumine kvartiil 175 quartile(1) Alumine kvartiil 75 188 70 169 72 Ülemine kvartiil 189 quartile(3) Ülemine kvartiil 84 192 73 169 72 Dispersioon 83.676768 var Dispersioon 34.959495
Mediaan Me 10419 Mood Mo Puudub Hajuvuskarakteristikud: Max Väärtus 12563 Min väärtus 6283 Haare 6280 Alumine kvartiil 9260 Ülemine kvartiil 11409 Kvartiilide vahe 2149 Dispersioon 3780832,1571429 Standardhälve 1944,4 Üldkogumi keskväärtuse usaldusintervall (usaldusnivooga 95%
7 4.4 Eeldades diameetri lognormaaljaotust Tabel 7. Eeldades diameetri lognormaaljaotust 1) leida, mitu protsenti diameetritest on väiksemad kui 11 cm, 7,5% 2) leida, mitu protsenti diameetritest on suuremad kui 8 cm, 99,8% 3) leida, mitu protsenti diameetritest jääb vahemikku 7 kuni 10 cm, 3% 4) leida diameetrite alumine kvartiil, 13,1 cm 5) leida diameeter, millest 20% on suuremad. 18,6 cm 5. Weibulli jaotus 5.1 Weibulli parameetrid Tabel 8. Weibulli parameetrid a= 1,61 b= 6,48 c= 6,40 5.2 Weibulli jaotuse tabel Tabel 9. Weibulli jaotuse tabel, mis on algandmete põhjal arvutatud Emp Weibull
x 1 +x 2 +. ..+x n 1 n x i = x= n i=1 3.2 Mediaan Me X = x0,5 Mediaan on variatsioonrea keskmine liige. Kui liikmeid on paaritu arv, siis keskmine liige. Kui liik 3.3 Kvartiilid Kv - alumine kvartiil ehk tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioon Kv - ülemine kvartiil ehk tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonr Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendik Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendik
4) Kirjeldav statistika eri tüüpi tunnuste kohta: mis on mood, mediaan, kvantiilid, keskmine, standardhälve, dispersioon. Nominaaltunnused · Mood kõige sagedasem väärtus või väärtusklass Järjestustunnused Mood Mediaan punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks. Kvantiilid Alumine kvartiil punkt, millest väiksemaid väärtusi on kogumis ¼ osa. Ülemine punkt, millest suuremaid väärtusi on kogumis ¼ osa. Detsiil punkt, mis eraldab 1/10 osa väärtustest. Normaaljaotuse sagedamini kasutatavad kvantiilid: mediaan = 0 alumine kvartiil = -0,675; ülemine kvartiil = 0,675 Arvtunnused Mood, Mediaan Kvantiilid Aritmeetiline keskmine ehk keskväärtus Hajuvuse näitajad Standardhälve kui kaugel on keskmine inimene keskmisest. Dispersioon standardhälbe ruut.
standardhälve, haare, kovariatsioon, korrelatsioonikordaja. Definitsioonid ja arvutamine. Aritmeetiline keskmine: AVERAGE Mediaan: MEDIAN Kui N is paaritu, siis on mediaan järjestatud statistilise rea ehk variatsioonrea keskmine liige. Kui N on paaris, siis on mediaan variatsioonrea kahe keskmise liikme poolsumma. Kvartiilid: QUARTILE 25-protsentiili nimetatakse esimeseks kvartiiliks. Mediaan on 50-protsentiil ehk teine kvartiil. 75-protsentiili nimetatakse kolmandaks kvartiiliks. Mood: MODE Mood on arvrea suurima sagedusega liige. Dispersioon: VARP Näitab, kui palju uuritav suurus varieerub. Arvutuste lihtsustamiseks võib kasutada valemit: Standarthälve: STDEVP Standardhälve iseloomustab tunnuse hajuvust. Haare on arverea suurima ja vähima väärtuse vahe. Kovariatsioon: COVAR Olgu igal objektil on mõõdetud rohkem kui üks tunnus.
hangitud andmete põhjal Statistiline rida, - rida, mille moodustavad valimi kõigi objektide sama tunnuse X väärtused variatsioonrida. - Järjestades objektide tunnuse X väärtused saame tunnuse X variatsioonrea. (=järjestatud statistiline rida) Mood, - tunnuse enim esinev väärtus mediaan, - tunnuse variatsioonrea (tunnuse järjestatud väärtused) keskmine liige, paarisarvulise valimi korral kahe liikme poolsumma. Alumine (ülemine) kvartiil - Kvartiilid koos mediaaniga jaotavad variatsioonirea neljaks võrdsel arvul liikmeid sisaldavaks osaks, kusjuures väikeseim (p = 0,25) kannab nimetust alumine kvartiil ja suurim (p = 0,75) kannab nime ülemine kvartiil p-kvantiil - arvväärtus, mis jaotab järjestatud statistilise rea (variatsioonrea) osadeks suhteliste mahtudega p ja 1-p, kus p on murdarv vahemikus 0...1. (kvantiil - JS väärtus, millest väiksemaid on osakaaluga p ja suuremaid 1-p. ) 17
Andmeanalüüs 1)Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Eelnevad: Uurimusprobleem, uurimusmeetodi valik (kvantitatiivne, kombineeritud, kvalitatiivne), valimi koostamine, andmestiku loomine. Järgnevad: Andmete analüüsimine ja tulemuste esitamine. Millised on alternatiivid kvantitatiivsetele meetoditele. kombineeritud, kvalitatiivne 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Võimalikult lühike, viisakalt sõnastatud, lihtsa grammatikaga, sisaldab infot ühe teema kohta, sama tähendusega kõigi jaoks, sobival spetsiifilisuse tasemel Ankeedi struktuur, sissejuhatus, miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed, tänud juba ette, lihtsamad küsimused, avaküsimused, keerulised ja põhiküsimused. Sotsiaal-demograafilline osa, lõpusõna ja tänud. Küsimuste tüübid: Avatud ( vastaja vastab oma sõnadega) Su...
· Binaarsed ehk dihhotoomsed ehk kaheväärtuselised tunnused 4) Kirjeldav statistika eri tüüpi tunnuste kohta: mood, mediaan, kvantiilid, keskmine, standardhälve, dispersioon. Mood- kõige sagedasem väärtus või väärtusklass, mehed naised Mediaan punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks. Kvantiilid Alumine kvartiil punkt, millest väiksemaid väärtusi on kogumis ¼ osa. Ülemine kvartiil punkt, millest suuremaid väärtusi on kogumis ¼ osa. · Arvtunnused Hajuvuse näitajad Standardhälve kui kaugel on keskmine inimene keskmisest. Dispersioon standardhälbe ruut. 5) Jooniste kasutamine tunnuste iseloomustamiseks, eri jooniste tüübid, histogramm. · Teine lihtne võimalus tunnuse jaotuse esitamiseks on teha sellest joonis.
On teada rühmade keskmised ja objektide arvud. Mediaan Kui N on paaritu, siis on mediaan järjestatud statistilise rea keskmine liige. Kui N on paaris, siis on mediaan järjestatud arvrea kahe keskmise liikme poolsumma. Kvartiilid p-protsentiil on arv, millest p protsenti andmetest on temast väiksem või võrdne ja (100-p) protsenti suurem või võrdne. 25- protsentiili nim. esimene kvartiil. Mediaan on 50-protsentiil e. teine kvartiil. 75-protsentiil nim. kolmas kvartiil. Mood arvrea suurima sagedusega liige. Dispersioon 2= ((x1-x)2+(x2-x)2+...+(xN-x)2)/N =(i=1N(xi-x)2)/N Standardhälve =2 Haare arvrea suurima ja vähima väärtuse vahe 2. Sündmus ja tõenäosus. Kindel sündmus ja võimatu sündmus. Sündmus on tõenäosusteooria põhimõiste