21-30 8 31-40 15 41-50 24 51-60 12 61-70 8 Iseloomustage selle seltskonna keskmist vanust aritmeetilise keskmise, moodi ja mediaani abil. 14. Kass püüdis hiiri mitmel erineval kuul järgmiselt: 5, 12, 11, 4, 10, 8, 6, 2, 3, 7, 9. Arvutage hiirte arvu varieeruvuse iseloomustamiseks keskmine lineaarhälve, dispersioon, standardhälve. Vastused: 1. Verivorst: 3.50, mandariinid 1.00 ja glögi 0.80 eurot. 2. 28 viinamarja 3. 1) 6237,32 eurot; 2) 7809,33 eurot; 3) 10953,34 eurot. 4. -6 -8 --6 -1 15 4 21 11 6 5. 6 6. C(q)=12000 + 6q 7. R(q)=15q 8. P(q)=-7q2 + 379q - 4000 9. 1600 10. Aritmeetiline keskmine=96,71 kr 11. Aritmeetiline keskmine=15,875; Mo=15, Me=16. 12. Harm. keskmine=9,25 kr 13.* Aritmeetiline keskmine=43,76; Mo=45,29 ja Me=44.75. 14
Struktuurnihete mõjul vähenes keskmine hind 9,3% (vale) 5. Ei ükski eelnevatest variantidest Normaalselt jaotuvas kogumis... 1. ei toimu väärtuste varieerumist 2. standardhälve peab võrduma nulliga 3. jaotuskõver on sümmeetriline 4. mõlemasuunalised kõrvalekalded ei ole võrdvõmalikud Normaalselt jaotuvas kogumis 1. Mediaan, mood ja aritmeetiline keskmine ei pea olema võrdsed (peavad) 2. Stadarthälve ei pea võrduma nulliga, kuid lineaarhälve peab olema null 3. Assümeetria kordaja peab olema alati positiivne (vale) 4. Ei esine väärtuste vatieerumist 5. Mõlemasuunalised kõrvalekalded keskmisest tasemest on võrdvõimalikud Normaaljaotuse korral 1. aritm, keskmine ei saa olla suurem kui geom. keskmine 2. geom. keskmine on alati aritm. keskmisega võrdne 3. ei ole aritm. Keskmise ja mediaanig võrdsed Mediaan, mood ja aritmeetiline keskmine ei pea olema võrdsed (peavad)
kuid kui vaadata aastat 2007, siis on sündimus vaid 15 775, seega vähem, kui keskmine. Sama ka abielude kohta. Üldiselt jäid keskmised 8000 ja 9000 vahele, siis 2007 oli abielusid vaid 7022 ning veel kurvem on aasta 1998 5430 abielu. Variatsiooninäitarvudeks nimetatakse tunnuse väärtuste varieeruvust iseloomustavaid rea üldistavaid karakteristikuid. Tabel 2 võib näha lineaarhälvet, dipersiooni ja assümeetriakoefitsienti. Lineaarhälve on keskmine erinevus keskmisest. Selle analüüsi puhul on see elussündide puhul 4620 ning abielude korral 3078. Erinevus on väga suur. Dispersioon ehk keskmine ruuthälve on elussündidel 23645458 ning abielude puhul 10280215, jällegi on erinevused väga suured. Mõlema puhul on asümmeetria vasakkaldeline ja positiivne- sündide puhul 0,13 ja abielu korral 0,06. Ekstsess on mõlemal negatiivne- see tähendab, et on lauge jaotuskõver. Andmeid on mõlemal andmekogumil 30
2. parameeter b ei tohi olla negatiivne 3. vabaliige 18,5 kirjeldab joone tõusu 4. igal ajaperioodil väärtused vähenevad 0,48 korda 5. ei ükski Eksponentkeskmine 1. kasutatakse keskmise kasvutempo leidmisel 2. ei arvesta rea kõiki väärtusi 3. on alati aritmeetilisest suurem 4. kasutatakse aegrea tasandamisel 5. ei ükski Keskmine esindusviga 1. on vale keskmise valiku tulemus 2. on väljavõtukeskmiste lineaarhälve 3. vahe ühe valimi keskmise ja üldkogumi keskmise vahel 4. on ruutjuur valimite keskmiste dispersioonist 5. ei ükski Keskmise taseme arvutamise juures 1. ruutkeskmine annab võrreldes aritm. keskmisega 1,253 korda väiksema tulemuse 2. kronoloogiline keskmine sobib kasutamiseks ainult aegridade korral 3. mediaani ei kasutata kunagi paarituarvulistes ridades 4. ....harmooniline keskmine... Kronoloogilist keskmist kasutatakse kui on tegemist:
3 771.7 6.033 681.9 630.1 2520.7 4016.6 788.9 6.003 723.1 630.5 2504.6 4035.7 766 5.76 741.8 631.5 2527 3907.3 759.6 5.533 671.8 631.8 2475.9 3927.9 766.7 5.733 673.7 634.8 2487.5 aritmeetiline keskmine 397.43485714 2.ül geomeetriline keskmine 366.91549607 harmooniline keskmine 337.70774552 mediaan 389.1 E C D keskmine lineaarhälve 33.271712653 2.6749263673 131.991 standardhälve 42.401033511 3.2913195329 154.694 dispersioon 6.511607598 1.8141994193 12.4376 A B C D standardhälve 862.46781242 149.22950665 3.29132 154.6939680673 aritmeetiline keskmine 2371.7051429 512.07485714 5.109771 397.4348571429
kronol. Keskmine sobib ainult väga pikkade ridade korral – VALE, rea pikkus ei määra kvanitatiivse tunnuse korral tuleb arvutada ainult aritmeetiline keskmine – VALE, saab, aga ei pea geom.keskmine on alati aritmeetilisest keskmisest väiksem – ÕIGE mood ja mediaan on alati aritmeetilisest keskmisest suuremad – VALE, mitte alati Varieeruvuse hindamisel peavad Me ja Mo olema võrdsed, aritmeetiline keskmine võib erineda – VALE lineaarhälve on seotud tõenäosusteooria rakendustega, kuid standardhälve ei ole – VALE, vastupidi peavad olema mõlemasuunalised kõrvalekalded keskm.tasemest võrdvõimalikud – VALE võib kasutada dispersiooni – ÕIGE standardhälve (hälvete ruutkeskmine) on varieeruvas kogumis alati keskmisest lineaarhälvest (hälvete aritm keskm) väiksem – VALE, suurem Väljavõtukogumi suurus ei tohi sõltuda: üldkogumi suurusest (mida suurem üldkogum, seda suurem valim)
subjektil, yj on sama näitaja võrreldaval objektil (ettevõte, tegevusala või regiooni keskmine, maksimum, etalon jms) või subjektil (töötaja, töötajate kogum). NB! Näitajad/tegurid peavad olema võrreldavad. Vastavate näitajate vahe on 'y yi y j Absoluutsed variatsiooninäitajad x individuaalne absoluutne hälve x standardhälve x variatsiooniamplituud x suhtelised variatsiooninäitajad x keskmine lineaarhälve x standardiseeritud väärtus x dispersioon Võimalik on juhuslikkus, kui y V d y i d y V Variatsioon ja standardhälve tulevad tavaliselt statistilistest programmidest välja. Paralleelridade analüüs Variant 1. Andmed aegridades (Y-müügitulu; X- töötajate arv, saadakse tööviljakus) Variant 2. Andmed ettevõtte allüksuste lõikes Andmete alusel saab välja tuua kasvu kiirenduskoefitsiendi ja muud koefitsiendid. Analüütiline rühmitamine
astendamisel saadud arvude aritmeetilisi keskmisi. Arvu, millega momendi leidmisel hälbeid astendatakse, nimetatakse momendi järguks. VARIATSIOONINÄITARVUD · Variatsiooniamplituud (R= Xmax-Xmin)näitab äärmuste vahet. Äärmusi kirjeldab, ei kirjelda seda mis on kogumi sees. Väheväärtuslik, infot pea ei olegi. · Absoluutsed variatsiooninäitarvud: variatsiooniamplituud, keskmine lineaarhälve, dispersioon ja standardhälve, kvartiilhälve. Absoluutsete variatsiooninäitarvude suurus sõltub variantide absoluutväärtustest, mis muudab nad erinevate ridade võrdlemisel raskesti kasutatavateks. Teiseks probleemiks absoluutsete varieeruvusnäitarvude kasutamisel on ühik. Neil on mõõdetava suurusega sama ühik, mis muudab võimatuks erinevate ühikutega suuruste hajuvuse võrdlemise. · Keskmine lineaarhälve (d katusega) ehk keskmine absoluuthälve. Hälve ehk
=6+ = 10,13 10 D8 = x8 D + 3 f 8D 13. Lineaarhälve: n - - - xi - x f i - 50,45 d = i =1 n d =
(13) 0,0490=4,90% (26) 1,7144=171,44% (39) müügi (52) 94,25% 2. osa Väljavõte AS Tallinna Sadama tulude kohta 2006 2007 2008 2009 2010 1. Selleks, et leida variatsioonikoefitsiente, pean kõigepealt leidma aritmeetilise keskmise, amplituudi, keskmise lineaarhälbe ning standardhälbe (sh dispersiooni). Aritmeetiline keskmine on . Amplituud on . Keskmine lineaarhälve on . Dispersioon on . Standardhälve on ruutjuur dispersioonist, seega . Variatsioonikoefitsientide leidmine: Amplituudi koefitsient on . Keskmise lineaarhälbe koefitsient on . Standardhälbe koefitsient on . Dispersiooni koefitsient on . 2. Tulude 2-sammu (ehk 2 aasta kaupa) tasandus. Selleks leian iga 2 aasta keskmise, seejuures asetan keskmise aastate keskele, tegelikkuses aastate vahele. Hiljem tsentreerin, et saaks teatud aasta juurde märkida. Tsentreeritult:
Mahukeskmised aritmeetiline keskmine, harmooniline keskmine, geomeetriline keskmine jt. i ( n + 1) ( Qi ) = 4 Asendi- ehk struktuurikeskmised mediaan, mood, kvantiilid (kvartiilid, detsiilid jt) Mood kõige sagedamini esinev liige kogumis Kvartiilid jagavad kogumi neljaks võrdseks osaks, detsiilid 10-ks. Hajuvuskarakteristikud jagunevad: Absoluutsed variatsiooninäitarvud variatsiooniamplituud, keskmine lineaarhälve, dispersioon, standardhälve jt. Suhtelised variatsiooninäitarvud erinevad variatsioonikoefitsiendid Variatsiooniamplituud - Näitab variatsiooni ulatust kogumis (R = X X ) max min Struktuurisuhtarv osakogumimaht / üldkogumi maht Koordinatsioonisuhtarv osakogumi i maht / osakogumi j maht Dünaamikasuhtarv tunnuse väärtus ajaperioodil / tunnuse väärtus eelmisel perioodil
KIRJELDAVAD STATISTIKUD INTERVALLITUD REAS Kirjeldav statistika on numbriliste andmete organiseerimine ja summeerimine, see on vajalik andmeanallüüsi esimesel etapil. Valimit kirjeldatakse, kuid üldistusi ei laiendata üldkogumile. Kirjeldav statistika annab järgmist informatsiooni: uuritava tunnuse väärtuste vahemik tunnuse kõige tüüpilisemad väärtused tunnuse varieeruvus Lisaks aitab kirjeldav statistika sõnastada hüpoteese ning tõlgendada uurimistulemusi. Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust kes...
Kirjaldav statistika- keskväärtused: - Aritmeetiline keskmine - Mediaan: jaotuse keskmine liige, millest mõlemale poole jääb 50% elementide koguarvust - Mood: variatsiooniteas kõige sagedamini esinev väärtus - Miinimum - Maksimum - Variatsiooniamplituud (max-min) - Kvartiilid Kirjeldav statistika -variatsiooni tunnused: - Hälve - tunnuse üksikväärtuse erinevus väärtuste aritmeetilisest keskmisest (võib olla neg. või pos.) - Keskmine lineaarhälve – üksikute hälvete absoluutväärtuste keskmine - Dispersioon (VARP)– keskmine ruuthälve ehk ruuthälvete aritmeetiline keskmine - Standard hälve (STDEV) – ruutjuur dispersioonist – mõõtühik sama, mis mõõdetaval parameetril - Variatiivsuse koefitsent – hälbivuse suhtnäitaja (standardhälbe ja aritmeetilise keskmise suhe), aitab võrrelda erineva suuruse ja skaalaga parameetreid 3) Andmete võrdlemine ja üldistamine – hinnatakse erinevuse eksisteerimise tõenäosust
reas onmoodi leidmine keerulisem. Selleks tuleb leida moodintervall, so kõige suurema sagedusega intervall ja arvutada. 8. Variatsiooniamplituud – on statistilise rea kõige suurema ja väiksema väärtuse vahe. Selle järgi saab kõige lihtsamini tunnuse väärtuse varieerumist kirjeldada. Puuduseks on, et ta ei väljeda rea kõigi, vaid üksnes äärmiste liikmete erisusi.St et suhteliselt erinevate ridade variatsiooniamplituudid võivad osutuda võrdseteks. Keskmine lineaarhälve – Variantide individuaalväärtuste ja nende aritmeetilise keskmise vaheliste hälvete absoluutväärtuste aritmeetiline keskmine. See üldistab lineaarhälve kogumi kõigi liikmete vahelisi erisusi. Selle mõõtühikuks on üksikväärtuste mõõtühik. Variatsioonikoefitsient keskmise lineaarhälbe järgi. – Lineaarhälbe abil ei saa võrrelda eri mõõtüh. esitatud ridade varieerumist. Seda saab lahendada suhtelise variatsiooninäitarvu e. Koefitsiendi arvutamisega.
osaks. Nt kvartiilid on 25%, 50% ja 75%. 2.2 Millised on keskmised Mahukeskmised: Aritmeetiline kekmine Harmooniline keskmine Astmekeskmine Geomeetriline keskmine Asendikeskmised: 3 / 10 Mood Mediaan Kvantiilid 2.3 Millised on variatsiooninäitarvud Variatsiooniulatus Keskmine lineaarhälve Dispersioon Standardhälve Kvartiilhälve 2.4 Mis on mood? Mood on kõige sagedamini esinev väärtus. 2.5 Mis on mediaan? Mediaan on jaotuse keskmine liige, millest mõlemale poole jääb võrdne arv elemente. Mediaan jaotab järjestatud statistilise rea kaheks. 2.6 Olukord (loengukiledelt). Millal kasutada moodi / mediaani / aritm. keskmist. mitu olukorda (nominaalskaalal, järjeskaalal, intevallskaalal)
nooremate inimeste osakaal võrreldes Tallinna omaga aastal 2010 oli suurem. Joonis 4. Joonis 5. 7 Kui võrrelda omavahel mõlema linna moodi, mis kujutab endast rahvastiku kõige sagedamini esinevat vanust, siis selle põhjal mingeid erilisi järeldusi teha ei saa, kuna nad on peaaegu samad. Tartus oli aastal 2010 selle väärtuseks 33,42 ning Tallinnas vastavalt 33,93. Keskmine lineaarhälve, mis näitab vanuse keskmist aritmeetilisest keskmisest kõrvalekaldumist, on mõlemal linnal peaaegu sama. Tartul 22,95 ning Tallinnal 22,68. Dispersiooni osas näha mõningaid erinevusi. Nimelt, Tartu rahvastiku dispersioon 2010. aastal oli 709,15 ning Tallinna oma 683,64. Kuna dispersioon, hälvete ruutude aritmeetiline keskmine, on seda suurem, mida rohkem on tunnusel keskväärtusest tugevasti hälbivaid väärtusi, siis järelikult näitab Tartu rahvastiku suurem dispersioon
Leida tabeli andmetest valemite abil funktsiooni F1 väikseim väärtus ja sellele vastav argument (x väärtus). Leida tabeli andmetest valemite abil funktsiooni F2 väikseim väärtus ja sellele vastav argument (x väärtus). mod 4 summast (var näitajad) iga aasta kohta iga aasta kohta iga maakonna kohta iga maakonna kohta mod 5 summast (var näitajad) väärtuste muutuse ulatus (variatsioonamplituud ehk range) väärtuste keskmine lineaarhälve (ehk keskmine absoluuthälve) väärtuste dispersioon (variance) väärtuste standardhälve (standard deviation) väärtuste variatsioonikordaja (coefficient of variation) Number 206653 ris 'Põllumajandus, metsamajandus ja kalapüük' SKP ühe elaniku kohta suurem kui 900 eurot ris 'Põllumajandus, metsamajandus ja kalapüük' SKP ühe elaniku kohta väiksem kui 700 eurot ris 'Teenused' SKP ühe elaniku kohta suurem kui 4000 eurot
x variatsiooniamplituud d yi max yi min ´ kus y i max ja y i min on vastava näitaja maksimum või miinimum i-ndate objektide või subjektide kogumis. n ¦d i 1 i x keskmine lineaarhälve d n kus n on i-ndate subjektide või objektide arv. n ¦ y y 2 i V2 i 1 x dispersioon n standardhälve V V 2 x x suhtelised variatsiooninäitajad (variatsioonikoefitsiendid variatsioon keskmise suhtes). Kui see on üle