KIRJELDAV STATISTIKA (MJRI.01.024. KODUTÖÖ NR.1 Kaia Philips Maj.teaduskond bakalaureus I kursus SUGU Alternatiivne e.kaheväärtuseline binaarne tunnus-sugu on tunnus, millel on ainult 2 võimalikku väärtust Andmebaasis mittearvuline tunnus on kodeeritud 0=mees, 1=naine. Antud ettevõttes töötab kokku 474 inimest - 46%töötajatest(mean) e. 216 (sum) on naised. Mehi on rohkem, kui naisi. Standardviga ±2% . VANUS- Pidev tunnus-mõõdetav arvtunnus Keskmine töötajate vanus 37,19 aastat(mean). Standardviga keskmisel vanusel ±0,5 aastat(standard error). 50% töötajatest on nooremad ja 50% vanemad, kui 32 aastat. Nooremaid inimesi on rohkem kui vanemaid(skewness-assümeetria näitaja). Kõige rohkem
Küsimus 3 Juku kohta on olemas järgmised andmed: Õige Sugu: mees Hindepunkte Perekonnaseis (abielus, vallaline): abielus 1.00/1.00 Laste arv: 2 Haridus: kesk Vanus: 25 aastane Amet: lukksepp Kategooria: kõrgeim Pikkus: 176 cm Määra nende andmete korral kasutatud tunnuste tüüp. amet mittearvuline nominaaltunnus kategooria mittearvuline järjestustunnus pikkus arvuline pidev tunnus haridus mittearvuline järjestustunnus
mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet). Nominaaltunnus mittearvuline tunnus, mille väärtused pole järjestatavad. 6. Juhuslik suurus ehk juhuslik muutuja suurus või muutuja, mille väärtus enne mõõtmist või katset ei ole teada. 7. Kuidas on defineeritud jaotusfunktsioon? Jaotusfunktsiooni skitseerimine,
Sagedustabel andmete kogumise tabel, mille esimesse ritta paigutatakse mõõdetavad suurused ja teise ritta iga väärtuse esinemise sagedus Mood rea kõige rohkem esinev liige Mediaan - variatsioonirea keskmine liige. Üldkogum kõik taimed, inimesed või asjad mida uuritakse Valim üldkogumist võetud uurimisgrupp Diskreetne tunnused tohivad olla ainult üksteisest eraldatud väärtused. Pidev tunnus pidevalt muutuvad suurused Kvalitatiivne tunnus - mittearvuline tunnus Kvantitatiivne tunnus -arvuline tunnus Kuidas moodustatakse klasse Kui tunnuseid on väga palju ja väga erinevaid siis jaotatakse tulemused klassidesse.
pangakontoris käinud klientide arv arvuline 1.00/1.00 Märgi küsimus lipuga mittearvuline hinnang valitsuse tööle eksamitöö kirjutamise aeg arvuline
ristsirge asuvad ühel tasandil sin = n21 ; sin Ühe keskkonna (absoluutne) murdumisnäitaja n selle keskkonna ja vaakumi suhteline murdumisnäitaja. Leitakse valguse murdumisel vaakumist keskkonda. Vaakumi murdumisnäitaja n0 = 1 . Kõikide keskkondade murdumisnäitajad n 1 ; Keskkonna optiline tihedus mittearvuline keskkonna iseloomustaja mida suurem on murdumisnäitaja, seda suurem on optiline tihedus; Kahe keskkonna murdumisnäitajate n1 ja n2 seos nende keskkondade suhtelise murdumisnäitajaga n 21 ja n12 n2 n 1 = n21 ; 1 = n12 ; n21 = ; n1 n2 n12 Keskkonna murdumisnäitaja seos valguse levimise kiirusega selles keskkonnas v ja vaakumis c
väärtusi (laste arv peres) Pidev - kõik reaalarvulised väärtused arvtelje teatud lõigul, omavad lõpmata palju võimalikke väärtusi (õhutemperatuur) Mittearvulised (kvalitatiivsed) tunnused Järjestustunnused - väärtused omavad sisulist järjekorda (hinnete sõnaline väljendus) Nominaaltunnused - väärtustel puudub sisuline järjekord (raamatute pealkirjad) Kaheväärtuseline (binaarne) tunnus - omab kahte võimalikku väärtust, võib olla nii arvuline (väärtused 1 ja 0) kui mittearvuline (sugu, jah/ei) Pidev tunnus võib omada arvtelje teatud lõigul kõiki reaalarvulisi väärtusi (näiteks õhutemperatuur, inimese kehakaal jms). Saadakse tavaliselt füüsikalise mõõtmise tulemusena. Diskreetne tunnus saab omada väärtusi teatud vahemike järel (laste arv peres, tudengite arv loengus jms). Saadakse tavaliselt loendamise teel. Valim on üldkogumi alamhulk, millelt kogutakse andmed järelduse tegemiseks.
BCU0431 STATISTIKA (PÄEVAÕPE) Started on pühapäev, 12 veebruar 2017, 8:25 State Finished Completed on pühapäev, 12 veebruar 2017, 8:44 Time taken 18 mins 38 secs Marks 19.0/20.0 Grade 5.7 out of 6.0 ( 95 %) Question 1 Selgita valimi mõistet. Kuidas tagada valimi juhuslikkus ning milleks seda vaja on? Complete Mark 4.0 out of 5.0 Valim - üldkogumist väljavalitud väike objektide grupp, kellelt saadud andmete põhjal tehakse järeldus terve üldkogumi kohta. Selleks, et tagada valimi juhuslikkus on mitmeid võimalusi. Näiteks: juhuväljavõtt, süstemaatiline väljavõtt, tüüp- ehk seeriaväljavõtt, kõikne valim. Selleks, et valim annaks üldkogumi kohta objektiivset j...
Reljeef on tasane nõlv, mikroreljeefiks on tasane ning raieid teostatud pole (Kiviste K 2011b). 2. Tunnuste liigid Nr 772 proovitükil on mõõdetud puuliikideks mänd, kuusk ja kask, puude diameeter proovitüki tsentri suunas (D1), diameeter tsentriga risti olevas suunas (D2), kõrgus (H), võra alguse kõrgus (HV). Mõõdetud ka puude kõrgus, kust hakkavad kuivad oksad (HKO), kahjustuse kood ja kahjustuse tugevus (nõrk, keskmine või tugev)(Kiviste K 2011b). Nominaaltunnus on mittearvuline tunnus, kus tunnuste väärtused ei ole sisemise loogika järgi järjestatavad (nt. veregrupp, rahvus, rass, puuliik, lehe kuju)(tabel 1)(Kiviste K 2011c). Tabel 1. Tunnuste liigid Pidev Diskreetne Arvuline Mittearvuline Järjestustunnus Nominaaltnnus Puuliik x x Rinne x x D1 x x D2 x x
Andmed mingi tunnus või omadus. Tunnus omadus, nt keskmine pikkus, kummas paralleelklassis läks matemaatika eksamitöö paremini jne. Arvuline tunnus väärtuseks on arvud, nt pikkus, palk, hinne jne. Mittearvuline tunnus väärtuseks ei ole arvud, nt sugu, rahvus, haridus, juuste värv. Järjestustunnus tunnus, mille väärtusi saab sisu põhjal järjestada, nt matemaatika kt hinne, skaala küsitluses. Nominaaltunnus tunnus, millel on rohkem kui kaks erinevat väärtust, kuid ei leidu ühtegi sisulist järjestust, mis haaraks kõik tunnuse väärtused, nt rahvus, silmade värv. Binaarne tunnus ainult kaks teineteist välistavat tunnust, nt sugu.
1. Statistiline kogum – uuritav kogum, mille kohta tahetakse järeldusi teha 2. Arvtunnus – arvuline tunnus – tunnus, mille väärtuseks on arvud, nt inimese pikkus, palga suurus. Jaguneb pidevateks ja diskreetseteks. 3. Mittearvuline (nominaal) tunnus – tunnus, mille väärtuseks ei ole arvud, nt rahvus, silmade värv 4. Pidev tunnus – tunnus, mis võib saada kõiki reaalarvulisi väärtusi mingist piirkonnast, nt kehakaal, temperatuur. 5. Diskreetne tunnus – tunnus, mis võib saada vaid üksikuid eraldiseisvaid (tavaliselt täisarvulisi) väärtusi. Nt seemnete arv viljapeas, tähtede arv sõnas, lehekülgede arv raamatus. 6. Statistiline rida – uuritava kogumi objektide mõõtmisel saadav
3 1. Proovitüki üldiseloomustus Proovitüki 710 kvartaliks on RO203, eralduse number on 9, kasvukohatüübiks on jõnesekapsa-mustika. Peapuuligiks on mänd, peapuuliigi vanuseks on 65 aastat. Proovitüki raadius 1 rinde puude jaoks on 25 cm, raadius 2 rinde puude jaoks on 10 cm. Reljeef on lainjas, mikroreljeef on matlik. Andmed mõõdeti 1. Juunil 2002. aastal. 2. Tunnuste liigid Pidev Diskreetne Arvuline Mittearvuline Puuliik x Rinne x x D1 x x D2 x x H x x HV x x HKO x x Rikke kood x x Kahjustusaste x 3. Risttabel 1. rinde enamuspuuliigi väljaselgitamiseks on koostatud risttabel, mis on esitatud tabelis 2.
0,98 0,068 9,959 1,00 0,020 2,959 1,00 146,321 6% 86% cm cm cm cm 7,10% 28% F(xüi) 25 30 ga, kui on E negatiivne siis tihedusfunktsioon on lameda tipuga normaaljaotuse ga ni emp ni norm ,4 20,2 23 25,8 Pidev Diskreetne Arvuline Mittearvuline Puuliik X Rinne X D1 X D2 X H X HV X HKO X Rikke kood X Kahjustusaste X Järjestustunnus Nominaaltunnus X X X X
tüvenumbreid, kui oli seda vähima tüvenumbrite arvuga algandmes. 3) mitme tehtega ülesandes tuleb: a) arvutada iga tehe eraldi ja jätta 1 varunumber ning lõppvastus ümardada täpselt. b) hinnata iga tehte tulemust ja otsustada milleni tuleb vastus ümardada. Protsent: Osa=osamäär * tervik Tervik=osa : osamäär Osamäär=osa : tervik Sagedustabel, sektordiagramm: 1)tunnus on suurus, mis iseloomustab mingit objekti. Tunnus võib olla arvuline(pikkus, kaal, jalanumber jne.) või mittearvuline(juuste värv, silmade värv) 2) Tunnust iseloomustavaid arve nimetatakse tunnuse väärtuseks. Kui tunnuse väärtused on kirja pandud mõõtmise järjekorras, siis seda rida nimetatakse statistiliseks teaks. Kui tunnuse väärtused on pandud ritta kas kasvavas või kahanevas järjekorras, kusjuures võrdsed on kõrvuti, siis seda rida nimetatakse variatsioonireaks. Kui tunnuse väärtused on kirjutatud tabelisse, kus neile vastab nende esinemissagedus, siis
Valim peab olema küllalt arvukas. Igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. 5. Kus saab kasutada objekt-tunnustabelit? Too näiteid. Uurimuse käigus saadud andmete põhjal tehtud tabel. Selle ridades on uuritavad objektid ja veergudes on objektide määratud tunnused. 6. Too näiteid arvtunnuste ja mittearvuliste tunnuste kohta. Arvtunnus eh kvantitatiivne tunnus: nt pindala, kinganr, vanus jne. Mittearvuline tunnus ehk kvalitatiivne tunnus: nt sugu, rahvus, haridus, juuste värv jne. 7. Kuidas jaotatakse mittearvulisi tunnuseid? Too näiteid. Järjestustunnused mille väärtusi saab sisu põhjal järjestada. Nt hinnang (meeldib, ei meeldi jne). Nominaaltunnused ei ole väärtuse järgi mõtet järjestada. Nt rahvus, silmade värv, kutseala. 8. Mis on diskreetsed, mis pidevad arvtunnused? Too näiteid.
mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul. Diskreetnearvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv. 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnusmittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet). Nominaaltunnusmittearvuline tunnus, mille väärtused pole järjestatavad. 6. Mis on juhuslik suurus? Juhuslikuks suurust nimetatakse, mis sõltub juhuslikest sündmustest ja mille väärtust pole seetõttu võimalik enne sündmuse toimumist kindlalt ennustada. 7. Kuidas on defineeritud jaotusfunktsioon
Joonised Funktsioonid Protseduurid Risttabelid (Pivot Table) Sagedustabelid ja -histogrammid Pidev arvtunnus Diskreetne arvtunnus Mittearvuline tunnus Arvkarakteristikud Usalduspiirid Hüpoteeside kontroll http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/ (1 of 2)29.05.2006 15:08:49 Andmeanalüüs MS Exceli abil Üldskeem z-test (keskväärtuse võrdlemine konstandiga, kahe üldkogumi
2) Naised mõtlevad rohkem, mida nad söövad. MÕISTED Statistika teadus, mis käsitleb andmete kogumist, töötlemist ja analüüsimist. Üldkogum looduse või ühiskonna nähtus või objektide hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi. Valim uurimiseks võetud üldkogumi osa. Järjestustunnus tunnus, mille väärtusi saab sisu põhjal järjestada. (hinded: väga hea, hea, rahuldav, mitterahuldav) Nominaalne tunnus mittearvuline tunnus, mille väärtusi pole mõtet järjestada. (rahvus, juuste värv, kutseala) Binaarne tunnus ainult kaks teineteist välistavat tunnust. (sugu) Kodeerimine tunnuste väärtuste hulga teisendamine, milles igale tunnuse esialgsele väärtusele antakse üks uus väärtus. (kood) Sagedustabel näitab mitmel korral antud tunnus saab antud väärtuse. Keskväärtus ehk aritmeetiline keskmine tunnuse kõigi väärtuste summa ja objektide arvu jagatis .
o Mitmese testimise probleem? o Lahendus: üldise olulisuse/seose testimiseks dispersioonanalüüs o Individuaalsete erinevuste testimiseks/leidmiseks post hoc testid gruppidevahelisteks paarikauoa võrdlusteks. · Dispersioonanalüüs (ANOVA) o Ühemõõtmeline dispersioonanalüüs Arvuline uuritav e sõltuv tunnus (pidev ligikaudse normaaljaotusega) Kategooriline kirjeldav tunnus (ehk grupitunnus, mittearvuline) Testitakse gruppide keskmiste olulist erinevust (ehk kahe tunnuse vahelist seost) Statistilised hüpoteesid: H0=y1=y2=...=yk kõikide gruppide keskmised on võrdsed H1: vähemalt üks y1ei=yj vähemalt kahe grupi keskmised erinevad üksteisest Metoodika: võrdleme grupisisest varieeruvust gruppide vahelise varieeruvusega (f-statistik) · Post Hoc testid
Andmetöötlus sotsiaalteadustes 9 annavad infot valimi väärtuste omavaheliselt paiknemisest (erinevustest, sarnasustest), nimetatakse hajuvuskarakteristikuteks. 2.2.1. Paiknemiskarakteristikud Mood on tunnuse suurima sagedusega väärtus ("moodsaim"). Moodi on võimalik leida iga tüüpi tunnuse puhul. Mood võib olla nii arvuline kui mittearvuline, mood võib tunnusel ka puududa, kui moode on kaks, siis on tunnus bimodaalne. Pideva tunnuse puhul saab määrata moodklassi, pidevale tunnusele ühearvulist moodi leida ei saa (ei ole mõtet). Miinimum ja maksimum on vastavalt valimis esinenud tunnuse väikseim ja suurim väärtus. Järjestades objektide tunnuse väärtused miinimumist maksimumini saame tunnusele variatsioonrea. Seega saame variatsioonrea leida vaid arv- ja järjestustunnustele. Variatsioonrea keskpunkti nimetame mediaaniks
sisuliselt järjestatavad. Näiteks on loogiliselt järjestatavad inimeste haridustasemed: alg-, põhi-, kesk- ja kõrgharidus. Järjestustunnuseks on ka isiku vanusegrupp, sisuliselt ka näiteks eksamitulemus (mida saame väljendada nii sõnaliste suurustena kui ka arvuliselt). 55 Matemaatika ja statistika 2008/2009 Nominaaltunnus, s.o mittearvuline tunnus, mille vastusevariantide jaoks ei leidu sisulist (täielikku) järjestust. Näiteks ei saa me järjestada inimesi rahvuse järgi, väites et üks rahvus on parem kui teine, samuti ei ole loogilist järjestust inimeste silmade värvil, lemmikansamblitel jne. Kahe väärtusega (binaarne ehk dihhotoomne) tunnus, s.o tunnus, millel on ainult kaks võimalikku väärtust (sugu; vastused: "õige" ja "vale"). Kahe väärtusega tunnust saab