8 mees 38 1 17 jah 9 mees 28 0 9 jah 10 mees 28 0 10 ei 11 naine 30 1 12 jah 12 mees 31 1 10 jah 13 mees 37 1 15 jah 14 mees 33 1 10 ei 15 mees 27 0 4 jah Ülesanne 1. Tunnuse "Sugu" jaoks koostada sagedustabel ja tulpdiagramm (legendi täitmisega) Sagedustabel Mees 11 Naine 4 Sugu 12 10 8 6 4
14-18 AASTASTE TÜDRUKUTE JALANUMBER AASTAL 2011 Uurimustöö Juhendaja: Tallinn 2011 Sissejuhatus Uurisin 14-18 aastaste tüdrukute jalanumbreid 2011. aastal. Tüdrukuid oli kokku 16 ja nad olid valitud juhuslikult. 1. Statistiline kogum 39; 39; 40; 38; 39; 40; 37; 38; 38; 36; 41; 36; 38; 38; 40; 37 2. Variatsioonirida 36; 36; 37; 37; 38; 38; 38; 38; 38; 39; 39; 39; 40; 40; 40; 41 3. Sagedustabel 2 realine tabel, mille ühes reas on tunnuse (x) erinevad väärtused ja teises reas nende esinemise sagedused (f) Jalanumber (x) 36 37 38 39 40 41 Sagedus (f) 2 2 5 3 3 1 Sageduste summa n=16 Tulpdiagramm 4. Suhteline sagedus (w) Tunnuse väärtuse esinemise arvu f suhe väärtuste koguarvu n f w = 100% n Sagedus-jaotustabel
ei viimase kuu jooksul viimase kuu jooksul ei viimase aasta jooksul viimase aasta jooksul enam ei, aga olen suitsetanud viimase aasta jooksul viimase kuu jooksul jah rohkem kui aasta tagasi viimase kuu jooksul jah viimase aasta jooksul viimase kuu jooksul ei viimase aasta jooksul viimase aasta jooksul 1. Konstrueerige sagedustabel tunnusele "PIKKUS" ja illustreerige s väljatrükis). Ülesande lahendamiseks vajalikud tulemused ja abitulemused leidke töölehel se Pikkuse vahemik Miinimum 157 Maksimum 193 Tudengite arv 57 Sobivad pikkuse intervallid
· Mittearvulised tunnused (silmade ja juuste värvus näiteks) Statistiline rida a1, a2, a3, ..., an - Statistilise rea liikmed N Kogumi maht (statistilise rea maht) 01) Ühe klassi kontrolltöö hinnete rida oli järgmine: 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5. (variatsioonirida) Kui kirjutatakse realiikmed kasvavas või kahanevad järjekorras (võrdsed liikmed kirjutatakse järjest), siis saadakse variatsioonirida. Sagedustabel Hinne x 2 3 4 5 Sagedus fa 3 7 10 8 fb 2 5 9 6 N: 2+5+9+6 = 22 Igale hindele vastab tema esinemise arv. N = 3 + 7 + 10 + 8 = 28 N = f1 + f2 + f3 + ... + fn Sirglõikdiagramm Sagedus hulknurk Kui kogumite mahud on erinevad, siis on vaja jaotustabelit. Kummas klassis tehti töö paremini? Et võrrelda erineva mahuga kogumeid, on otstarbekas kasutada sageduste asemel suhtelisi sagedusi. f f W= ; W(%)= W = *100%
Kvalitatiivse suuruse keskväärtuse muutumist, mis on tingitud nii kvantitatiivse teguri muutustest kui ka kvalitatiivse teguri enda muuutustest, iseloomustab Vali üks vastus. a. püsiva struktuuri indeks b. struktuurinihete indeks c. muutuva struktuuri indeks Vale Selle esituse hinded: 0/1. Question 2 Hinded: 1 Hüpoteesi statistilisel kontrollimisel võetakse vastu sisukas hüpotees, kui Vali üks vastus. a. parameetri empiiriline väärtus on suurem kui kriitiline b. parameetri empiirilise väärtuse absoluutväärtus on väiksem kui kriitilise väärtuse absoluutväärtus. c. parameetri empiirilise väärtuse absoluutväärtus on suurem kui kriitilise väärtuse absoluutväärtus; Vale Selle esituse hinded: 0/1. Question 3 Hinded: 1 Diskreetsel juhuslikul suurusel võib olla kolm väärtust : väärtus "2" tõenäosusega 0,2; väärtus "4" tõenäosusega 0,5 ja väärtus "7" tõenäosusega 0,3. Selle juhusliku suuruse keskväärtus on...
Harju Maakond 1 L1e Err:508 Harju MaakondTallinn 1 L2e Err:508 Harju MaakondSaue 1 L3e Err:508 Viljandi Maako Viljandi 1 L7e Err:508 Harju MaakondTallinn 1 M1 Err:508 Viljandi Maako Viljandi 1 N1 Err:508 Harju Maakond 1 Harju MaakondTallinn 1 Harju Maakond 1 1. Täida nominaaltunnuse sagedustabel leides Pärnu Maakon Pärnu 1 eri kategooria sõidukite esinemissageduse Harju MaakondTallinn 1 registris. Kasuta funktsiooni COUNTIF. Saare Maakon Kuressaare 1 2. Täida vahemiktunnuse sagedustabel leides Harju Maakond 1 mootori erinevate võimsuste Määramata 1 esinemissageduse registris. Kasuta Harju MaakondTallinn 1 funktsiooni FREQUENCY.
Defineeri mõisted: Statistika Matemaatiline statistika Üldkogum. Näide. Üldkogu uurimisel on kaks võimalust: Valim. Kuidas on seotud üldkogu ja valim? Millised on nõuded valimile? Valimi moodustamise viisid. Statistiline rida. Variatsioonirida. Sagedustabel. Diagramm. Mood. Mediaan. Aritmeetiline keskmine. Variatsiooni ulatus. Hälve. Dispersioon. Standardhälve. Korrelatsiooniväli. Normaaljaotus. Statistika mõisted Andmete esitamine 1.Statistika - teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. 2.Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. 3.Statistikas on oluline uurimise objekt - üldkogum. 4
12. klass Uurimistöö Kas matemaatika hinne on sõltuvuses eesti keele hindest Palamuse, 2011 1 Sisukord 1. Sissejuhatus....................................................................... 3 2. Sagedustabel...................................................................... 4 3.1 Matemaatika hinne........................................................5 3.2 Eesti keele hinne...........................................................6 4. Kokkuvõte............................................................................7 2 1. Sissejuhatus
Sisukord ................................................................................................................................................2 Sissejuhatus............................................................................................................................ 3 Valimi iseloomustus...............................................................................................................5 1.1 Sagedustabel.................................................................................................................6 1.2 Histogramm..................................................................................................................6 1.3 Karakteristikud............................................................................................................. 7 1.3.1 Keskväärtus.........................................................................................
Palamuse 2008 Sisukord ................................................................................................................................................2 Sissejuhatus............................................................................................................................ 3 Valimi iseloomustus...............................................................................................................5 1.1 Sagedustabel.................................................................................................................6 1.3 Histogramm..................................................................................................................6 ............................................................................................................................................6 1.4 Karakteristikud..................................................................................
22. Korrelatsiooniväli on kordinaattasandile kantud punktihulk, kus iga punkti x- koordinaadiks on uuritava objekti esimese tunnuse väärtus ja y- kooridnaadiks sama objekti teise tunnuse väärtus. 2. Andmed ja arvutused 2.1 Ajalugu 1. Statistiline rida: 5;5;4;4;4;4;5;4;5;5;4;5;3;3;3;3;4;4;3;3 2. Variatsioonirida: 3;3;3;3;3;3;4;4;4;4;4;4;4;4;5;5;5;5;5;5 3. Sagedustabel: 4. Sagedustabel protsendina: 5. Arvutused: 6. Ajaloo hinded protsentidena. 7. Ajaloo hinnete histogramm 2.2 Ühiskonnaõpetus 1. Statistiline rida: 5;4;5;4;4;5;5;5;5;5;3;5;4;4;4;5;5;5;4;4 2. Variatsioonirida: 3;4;4;4;4;4;4;4;4;5;5;5;5;5;5;5;5;5;5;5 3. Sagedustabel: 4. Sagedustabel protsendina: 5. Arvutused: 6. Ühiskonna hinded protsentidena. 7. Ühiskonna hinnete histogramm 3. Kahe tunnuse analüüs
Valim uurimiseks võetud üldkogumi osa. Järjestustunnus tunnus, mille väärtusi saab sisu põhjal järjestada. (hinded: väga hea, hea, rahuldav, mitterahuldav) Nominaalne tunnus mittearvuline tunnus, mille väärtusi pole mõtet järjestada. (rahvus, juuste värv, kutseala) Binaarne tunnus ainult kaks teineteist välistavat tunnust. (sugu) Kodeerimine tunnuste väärtuste hulga teisendamine, milles igale tunnuse esialgsele väärtusele antakse üks uus väärtus. (kood) Sagedustabel näitab mitmel korral antud tunnus saab antud väärtuse. Keskväärtus ehk aritmeetiline keskmine tunnuse kõigi väärtuste summa ja objektide arvu jagatis . Mediaan - arv, millest suuremaid ja väiksemaid väärtusi on variatsioonireas ühepalju. Tähistatakse sümblouga Me . Mood - tunnuse kõige sagedamini esinev väärtus. Tähistatakse sümboliga Mo . Alumine kvartiil Kv - tunnuse väärtus, millest väiksemaid (või millega võrdseid) liikmeid
Andmete edukaks töötlemiseks on tarvis lisada andmetele andmekirjeldus. Andmekirjeldus sisaldab:*tunnuste nimesid ehk identifikaatoreid;*tunnuste tüüpe;*kodeerimiseeskirju;*arvuliste (kvantitatiivsete) tunnuste korral ka mõõtühikuid ning on vajalik andmetöötlussüsteemidega suhtlemiseks, lahendust vajavate ülesannete esitamiseks ja tulemuste vormistamiseks. Variatsioonrida on arvude rida, mis on esitatud korrastatud kujul ehk arvude kasvamise (kahanemise) järjekorras. Sagedustabel - võtab andmetabelist kokku mitmel objektil mingit väärtust esineb ehk esitab vastava sageduse. Jaotustabel näitab tunnuse erinevate väärtuste esinemissagedust suhtarvudes, Sagedustabel näitab tunnuse erinevate väärtuste esinemissagedust absaluutarvudes. Tulpdiagramm ja sektor-diagramm on mõeldud sagedustabeli graafiliseks illustreerimiseks.Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. Aritmeetiline keskmine-variatsioonireas
6 Andmete kogumine ja korrastamine on vajalik eeltöö töötlemisele, mis koosneb järgmistest etappidest: 1) probleemi püstitamine ja üldkogumi määramine 2) mõõdetavate tunnuste ja mõõtmistäpsuse määramine 3) valimi moodustamine 4) kodeerimiseeskirja fikseerimine 5) andmekirjelduse lisamine 7 Variatsioonirida saadud tulemused on järjestatud kasvavalt või kahanevalt Sagedustabel näitab, mitmel korral antud tunnus saab antud väärtuse Hea ülevaate annab graafik (tulpdiagramm, sektordiagramm, ...) (pideva tunnuse korral võib sagedustabeli jaotada vahemikeks ehk klassideks). 8 Jaotustabel näitab tunnuse väärtuse suhtelist sagedust ehk sageduste osakaalu Kumulatiivne sagedus (sageduste summa) absoluutsed sagedused liidetakse (kasutatakse ka kumulatiivset suhtelist sagedust).
esialgsele väärtusele seatakse vastavusse uus väärtus kood. 10. Mis on andmekirjeldus? Miks on see vajalik? Andmekirjeldus sisaldab:*tunnuste nimesid ehk identifikaatoreid;*tunnuste tüüpe;*kodeerimiseeskirju;*arvuliste (kvantitatiivsete) tunnuste korral ka mõõtühikuid ning on vajalik andmetöötlussüsteemidega suhtlemiseks, lahendust vajavate ülesannete esitamiseks ja tulemuste vormistamiseks. 11. Mis on variatsioonrida, mis on sagedustabel? Variatsioonrida kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida. Sagedustabel näitab, mitmel korral antud tunnus saab antud väärtuse. 12. Mille poolest erinevad sagedustabel ja jaotustabel? Jaotustabel näitab tunnuse väärtuste suhtelist esinemissagedust (%). 13. Millal kasutatakse tulpdiagrammi, millal sektordiagrammi? Sektordiagrammi valime siis kui tahame näidata osakaalu tervikus (midagi on 100 %).
Kodune ülesanne 1.1 Kuus enimmüüdud raamatut USA-s 1994. aastal olid Celestine Prophecy (C), Debt of Honor (D), Insomnia (I), The Lottery Winner (L), Politically Correct (P), Wings (W). Houstonis Texases võeti raamatuostjatest, kes ostsid ühe raamatu, valim ja saadi järgmised tulemused: WDWCIPCWPIWWPCPCLCPCWWPWWCIPLDDIPDWCILCDLDILI Koostada ostude sagedustabel ja joonistada tulpdiagramm. Ostude osakaalud kujutada sektordiagrammil. Raamat Arv Celestine Prophecy - C C 9 Cdebt of Honor - D D 6 Insomnia - I I 7 The Lottery Winner - L L 5 Politically Correct - P P 8 Wings - W W 10
2) Jagades osamääraga 9020100=450 3. Osa leidmine 1) Ühe osa kaudu 60% 240-st 240100=2,4 2,460=144 2) Osamääraga korrutamine =144 Tervik korrutatakse osamääraga ja tulemus jagatakse 100-ga 4. Jagatise väljendamine protsentides 8 16-st 816=0,5 05100=50 65 6-st 656=10,8(3)10,8 10,8100=1080% Esimene arv jagatakse teisega ja tulemus avaldatakse protsentides. 5.Sagedustabel Sagedustabel arvandmed korrastatud kujul Sagedus loendamisel saadud tulemus Suhteline sagedus näitab, kui suure osa moodustab antud sagedus 6. Suuruste võrdlemine protsentides 1) Võrdlemine Mitme võrra on 2 väiksem 6-st? 62=4 46=0,666...0,67 0,67100=67% 2) Ühelt teisele e LT-LE 4000lt 6000le 60004000=2000 20004000=0,50,5100=50% 7. Oleme juhuse võimuses Katse-mingi tegevus Iga katse tulemusena toimub üks võimalik sündmus.
Kirjeldav statistika - teeme järeldusi valimi piires. (sagedustabel-kui palju? kui suur osa?) Valim - uuritavad isikud/objektid. Vastajad Üldkogum - need kelle kohta tehakse järeldused. Valim peavad olema esinduslik (need proportsioonid, mis on üldkogus, peavad kehtima ka valimi korral), piisavalt suure inimeste hulgaga, igal üldkogu liikmel on võrdne võimalus sattuda valimisse. Objektid - uuritavad (rida) Tunnus - objektide omadus, nt mitu korda päevas sa sööd? küsimus (veerg) Väärtus - tulemus, vastus küsimusele.(lahtrites) N - objektide arv
1 SISUKORD Sissejuhatus.................................................................................................................................3 1.Riigieksami tulemuste koondtabel...........................................................................................5 2. Esimene punkt.........................................................................................................................6 2.1 Kirjandi tulemuste sagedustabel................................................................................6 2.2 Kirjandi sageduspolügoon.........................................................................................6 2.3 Kirjandi tulemuste mood, mediaan ja keskväärtus....................................................6 3. Teine punkt.............................................................................................................................8 3
korrutised võrdsed. NT : Võrdekujuliseks võrrandiks nimetatakse võrdust, mis on võrde kujul ja mille üks liige on tundmatu. Nt : Võrde põhiomadust kutsutakse mõnikord ka ristkorrutiseks. Sagedus näitab, kui tihti mingi sündmus toimub. Suhteline sagedus näitab, kui suure osa moodustab kindel sündmus kõikide vaadeldud sündmuste arvust. Suhtelist sagedust väljendatakse protsentides . Sagedustabel kirjeldab sündmuste esinemise sagedust. Näiteks sagedustabel õpilase vanuste kohta, klassis on 30 õpilast. P = k/n K = soodsate võimaluste arv, N= kõigi võimaluste arv Vanus Sagedus Suhteline sagedus 15 20 20/30 ~67% 16 3 3/30~10% 14 7 7/30 ~23%
(Add Trendline) koos determinatsioonikordaja ruuduga (R2). Ülesanne 3: Kontrolli Tabelis 2 toodud joonemõõtmise seeria normaaljaotust graafiliselt histogrammi abil. Leia seeria hulgast erindid. Kas mõõtmisseeria on peale erindite eemaldamist täpsem. Mille põhjal otsustate? Histogrammi lasime Excelil esmalt teha nö vabalt- me ei andnud vahemikke (Bin Range) programmile ette. Tulemus on toodud joonisel 2. 3 Histogram(sagedustabel) 9 8 7 6 5 Sagedus 4 3 2 1 0 152.091 152.105 152.119 152.133 More Joonepikkus Joonis 2. Joonepikkuse mõõtmisseeria sagedustabel. Järgnevalt arvutasime vajalike intervallide arvu valemi n abil ning ümardasime selle täisarvuks. Meie valimi suuruse juures on tulemuseks 5. Selleks, et leida intervallic
Matemaatika mõisted: Üldkogum ja Valim Variatsioonrida -väärtuse kasvamise või kahanemise järgi järjestatud valim Sagedustabel andmete kogumise tabel, mille esimesse ritta paigutatakse mõõdetavad suurused ja teise ritta iga väärtuse esinemise sagedus Mood rea kõige rohkem esinev liige Mediaan - variatsioonirea keskmine liige. Üldkogum kõik taimed, inimesed või asjad mida uuritakse Valim üldkogumist võetud uurimisgrupp Diskreetne tunnused tohivad olla ainult üksteisest eraldatud väärtused. Pidev tunnus pidevalt muutuvad suurused Kvalitatiivne tunnus - mittearvuline tunnus
korral) F-test (kahe üldkogumi dispersioonide võrdlemine) Korrelatsioonanalüüs Regressioonanalüüs 2 Kahemõõtmeline sagedustabel, -test Dispersioonanalüüs (pole veel) [email protected] http://ph.eau.ee/~ktanel/kool_ja_too/ märts, 2000 http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/ (2 of 2)29.05.2006 15:08:49
Intervallid Ülemine piir s 11000-13000 13000 4 13000-15000 15000 9 15000-17000 17000 2 19000-21000 21000 2 21000-23000 23000 5 23000-25000 25000 6 25000-27000 27000 2 Tabel 4. Elussündide sagedustabel Allikas: Lisa 1. 5 . Sagedu Intervallid Ülemine piir s 4500-6000 6000 8 6000-7500 7500 6 7500-9000 9000 2 9000-10500 10500 1 10500-12000 12000 1
Mittearvulised tunnused jagunevad a) nominaalseteks tunnusteks; b) järjestustunnusteks. Diskreetne tunnus võib omandada vaid üksteisest eraldatud väärtusi. Diskreetse tunnuse väärtused saadakse tavaliselt loendamise teel, näiteks elanike arv majas, õpilaste arv klassis vms. Pidev tunnus võib omandada kõiki reaalarvulisi väärtusi mingist piirkonnast. Näiteks kaal, kasv, aeg ja temperatuur on pidevad tunnused. Variatsioonrida korrastatud andmete rida, kasvavas järjekorras. Sagedustabel näitab, mitmel korral antud tunnus saab antud väärtuse. Jaotustabel näitab tunnuse väärtuse suhtelist esinemissagedust.
Praktiline töö: statistika Matemaatika Antud uurimistöös uurisin 11.klassi õpilaste matemaatika hinnet. Küsitlesin 30 Saku Gümnaasiumi õpilast. 1. Variatsioonirida 3;3;3;3;4;4;4;4;4;4;4;4;4;4;4;4;4;4;4;4;5;5;5;5;5;5;5;5;5;5 n=30 Variatsioonirea järgi koostasin sagedustabeli, mille järgi leidsin millist hinnet esineb klassis kõige rohkem ehk mood ja mis on mediaan. 2. Sagedustabel Hinne x 5 4 3 Sagedus f 10 16 4 3. Mo= 4 4. Me= 4 Sagedustabeli järgi koostasin sagedusdiagrammi ja sektordiagrammi, kuhu kandsin hinded ja kui palju neid esines. 5. 6. 7. 6. Sagedusjaotus tabel
· Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse. · Statistiline rida tunnuse väärtuste järjestamata rida · Variatsioonirida tunnuse väärtuste rida kasvavad või kahanevas järjekorras · Arvjoonis andmete esitamise graafiline viis, mis aitab neid paremini analüüsida ja nähtuste olemusest aru saada. · Mood variatsioonirea kõige suurema esinemissagedusega liige. Tähis Mo.
Harjutus 1 4 punkti Viidi läbi ostjate küsitlus leivatoodete eelistuste kohta. Küsitleti 40 ostjat ja küsimuseks oli: "Millist leiba kõige sagedamini ostate?" Vastusevariandid olid: Koosta sagedustabel. Loo histogramm, näita väärtused, leiva sordid, pealkiri, ilma raamita. Sort Kood Viru 1 Madise 2 Taluleib 3 Toolse 4 Muu 5 Ostja Vastus 1 #NAME? 2 1 3 3 4 4 5 2 6 3 7 4 8 1
Statistika mõisted 1) Andmete esitamine Statistiline rida- uuritava kogumi objektide mõõtmisel saadud vaadeldava tunnuse väärtuste rida Variatsioonrida- väärtuse kasvamise või kahanemise järgi järjestatud valim Sagedustabel- võtab andmebaasist kokku mitmel objektil esineb antud väärtus ehk esitab vastava sageduse Diagramm- andmete esitamise graafiline viis 2) Asendit kirjeldavad Mood- tunnuse kõige enam esinev väärtus Mediaan- tunnuse väärtus, mille väiksemaid ja suuremaid väärtusi on võrdne arv Aritmeetiline keskmine- arvusuuruste summa jagatis nende suuruste koguarvuga 3) Hajuvust iseloomustavad Variatsiooni ulatus- tunnuse suurim ja vähim väärtus
valinud kõige suurem osa õpilastest?" Sammud andmete analüüsimisel Sõnastan konkreetsetest andmetest lähtuva küsimuse, millele tahan vastust saada. Valin püstitatud küsimusest lähtudes kasutada olevate andmete jaoks sobiva analüüsimeetodi. Tulemuste esitlemiseks valin andmete olemust ja tulemuste sisu parimal viisil välja toova ning sihtrühmale arusaadava ja esitluse kohale sobiva esitlusviisi ning kujunduse. Sagedustabel Isegi kui esmane küsimus eeldab ainult ühe vastusevariandi e väärtuse esinemissageduse leidmist, koostatakse arvuti abil analüüsi läbi viies mugavuse ja analüüsi kompaktsuse tõttu üldjuhul vastava tunnuse kõiki väärtusi kokkuvõttev sagedustabel, mis võiks eelpool toodud näite 9 puhul välja näha selline: Tabel 3. Facebooki külastuste sagedus. Tabelite ja jooniste kasutamine tulemuste esitlemisel Tabelid ja joonised (s.h. diagrammid, skeemid, pildid) teevad õige
Kursusel osalejate elukoht soo alusel 12 10 8 Summa 6 N M 4 2 0 Linn Alev Maa-asula Suur linn Elukoht I OSA. Kirjeldav statistika 1. Koostada sagedustabelid 1.1 Sagedustabel Sugu Total N 29 M 10 Grand Total 39 1.2 Sagedustabel Elukoht Sugu Linn Alev Maa-asula Suur linn Grand Total N 10 9 4 6 29
Õppejõupoolne märkus: pidi lahtrite kaitsmise ja nädalapäevade menüü looma käsklustega Data - Data Validatio esmaspäev teisipäev kolmapäev neljapäev reede laupäev pühapäev ustega Data - Data Validation Harjutus 5 4 punkti Sagedus 1 Viidi läbi küsitlus transpordi k Buss 1 127 2 1. Loo sagedustabel Tramm 2 36 3 2. Koosta diagramm Troll 3 37 4 Jalgsi 4 39 5 Auto 5 53 1 Mootorratas 6 8 3 Liiklusvah 1 140 4 120 5
300 35 Mediaan 250 35 Mood 370 40 Väikseim 500 45 Suurim 300 45 (Arvude) loendamine 30 50 Alumine kvartiil 15 50 Asümmeetriakordaja 65 60 Keskmine hälve 60 60 35 60 50 65 Nominaaltunnuse sagedustabel 60 75 COUNTIF 120 75 20 120 40 120 45 120 Vahemiktunnuse sagedustabel 60 120 FREQUENCY 35 120 75 140 370 210 50 250 140 250 45 300 120 300 75 350 210 370
Statistika uurimistöö. Õpilaste koolitee pikkus 1) Kogum: 12 klass Valim: 12a klassi 26 õpilast 2) Variatsioonirida (km): 0,2; 0,3; 1; 1; 1; 1; 1,5; 1,5; 1,5; 1,8; 2; 2,5; 3; 3; 5; 6; 7; 9; 9; 9; 10; 10; 20; 20; 20; 24 3) Sagedustabel ja sagedus-jaotustabel X (km) f W (%) 03 14 53,8 3,1 6 2 7,7 6,1 9 4 15,5 9,1 12 2 7,7 12,1 15 0 0 15,1 18 0 0 18,1 21 3 11,5 21,1 24 1 3,8
Sagedamini kasutatavad jooniste tüübid tunnuse jaotuse esitamiseks: · Tulpdiagramm Mõnikord kujundatakse tulpdiagramm nii, et väärtusklassile vastava tulba pindala (kõrgus x laius) oleks võrdeline väärtusklassi sagedusega. Sellist tulpdiagrammi nimetatakse histogrammiks. · Joondiagramm · Ringdiagramm · Histogramm-astmikdiagramm, sagedused püstteljel 6) Sagedustabel, selles esitatavad näitajad. Eelmisel slaidil oli tunnuse jaotus esitatud sagedustabelina. Sagedustabel koosneb: · tunnuste üksikväärtuste või väärtuste vahemike loetelust · koos nende indiviidide arvuga, kelle puhul analüüsitava tunnuse väärtus ühtib vaadeldava konkreetse väärtusega või kuulub vastavasse väärtusvahemikku. Indiviidide hulka saame mõõta: · "tükiarvu" ehk sageduse ehk absoluutse sagedusega;
jalanumbri suurus, standardhälve, mediaan, mood, alumine- ja ülemine kvartiil. Leida hajuvusnäitajad. Võrrelda tulemusi. Statistiline rida 43, 41, 42, 43, 44, 44, 40, 43, 42, 43, 44, 42, 43, 46, 44, 40, 45, 42, 43, 41, 42, 43, 44, 43, 41, 42, 41, 43, 42, 44, 41, 42, 43, 45, 44, 46, 40, 41, 43, 44 Variatsioonirida 46, 46, 45, 45, 44, 44, 44, 44, 44, 44, 44, 44, 43, 43, 43, 43, 43, 43, 43, 43, 43, 43, 43, 42, 42, 42, 42, 42, 42, 42, 42, 41, 41, 41, 41, 41, 41, 40, 40, 40, Sagedustabel Saapa number 40 41 42 43 44 45 46 Kandjaid 3 6 8 11 8 2 2 Graafik Aritmeetiline keskmine X= 43+41+42+43+44+44+40+43+42+43+44+42+43+46+44+40+45+42+43+41+4 2+43+44+43+41+42+41+43+42+44+41+42+43+45+44+46+40+41+43+44= 1709 ÷ 40 = 42,725 Mediaan Mediaan on arv, millest suuremaid ja väiksemaid väärtusi on variatsioonireas sama palju Me= 43 Seega on 43 jalanumbrist väiksemaid ja suuremaid jalanumbreid samapalju
Küsisime poistelt ja tüdrukutelt eraldi (10). 1. Kogume andmed: Küsisime kümnelt poisilt ja kümnelt tüdrukult mitu raamatut loevad nad aasta jooksul läbi? Tüdrukud 0; 1; 2; 2; 0; 30; 20; 3; 5; 50 Poisid 0; 3; 7; 1; 5; 2; 8; 4; 1; 4 2. Variatsioonirida ehk arvud kasvavas järjekorras Tüdrukud 0; 0; 1; 2; 2; 3; 5; 20; 30; 50 Poisid 0; 1; 1; 2; 3; 4; 4; 5; 7; 8 3. Sagedustabel ja graafik poiste ja tüdrukute andmete kohta eraldi TÜDRUKUD Raamatute arv (x) 0 1 2 3 5 20 30 50 Sagedus (f) 2 1 2 1 1 1 1 1 POISID Raamatute arv (x) 0 1 2 3 4 5 7 8 Sagedus (f) 1 2 1 1 2 1 1 1 4. Mood Mo (tüdrukud) = 0 ja 2 Mo (poisid) = 1 5. Mediaan Me (tüdrukud) = (5+3):2 = 4 Me (poisid) = (4+3):2 = 3,5 6
... + x n x= jagatis. n Mediaan Me arv, millest suuremaid ja väiksemaid väärtusi on variatsioonireas ühepalju. Mood Mo tunnuse kõige sagedamini esinev väärtus. Minimaalne element xmin tunnuste väärtuste hulgas vähim. Maksimaalne element xmax tunnuste väärtuste hulgas maksimaalne. Variatsioonirida järjestatud kasvavate või kahanevate väärtuste jada. Variatsioonikordaja Variatsioonirea ulatus u maksimaalse ja minimaalse elemendi vahe. Sagedustabel näitab, mitmel korral saab antud tunnus antud väärtuse. Korrelatsioon kasutatakse statistikas võrdlemisel. Näitab, kas uuritavate objektide puhul on tegemist mingite sarnaste ilmingutega või mitte. ( x1 - x )( y1 - y ) + ( x 2 - x )( y 2 - y = +... + ( x n - x )( y n - y ) r= n x y Dispersioon andmetele vastav hälvete keskväärtus. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda
Mood Mo tunnuse kõige sagedamini esinev väärtus. Minimaalne element Xmin - tunnuste väärtuste hulgas vähim. Maksimaalne element Xmax - tunnuste väärtuste hulgas maksimaalne. Variatsioonirida järjestatud kasvavate või kahanevate väärtuste jada. Variatsioonikordaja - on hajuvusmõõt, mis seisneb kogumi standardhälbe ja keskväärtuse suhtes. Variatsioonirea ulatus u maksimaalse ja minimaalse elemendi vahe. Sagedustabel näitab, mitmel korral saab antud tunnus antud väärtuse. Korrelatsioon kasutatakse statistikas võrdlemisel. Näitab, kas uuritavate objektide puhul on tegemist mingite sarnaste ilmingutega või mitte. Dispersioon andmetele vastav hälvete keskväärtus. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on tunnuse väärtuste hajuvus. Alumine kvartiil Kv - tunnuse väärtus, millest väiksemaid (või
Kontrollin: alumisest kvartiilist väiksemaid liimeid on 7 ehk ligikaudu 23 protsenti ülemisest kvartiilist suuremaid liikmeid on samuti 7 23 protsenti alumise ja ülemise kvartiili vahele jääb 14 liiget 46 protsenti 8) Keskväärtus(tunnuse väärtuste aritmeetiline keskmine) Leian keskväärtuse, liites kõik tunnuse väärtused ning jagades 30-ga: x= = 5,85 9) Sagedustabel näitab, mitmel korral antud tunnus saab antud väärtuse. Koostan sagedustabeli. Vaba 1 2 3 3,5 4 5 6 8 10 11 12 13 14 aega(h) Sagedus 1 3 4 1 6 3 4 1 2 1 2 1 1 Graafilise ülevaate saamiseks koostan tulpdiagrammi: 9 10) Jaotustabel näitab tunnuse väärtuste suhtelist esinemissagedust
rea x1,x2,x3, ... , xn. Variatsioonrida katse korduval sooritamisel saadud tulemuste esitamine mittekahaneva või mittekasvava järjendina. Suhtelist sagedust võib esitada sagedustabeli kolmanda reana, omaette tabelina või sektordiagrammina. Sagedus võrdsete ajavahemike tagant korduvate sündmuste arv. Suhteline sagedus tunnuse väärtuse esinemise arvu f suhe väärtuse koguarvu n ning seda väljendatakse kas kümnendmurrnuna f/n või osana protsentides f/nx100%. Sagedustabel kaherealine tabel, mille ühes reas on tunnuse (x) erinevad väärtused ja nende esinemise sagedused (f). Jaotustabel sagedustabeli kolmas rida, jaotus protsentides w% - kuhu arvutatakse arvud valemiga. Sagedus-jaotustabel tabelis on olemas tunnuse väärtused, esinemise sagedus ja suhteline sagedus. Diagramm ehk arvjoonis on andmete esitamise graafiline viis, mis aitab neid paremini analüüsida ja nähtuste olemusest hästi aru saada.
0 4 3 4 0 1 2 3 3 0 5 4 5 0 1 2 2 2 0 3 0 5 3 1 3 5 2 4 3 4 3 3 1 5 5 0 0 3 3 0 0 1 4 0 3 5 3 3 2 3 2 2 0 5 5 4 3 2 3 2 3 0 5 3 5 3 3 2 4 3 2 2 2 3 4 4 3 3 3 4 3 1 2 1 0 1 2 0 3 3 2 0 4 2 4 2 2 0 2 3 3 0 3 1 4 1 5 4 3 0 4 3 2 4 0 1 3 5 3 0 2 4 2 0 4 4 0 5 0 5 4 3 4 3 5 4 5 3 0 2 0 2 4 2 5 3 4 2 3 5 3 1 3 5 0 1 3 3 3 1 3 2 2 4 0 0 1 1 5 1 3 0 2 2 4 3 0 3 4 4 4 2 2 4 0 2 0 2 3 3 0 1 2 0 3 4 2 0 4 3 0 1 3 1 0 1 4 0 1 2 0 3 0 4 5 0 1 1 3 3 2 3 4 5 0 2 0 1 5 0 3 4 1 1 2 4 2 2 2 2 3 ÜLESANNE Sagedustabel Mitmesugustest uuringutest kokkuvõtete tegemiseks kasutatakse tihti sagedustabeleid. 68 inimest vastasid mitmest küsimusest koosnevale ankeedile. Vastusevariandid olid ette antud. Esimese kahe küsimuse vastused on toodud veergudes J ja K. Küsimuse 1 vastusevariante oli kuus ja vastav sagedustabel on toodud allpool. ÜLESANNE: koosta samasugune sagedustabel küsimuse 2 vastuste kohta. Küsimuse 1 vastuste jaotus Antud vastusevariandi sageduse leidmiseks
viljapeas, tähtede arv sõnas, lehekülgede arv raamatus. 6. Statistiline rida – uuritava kogumi objektide mõõtmisel saadav vaadeldava tunnuse väärtuste rida. (andmed ajalises/mõõtmise järjekorras, kõige varasem ees) 7. Statistilise rea maht, kogumi maht – tunnuse väärtuste arv N. N = f1 + f2 + f3 + … + fn 8. Variatsioonirida – rea liikmed kirjutatuna kasvavas või kahanevas järjekorras, kusjuures võrdsed liikmed kirjutatakse järjest 9. Sagedus (f); sagedustabel – näitab mitmel korral antud tunnus saab antud väärtuse, tunnus (x, x1, x2…), sagedus (f, f1, f2). Esitatakse kas horisontaalse või vertikaalsena. 10. Suhteline sagedus – (wi) wi = fi/N; wi(%) = (fi/N) * 100% (kas suhtena või protsentidena) 11. Jaotustabel – tabel, kus tunnuse väärtustele on seatud vastavusse nende esinemise suhteline sagedus (x, x1, x2; w, w1, w2) (w1+w2+w3+ …+wn =1 või =100%) 12
palju, siis ei kasutata sagedustabelit Seal esitatakse tunnuse väärtused (valid), nende esinemissagedus (frequence) ning protsendid (percent). Sagedustabeli järjestamiseks sagduste järgi: uus tabel: analyze/ferquences . tunnus perekonnaseis varialbel väljale ning klõpsame nupule format. Descending counts linnuke. Kui tunnusel on aga palju erinevaid väärtuseid, näiteks sissetulekud on kõikidel vastajatel tõenäoliselt erinevad, siis sagedustabel andmete kokkuvõtmiseks ei sobi. Andmestikus kultuur.sav on selliseks tunnuseks vanus. Koostades vanuse väärtustest sagedustabeli, on see liiga mahukas, et seda andmete esitamiseks kasutada. Statistics – Summarize – Frequencies Variable(s): millistest muutujatest sagedustabelit soovitakse Statistics: võimalus tellida muutuja(te) kohta statistikuid (kvartiile-min/max, keskmist, standardhälvet jne) – ainult rangelt arvandmete korral!
10 Meetod/tunnus/skaala tabel KASUTATAV LUBATUD STATISTILINE ANALÜÜSI MEETOD TUNNUSE LIIK LUBATUD SKAALA LIIK NÄITAJA VÕI TEST VÄLJUNDI OSA ühe tunnuse nominaalskaala mood sagedustabel analüüs ühe tunnuse järjeskaala mood, mediaan sagedustabel, analüüs kvartiilid, tsentiilid ühe tunnuse intervallskaala kõik kõik analüüs
5 4 5 5 2.3 12.klass Füüsika Matemaatika hinne hinne 4 3 4 3 4 3 3 3 5 5 5 4 4 3 3 3 3 3 5 4 3. Sagedustabelid Sagedustabel näitab, mitmel korral antud tunnus saab antud väärtuse. 3.1 Füüsika Hinne 1 Hinne 2 Hinne 3 Hinne 4 Hinne 5 0 0 4 10 16 3.2 Matemaatika Hinne 1 Hinne 2 Hinne 3 Hinne 4 Hinne 5 0 0 14 9 7 2 4. Histogrammid
Row 0,2000 Osakaal: 0,1905 0,1500 Osakaal_% 19% 0,1000 Intervallide 0,0500 keskkohad 7068 0,0000 7068 8638 10208 11778 Kahemõõtmeline sagedustabel: X/Y 5884 6101 6567 6816 [6283; 7853) #NAME? #NAME? #NAME? #NAME? [7853; 9423) #NAME? #NAME? #NAME? #NAME? [9423; 10993) #NAME? #NAME? #NAME? #NAME? [10993; 12563) #NAME? #NAME? #NAME? #NAME? #NAME? #NAME? #NAME? #NAME?
(Tüvenumbrite madalaima järguni) 2) korrutamisel, jagamisel tuleb lõppvastus ümardada nii, et temas oleks sama palju tüvenumbreid, kui oli seda vähima tüvenumbrite arvuga algandmes. 3) mitme tehtega ülesandes tuleb: a) arvutada iga tehe eraldi ja jätta 1 varunumber ning lõppvastus ümardada täpselt. b) hinnata iga tehte tulemust ja otsustada milleni tuleb vastus ümardada. Protsent: Osa=osamäär * tervik Tervik=osa : osamäär Osamäär=osa : tervik Sagedustabel, sektordiagramm: 1)tunnus on suurus, mis iseloomustab mingit objekti. Tunnus võib olla arvuline(pikkus, kaal, jalanumber jne.) või mittearvuline(juuste värv, silmade värv) 2) Tunnust iseloomustavaid arve nimetatakse tunnuse väärtuseks. Kui tunnuse väärtused on kirja pandud mõõtmise järjekorras, siis seda rida nimetatakse statistiliseks teaks. Kui tunnuse väärtused on pandud ritta kas kasvavas või kahanevas järjekorras, kusjuures võrdsed on
TEADUSLIKU MÕTTEVIISI PRAKTILINE ANDMEANALÜÜS Iseseisev töö Koostajad: Tallinn 2017 Iseseisev töö nr 1 Ülevaade vastajatest Küsimustikule vastas 5836 inimest kellest 43% ehk 2528 olid mehed ja ülejäänud 56,7% naised. 28,5% ehk 1661vastanut olid Eestlased, 37,6% Soomlased ja 33,9% Lätlased. Kõige noorem vastaja oli 15 aastane ning vanim 96 aastane. 1)Sagedustabel sugu: Kui paljud suur osa vastanutest on naised? 2)Risttabel kõrgeima omandatud hariduse ja elukoha riigi suhe: Kui suur osa eestlastest oli lõpetamata kõrgharidusega kõigist vastanutest? 3)Kirjeldavad arvnäitajad vastajate kooliskäidud aastate kohta: 4)Tulpdiagramm vastajate perekonnaseisu kohta: Kui suur osa vastanutest on abielus? skaalat ei pööranud kuna tulpade pealkirjad mahtusid tulpade alla ära muutsin tulpade ja tausta värvi
Biomeetria eksamiks ·Konstrueerige sagedustabel tunnusele"hommik" ---- insert PivotTable, joonise tegemisel copy andmed kõrvale (ilma grand total lahtrita) ·Diagrammi kujundamine - kustutada legend ja joonise pealkiri; y-telje põhikoordinaatjooned helehallid katkendlikud; y-teljele nimetus 'Tudengite arv'; x- teljele nimetus 'Mida te tavaliselt hommikul sööte?' ja tõstke see joonise sisse; telgede ühikute kirjasuurus 10 ja nimetustel 12 punkti; y-telje maksimum 29 ja miinimum 0 ühikut ning ühikute vahe (major unit) 5; tulpade vahe 120%; jooniseala (Chart Area) ümbert hall kastijoon kustutada; hall kastijoon teha ümber jooniseala (Plot Area) ·Suhteline sagedus grupi vaatluste arv/kõigi vaatluste arv. Home sakil saab teha protsendiks ·Pidevate arvtunnuste jaoks on vaja klasse. Klasside arvu leiab võttes vaatluste arvust ruutjuure, klassid peavad olema ühepikkuse...