Mootori Väljalaske Aasta Kuu nr Kategooria Mark Mudel võimsus aasta Tüüp 1994 4 M1 GAZ 20 12 1958 Füüsiline isik 2003 3 L3e SUZUKI GS 500EU 12 1991 Füüsiline isik 2004 5 N1 SUBARU E10 13 1991 Juriidiline isik 2005 9 M1 VOLKSWAGENGOLF 7 1992 Füüsiline isik 2005 9 M1 VOLKSWAGENGOLF VARIAN 24 1993 Füüsiline isik 2006 11 N1 SUBARU E12 ELCAT CI 14 1999 Füüsiline isik 2008 4 M1 ZEV SMILEY 7 2008 Füüsiline isik 2010 6 M1 OMAVALMISTAZEV SEVEN 14 2010 Riigiasutus 2011 3 M1 CITROEN C-ZERO 35 201...
Populaarsemad lastele pandud nimed 2010 Statistiline uurimustöö Autor: Juhendaja: JAANUARIKUU NIMED Poiste nimed Marten Gregor Kaspar Maksim Markus Kokku Sagedus 11 8 8 8 8 43 Sagedus (%) 26% 19% 19% 19% 19% 100% Tüdrukute nimed Maria Sandra Johanna Milana Polina Kokku Sagedus 9 8 7 7 7 38 Sagedus (%) 24% 21% 18% 18% 18% 100% VEEBRUARIKUU NIMED Poiste nimed Rasmus Martin Maksim Marten Oskar Kokku Sagedus 11 10 9 9 9 48 Sagedus (%) 23% 21% 19% 19% 1...
.......................................................3 1.DIAGRAMMID JA RISTTABELID............................................................................................4 1.1.Diagramid...............................................................................................................................4 1.2.Risttabelid...............................................................................................................................7 2.FILTREERIMISE KÜSIMUSED JA SAGEDUSTABELID......................................................10 2.1.Filtreerimise küsimused.......................................................................................................10 2.2.Sagedustabelid......................................................................................................................10 KOKKUVÕTE..............................................................................................................................12 LISAD....................
(nn. tehnilisi erinevusi on jooniste ja tabelite konstrueerimisel). Lühidalt peamistest andmeanalüüsi teostamise vahenditest Excelis Joonised Funktsioonid Protseduurid Risttabelid (Pivot Table) Sagedustabelid ja -histogrammid Pidev arvtunnus Diskreetne arvtunnus Mittearvuline tunnus Arvkarakteristikud Usalduspiirid Hüpoteeside kontroll http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/ (1 of 2)29.05.2006 15:08:49
.............................................................6 4.DIAGRAMMID......................................................................................................................................8 5.RISTTABELID.....................................................................................................................................12 6.FILTREERIMISE KÜSIMUSED.........................................................................................................14 7.SAGEDUSTABELID...........................................................................................................................15 8.KOKKUVÕTE......................................................................................................................................16 9.Viidatud allikad.....................................................................................................................................17 10.LISAD............................................................
1,1 - 2 1 4 2 2,1 - 3 3 0 3,1 - 4 10 2 3 4,1 - 5 11 25 sika kontrolltöö hinnete sagedustabelid. Matemaatika Füüsika 12 10 8 6 4 2 0 3 4 5 2 3 4
Esimene andmekogu kujutab endast Meeste ja naiste abielusid aastatel 1978- 2007. Teine andmekogu kujutab elussündisid samuti aastatel 1978-2007. Võtsin huvi pärast just sellised andmed, kuigi ega nad üksteisest täiesti ei sõltu, on siiski huvitav võrrelda abielusid ja elussünde (lapsesaamisi). Eelnimetatud andmete põhjal leidsin keskmised, , jaotuse kuju iseloomustavad näitarvud, sagedusklassid ning variatsioonnäitarvud. Lisasin ka diagrammi ning sagedustabelid. Andmekogumite kirjeldamine lõppeb tulemuste tõlgendamisega, andmekogumite hajuvuse ja jaotuvuse kuju võrdlemisega 2 2. Andmekogumite analüüs Analüüsin elussünde ning abielusid, nagu ennist juba öeldud- otseselt küll omavahel seotud ei ole, kuid olenevalt perekonnast ning traditsioonidest(enne abielu, siis laps), võib siit nii mõndagi järeldada.
44 dke tunnuse kaal järgmised arvkarakteristikud: average harmean geomean min max max-min mode quartile(2) või median quartile(1) quartile(3) var stdev skew kurt var.amplituud / aritm. keskmine (väljenda %) st.hälve / aritm. keskmine (väljenda %) Koostage ülesande 1 andmetega ja funktsiooni frequency abil pikkuste intervallide sagedustabelid Leidke valemite abil järgmised arvkarakteristikud: aritmeetiline keskmine, mood ja mediaan. x f Pikkus (cm) Sagedus x' x'f Σ 165 - 168 5 166.5 832.5 5 168.5 - 171.5 9 170 1530 14 kus 172 - 175 14 173.5 2429 28 f – variantide kaalud 175.5 - 178
4 3 5 4 5 5 2.3 12.klass Füüsika Matemaatika hinne hinne 4 3 4 3 4 3 3 3 5 5 5 4 4 3 3 3 3 3 5 4 3. Sagedustabelid Sagedustabel näitab, mitmel korral antud tunnus saab antud väärtuse. 3.1 Füüsika Hinne 1 Hinne 2 Hinne 3 Hinne 4 Hinne 5 0 0 4 10 16 3.2 Matemaatika Hinne 1 Hinne 2 Hinne 3 Hinne 4 Hinne 5 0 0 14 9 7 2 4. Histogrammid
ANOVA, on kujul: H0: regressioonivõrrand ei ole statistiliselt oluline H1: regressioonivõrrand on statistiliselt oluline ehk H0: leitud võrrand ei ole parem võrreldes konstantse võrrandiga H1: leitud võrrand on parem võrreldes konstantse võrrandiga ehk H0: Pikkus = a H1: Pikkus = a + b×Jalanumber Reaalselt rakendada on põhjust vaid statistiliselt olulist regressioonivõrrandit. Praks 7 2-mõõtmelised sagedustabelid Pivot Table'i vahendiga; hii2-test funktsiooniga CHITEST. Kas sugu ja auto omamine on seotud, st kas autot omavate tudengite arv on mees- ja naistudengite hulgas erinev? Praks 8 Ühefaktoriline dispersioonanalüüs - protseduur Anova: Single Factor. Kordamine.
Kursusel osalejate elukoht soo alusel 12 10 8 Summa 6 N M 4 2 0 Linn Alev Maa-asula Suur linn Elukoht I OSA. Kirjeldav statistika 1. Koostada sagedustabelid 1.1 Sagedustabel Sugu Total N 29 M 10 Grand Total 39 1.2 Sagedustabel Elukoht Sugu Linn Alev Maa-asula Suur linn Grand Total N 10 9 4 6 29
uurimisprobleemi lahendamiseni. Andmete analüüsiks on välja töötatud terve rida statistilisi teste. Sellele lisanduvad veel mitmed arvutprogrammid. (mis arvutiprogramm, otsi välja) Andmete analüüsitulemus saab olla usaldusväärne vaid siis kui kogutud andmete kvaliteet on kõrge. Andmeid analüüsima asudes tuleks meeles pidada, et kõik analüüsimeetodid ei sobi erinevate probleemide lahendamiseks. Kaks kõige tüüpilisemat meetodigruppi on sagedustabelid ja arvnäitajad. 1.5. Järelduste ja soovituste väljatöötamine ja juhtkonnale esitamine 2 Teder, J. Puulinn, V. Mainori Majanduskooli turunduse alused õppeaine konspekt, Googledocs, lk 12 6 Turu uuringu lõppstaadiumis minnakse taas probleemi tekkepõhjuse juurde tagasi. Tulemuste esitamisel on tihti ettetulevaks veaks see, et pööratakse suuremat tähelepanu faktidele, jättes järeldused ja ettepanekud tagaplaanile.
arvkarakteristikud: average harmean geomean min max max-min mode quartile(2) või median quartile(1) quartile(3) var stdev skew kurt var.amplituud / aritm. keskmine (väljenda %) st.hälve / aritm. keskmine (väljenda %) Koostage ülesande 1 andmetega ja funktsiooni frequency abil pikkuste intervallide sagedustabelid. k ( f Mo f Mo 1 ) Leidke valemite abil järgmised arvkarakteristikud: Mo xMo aritmeetiline keskmine, mood ja mediaan
Andmete analüüsimiseks on mõistlik jätta puuduvale väärtusele vastav lahter tühjaks. Aruandes võib selguse mõttes kirjutada puuduva väärtuse kohale punkti või kriipsu. Kui ühe küsimuse puhul on lubatud valida mitu vastusevarianti, siis iga variant annab andmetabelis eraldi tunnuse (veeru). TULEMUSTE ESITAMINE Struktureeritud andmete esmaseks kokkuvõtteks ning ülevaatlikuks analüüsiks saab kasutada kirjeldava statistika meetodeid, mis võib jagada kolme suurde rühma: 1. Sagedustabelid 2. Arvjoonised ehk diagrammid 3. Arvnäitajad Sagedustabelid aitavad vastust leida kahte tüüpi küsimustele: · Kui palju on/oli? (arv, sagedus, absoluutne sagedus) · Kui suur osa on/oli? (protsent, osakaal, suhteline sagedus) Kui vastajaid on alla saja, kasuta tulemuste esitamisel ka sagedusi. Kui vastajaid on üle saja, siis kasuta protsente. Diagrammide ülesanne on esitada infot visuaalselt. Graafiliselt esitatud statistika on inimesele
kontingentsus koef. Nominaal - Crameri V, Phi, Crameri V, Phi, kontingentsus koef. kontingentsus koef. Nominaaltunnuste puhul saab valida Crameri V(m*n), Phi(2*2) ja kontingentsus koefitsiendi(m*m) vahel. Crameri V tuleb valida, kui sagedustabelid on ebasümmeetrilised ehk ühel tunnusel on rohkem väärtuseid kui teisel (näiteks abielulisel staatusel 5 gruppi, aga eluga rahulolul 3 gruppi). Phi sobib ainult 2x2 sagedustabeli puhul (N: mehed/naised ja töötab/ei tööta). Kontingentsus koefitsient sobib samuti ainult sümmeetriliste tabelite puhul (ükskõik, millise nxn puhul). Korrelatsioonanalüüsi etapid: 1) Mis liiki tunnusega on meil tegemist? 2) Kas seos muutujate vahel on lineaarne? 3) Korrelatsioonikordaja valik lähtudes
on andmevaade ja avaneb tavaliselt esimesene, teine vaade on tunnuse vaade. Nt sugu, pikemalt SUGU, sisestatud on numbreid, kodeerimiseeskiri on väärtute alla –nt 1 on mees ja 2 on naine Andmevaatel on omakorda andmevaade –numbrid ehk koodid ja kirjeldused. View-value labels –saab muuta kas numbrid või tekstiline. Esimesena, mida vaja on teha andmestik puhtaks. On nii sisestuse kui ka arusaamise vigu. Kõige lihtsam ülevaate saamiseks tunnustest on teha sagedustabelid. Neid tehakse just nii palju, kui neid tunnuseid on. Analyze – descriptive statistics- frequencies võtame sealt kõik tunnused ühekaupa või ctrl Aga viid sinnapoole – OK. Output file on jagatud kaheks – sisukord ja vastavad tabelid. Siin pole nagu ekselis, et muudad andmeid ja tabelid muutuvad .Tabelid on lõplikud Sagedustabeli struktuur: Puuduvate vastuste protsent võib olla kuni 3%, edasi tuleb kaaluda, miks see on nii läinud
◦p on väiksem või võrdne 0,05 – seos on juhuslik 5% 100-st Statistiliselt olulisi tulemusi võib üldistada Kui seos pole stat.oluline, siis üldistada ei saa Kuidas tõsta statistiliselt olulisuse tõenäosust? ◦Mida suurem on valim, seda lihtsam saavutada statistiliselt olulist seost Mida andmetega teha saab Kirjeldada tunnuste varieeruvust valimis/üldkogumis Univariatiivne (ühemõõtmeline analüüs) Vahendid ◦Sagedustabelid ◦Keskväärtused Keskmine Mediaan Mood Mida teha saab – mõõta seoseid Mõõta seoseid muutujate vahel Kahemõõtmeline analüüs ◦Kas osaajaga töötajate hulgas on rohkem naisi või mehi? ◦Kas toetus erakonnale oleneb sissetulekust? Vahend: Risttabel ◦Näitab sõltuva muutuja esinemissagedust sõltumatu muutuja tunnuste lõikes 2-mõõtmeline analüüs Korrelatsioon
p on väiksem või võrdne 0,05 seos on juhuslik 5% 100-st Statistiliselt olulisi tulemusi võib üldistada Kui seos pole stat.oluline, siis üldistada ei saa Kuidas tõsta statistiliselt olulisuse tõenäosust? Mida suurem on valim, seda lihtsam saavutada statistiliselt olulist seost Mida andmetega teha saab? Kirjeldada tunnuste varieeruvust valimis/üldkogumis Univariatiivne (ühemõõtmeline analüüs) Vahendid Sagedustabelid Keskväärtused Keskmine Mediaan Mood Sagedustabel uuringus osalenute arv riigiti Sektordiagramm Tuldiagramm Kulmulatiivne tulpdiagramm Moodi ja mediaani näide
· Diskreetsed (sõredad, eraldatud) avalduvad üksnes täisarvuliste väärtustena (nt lugejate arv, külastajate arv, fondi suurus jms); · Pidevad võivad omada mistahes täis- või murdarvulisi väärtusi (nt inimeste vanus, pikkus jms). Sageli käsitletakse pidevaid tunnuseid diskreetsetena (vanus, pikkus jm). 2.6 Andmete töötlemise metoodika Siin võib üliõpilane kasutada kõiki statistikas tuntud meetodeid: näit rühmitamine, sagedustabelid, jaotustabelid jne 37 3. ESMASTE ANDMETE KOGUMISE MEETODID Küsitlus on soovitud andmete kogumine inimeste intervjueerimise teel spetsiaalsete küsimuste abil kas siis otse, telefonitsi, posti teel või arvuti abil. Eeliseks on, et info saadakse otse inimeselt. Küsitlusel on järgmised piirangud: · vea võimalused küsimustiku koostamisel ja intervjueerimisel; · küsitlus võib olla kulukas ja aega nõudev;
päriselt aru, mis toimub?“ vastused tabelina tekstidokumenti kolmel erineval kujul (formaatimata tekst, formaaditud tekst, pilt) Kui tihti tundub poliitika Teile nii keerulisena, et Te ei saa päriselt aru, mis toimub? 99 6,0 335 20,2 701 42,2 345 20,8 158 9,5 1638 98,6 21 1,3 2 ,1 23 1,4 1661 100,0 Mitte kunagi Harva Vahetevahel Sageli Väga sageli Total Valid Ei oska öelda Vastus puudub Total Missing Total Frequency Percent Kopeeri tekstidokumenti kõik loodud sagedustabelid(Copy Objects) Ekspordi tekstifailiks (Text Filevõi Word/RTF File) kõik loodud objektid Ekspordi esitlusfailiks (Powerpoint File) ainult tulemused (visible objects) 4.3. ANDMESTIKU JAGAMINE OSADEKS. 1. Jagame andmestiku osadeks (tunnuse sugupõhjal) 2. Tellime sagedustabeli küsimuse „Kas Teie osalesite viimastel valimistel?“ tulemuste kohta. 3. Taastame esialgse olukorra (eemaldame osadeks jagamise). Tabel 4A. Kas Teie osalesite viimastel valimistel? Mees Naine Vastajate arv %