Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Epidemioloogia konspekt". Need materjalid aitavad sul teemat sügavamalt mõista.
valim, jaotu, juhu, populatsioon, normaaljaotus, statistik, levimus, ekspositsioon, ajaperiood, keskväärtus, uuringus, vähk, kvartiilnemist, juhud, mediaani, epidemioloogia, terviseseisund, haigestumusrisk, riskiaeg, kroonilise, rind, diskreetse, histogramm, standardhälve, vaatlus, valimite, usaldusvahemik, vererõhk, tervisega, terviseseisundi1. Rahvatervis- teadus ja kunst haiguste ennetamiseks, eluea Ekspositsioon kokkupuude teguriga, mis võib mõjutada inimese Tundlikkus=P(T+/H+) valenegatiivne=P(T-/H+) spetsiifilisus= pikendamiseks ning vaimse ja füüsilise tervise edendamiseks ja terviseseisundit. Risk- inimest või keskkonda iseloomustav tegur, mille P(T-/H-) valepositiivne= P(T+/H-) Valenegatiivne=1-tundlikkus
Tuleb püstitada uurimisküsimused: mida ja kelle käest tahan teada saada; millistele küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
Pidev suurus - väärtused täidavad mingi vahemiku täielikult ära Jaotusseadus - Diskreetse juhusliku suuruse X jaotusseaduseks nimetatakse vastavust suuruse kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest
Tunnuse jaotus Jäotus üldarvudena v protsentidena Segadustabel, risttabel Jaotus joonisel Võrdlus normaaljaotusega Parameetrite võrdlus Mood- kõige sagedasem väärtus v väärtusklass Mediaan- punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks Kvantiilid Aritmeetiline keskmine e keskväärtus Standardhälve kui kaugel on keskmine inimene keskmisest Dispersioon standardhälbe ruut Võrdlusülesanded Tunnuse jaotuse võrdlus: risttabelid ja seosekordajad Tunnuste keskmine väärtuste võrdlus kirjeldaval tasemel: keskmine ja selle usalduspiirid Ühe tunnuse keskmine väärtuse võrdlus kahes gruppis: t-test Kahe tunnuse keskmine väärtuste võrdlus: t-test Ühe tunnuse keskmiste väärtuste võrdlus kahes v rohkemas grupis:
rühmade jaoks (independent samples t-test) Kui võrreldakse ühe ja sama katsegrupi seisundeid erinevail ajahetkedel (kordusmõõtmised), siis on tegemist omavahel sõltuvate rühmadega ja kasutatakse sõltuvate rühmade t-testi (dependent samples/ paired-samples t-test) Andmed peavad olema vähemalt intervall skaalal (mõõdetav tunnus peab olema pidev muutuja) Sõltuvate rühmade t-testi puhul peab olema normaaljaotus, mis on moodustatud järgmiselt: ühel korral mõõdetud tulemustest on lahutatud teisel korral mõõdetud tulemused. Sõltumatute gruppidega t-testi puhul peaksid olema dispersioonid sarnased (seda saab kontrollida Leveni testiga). Kui gruppide suurused on sarnased, siis ei ole selle eelduse rikkumine väga tõsine. JASPis saab arvutada t-testi statistiku, mis arvestab selle eelduse rikkumisega (Welchi statistik).
Hüpoteeside koltrollimine 1. Oletus, väide 2. Sobiv hüpoteeside paar (millised tunnused on vaja võrrelda) 3. Olulise tõenäosus (p) 4. Järeldus (p>0,05 H0, p<0,05 H1) 5. Lõppvastus (sama, mis oli küsitud hüpoteesis) T-test sobivad valemid 1. T-test H0: keskmised võrdsed H1: keskmised erinevad 2. F-test sõltumatud valemid H0: dispersioonid võrdsed H1: dispersioonid erinevad P>a H0, P<0,05 H1 Võrdsete disp mittevõrdsete disp t-test t-test 3. Olulisuse tõenäosus 4. Lõppvastus (p<0,05 H0) Vormistus nii nagu iseseisvates töös Ülesanne Eesmärk Tunnusetüüp 1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, millel on vähe
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
.. 200-300 200-300 250 28 7000 38 -179,5 32220,25 ... 300-400 300-400 350 42 14700 80 -79,5 6320,25 ... 400-600 400-600 500 50 25000 130 70,5 4970,25 ... Üle 600 600-1000 800 20 16000 150 370,5 137270,3 ... Kokku 150 64425 4822025 USALDUSINTERVALLID Usaldusintervalle on vaja selleks, et hinnata valimi ja üldkogumi vastavust. Valim on juhuslik,võib esineda erinevaid tulemusi. Tehes üldistusi üldkogumile,peame veaga arvestama. Usaldusintervalle kasutataksegi selle vea hindamiseks. Keskmine esindusviga. Valimi suurenedes esindusviga väheneb. Selle leidmiseks on erinevad valemid lähtuvalt sellest, kas üldkogumi suurus on teada või ei ole.(valimi mahu võtmisel ei arvestata missing lahtrit) Piiresindusviga. Jälle kaks valemit lähtuvalt üldkogumist. Kasutatakse t-jaotuse täiendkvantiili
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
· joondiagramm Diagrammi ei ole mõtet kasutada, kui andmestik on väga hajutatud, andmed ei peegelda mingeid muutusi või kui andmeid on liiga vähe või liiga palju. ANDMEANALÜÜS: KIRJELDAV STATISTIKA Mood on variatsioonreas kõige sagedamini esinev liige. Mediaan on jaotuse keskmine liige, millest mõlemale poole jääb võrdne arv elemente. Kvantiilid on asendikeskmised, mis jaotavad korrastatud statistilise rea võrdseteks osadeks. Aritmeetiline keskmine on elementide keskväärtus. Variatsioon ehk hajuvus on kõige suurema ja kõige väiksema väärtuse vahe. Kõige levinumaks näitajaks on standardhälve. Standardhälve iseloomustab vastuste harjuvust keskmise ümber. Variatsioonikoefitsient on standardhälbe ja aritmeetilise keskmise suhe. VALIMI MOODUSTAMINE Valikuuring on statistiline uuring, milles otsustused kogumi kohta tehakse valimi (kogumi ühe osa) baasil. Valim peab olema representatiivne ehk andma õige ettekujutuse uuritava elanikkonna omadustest.
gruppide vahel on erinevused. Tukey – gruppide suurused sarnased. Bonferroni – gruppide suurused erinevad. Korrelatsioon näitab seost kahe tunnuse vahel. Korrelatsiooni koefitsent on alati -1…1 ja näitab kahte asja: seose suunda ja tugevust. Pearson r eranditeta invervalltunnused, pole erandlikke väärtusi, seos lineaarne. Spearman ϱ järjestustunnus+järjestus, intervall+J, I+I Kendall τ järjestustunnus + järjestustunnus, väike valim palju sarnaseid väärtusi Cramer V (nimitunnust võrreldakse binaarsega, arvut risttabeli alusel, suunda ei näidata) Hii ruut- võrdleb binaarseid, nimi ja/või järjestustunnuseid risttabeli põhjal. Nt. 2 gruppi (M,N) võrreldi ühe järjestustunnuse (palk) sageduse (nt. kui suur osa N ja M teenib keskmist) põhjal. Mis on α?-veapiir mida teadlane endale lubab, 1% või 5%. TULEMUSED: Mean- keskmine. N- vastajate arv. Std. hälve e. mediaan- keskmine erinevus keskväärtusest ehk hajuvus
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1 Jaotusfunktsiooni abil on raske otsustada juhusliku suuruse käitumise üle mingi punkti ümbruses. Seetõttu kasutatakse lisaks jaotusfunktsioonile ka sellest tuletatud tihedusfunktsiooni. 2 4. Populatsioon ja valim, standardviga Populatsioon on kõigi objektide, isendite, esemete, nähtuste või seisundite kogum, mille kohta soovitakse järeldusi teha Populatsiooni neid objekte, mida on vaadeldud või uurimiseks välja valitud, kutsutakse valimiks Valimit, kus uuritava tunnuse jaotus on samasugune kui populatsioonis, nimetatakse esindavaks valimiks Standardhälve- ruutjuur dispersioonist (dispersioon pt.2) standardviga = uuritava tunnuse standardhälve / ruutjuur valimi suurusest
· Mõõteskaalad, keskmised (aritmeetiline, mediaan, mood), · Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks)
Sõnavara mees ,091 608 ,000 ,988 608 ,000 naine ,071 742 ,000 ,989 742 ,000 a. Lilliefors Significance Correction Selleks, et vastata küsimusele kas on tegemist normaaljaotusega või mitte peame esmalt välja nuputama, millist testi vaatame. Kolmogorov-Smirnov testi on mõttekas vaadata siis, kui valim on väga suur (tuhanded indiviidid), Shapiro-Wilk test on kohane väikese valimi puhul (u 50-2000 indiviidi). Meie andmestikus on 1350 inimest, seega võiks kasutada Shapiro-Wilk testi. Juurde tasub aga märkida, et mõlemad testid on üsna tundlikud äärmuslike väärtuste ning valimi suuruse suhtes, mistõttu teatud olukordades ei pruugi nende testi alusel tehtud otsustused olla täpsed!
Majandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
standardvead ei ole korrektsed ja seega ei ole korrektsed ka parameetrite hinnangute usaldusvahemikud. Fkriteeriumi hinnang ei pruugi olla õige; c) mudel võib viia uurija valedele järeldustele, kui tegemist on statistiliste hüpoteeside kontrollimisega. Kasutatakse graafilist analüüsi. Juhuslik liige ehk jääkliige ui on juhuslik suurus, mille keskväärtus ehk matemaatiline ootus on võrdne nulliga. E (ui) = 0. Kui juhuslike liikmete dispersioon pole konstantne ning tema jaotus oleneb Xst, on tegemist heteroskedestatiivsusega. Parki test kui sõltumatute muutujate ln(Xi) vastava regressioonikordaja hinnang a1 on statistiliselt olulisel määral erinev nullist, siis esialgses mudelis on heteroskedestatiivsus. 11
muutumisvahemiku sees kõik juhusliku suuruse väärtused on tekke mõttes samaväärsed. Jaotuse parameetriteks on juhusliku suuruse muutumisintervalli alumine piir a ja ülemine piir b. Eksponentjaotus (pidev) kirjeldab mingi sündmuse toimumisaja jaotust eeldusel, et sündmuse tekkimise jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate
Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud
Enne katse toimumist on tundmata. Üldjuhul tähistatakse X. Diskreetne juhuslik suurus on juhuslik suurus, mille väärtuste hulk on lõplik või loenduv. Praktiliselt vaatleme ainult selliseid DJS, mille võimalikud väärtused on 0, 1, 2, ... või alamhulk eelnevast. DJS jaotusseadus on eeskiri, mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X). kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima väärtuse vahel dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2= standardhälve - Standardhälve on ruutjuur dispersioonist 7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
Juhusliku suuruse X väärtused x1 x2 ... xn
Väärtuste ilmumise tõenäosused f(x1) f(x2) ... f(xn) f (x ) = 1
i
Diskreetse juhusliku suuruse jaotusfunktsioon F(x)=P(X
Teiseks on kõigi enamkasutatavate arvkarakteristikute leidmiseks MS Exceli funktsioon, näiteks AVERAGE - aritmeetiline keskmine, STDEV - standardhälbe valimhinnang, SKEW - asümmeetriakordaja jne. Kõigi nende funktsioonide argumendiks on uuritava tunnuse väärtusi sisaldav andmeblokk. Tunnuse 'Pikkus' keskväärtus leituna funktsiooni AVERAGE abil. http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/arvkar.html (1 of 5)29.05.2006 15:08:55 Andmeanalüüs MS Exceli abil - sagedustabelid Funktsiooni argumentidena on ette antud lahtrid B1-J1, mis sisaldavad uuritava tunnuse väärtusi. NB! Funktsioonide korral sisestatakse andmeblokk ilma
muutujateks ruumiline mõtlemine ja sõnavara ning sõltumatuks muutujaks sugu) Plots-> Normality Plots with tests Võite ära märkida, et tahate joonist histogrammi kujul. Kui olete need sammud ära teinud, peaks teile ilmuma tabel. Selleks, et vastata küsimusele kas on tegemist normaaljaotusega või mitte peame esmalt välja nuputama, millist testi vaatame. Kolmogorov-Smirnov testi on mõttekas vaadata siis, kui valim on väga suur (tuhanded indiviidid), Shapiro- Wilk test on kohane väikese valimi puhul (u 50-2000 indiviidi). Meie andmestikus on 1350 inimest, seega võiks kasutada Shapiro-Wilk testi. Järgnevalt tuleb vaadata Sig.-i. Kui Sig on väiksem kui 0.05, siis ei ole andmed normaaljaotuslikud. Sageduste võrdlemine: (Analyze Descriptive Statistics ->Crosstabs). Lisaks on võimalik tellida statistik (Statistics -> Chi-
Sõnavara mees ,091 608 ,000 ,988 608 ,000 naine ,071 742 ,000 ,989 742 ,000 a. Lilliefors Significance Correction Selleks, et vastata küsimusele kas on tegemist normaaljaotusega või mitte peame esmalt välja nuputama, millist testi vaatame. Kolmogorov-Smirnov testi on mõttekas vaadata siis, kui valim on väga suur (tuhanded indiviidid), Shapiro-Wilk test on kohane väikese valimi puhul (u 50-2000 indiviidi). Meie andmestikus on 1350 inimest, seega võiks kasutada Shapiro-Wilk testi. Juurde tasub aga märkida, et mõlemad testid on üsna tundlikud äärmuslike väärtuste ning valimi suuruse suhtes, mistõttu teatud olukordades ei pruugi nende testi alusel tehtud otsustused olla täpsed! Järgnevalt tuleb vaadata Sig.-i (olulisuse tõenäosus)
Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed tänud juba ette või lõpus · Lihtsamad küsimused, avaküsimused
Testis kasutatav teststatistik iseloomustab erinevust hüpoteetilise ja empiirilise jaotuse vahel histogrammi vahemikele vastavate hüpoteetilise ja empiirilise sageduse kaudu. Kolmogorovi-Smirnovi test: Hüpoteesipaari {H0: F(x,) = F0(x,), H1: F(x,) F0(x,)} kontrollimine Kolmogorovi-Smirnovi testi abil kasutab erinevust hüpoteetilise ja empiirilise jaotusfunktsiooni vahel ning põhineb asjaolu, et nullhüpoteesi H0: F(x,) = F0(x,) tõesuse korral statistik on N puhul jaotunud Kolmogorovi jaotusseaduse järgi (kui jaotuse parameetrid on teada ja F0(x) täpselt fikseeritud). Korrelatsioon-Korrelatsioon (korrelatsioonikordaja, korrelatsioonitegur, korrelatsioonikoefitsient) on levinuim arvkarakteristik iseloomustamaks kahe sõltuva juhusliku suuruse X ja Y vahelist (lineaarset) seost. Korrelatsiooni hindamiseks katseandmete järgi on vaja nn paarisvalimit, mis koosneb katse/vaatluse tulemusel saadud paarisvaatlustest (xi, yi), kus i = 1, 2, ..
2) Statistilise uurimistöö etapid Uuringu ettevalmistamine (eesmärk, plaan, andmete vajadus, andmete kogumisviis, töötlemisviis, võimalikud järeldused). Statistiline vaatlus (küsitlus, dokumentide läbivaatamine, ankeedi korraldamine, andmete hankimine statistilistest andmebaasidest). Vaatlusandmete kokkuvõtt ja esialgne töötlemine. Andmete analüüs, järelduste ja üldistuste sõnastamine. 3) Statistilise vaatluse vead Metodoloogilised vead – valim ei kirjelda üldkogumit adekvaatselt. – vaatluse eesmärk ja objekt pole täpselt piiritletud. – vaatlusviis on ebaõnnestunult valitud. – vaatluse juhendmaterjalid pole üheselt mõistetavad. Registreerimisvead (tahtlikult tekitatud vead; mittetahtlikud vead). tahtlikud vead – andmeid moonutatakse meelega. mittetahtlikud vead – jämedad vead (tekivad mõõtmist, vaatlust või küsitlemist segava
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
A32_1 pane tah nt P nagu pööratud Edasi Kustuta ära vana A32_1 Kirjuta väärtused Millised vead olid : sisestusviga, skaala ebaloogiline, grupeerimine, palju oli missing. Teisendused on ka veebis olemas –mine vaata. 12.02.03 Võtame kaks intervalltunnust T1 : rahulolu ilmaga T2: rahulolu eluga Loo uus fail: Võta variable view: Pane nimed ja komakohad nulli: Valime skaala 1-5, kus 1 ei ole rahul ja 5 on väga rahul. Võta data view ja sisesta sinna vastuseid, mida valim on andnud: Valimisse tuli 17 objekti. Enne üldistamist antakse ülevaade, kes meil seal andmestikus on ehk räägime valimist, sest see on kõige alus. Meil on kaks tunnus –sagedustabeleid oleks halb teha. Arvutame keskväärtuse, standardhälbe ja võrdleks läbi selle. N=17 Võta alaize ja descripive statistics Kui öeldakse keskväärtus, siis mõeldakse aritmeetilist väärtust ja see on MEAN ehk MIlma puhul tuleb kindlasti standardhälve suurem, sest see sõltub vastuste