Dispersioonanalüüs kui valimeid 3+ Kasutades kirjeldavat statistikat, uurige, milline on indiviidide keskmine abiellumisiga (tunnus agewed) ning seejärel testige hüpoteesi, kas mehed ja naised abielluvad esimest korda keskmiselt sama vanalt. Millist testi kasutate ja millised eeldused peavad olema selleks täidetud? Milline on varieeruvus soo lõikes? Esitage saadud tulemustest sisuline kokkuvõte. 2 valimiga t-test eeldused arvuline tunnus, normaaljaotus, valemite sõltumatus, dispersioonide võrdsus gruppides H0 vanuse abiellumisea disp. on võrdsed sugu lõikes H1 vanuse abiellumisea disp. ei ole võrdne sugu lõikes H0 keskm vanus on võrdne sugude lõikes H1 keskm ei ole võrdne VASTUS Funktsioonitunnus arvuline, normaaljaotus, dispersioonid kõigis gruppides samad Argumenttunnus kategooriline, vähemalt 2 vaatlust igas grupis Rühmadesisene hälve saadakse, liites kõigi kaupluse gruppide puhul nende keskmise müügikoguse
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
4. Dispersioon iseloomustab juhusliku suuruse Xi erinevust keskväärtusest, seega iseloomustab tunnuse hajuvust. Valimi dispersiooni kui üldkogumi dispersiooni hinnangu tähiseks on tavaliselt Sruut, üldkogumi dispersiooni tähiseks ruut (kasutatakse teisi tähiseid ka: var, D(X)). Seega, mida suurem on Xi väärtus võrreldes keskväärtusega, (aritmeetilise keskmisega) seda suurem on hajuvus e dispersiooni. 5. Dispersiooni meetod 6. Diskreetne arvuline tunnus omab vaid täisarvulist väärtust, n laste arv perekonnas, eesti elanike arv. 7. DurbinWatsoni test. Kasut 1. järku autokorrelatsiooni avastamiseks. Kasut.tingimused: reg.mudel sisaldab vabaliiget. Mudel ei sisalda sõltuva muutuja viitajaga liikmeid (nt Yt1, Yt2) 8. Fiktiivne muutuja (dummy) iseloomustavaid binaarseid muutujaid. Binaarne muutuja
Kvantitaiivne tunnus (arvtunnus) on tunnus , mille väärtused on arvud (nt. Pikkus, kaal, rahvaarv, keskmine hinne) Kvalitatiivne tunnus on tunnus, mille väärtused ei ole arvud ( juustevärv, perekonnaseis, rahvus). STATISTIKA EKSAMI KORDAMISKÜSIMUS TE VASTUSED 1. Statistika aine ja meetod Statistika on iseseisev teadus. Ta uurib ühiskondlike nähtuste kvantitatiivset külge lahutamata seoses nende kvalitatiivse küljega ja ühiskonna arengu kvalitatiivset väljendumist konkreetsel ajal ja kohal. Peamiselt tegeleb statistika : 1) Statistiliste andmete hankimisega e. statistiline vaatlus 2) Ststistilise informatsiooni kompaktne ja ülevaatlik esitamine e. Kirjeldava statistika (andmete esitamine ja organiseerimine) 3) Tõenäosusteooria so.reaalsuses sageli esineva ja majanduses eelkõige tulevikuga seonduva ebakindluse kirjeldaminne 4) Järeldav
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
Pidev suurus - väärtused täidavad mingi vahemiku täielikult ära Jaotusseadus - Diskreetse juhusliku suuruse X jaotusseaduseks nimetatakse vastavust suuruse kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest
1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi eesmärk on: 1. dispersioonide leidmine 2. uuritava nähtuste tegurite mõju olulisuse hindamine Valimi andmete põhjal saadi järgmised tulemused: aritm.keskmine=80 ja standardhälve 20. Üldkogumi maht 1200. Kui suur peaks olema valim, et teha kindlaks üle 110 väärtusega elementide osakaalu üldkogumis täpsusega +/-4 ühikut, usaldatavusega 95%. 1. 1700 (üldkogum 1200) 2. 1280 (üldkogum 1200) 3. Ei saa arvutada, sest dispersioon ei ole teada (standarthälbe väärtus on olemas, tõstam ruutu saan dispersiooni, 2. Tahan teha kindlaks elementide osakaalu, ehk et kui dispersiooni ei tea, saan arvutada võttes maksimaalse dispersiooni) 4. Ei ükski eelpool toodud valikutest
Hüpoteeside koltrollimine 1. Oletus, väide 2. Sobiv hüpoteeside paar (millised tunnused on vaja võrrelda) 3. Olulise tõenäosus (p) 4. Järeldus (p>0,05 H0, p<0,05 H1) 5. Lõppvastus (sama, mis oli küsitud hüpoteesis) T-test sobivad valemid 1. T-test H0: keskmised võrdsed H1: keskmised erinevad 2. F-test sõltumatud valemid H0: dispersioonid võrdsed H1: dispersioonid erinevad P>a H0, P<0,05 H1 Võrdsete disp mittevõrdsete disp t-test t-test 3. Olulisuse tõenäosus 4. Lõppvastus (p<0,05 H0) Vormistus nii nagu iseseisvates töös Ülesanne Eesmärk Tunnusetüüp 1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, millel on vähe
sama ühik, mis muudab võimatuks erinevate ühikutega suuruste hajuvuse võrdlemise. · Keskmine lineaarhälve (d katusega) ehk keskmine absoluuthälve. Hälve ehk erinevus. Kokkuvõtlikult on lineaarhälve erinevuste keskmine. Keskmise lineaarhälbe eeliseks on tema lihtne interpreteeritavus. Probleemiks on absoluutväärtuse kasutamine arvutustes, mis muudab keskmise lineaarhälbe matemaatiliste operatsioonide jaoks ebamugavaks. · Dispersioon 2 ehk hajuvus ehk hälvete ruutude keskmine (keskmine ruuthälve). Dispersiooniks nimetatakse variantide väärtuste ja aritmeetilise keskmise erinevuste ruutude (ruuthälvete) aritmeetilist keskmist. · Standardhälve ehk hälvete keskmine on leitud ruutkeskmise abil. Standardhälve ehk ruutkeskmine hälve on ruutjuur dispersioonist. Standardhälve on seotud tõenäosusteooria rakendustega, lineaarhälve ei ole. Standardhälve ON ALATI
2. on alati moodist suurem 3. on alati geomeetrilisest keskmisest suurem 4. normaaljaotuse puhul on moodiga võrdne 5. ei ükski Standardhälve 1. leitav dispersiooni ruuduga 2. paikneb alati vahemikus 0 ... lõpmatus 3. ei saa olla lineaarhälbest suurem 4. varieeruvas reas = 0 5. ei ükski Normaaljaotuse korral 1. puudub sümmeetria 2. st. hälve = 0 3. Mo = Me ei võrdu aritmeetilise keskmisega 4. keskväärtus on alati = 0 5. ei ükski Seos Y = 18,5 + 0,48 X 1. kirjeldab X-i mõju Y-le 2. kirjeldab seose tugevust 3. kirjeldab Y-i mõju X-le 4. on pööratav ka kujule X = 18,5 + 0,48 Y 5. ei ükski Tasandusjoon Y = 18,5 – 0,48 X 1. näitab kasvavat lineaarset tendentsi 2. parameeter b ei tohi olla negatiivne 3. vabaliige 18,5 kirjeldab joone tõusu 4. igal ajaperioodil väärtused vähenevad 0,48 korda 5. ei ükski Eksponentkeskmine
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2. Ettekavatsetud- vastavalt eelteadmistele valitud uuritavad 3
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
üldkogumi suurusest (mida suurem üldkogum, seda suurem valim) üldkogumi keskmisest väärtusest – ÕIGE usaldatavusest (mida suurem usaldatavus, seda suurem valim) soovitud täpsusest (mida täpsemat tulemust tahan, seda suurem peab olema valim) väärtuste varieeruvusest üldkogumis (mida suurem dispersioon, seda suurem on valim) Keskmine esindusviga on oma sisult: vale keskmise valiku tulemusel tekkinud arvutusviga - esindusviga ei ole arvutusviga, valim esindab üldkogumit kõikide võimalike esindusvigade harmooniline keskmine - õige on ruutkeskmine!!! vahe ühe juhuslikult moodustatud valimi keskmise taseme ja üldkogumi keskväärtuse - küsitakse keskmist esindusviga, siin on ühe juhuslikult moodustatud valim...ei saa olla keskmine; siis on lihtsalt esindusviga väljavõtukeskmiste standardhälve - ÕIGE, keskmine esindusviga on väljavõtukeskmiste standardhälve (definitsioon) Hüpoteeside kontrollimisel:
· joondiagramm Diagrammi ei ole mõtet kasutada, kui andmestik on väga hajutatud, andmed ei peegelda mingeid muutusi või kui andmeid on liiga vähe või liiga palju. ANDMEANALÜÜS: KIRJELDAV STATISTIKA Mood on variatsioonreas kõige sagedamini esinev liige. Mediaan on jaotuse keskmine liige, millest mõlemale poole jääb võrdne arv elemente. Kvantiilid on asendikeskmised, mis jaotavad korrastatud statistilise rea võrdseteks osadeks. Aritmeetiline keskmine on elementide keskväärtus. Variatsioon ehk hajuvus on kõige suurema ja kõige väiksema väärtuse vahe. Kõige levinumaks näitajaks on standardhälve. Standardhälve iseloomustab vastuste harjuvust keskmise ümber. Variatsioonikoefitsient on standardhälbe ja aritmeetilise keskmise suhe. VALIMI MOODUSTAMINE Valikuuring on statistiline uuring, milles otsustused kogumi kohta tehakse valimi (kogumi ühe osa) baasil. Valim peab olema representatiivne ehk andma õige ettekujutuse uuritava elanikkonna omadustest.
üldkogumi keskmisest väärtusest Vahemikhinnangu andmisel usalduspiiris on suurema valitud usaltatavuse puhul laiemad Hüpoteeside kontrollimisel: On võimalik I tüüpi vea tekkimine kui lükatakse tagasi nullhüpotees Kui kasutada otsuste langetamisel väiksemat valimit, siis vea tekkimise võimalus suureneb Valimi suurus mõjutab hüpoteesi kontrollimisel tehtavad otsust Hüpoteesi kontrollimisel viga saab tekkida: kuna anname hinnangu valimi põhjal ja valim on moodustatud juhuväljavõtu teel Statistilite hüpoteeside kontrollimisel: võrreldakse empiirilistel andmetel leitud statistikut kontrollstatistikuga Normaalselt jaotuvad kogumis: ei ükski; Mood, mediaan ja aritmeetiline keskmine on võrdsed asümmeetriakordaja ei erine 0-st Dispersioon on standardhälbe ruut jaotuskõver on sümmeetriline Normaaljaotuse korral: Kolmandat järku standardmomemt on võrdne nulliga Tugeva neg lineaarse seose korral:
Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud
STATISTIKA MÕISTED, VALEMID AEGRIDADE ANALÜÜS • Aegrida – nähtuste ajalist muutumist iseloomustavate arvandmete rida. • Aegrea elemendid – nähtust iseloomustava tunnuse arvväärtused ning neile vastavad teatud ajamomendid või –perioodid Aegread liigitatakse moment- ja perioodridadeks • Momentrida – aegrida, mille iga element on seotud teatud ajamomendiga. See kindel ajamoment võib olla mingi kindel kuupäev, näiteks aasta lõpp või algus, näiteks rahvaarv 1. jaanuari seisuga või bilanss mingi kuupäeva seisuga. Momentrea oluliseks iseärasuseks on asjaolu, et nähtust iseloomustava tunnuse arvväärtuste summal ei ole reaalset sisu. Näiteks ei oma sisu rahvaarvude liitmine 1. jaanuari seisuga. • Perioodrida – aegrida, mille iga element on seotud mingi ajavahemikuga, perioodiga (perioodiks võib olla kuu, kvartal, aasta). Selliseid ridu nimetataks
muutumisvahemiku sees kõik juhusliku suuruse väärtused on tekke mõttes samaväärsed. Jaotuse parameetriteks on juhusliku suuruse muutumisintervalli alumine piir a ja ülemine piir b. Eksponentjaotus (pidev) kirjeldab mingi sündmuse toimumisaja jaotust eeldusel, et sündmuse tekkimise jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate
nullpunkt (nt raha) o Lickerti skaalal tehtud mõõtmisi on lubatud käsitleda vajadusel pideva muutujana Jaotused (normaaljaotus, negatiivne asümmeetria, positiivne asümmeetria): Andmetöötluse alused: Valemid ja tähised n või N – juhtumite arv x – muutuja X̅ või µ – keskmine i – indekseerimistähis σ või SD – standardhälve (standard deviation) σ2 või SD2 – hajuvus Σ – summeerimine Standardhälve Näitab, kui hästi keskmine esindab mõõdetud andmeid. Muutjal on keskmine väärtus ja iga juhtum on sellest teatud kaugusel: x1- X̅ Hajuvus on keskmine ruutkaugus, seega standardhälve on nö keskmine kaugus keskmisest: Normaaljaotuse puhul paikneb kõigist mõõtetulemustest 68,27% ±1SD, 95,45% ±2SD ja 99,73% ±3SD kaugusel keskmisest. Kaugus keskmisest (indiv
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
Value df (2-tailed) kokku tõmmata kas andmeid filtreerides või Pearson 45,508 a 10 ,000 uusi muutujaid moodustades (vt allpool). Chi-Square Hii-ruut statistik ise ei näita seost veeru- ja Likelihood Ratio 27,000 10 ,003 reamuutuja vahel, selle suurus sõltub tabeli Linear-by-Linear Association ,363 1 ,547 suurusest. Seosele viitab väike (<0,05) p N of Valid Cases 555 (“Asymp. Sig.”). Ettevaatust! Suurte a
Tunnuse jaotus Jäotus üldarvudena v protsentidena Segadustabel, risttabel Jaotus joonisel Võrdlus normaaljaotusega Parameetrite võrdlus Mood- kõige sagedasem väärtus v väärtusklass Mediaan- punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks Kvantiilid Aritmeetiline keskmine e keskväärtus Standardhälve kui kaugel on keskmine inimene keskmisest Dispersioon standardhälbe ruut Võrdlusülesanded Tunnuse jaotuse võrdlus: risttabelid ja seosekordajad Tunnuste keskmine väärtuste võrdlus kirjeldaval tasemel: keskmine ja selle usalduspiirid Ühe tunnuse keskmine väärtuse võrdlus kahes gruppis: t-test Kahe tunnuse keskmine väärtuste võrdlus: t-test Ühe tunnuse keskmiste väärtuste võrdlus kahes v rohkemas grupis:
Juhusliku suuruse X väärtused x1 x2 ... xn
Väärtuste ilmumise tõenäosused f(x1) f(x2) ... f(xn) f (x ) = 1
i
Diskreetse juhusliku suuruse jaotusfunktsioon F(x)=P(X
A32_1 pane tah nt P nagu pööratud Edasi Kustuta ära vana A32_1 Kirjuta väärtused Millised vead olid : sisestusviga, skaala ebaloogiline, grupeerimine, palju oli missing. Teisendused on ka veebis olemas –mine vaata. 12.02.03 Võtame kaks intervalltunnust T1 : rahulolu ilmaga T2: rahulolu eluga Loo uus fail: Võta variable view: Pane nimed ja komakohad nulli: Valime skaala 1-5, kus 1 ei ole rahul ja 5 on väga rahul. Võta data view ja sisesta sinna vastuseid, mida valim on andnud: Valimisse tuli 17 objekti. Enne üldistamist antakse ülevaade, kes meil seal andmestikus on ehk räägime valimist, sest see on kõige alus. Meil on kaks tunnus –sagedustabeleid oleks halb teha. Arvutame keskväärtuse, standardhälbe ja võrdleks läbi selle. N=17 Võta alaize ja descripive statistics Kui öeldakse keskväärtus, siis mõeldakse aritmeetilist väärtust ja see on MEAN ehk MIlma puhul tuleb kindlasti standardhälve suurem, sest see sõltub vastuste
Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed tänud juba ette või lõpus · Lihtsamad küsimused, avaküsimused
väärtused) test Kruskal-Wallis või Games-Howell. Kui H1, siis Post-Hoc testid, et välja selgitada, milliste gruppide vahel on erinevused. Tukey – gruppide suurused sarnased. Bonferroni – gruppide suurused erinevad. Korrelatsioon näitab seost kahe tunnuse vahel. Korrelatsiooni koefitsent on alati -1…1 ja näitab kahte asja: seose suunda ja tugevust. Pearson r eranditeta invervalltunnused, pole erandlikke väärtusi, seos lineaarne. Spearman ϱ järjestustunnus+järjestus, intervall+J, I+I Kendall τ järjestustunnus + järjestustunnus, väike valim palju sarnaseid väärtusi Cramer V (nimitunnust võrreldakse binaarsega, arvut risttabeli alusel, suunda ei näidata) Hii ruut- võrdleb binaarseid, nimi ja/või järjestustunnuseid risttabeli põhjal. Nt. 2 gruppi (M,N) võrreldi ühe järjestustunnuse (palk) sageduse (nt. kui suur osa N ja M teenib keskmist) põhjal. Mis on α
Teiseks on kõigi enamkasutatavate arvkarakteristikute leidmiseks MS Exceli funktsioon, näiteks AVERAGE - aritmeetiline keskmine, STDEV - standardhälbe valimhinnang, SKEW - asümmeetriakordaja jne. Kõigi nende funktsioonide argumendiks on uuritava tunnuse väärtusi sisaldav andmeblokk. Tunnuse 'Pikkus' keskväärtus leituna funktsiooni AVERAGE abil. http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/arvkar.html (1 of 5)29.05.2006 15:08:55 Andmeanalüüs MS Exceli abil - sagedustabelid Funktsiooni argumentidena on ette antud lahtrid B1-J1, mis sisaldavad uuritava tunnuse väärtusi. NB! Funktsioonide korral sisestatakse andmeblokk ilma
xii. Mõned isikud lahkuvad riskipopulatsioonist surres, mujale kolides või edasisest osalemisest keeldudes. e.xiii. Levimuse hindamine läbilõikelistes uuringutes. e.xiv. Haigestumuse hindamine kohortuuringus. f. Populatsioon ühikute kogum, mille hulgast me leiame oma uuringu osalised. Kogum, mille kohta tahame esitada väiteid oma uuringu tulemuste põhjal. g. Valim osa populatsioonist, mida me uurime. Et valimi uurimise tulemusi saaks üldistada populatsioonile, peab olema teada iga populatsiooni liikme võimalus valimisse sattuda. Lihtsaim variant võimalus valimisse sattuda on võrdne: juhuvalim. h. Sansid- vt valemit. Kasutatakse esinemisnäitajana harva. Sansside suhe on oluline esinemise võrdlusnäitaja. i
Mainori Kõrgkool Matemaatika ja statistika Loengukonspekt Silver Toompalu, MSc 2008/2009 1 Matemaatika ja statistika 2008/2009 Sisukord 1 Mudelid majanduses ............................................................................................................. 4 1.1 Mudeli mõiste ......................................................................................................................... 4 1.2 Matemaatilise mudeli struktuur ja sisu ................................................................................... 4 2 Funktsioonid ja nende algebra............................................................................................... 5 2.1 Funktsionaalne sõltuvus ....................................