Kirjeldav statistika - teeme järeldusi valimi piires. (sagedustabel-kui palju? kui suur osa?) Valim - uuritavad isikud/objektid. Vastajad Üldkogum - need kelle kohta tehakse järeldused. Valim peavad olema esinduslik (need proportsioonid, mis on üldkogus, peavad kehtima ka valimi korral), piisavalt suure inimeste hulgaga, igal üldkogu liikmel on võrdne võimalus sattuda valimisse. Objektid - uuritavad (rida) Tunnus - objektide omadus, nt mitu korda päevas sa sööd? küsimus (veerg) Väärtus - tulemus, vastus küsimusele.(lahtrites) N - objektide arv Kas väärtused on järjestatavad? Kas vahemikud on võrdsed? Nimitunnus - väärtused ei ole järjestatavad.Nt elukoht, lemmiktoit, Järjestustunnus - väärtused on üheselt järjestatavad, vahemikud ei ole võrdsed. Nt haridustase Intervalltunnus e arvtunnus - alati üheselt järjestatav ja vahemikud on võrdsed.Nt vanus, pikkus, kaal, kehamassi index, sissetulek. Sobib Pearsoni korrelatsiooni kordaja Binaarsed tunnused - kaks va
Soo defineerimine: Variable view - soolahtrist Values... - 1=mees, 2=naine - data view - ülevalt view - value labels ette linnuke Kasvavas järjekorras järjestamine: Teed lahtri aktiivseks mida järjestada soovid - ülevalt Data - Sort cases - valid mida soovid sortida - linnuke ascending lahtri ees kindlalt ja OK Mingi väärtuse minimaalse ja maksimaalse väärtuse leidmine, standardhälve, keskmine: Analyze - descriptive statistics - descriptives/frequencies (kui vaja ekstsessi, histogrammi kellukat jn) - valid mille puhul tahad uurida - Options - valid milliseid väärtusi leida tahad ja ok, vastused ilmuvad OutPuti aknasse. Charts all on võimalik kasutada histogrammi joonistamise võimalust. Joonisel olev küsimärk käib osutatud linnukese kohta. Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel. Küsimärk on juurde tehtud, et uurida, kas sellise tabeli koostamine on vajalik. Uue muutuja arvutamine: Transform - Compute variable - kirjutad u
Statistika on teadus, mis uurib andmete kogumist, töötlemist, analüüsi ja järelduste tegemist. Üldistav statistika: andmete põhjal järelduste tegemine üldisemale grupile. Pakub meetodeid vea hindamiseks (vea me teeme nagunii). Kirjeldav statistika: kirjeldab neid andmeid, mida mõõtsime. Tehakse järeldusi, aga ainult nende andmete kohta, mida kogusime. Üldkogumi all mõeldakse kõiki juhtumeid või objekte, mille kohta meie poolt püstitatud järeldused, oletused kehtivad. Mõõtmiseks valitud (uuringusse kaasatud) üldkogumi osa nimetatakse valimiks. Valimi tingimused: Juhuslik – kõigil üldkogu liikmeil on võrdne võimalus sattuda valimisse. Esinduslik – samad proportsioonid, mis on üldkogus, peavad olema ka valimis. Piisavalt arvukas. Tunnused- nimi, järjestus, intervall, binaarne. Võtmeküsimused: Kas väärtused on järjestatavad? Kas skaalavahemikud on võrdsed? Nimitunnused nimi, sugu, perek. seis, elukoht, maakond. Väärtused ei ole üheselt järjestatavad
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel..........................................................................................................................7 2. Val
Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Uurimisprobleem, kust probleem tuleb, teooria, praktiline probleem, varasemad uurimused Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esi
Võta data view ja sisesta sinna vastuseid, mida valim on andnud: Valimisse tuli 17 objekti. Enne üldistamist antakse ülevaade, kes meil seal andmestikus on ehk räägime valimist, sest see on kõige alus. Meil on kaks tunnus –sagedustabeleid oleks halb teha. Arvutame keskväärtuse, standardhälbe ja võrdleks läbi selle. N=17 Võta alaize ja descripive statistics Kui öeldakse keskväärtus, siis mõeldakse aritmeetilist väärtust ja see on MEAN ehk MIlma puhul tuleb kindlasti standardhälve suurem, sest see sõltub vastuste varieeruvusest Tulemused: Kõik tulemused saab ka SPSSi keskkonda –nt wordi File-Export Standardhälve tuleb alati välja võrdluses. Erinevus on 1,88 punkti. Viiepunkti skaalal on see päris suur. Siit tuli välja, et kõik on eluga rohkem rahul kui ilmaga. See tulemus võib olla ilmselge, aga siiski peaks tegema alati t- testi. T test on kahe üldkogumi keskväärtuste võrdlemine
Andmeanalüüs MS Exceli abil Andmeanalüüs MS Exceli abil Järgnev õpetus püüab võimalikult 'puust ja punaselt' ette näidata elementaarse andmeanalüüsi teostamise võimalused MS Excelis. Samas ei ole see materjal mõeldud matemaatilise statistika konspektiks, vastavad teadmised/materjalid eeldatakse kasutajal enesel olemas olevat. Seetõttu pole ka eriti tegeletud konkreetsete näidetega ega tulemuste tõlgendamisega.
Selleks, et keskmisi võrrelda(2 sõltumatut gruppi): Analyze Compare Means Independent Samples T Test. Kuidas me hüpoteesi uurima hakkame? Esmalt väljundiaknas kuvatud tabelitest ja arvudest: Independent Samples T-testi tulemused ja nende tõlgendamine: Group Statistics Std. Error Sugu N Mean Std. Deviation Mean matemaatika 1 608 9.46 4.516 .183 2 742 7.35 3.856 .142 Esimeses tabelis tuuakse ära mõlema grupi valimi suurus, aritmeetiline keskmine, standardhälve ja aritmeetilise keskmise standardviga. Teise tabeli esimeses pooles tuuakse ära Levene'i test gruppide dispersioonide võrdlemiseks: Teise tabeli teises pooles on info gruppide keskmiste võrdlemiseks:
Kõik kommentaarid