huvitavad, näiteks: värvus, vanus, hind, kaal, arvamus millegi suhtes, jne – selliseid omadusi nimetatakse muutujateks. Omadusi, mida saab mõõta nii (või mis on juba kokku võetud nii), et iga objekti jaoks saadakse ainult üks vastus ehk üks ühik infot nimetatakse tunnusteks. Objektid ja tunnused peavad olema valitud enne andmete kogumist ning andmete kogumise käigus püüame saada tulemuse või vastuse iga objekti kohta kõigi meid huvitavate tunnuste lõikes - statistika terminoloogiast lähtudes on need väärtused. Nii võivad tunnuse „haridus“ võimalikud väärtused olla näiteks „algharidus“, „põhiharidus“, „keskharidus“ ja „kõrgharidus“, aga tunnuse „vanus“ väärtused näiteks arvud „12“, „27“, „6“, jne. (Arvuti kasutamine uurimistöös (http://aku.opetaja.ee/)) Andmete analüüsi kontekstis on oluline teha vahet nelja erineva tunnuse tüübi vahel:
.................................................................. 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel..........................................................................................................................7 2. Valimit kirjeldav statistika ..................................................................................................... 7 2.1. Andmete graafiline kirjeldus................................................................................................7 2.2. Andmete arvuline kirjeldus..................................................................................................8 2.2.1. Paiknemiskarakteristikud...........................................................................................
korrektselt loetavad ka must-valge trüki puhul, mistõttu on välditud erinevate värvide kasutamist ning eelistatud halle toone. Loomulikult võib diagrammide kujundamisel kasutada ka rõõmsamaid värve, mis aitavad sisu emotsionaalsemalt ja seeläbi meeldejäävamalt esitada. Näiteid ja juhiseid diagrammide kujundamise kohta leiad eelpool mainitud slaidiprogrammist. 3 1. MIS ON STATISTIKA NING KUIDAS OMA ANDMED JA MÕTLEMINE STATISTILISE ANALÜÜSI LÄBIVIIMISEKS ETTE VALMISTADA? On olemas kolme tüüpi valesid: Valed alatud valed statistika (Disraeli). Tõepoolest, kasutades statistilisi meetodeid aru saamata nende sisust või siis, halvemal juhul, arvestades kuulajate/lugejate asjatundmatust, on statistika abil valet vanduda küllalt lihtne. Kuid kas selles on õige süüdistada statistikat
oleksid korrektselt loetavad ka must-valge trüki puhul, mistõttu on välditud erinevate värvide kasutamist ning eelistatud halle toone. Loomulikult võib diagrammide kujundamisel kasutada ka rõõmsamaid värve, mis aitavad sisu emotsionaalsemalt ja seeläbi meeldejäävamalt esitada. Näiteid ja juhiseid diagrammide kujundamise kohta leiad eelpool mainitud slaidiprogrammist. 4 1 Mis on statistika ning kuidas oma andmed ja mõtlemine statistilise analüüsi läbiviimiseks ette valmistada? On olemas kolme tüüpi valesid: valed, alatud valed ja statistika (Disraeli). Tõepoolest, kasutades statistilisi meetodeid aru saamata nende sisust või siis, halvemal juhul, arvestades kuulajate/lugejate asjatundmatust, on statistika abil valet vanduda küllalt lihtne. Kuid kas selles on õige süüdistada statistikat? Paljud statistika õpikud algavad lubadusega, et lugejad ei pea
oleksid korrektselt loetavad ka must-valge trüki puhul, mistõttu on välditud erinevate värvide kasutamist ning eelistatud halle toone. Loomulikult võib diagrammide kujundamisel kasutada ka rõõmsamaid värve, mis aitavad sisu emotsionaalsemalt ja seeläbi meeldejäävamalt esitada. Näiteid ja juhiseid diagrammide kujundamise kohta leiad eelpool mainitud slaidiprogrammist. 4 1 Mis on statistika ning kuidas oma andmed ja mõtlemine statistilise analüüsi läbiviimiseks ette valmistada? On olemas kolme tüüpi valesid: valed, alatud valed ja statistika (Disraeli). Tõepoolest, kasutades statistilisi meetodeid aru saamata nende sisust või siis, halvemal juhul, arvestades kuulajate/lugejate asjatundmatust, on statistika abil valet vanduda küllalt lihtne. Kuid kas selles on õige süüdistada statistikat? Paljud statistika õpikud algavad lubadusega, et lugejad ei pea
järgnevad keerukamad ja spetsiifilisemad. · Tõlkeküsimustikus otsetõlge pole alati võimalik, tuleb arvestada kohaliku keele ja kultuuriga. · Vormistus korrektne, ühtne stiil. Valim on mõõtmiseks valitud (uuringusse kaasatud) üldkogumi osa. Valimit kasutatakse, kuna koguvalimit mõõta on liiga kallis ja mahult võimatu. Statistilise analüüsi jaoks peab olema vähemalt 60-100 vastust. Vastuseid peab olema muutujatest vähemalt viis korda rohkem. Kvantitatiivne andmeanalüüs: · Statistilised andmetöötlusprogrammid, näiteks SPSS · Atribuudid o sõltumatu atribuut - manipuleeritav atribuut o sõltuv atribuut - see, mida mõõdetakse · Eeldused (normaaljaotus) · Andmeanalüüsid o Parameetrilised testid (peavad vastama eeldustele) o Testid muutujate vaheliste seoste leidmiseks (pideva atribuudi keskväärtuste võrdlemine) Korrelatsioon - seose tugevus kahe pideva atribuudi vahel
nullpunkt on määratud. Näiteks: sissetulek, pikkus, kaal, temperatuur, vanus, laste arv Veel tunnuste liigitamise võimalusi: Kvalitatiivsed ja kvantitatiivsed tunnused Diskreetsed ja pidevad tunnused Kategoriaalsed tunnused: diskreetne kvalitatiivne tunnus Binaarsed ehk dihhotoomsed ehk kaheväärtuselised tunnused 4) Kirjeldav statistika eri tüüpi tunnuste kohta: mis on mood, mediaan, kvantiilid, keskmine, standardhälve, dispersioon. Nominaaltunnused · Mood kõige sagedasem väärtus või väärtusklass Järjestustunnused Mood Mediaan punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks. Kvantiilid Alumine kvartiil punkt, millest väiksemaid väärtusi on kogumis ¼ osa.
Andmeanalüüs MS Exceli abil Andmeanalüüs MS Exceli abil Järgnev õpetus püüab võimalikult 'puust ja punaselt' ette näidata elementaarse andmeanalüüsi teostamise võimalused MS Excelis. Samas ei ole see materjal mõeldud matemaatilise statistika konspektiks, vastavad teadmised/materjalid eeldatakse kasutajal enesel olemas olevat. Seetõttu pole ka eriti tegeletud konkreetsete näidetega ega tulemuste tõlgendamisega. See konspekt ei ole Andres Kiviste 1998 aastal ilmunud vihiku "Matemaatilise statistika algteadmisi ja rakenduslikke näiteid MS Exceli
Kõik kommentaarid