AndmeanalüüsKordamisteemad1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile.
Uurimisprobleem , kust probleem tuleb, teooria, praktiline probleem, varasemad uurimused
Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust,
hüpoteeside sõnastamine.
Uurimismeetodid: Millised meetodid aitavad lahendada.
Kvantitatiivsed meetodid- kui palju
midagi esineb,
arvuline , suhteliselt palju uuritavad.
Kvalitatiivsed meetodid- Kuidas midagi
kirjaldatakse, sõnaline, vähem uuritavad.
Kombineeritud meetodid- kasut koos.
Andmed.kas olemas või vaja koguda.
Keda uurida: kas
valim või üldkogum.
Kuidas andmeid koguda: küsitlus,
intervjuu ,
Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine
2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste
tüübid, vastuste tüübid.
Ankeedi struktuur
•
Sissejuhatus: miks
uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus,
kontaktandmed tänud juba ette või lõpus
•
Lihtsamad küsimused, avaküsimused
•
Keerulisemad küsimused, põhiküsimused
•
Sotsiaal-demograafiline osa
•
Lõpuosa, tänusõnad
Avatud küsimused –
vastaja vastab oma sõnadega
1. Hea intervjuudes
2. Ei ole head sellistes uuringutes, kus vastaja peab ise kirjutama vastused
kuhugi üles
3. Raske arvutiga töödelda
4. Kodeerija
subjektiivsus Suletud küsimused – vastajale on antud ette
vastusevariandid 1. Aitavad kokku hoida aega
2. Lihtsam analüüsida
3. Peab olema kindel, et kõik võimalikud vastusevariandid on esitatud
4. Tõlgenduserinevused vastamisel eri gruppide vahel
2.
Nominaalskaala ehk nimeskaala
1. Esitab või võimaldab esitada vastuse nimetuse või kirjeldusena. Näiteks
vastaja rahvus, lemmikvärv, perekonnaseis
3.
Ordinaalskaala ehk järjestusskaala
1. Esitab vastusevariandid sel viisil, et neid on võimalik hinnangu intensiivsuse
alusel järjestada. Näiteks haridustase, mitmesugused rahulolu
hinnangud vms
(Näiteks: Likerti skaala)
4. Arvskaala
1. Esitab või võimaldab esitada vastused arvudena
3) Tunnuste tüübid, näited selle kohta.•
Nominaaltunnus
– Enamasti sõnaline, kuigi harvadel juhtudel võib olla ka arvuline, mõni sümbol
vms
– Iseloomustab vastavat tunnust, kuid ei anna infot tunnuse omaduse
intensiivsuse või suuruse kohta
– Näiteks: inimese nimi, lemmikvärv, perekonnaseis, rahvus, jalgpallimängija
särginumber
•
Järjestustunnus ehk ordinaaltunnus
– Enamasti on sõnaline, aga võib olla ka arvuline
– Annab edasi indiviidi või objekti omaduse intensiivsust, suurust.
– Näiteks: haridustase, erinevad nõustumise (olen täiesti nõus; olen nõus; ei ole
nõus; ei ole üldse nõus) või meeldivuse hinnangud vms.
•
Arvtunnused – Mõõdetud arvulisena
– Võib eristada kahte arvtunnuste mõõtmise skaalat
•
Vahemikskaala : sel juhul on kõigi skaalapunktide vahemikud võrdsed,
kuid skaala
nullpunkt pole üheselt määratud
•
Suhteskaala: sel juhul on skaalapunktide vahemikud võrdsed ja ka
nullpunkt on määratud.
– Näiteks: sissetulek, pikkus, kaal, temperatuur, vanus, laste arv
Veel tunnuste
liigitamise võimalusi:
•
Kvalitatiivsed ja kvantitatiivsed tunnused
•
Diskreetsed ja
pidevad tunnused
•
Kategoriaalsed tunnused:
diskreetne kvalitatiivne tunnus
•
Binaarsed ehk dihhotoomsed ehk kaheväärtuselised tunnused
4) Kirjeldav statistika eri tüüpi tunnuste kohta: mood, mediaan, kvantiilid, keskmine,
standardhälve, dispersioon.
Mood- kõige
sagedasem väärtus või väärtusklass, mehed naised
Mediaan – punkt tunnuse skaalal, millest väiksemaid ja
suuremaid väärtusi on variatsioonreas
ühepalju. Mediaan
jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks
osaks.
Kvantiilid
Alumine
kvartiil – punkt, millest väiksemaid väärtusi on kogumis ¼ osa.
Ülemine kvartiil – punkt, millest suuremaid väärtusi on kogumis ¼ osa.
•
Arvtunnused
Hajuvuse näitajad
Standardhälve – kui kaugel on keskmine inimene keskmisest.
Dispersioon – standardhälbe ruut.
5) Jooniste kasutamine tunnuste iseloomustamiseks, eri jooniste tüübid, histogramm .•
Teine lihtne võimalus tunnuse jaotuse
esitamiseks on teha sellest joonis.
Sagedamini kasutatavad jooniste tüübid tunnuse jaotuse esitamiseks:
•
Tulpdiagramm – Mõnikord kujundatakse tulpdiagramm nii, et väärtusklassile vastava
tulba pindala (kõrgus x laius) oleks võrdeline väärtusklassi sagedusega. Sellist
tulpdiagrammi nimetatakse histogrammiks.
•
Joondiagramm •
Ringdiagramm
Histogramm-astmikdiagramm,
sagedused püstteljel
6) Sagedustabel , selles esitatavad näitajad.
Eelmisel slaidil oli tunnuse jaotus esitatud sagedustabelina.
Sagedustabel koosneb:
•
tunnuste üksikväärtuste või väärtuste vahemike loetelust
•
koos nende indiviidide arvuga, kelle puhul analüüsitava tunnuse väärtus ühtib
vaadeldava konkreetse väärtusega või kuulub vastavasse väärtusvahemikku.
Indiviidide hulka saame mõõta:
•
“tükiarvu” ehk sageduse ehk absoluutse sagedusega;
•
suhtelise sagedusega, mis tähendab absoluutse sageduse suhet indiviidide
koguarvusse.
7) Normaaljaotus , selle kohta käivad reeglid.•
Normaaljaotus on ühetipuline keskväärtuse (keskmise) suhtes
sümmeetriline jaotus.
•
Normaaljaotuse standardtähistuseks on N(μ,σ²)
•
Keskväärtus (μ) määrab jaotuse raskuskeskme asukoha, standardhälve (σ) aga kõvera
kuju.
•
Mida suurem on standardhälve, seda väiksema järsakusastmega on kõver.
•
Kõvera ja horisontaaltelje vahele jääva pinnaosa pindala näitab, kui tõenäone on
juhusliku suuruse
sattumine vaadeldavale lõigule.
•
Normaaljaotuse keskväärtusest ka kui tahes kauged väärtused on võimalikud, kuid
vähetõenäosed.
8) Usalduspiirid, millal kasutada ja mis nende laiust mõjutab.•
Eksimist tulemuste üldistamisel valimilt üldkogumile me täielikult vältida ei saa.
Seepärast kehtestatakse lubatava eksimise piir ehk
usaldusnivoo .
•
Näiteks usaldusnivoo 95% tähendab, et lubame endale järeldustes eksimist
maksimaalselt 5%. Sel juhul on 5%.
•
Normaaljaotusega tunnuse puhul on teada, milliste punktide vahel on 95% tunnuse
väärtustest (umbes keskmine +/- 2 standardhälvet).
Usaldusvahemik on seda laiem, mida:
•
Suurem on tunnuse
hajuvus •
Väiksem on valimi maht
•
Suurem on usaldusnivoo
Usaldusvahemik on seda kitsam, mida:
•
Väiksem on tunnuse hajuvus
•
Suurem on valimi maht
•
Väiksem on usaldusnivoo
9) Hüpoteeside kontrollimine.•
2. võimalus: Hüpoteeside kontrollimine
•
Statistiliseks hüpoteesiks nimetatakse mis tahes oletust otseselt või
kaudselt kas
üldkogumi jaotuse kohta
tervikuna või jaotuse mõne parameetri (näiteks keskmise)
kohta,
kusjuures seda oletust kontrollitakse valimi põhjal.
Antud juhul võiks kontrollida oletust, et meeste ja naiste abiellumisvanused on
erinevad ka üldkogumil (mitte ainult valimil, mida nägime eelnevalt) ehk kas meeste
ja naiste abiellumisvanuste erinevus ei ole 0.
Hüpoteesid püstitatakse
paaridena nullhüpoteesist ja
alternatiivhüpoteesist.
•
Alternatiivhüpoteesi nimetatakse ka
sisukaks hüpoteesiks.
•
Alternatiivhüpoteesis sõnastatakse tavaliselt see, mida tahetakse tõestada.
•
Nullhüpoteesiga väidetakse teatavas mõttes vastupidist alternatiivhüpoteesile.
•
Hüpoteesid sõnastatakse nii, et üks neist peab alati kehtima.
11) T-test keskmiste võrdlemiseks.12) Risttabel, protsendid risttabelis.
Risttabeli elementideks on read, veerud ja
lahtrid , mille järgi nimetatakse ka tabelisse
märgitavaid protsente.
•
Rea protsendid: mitu % selle rea inimestest kuulub ühte või teise veergu.
•
Veeru protsendid: mitu % selle veeru inimestest kuulub ühte või teise ritta.
Üldised protsendid: mitu % selle tabeli inimestest kuulub ühte või teise lahtrisse
13) Hii-ruut- statistik , selle kasutamine seose uurimiseks risttabelis, Crameri V•
Hii-ruut statistiku arvutamisel võrreldakse omavahel
tegelikku tabelit ja seda tabelit,
milles seost pole.
•
Kui nende tabelite erinevus on suur, siis on ka hii-ruut-statistik suure väärtusega.
•
Kui need tabelid on täpselt ühesugused, on hii-ruut-statistiku väärtuseks 0.
Seega: leitakse, kui palju tegelik jaotus erineb hüpoteetilisest jaotusest.
•
Tunnuste vahel on statistiline seos siis, kui ühe tunnuse käitumine sõltub teise tunnuse
väärtustest. Näiteks kui inimese valimiseelistus sõltuks tema soost.
•
Uurides seost nominaaltunnuste vahel võetakse appi risttabel.
•
Seost risttabelis mõõdetakse hii-ruut-statistiku
(c²-statistiku) abiga.
Crameri V - Kui tunnused on sõltumatud, siis 0;
tugevaim seos 1.
•
Saab kasutada sagedustabeli kuju ja kogumi suurust arvesse võtmata
. 14) Hajuvusdiagramm ja korrelatsioonikordajad seose uurimiseks kahe arvtunnuse
vahel. Spearmani korrelatsioonikordaja järjestustunnuste korral. Probleemid
korrelatsioonikordajate kasutamisel .Hajuvusdiagrammi põhjal saab anda
esialgse hinnangu tunnustevahelise seose tugevusele.
Vastavalt sellele, milline on korrelatsioonikordaja märk, räägitakse positiivsest ja negatiivsest
korrelatsioonist tunnuste vahel.
Kui tunnuste vahel on kasvav seos, on korrelatsioonikordaja positiivne.
Kui tunnuste vahel on kahanev seos, on korrelatsioonikordaja negatiivne.
Spearmani korrelatsioonikordaja kasutab mõõtmistulemuste asemel nende astakuid.
Kõik kommentaarid