Vajad kellegagi rääkida?
Küsi julgelt abi LasteAbi
Logi sisse

Statistiline modelleerimine praktikumide juhised. (0)

5 VÄGA HEA
Punktid

Esitatud küsimused

  • Kuidas muutuja KOKKUz leida?
  • Mida täpsemalt vaadata?
  • Mida teha siis kui parameetriliste testide eeldused ei ole täidetud?
  • Kui suur doos ravimit on parima mõjuga?
  • Kui suured nad on?
  • PRAKTIKUM
  • JÄRJESTAMINE NOOREMAST VANIMANI
    • Parmeklõps Sort Ascending/Descending -> Kasvavas/Kahanevas järjestuses
    • Data – Sort cases – Sort Ascending/Sort Descending (tuleb valida muutujad ka)

  • VARIABLE VIEW
  • KIRJELDAVAD ANDMED
    • Leiame vanusele antud hinnangute keskmise, moodi, mediaani, maksimaalse ning minimaalse hinnangu. + HISTOGRAMM

    • Käsklusrida:

    Analyze - Descriptive statistics – Frequencies.
    Muutujatekasti liigutage muutuja .
    Statistics - Mean , Mode, Median, Minimum, Maximum .
    Charts - Histograms
  • PRAKTIKUM
  • UUE MUUTUJA ARVUTAMINE
    • Tihtipeale tuleb andmete töötlemise jooksul tekitada uusi muutujaid eelmiste muutujate põhjal. Käesolevas praktikumis tutvume uue muutuja arvutamise põhitõdedega. Etteruttavalt võib öelda, et me arvutame saadavaloleva andmestiku põhjal uueks muutujaks kehamassiindeksi (BMI – body mass index).
    • Käsklusrida:

    Transform – Compute variable – me ka kasutame.
    Nimetus läheb Target Variable lahtrisse .
  • ANDMETE ERALDAMINE
    • Selleks, et eraldada andmeid, saab kasutada menüüriba käsklust Data, mille alt leiab valiku Select Cases; avaneb allolev kast:

    Kui eesmärgiks on spetsiifilise grupiga andmeanalüüside läbiviimisega, tuleb kasti ülemisse osasse ära märkida If condition is satisfied, mille järel tuleb klikkida kastikesele If... . Avaneb veel üks kastike, milles vasakul on teil muutujate loetelu . Et saada nt ainult naiste andmestikku, tuleks paremale kasti liigutada muutuja SUGU ning sellele järele kirjutada =mingiväärtus. Antud juhul näeks see võrrand välja selline: SUGU=0. Kui olete valiku ära teinud, tuleb see võrrand ka If... kastikese järgi.
    Seejärel tasub vaadata Select Cases alumist osa. Kui valite Filter out unselected cases, siis on meeste andmed jätkuvalt tabelis näha, aga indiviidide andmestikule on peale tõmmatud kriipsSPSS neid analüüsides ei arvesta; siis on võimalus teha uus tööleht, kus on eralditult ainult valitud andmestik ; viimaseks variandiks on mittevalitud andmestiku kustutamine. Viimast ehk ei soovitaks, sest äkki on üldist andmestikku uuesti vaja vaadata. Ja küll on kehvasti, kui raske vaevaga kogutud andmeid kuidagi taastada ei saa.
  • KIRJELDAV STATISTIKA
    Analyze -> Descriptive statistics -> Frequencies...
    Statistics -> Sealt saate erinevate vajalike kirjeldavate statistikute arvutamist „ tellida “.
    Charts -> on võimalik kasutada histogrammi joonistamise võimalust
    Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel .
    NB! Uurida, kas sellise tabeli koostamine on vajalik
  • PRAKTIKUM
  • ANDMETEISENDUSED
    • NT: Kodeerige muutujast SÜNNIAASTA muutuja VANUSEKLASS. Looge kolm vanuseklassi.
    • Käsklusrida:
      Analyse -> Frequencies, kui palju on objekte igas vanuses. Ehk siis kui palju katseisikuid iga sünniaastaga esineb. Kuidas jagaksite need vanused kolmeks rühmaks? Põhimõte võiks olla: et tekiks enam-vähem võrdse arvuga grupid, aga jaotumine võiks olla ka loogiliselt põhjendatav. Kui uus muutuja on defineeritud, vaadake käsuga Analyse -> Frequencies, kuidas ta jaotub

    Transform, sest me „transformeerime“, muundame andmeid. Olenevalt sellest, kas te tekitate uue muutuja või mitte, valige üks käsklus, mis on alljärgneval joonisel kujutatud:
  • MUUTUJA STANDARDISEERIMINE
    • Muutuja standardiseerimiseks nimetatakse teisendust, kus muutuja igast väärtusest lahutatakse aritmeetiline keskmine ning saadud vahe jagatakse standardhälbega. Saadud tulemust nimetatakse ka z-skoorideks.
    • Näide:
      • Ülesanne 5:
        Standardiseerige muutuja KOKKU, uue muutuja nimeks pange KOKKU_z.

    !! Leidke selleks kõigepealt muutuja KOKKU aritmeetiline keskmine ja standardhälve. !!
    Kuidas muutuja KOKKU_z leida? Kui teil on leitud aritmeetiline keskmine ja standardhälve, saate läbi viia arvutuse ning tekitada uue muutuja: z = (x – M)/SD
      • Ülesanne 6.:

    Kasutades käsku Analyse -> Descriptive Statistics -> Descriptives, leidke uue muutuja KOKKU_z aritmeetiline keskmine ja standardhälve. Kuid SPSS võimaldab tihtipeale ka lihtsamalt arvutusi läbi viia.
      • Ülesanne 7:

    Leiame muutuja KOKKU z-skoorid ehk standardiseerime muutuja hoopis lihtsamal moel.
    Analyse -> Descriptive Statistics -> Descriptives
    Kasutage võimalust teha analüüsiaknas linnuke kohta: Save standardized values as variables.
  • JUHUSLIKU SUURUSE JAOTUSE UURIMINE
    • Et välja selgitada, kas andmed pärinevad normaaljaotusega populatsioonist, saab läbi viia normaaljaotust uuriva testi.
    • Käsklusrida:

    Analyze-> Descriptive Statistics-> Explore-> Plots-> Normality Plots with tests
    • Tulemus:

    Tests of Normality
    Sugu
    Kolmogorov-Smirnova
    Shapiro -Wilk
    Statistic
    df
    Sig.
    Statistic
    df
    Sig.
    ruumiline
    mees
    ,093
    608
    ,000
    ,974
    608
    ,000
    naine
    ,071
    742
    ,000
    ,985
    742
    ,000
    Sõnavara
    mees
    ,091
    608
    ,000
    ,988
    608
    ,000
    naine
    ,071
    742
    ,000
    ,989
    742
    ,000
    a. Lilliefors Significance Correction
    Selleks, et vastata küsimusele – kas on tegemist normaaljaotusega või mitte – peame esmalt välja nuputama, millist testi vaatame. Kolmogorov-Smirnov testi on mõttekas vaadata siis, kui valim on väga suur (tuhanded indiviidid), Shapiro-Wilk test on kohane väikese valimi puhul (u 50-2000 indiviidi). Meie andmestikus on 1350 inimest, seega võiks kasutada Shapiro-Wilk testi. Juurde tasub aga märkida, et mõlemad testid on üsna tundlikud äärmuslike väärtuste ning valimi suuruse suhtes, mistõttu teatud olukordades ei pruugi nende testi alusel tehtud otsustused olla täpsed!
    Järgnevalt tuleb vaadata Sig.-i (olulisuse tõenäosus). Kui Sig on väiksem kui 0.05, siis ei ole testi(de) kohaselt andmed normaaljaotuslikud.
    Praktikas aga on omajagu harv normaaljaotustestide põhjal leida normaaljaotuslikkust – levinud on asümmeetriakordaja ( skewness ) ning ekstsessi (kurtosis) vaatamine. Nii K-S kui ka S-W testidel on omad probleemid; üheks neist on liigne tundlikkus äärmuslikele väärtustele ehk erinditele (outliers).
    Andmeid peetakse normaaljaotuslikult siis, kui nii asümmeetriakordaja kui ka järsakusaste/ekstsess on vahemikus (-0.5;0.5); liberaalsemalt on aga levinud ka vahemike (-1; 1) kasutamine
  • GRUPPIDE KESKMISED JA USALDUSPIIRID
    • Käsklusrida:

    Analyze - Compare Means
    • Vaatame andmeid ka graafiliselt. Joonistame usalduspiirid. Selleks tuleb valida järgnevad käsklused:

    Ül: Leiame naiste ja meeste matemaatika keskmise tulemuse.
    Avanenud aknas valida x-teljele Sugu ja y-teljele matemaatika.
    Outputis tulemus:
    • Keskväärtuse usalduspiiri arvutamiseks:
      Analyze-> Descriptive Statistics-> Explore.

  • PRAKTIKUM
  • KESKMISTE VÕRDLEMINE
    • Järelduste tegemisel ei piisa aga sellest, kui te näitate, et kahe grupi keskmised on erinevad – lisaks on vaja teada, kas see leid on statistiliselt oluline või mitte. Kahe sõltumatu grupi keskmiste erinevuse uurimiseks kasutame kahe sõltumatu grupiga ( Student ’i) t testi.

    • Käsklusrida:

    Analyze – Compare Means – Independent Samples T Test
    • Tulemused:

  • Teise tabeli esimeses pooles tuuakse ära Levene’i test gruppide dispersioonide võrdlemiseks (meenutame, et üks eeldusi oli dispersioonide homogeensus):
  • Teise tabeli teises pooles on info gruppide keskmiste võrdlemiseks:
    Statistikas on saanud traditsiooniks kasutada olulisusnivoosid 0.01 (ehk 1%) ja 0.05 (ehk 5%). Valides olulisusnivooks 0.05, peab olulisustõenäosus selleks, et nullhüpoteesi ümber lükata, olema väiksem kui 0.05 ning vastavalt olulisusnivoo 0.01 korral peab ta olema väiksem kui 0.01.
    Seega – mida täpsemalt vaadata? Esmalt visake pilk peale tabeli esimesele osale, kus on Levene-i test – seda on oluline silmas pidada, et teaksite, kumma rea tulemusi edasi lugeda. Kui Levene’i testi Sig on suurem kui 0.05, vaatame edaspidi ülemist tabelirida (näitab, et jaotuste „kujud“ ei erine statistiliselt oluliselt); kui Levene’i test Sig on väiksem kui 0.05, loeme edaspidi alumist rida (näitab, et jaotuste „kujud“ erinevad statistiliselt oluliselt).
    • Mida teha siis, kui parameetriliste testide eeldused ei ole täidetud? Näiteks juhul, kui meie andmed on kogutud järjestusskaalal.

    Kahe sõltumatu grupi puhul saame kasutada mitteparameetrilist testi nimega Mann -Whitney U Test.
    Analyze – Nonparametric Tests – Legacy Dialogues – 2 Independent Samples.
  • PRAKTIKUM
  • KAHE SÕLTUMATU GRUPI KESKMISTE VÕRDLEMITE PARAMEETRILISE TESTIGA
    • Käskluserida:
      Analyze – Compare Means – Independent Samples T Test

    • Independent Samples T-testi tulemused ja nende tõlgendamine:

  • Esimeses tabelis tuuakse ära mõlema grupi valimi suurus, aritmeetiline keskmine, standardhälve ja aritmeetilise keskmise standardviga.
    Group Statistics
    Sugu
    N
    Mean
    Std. Deviation
    Std. Error Mean
    matemaatika
    1
    608
    9.46
    4.516
    .183
    2
    742
    7.35
    3.856
    .142
  • Teise tabeli esimeses pooles tuuakse ära Levene’i test gruppide dispersioonide võrdlemiseks:
  • Teise tabeli teises pooles on info gruppide keskmiste võrdlemiseks:
    Statistikas on saanud traditsiooniks kasutada olulisusnivoosid 0.01 (ehk 1%) ja 0.05 (ehk 5%). Valides olulisusnivooks 0.05, peab olulisustõenäosus selleks, et nullhüpoteesi ümber lükata, olema väiksem kui 0.05 ning vastavalt olulisusnivoo 0.01 korral peab ta olema väiksem kui 0.01.
    Seega – mida täpsemalt vaadata? Esmalt visake pilk peale tabeli esimesele osale, kus on Levene-i test – seda on oluline silmas pidada, et teaksite, kumma rea tulemusi edasi lugeda. Kui Levene’i testi Sig on suurem kui 0.05, vaatame edaspidi ülemist tabelirida (näitab, et jaotuste „kujud“ ei erine statistiliselt oluliselt); kui Levene’i test Sig on väiksem kui 0.05, loeme edaspidi alumist rida (näitab, et jaotuste „kujud“ erinevad statistiliselt oluliselt).
    Kuid teadmisest, kuidas näevad välja gruppide keskmised ning kas gruppidevaheline erinevus on oluline või mitte, üksi ei piisa. Need tulemused tuleb kuidagi ka kirjapilti saada.
    T testi raporteeritakse järgnevalt :
    Selles suvalises näidislauses leiti, et loengutes kohalkäijate keskmine tulemus (M = 4.51, SD = 0.30) on statistiliselt oluliselt kõrgem kui neil, kes magavad sisse ja kohale ei tule (M = 2.92, SD = 0.31), t(kirjuta siia df väärtus) = (kirjuta siia t väärtus), p = 0.008, [efektisuuruse statistik] = (kirjuta efekti suurus siia).
  • KESKMISTE VÕRDLEMINE KAHE SÕLTUVA RÜHMA KORRAL PARAMEETRILISE TESTIGA
    • Lahenduskäik on sarnane sõltumatute valimitega t-testi korral; kaks olulist erinevust siiski on. Kui sõltumatu t-testi puhul kontrollisime sõltuvate muutujate eeldusi, siis sõltuvate valimitega t-testi korral tuleb kontrollida esimese ja teise (või ajaliselt mõne muu) mõõtmiskorra vahe normaaljaotuslikkust (vt Fieldi õpik lk 329). Selleks tekitame käskluse Compute variable abil veel kaks muutujat: U_vahe ning A_vahe. Kui need muutujad on olemas, saate nende normaaljaotuslikkust testida juba harjumuspärasel viisil.

    • Käsklusrida:

    Analyze - Compare Means – Paired-Samples T Test
    Variable 1 alla pange esimese mõõtmise muutuja ning Variable 2 alla valige tema paariline teisest mõõtmiskorrast.
    • Väljundiakna (Output) loogika on enam-vähem sama, mis sõltumatute valimitega testi puhul.

  • EFEKTI SUURUSE ARVUTAMINE
    • Efekti suurus on statistiline näitaja, mis võimaldab lisaks statistilisele olulisusele kirjeldada gruppidevahelisi erinevusi. Efekti suurust saab väljendada mitmete statistikutega; ilmselt levinuim on Cohen -i d. Kokkuleppeliselt tähistavad Cohen’i d väärtused väikest efekti väärtusel d = 0.2; keskmise suurusega efekti väärtus on d = 0.5; suure efekti väärtuse algus on d = 0.8.

    • SPSS-is ei ole funktsiooni/käsklust, millega saaks paari kliki abil efekti suurust (st Coheni d-d) kätte. Seega on mõned alternatiivid – kiirelt Coheni d arvutamiseks saab kasutada kalkulaatorit, mis asub aadressil https://www.psychometrica.de/effect_size.html .

  • MITTEPARAMEETRILISED TESTID KESKMISTE VÕRDLEMISEKS
    • Mis juhtub siis, kui parameetriliste testide parameetrid (ehk eeldused siin kontekstis) ei ole täidetud? Väga lihtne – appi saab võtta mitteparameetrilised testid

    • Käsklusterida:
      Analyze – Nonparametric Tests – Legacy Dialogues – 2 Independent Samples.

    • Vanemates SPSS-i versioonides võivad sõltumatute ja sõltuvate gruppidega t testid olla muud moodi nimetatud. Kui nõnda, siis vasted võivad olla järgmised:

    Parameetriline
    Mitteparameetriline
    2 sõltumatu valimiga t test
    Mann-Whitney U Test
    Sõltuva valimiga t test
    Wilcoxon Signed Ranks Test
    • Sõltumatute valimitega t-testi raporteerimine käib nõnda:

    Selles suvalises näidislauses leiti, et loengutes kohalkäijate keskmine tulemus (N = kohalkäijate arv, M astak = keskmise astaku väärtus) on statistiliselt oluliselt kõrgem kui neil, kes magavad sisse ja kohale ei tule (N = kohalkäijate arv, Mastak = keskmise astaku väärtus), U = U väärtus, p = toodud Sig.
    • Sõltuva valimiga t-testi mitteparameetrilise analoogini jõudmine järgi eeltoodud käsklusterea loogikat:

    Analyze – Nonparametric Tests – Legacy Dialogues – 2 Related Samples
    • Tulemused:

  • Väljundiaknas näete erinevust statistikutes – ehkki nii parameetrilistes kui ka mitteparameetrilistes testides kuvatakse teile olulisuse tõenäosust, näete te mitteparameetriliste testide tulemustes keskmise (mean) asemel keskmist astakut (mean rank ); samuti on mitteparameetrilises analoogis olulisel kohal Wilcoxoni Z (sõltumatute valimite puhul Mann-Whitney U).
    Need statistikud tuleb teil raporteerida järgnevalt:
    • Wilcoxoni Signed Ranks Test näitas, et otse vaatava pilguga pilte hinnati statistiliselt oluliselt atraktiivsemaks kui kõrvale vaatava pilguga pilte, Z = ..., p = .02.

    Alternatiivselt:
    • Wilcoxoni Signed Ranks Test näitas, et otse vaatava pilguga piltide atraktiivsuse astakud olid statistiliselt oluliselt kõrgemad kui kõrvale vaatava pilguga piltide astakud, Z = ..., p = .02

  • PRAKTIKUM
  • KESKMISTE VÕRDLEMINE ENAM KUI KAHE GRUPI KORRAL (ONE-WAY ANOVA )
    • Sageli hõlmavad eksperimentaalsed uuringud enam kui kahe grupi või tingimuse võrdlusi. Näiteks võib ravimiuurijaid huvitada, kas (a) ravim on parem kui platseebo ning (b) kui suur doos ravimit on parima mõjuga? Tihtipeale võrreldakse sellistes olukordades nt kolme gruppi – platseebot saanud, madala ning kõrge doosiga eksperimentaalsed rühmad. Dispersioonanalüüsi saab kasutada mitme grupi võrdlemisel.

    Ravimiuuringud on ilmselt üks lihtsamini näitlikustatav valdkond dispersioonanalüüsi ehk ANOVA ( ANalysis Of VAriance) kasutamisest. Aga samuti on see meetod üsna laialt kasutatav erinevates mitut gruppi (st enamat kui kahte gruppi) võrdlevates uuringutes.
    • (Parameetrilise) ANOVA läbiviimiseks on mitmed eeldused:
    • Vaatlused on teineteisest sõltumatud;
    • Sõltuv muutuja on GRUPPIDE LÕIKES normaaljaotuslik. Seda saad testida nii: Analyze – Descriptive Statistics – Explore. Dependent . Määrake muutujad ning Plots alt valige Normality plots with tests ning Histogram (graafiliseks representatsiooniks). Kirjeldava statistika tabelid sialdavad ka asümmeetriakordajat ning ekstsessi, mis aitavad määratleda jaotuse kuju ning selle suhestumist normaaljaotusega.
    • Hajuvused on sarnased (SPSS-is Levene's Test for Homogeneity of Variances näitab statistiliselt olulise erinevuse puudumist)

    Kui sõltuval muutujal on ainult üks tase (nt konkreetne testiskoor), saab kasutada ühefaktorilist ANOVAT – One-Way ANOVA
    • Käsklusterida:
      Analyze – Compare Means – One-Way ANOVA

    Avanenud aknas viite sõltuva muutuja kasti Dependent list, sõltumatu muutuja on Factor .
    Ehkki ANOVA ise näitab, kas esineb gruppievahelisi erinevusi, siis dispersioonanalüüs ei näita, milliste gruppide vahel need erinevused on. Menüüst Post Hoc saate valida nn järeltesti ehk post hoc testi, mis analüüsib konkreetsete tingimuste vahelisi erinevusi. Kui gruppide hajuvused on sarnased, tuleks kasutada Tukey (HSD) testi, kui aga ei ole sarnased, on soovitatav kasutada Games -Howell testi.
    Options aknast saate lisaks valida kirjeldavate statistikute kuvamise (Descriptive) ja samuti saate ka hajuvust testida (Homogeneity of variance test).
    • Tulemused:

    a) Kui valisite kirjeldava statistika kuvamise, siis see peaks olema esimene tabel, mis ANOVA puhul näidatakse. Seal on mh kajastatud gruppide suurused, nende keskmised mõõdetud parameetril, jms.
    b) Järgmisena peaks olema hajuvustestselle abil otsustaste, kumma post hoc testi tulemusi vaatate . Kui p> .05 (ehk ei ole statistiliselt olulist erinevust), on tegemist sarnase hajuvusega ning vaadata tuleks Tukey testi tulemusi; kui aga p (ehk on statistiliselt oluline erinevus), ei ole tegemist sarnaste hajuvustega ning peaks vaatama Games-Howell testi tulemusi.
    c) ANOVA tabel meid kõige enam huvitava küsimuse vastust – kas gruppide vahel on statistiliselt olulised erinevused või mitte. Sig (ehk olulisuse tõenäosus) annab meile vastuse. Kui p
    d) Post hoc testide tabel näitab erinevate gruppide vahelisi võrdlusi. Oluline on siingi jälgida, millised nendest võrdlustest on statistiliselt olulised.
    • Kui parameetrilise ANOVA eeldused ei ole täidetud, on olemas ka mitteparameetriline analoog:
      Kruskall-Wallis test.
      SPSS-is jõuab sinna nii:
      Analyze – Nonparametric Tests – Legacy dialogs – K Independent Samples. Üldjoontes sarnaneb edasine lahenduskäik parameetrilise testi omale.

  • FAKTORIAALNE ANOVA
    • Kuidas aga lahendada olukorda, kus on mitu erinevat sõltumatut muutujat, millel omakorda on mitu taset? Sellist olukorda võiks näitlikustada ravimiuuringuga, kus vaadatakse kahe erineva ravimi mõju kahe erineva doosiga. Saaksime järgneva uuringu ülesehituse: 2 (ravim 1, ravim2) x 2 (madal doos, kõrge doos) eksperiment. Eeltoodud kujul raporteeritakse tihtipeale faktoriaalset eksperimenti.

    Faktoriaalse lahenduse puhul saab rääkida peaefekti(de)st ja interaktsioonist (koosmõjust). Eeltoodud näite puhul tähendab peaeefekt seda, et nt ainult ravimitüübist oleneb, kas ravi on efekti või ei – seevastu ravimi doos ei ole oluline; realistlikum on ehk teistpidi – doos on oluline, ent ravimitüüp mitte. Interaktsioon tähendab aga nt seda, et ravimite efektiivsus sõltub doosist – nt ravim1 on efektiivne siis, kui doos on kõrge, ravim2 on aga efektiivne siis, kui doos on madal.
    • Käsklusterida:

    Analyze – General Linear Model – Univariate
    Kui eeltoodud käsklus on sisestatud , siis on väga palju valikuid . Esmalt määratlege ära sõltuv muutuja ning sõltumatud muutujad (Fixed Factors).
    - Plots alt pange vanusegrupp horisontaalsele teljele ning sugu olgu eraldi joontena. Vajutage Add ning jätkake.
    - Post hoc käskluse alt võite valida mõlemad sõltumatud muutujad ning Tukey test.
    - Options alt valige sõltumatud muutujad ning nende interaktsioon.
    - Display käskluse alt saate valida erinevate statistikute kuvamist. Enamasti tasub valida kirjeldavad statistikud, hajuvustest, efektisuurus ning võib valida ka statistilise jõu (statistical power ).
    - Kui olete kõik valikud ära teinud, teostage analüüs.
    • Tulemused:

    Sarnaselt one-way¬ ANOVA-ga on ka faktoriaalses lahenduses esmalt toodud kirjeldavad statistikud, seejärel hajuvustest, ANOVA-tabel ning post hoc analüüsid. Viimasena on joonis, mis ilmestab graafiliselt kas peamõju või interaktsiooni.
  • ANOVA tabel (ehk Test of Between- Subjects Effects) annab infot selle kohta, kas mudel, sõltumatute muutujate peamõjud ning interaktsioon on statistiliselt olulised. Lisaks on võimalik teada saada, mis on nende peamõjude ja interaktsiooni efekti suurus ja statistiline jõud.
  • Post hoc tabelid näitavad gruppide keskmisi. Kui nt analüüs näitab, et interaktsioon on statistiliselt oluline, siis tasub raporteerida seal tabelis toodud keskmised.
  • LISAMATERJAL
    Astaktransformatsioon (rank transformation)
    Tihtipeale siis, kui andmestik ei täida parameetrilise statistika eeldusi (nt on järjestusskaalal, mittenormaaljaotuslik, jms), tuleb andmestikku muundada nii, et see oleks testidele „vastuvõetav“. Tihti saavutatakse selline olukord nii, et olemasolevat toorandmestikku muundatakse mingite arvutuste abil rohkem eeldustele vastavaks. Sagedasti nimetatakse selliste statistilisi võtteid andmete normaliseerimiseks, mille kaudu saab enam silmaringiinfot näiteks siit: https://en.wikipedia.org/wiki/Data_transformation_(statistics)
    Üheks kasutatavaks võtteks on andmete astak-transformatsioon (rank transformation), mille põhiolemuseks on toorandmestik järjestamine ning selle alusel iga toorandmepunkti asendamine tema järjekorranumbriga. Seda kasutatakse nt gruppide keskmiste võrdlemise mitteparameetrilistes testides SPSS-is „taustal“. Allolevas Tabelis 1 on näitlikustatud, kuidas see protsess välja näeb. Meil on toorandmete põhjal tehtud allolevalt järjestus – väiksemast suuremani. Seejärel saab selle järjekorra alusel iga väärtus omale vastava astaku; tuleb tähele panna, et kui andmetabelis on samasugused väärtused, siis nad jagavad astaku väärtust. Viimase olukorra näiteks on Tabelis 1 toodud esimesed kaks rida, kus toorskooriks on mõlemal indiviidil 1 punkt. Et sellele sama astak anda, võetakse nende sama väärtust jagavate andmepunktide astakute aritmeetiline keskmine (seega praeguses olukorras „hõivasid“ skooriga 1 väärtused kaks esimest astakut järjekorras, st 1. ja 2. väärtus selles reas: (1+2)/2 = 1.5).
    Tabel 1
    Andmetabel, kus on grupeeriv tunnus, toorandmed ning andmete astakud.
    Grupp
    Väärtus
    (toorandmed)
    Väärtus
    (astakud)
    A
    1
    1.5
    B
    1
    1.5
    A
    2
    3
    A
    4
    4
    B
    8
    5
    B
    10
    6
    Kui meil on nt mitteparameetrilise testiga gruppide A ja B keskmiste võrdlemine, siis sellest järjekorrast võetakse mõlema grupi astakud ning leitakse nende keskmised (koos muude statistikutega keskmiste võrdlemiseks. Seega...
    grupi A keskmine astak Mastak(A) = (1.5 + 3 + 4) / 3 = 2.83
    grupi B keskmine astak Mastak(B) = (1.5 + 5 + 6) / 3 = 4.17
    Ehkki SPSS-is muundatakse toorandmed astakuteks „taustal“, kui on valitud mitteparameetriline test, siis astakuid saab oma andmestikust ka ise tekitada. Selleks: TransformRank Cases.
    Korduvmõõtmsite ANOVA (Repeated measures ANOVA) on sarnane tavalise ANOVA-ga (One Way ANOVA). Tavalise ANOVA-ga võrdlesime erinevusi sõltumatute gruppide vahel. Korduvmõõtmiste ANOVA-ga saame võrrelda erinevusi sõltuvate gruppide korral. Eksperimentaalpsühholoogias kohtab seda analüüsi üsna sageli, sest eelistatakse kasutada katsedisaine, kus kõik katseisikud teevad kõik tingimused läbi (sõltuvate gruppidega katsedisain).
    Avage andmefail recall_data.xlsx.
    Selles katses esitati inimestele erinev emotsionaalse väärtusega sõnu ja paluti neid hiljem meenutada. Näeme andmestikus, et iga katseisik on läbinud kõik katsetingimused („Pos“ – positiivse väärtuseg sõnad, „Neg“ – negatiivse väärtusega sõnad, „Neu“ – neutraalse väärtusega sõnad).
    Korduvmõõtmiste ANOVA-ga saame kontrollida, kas nende tingimuste puhul erinesid meenutamise tulemused.
    Korduvmõõtmiste ANOVA analüüsi leiate:
    AnalyzeGeneral Linear Model Repeated Measures
    Esialgu tuleb teil määrata uuritav faktor. Nende andmete puhul tahame teada sõnade valentsi mõju meenutamisele. Panemegi faktori nimeks „ valents “. Tasemete arvuks (Number of Levels) pange kolm, üks tase iga katsetingimuse kohta. Tasemete sisu saate määrata järgmisest menüüst.
  • PRAKTIKUM = KT
    8. PRAKTIKUM
    • Korrelatsiooni kasutatakse selleks, et uurida muutujate vahelisi seoseid ning nende seoste tugevust. Parameetriline seosekordaja on Pearsoni r, mitteparameetrilisteks seosekordajateks on Spearmani roo ning Kendalli tau. Mitteparameetriliste analüüside korral kasutatakse tihtipeale Spearmani roo statistikut, ent Kendalli tau-d peetakse paremaks näitajaks väiksematel valimitel.

    • Korrelatsioonikordaja on sisuliselt ka efekti suuruse ning mudeli seletusvõime näitaja. Võttes korrelatsiooni ruutu, saame R2 statistiku ehk, eesti keeles, determinatsioonikordaja . Kui me seda kordajat sajaga korrutame, saame protsendid selle kohta, kui palju ühe muutuja varieerimine teise muutuja varieeruvusest seletab. Näiteks kui kahe muutuja – X ja Y – vaheline korrelatsioon r = 0.20, siis R2= (0.20)2= 0.20*0.20 = 0.04 ning muutuja X seletab ära 0.04*100 = 4% muutuja Y varieeruvusest.
    • Väga oluline on tähele panna ja meelde jätta, et korrelatsioon ei näita põhjuslikkust. Ka tulemuste raporteerimisel saame rääkida muutujatevahelisest seosest, mitte ühe muutuja mõjust teisele. Statistiliselt võttes saame rääkida kolmest võimalikust põhjuslikkuse suunast . Eeltoodud näite põhjal võivad nad olla järgnevad:

  • Muutuja X põhjustab muutuja Y varieerumist.
  • Muutuja Y põhjustab muutuja X varieerumist.
  • Kolmas muutuja Z põhjustab nii muutuja X kui ka muutuja Y varieerumist.
  • KORRELATSIOON
    • Enne statistikute uurimist vaadata ka hajuvusdiagrammi:
      Graphs – Legacy Dialogs – Scatter/Dot – Simple Scatter

    Lisa joonisele ka lineaarset seost kujutav joon!
    • Graafilise info väljendumine statistikutes: (korrelatsioon)
      Analyze – Correlate – Bivariate

    Options alt valida, mida teha puuduva andmestikuga. Vaikimisi peaks seal olema käsklus Exclude cases pairwise, mis tähendab, et kui terve indiviidi/andmerea sees on ühel muutujal väärtus puudu, siis ainult seda andmepunkti ei kasutata edaspidises analüüsis – kõigi teiste muutujate vahelisi korrelatsioone aga vaadatakse. Exclude cases listwise aga eemaldab terve indiviidi/andmerea. Viimast käsklust kasutades oleksid kõikides korrelatsioonimaatriksi lahtrites valimid võrdsed
  • OSAKORRELATSIOON
    • Analyze – Correlate – Partial

    Valige uuritavad muutujad ning lahtrisse Controlled for lisage kontrollmuutuja.
    • Nt: Ülesanne 12. Vaadake eelmises analüüsis PISA tulemuste, demokraatiindeksi ning GDP omavahelisi korrelatsioone. Kui suured nad on? Kas nad on statistiliselt olulised?

    Kuivõrd PISA tulemusi võib ennustada vaimne võimekus, mis siinses andmefailis on IQ ehk riigi keskmine intelligentsuskoefitsient, saame IQ skoori kontrolli alla võtta, et vaadata, kui suured on PISA, demokraatiaindeksi ning GDP omavahelised korrelatsioonid . Teostame osakorrelatsiooni-analüüsi.
    9. PRAKTIKUM:
    1) LINEAARNE (PAARIS) REGRESSIOON
    • Regressioon on korrelatiivne protseduur, mis võimaldab tulemuse väärtusi korrelatsiooni alusel mingi teise muutujaga ennustada (Elmes, Kantowitz, & Roediger, 2013: lk 1351). Korrelatsioon ja regressioon on olemuselt üsna sarnased mõisted; arvuliselt on tegelikult Pearsoni r, mis väljendab kahe muutuja (nt X ja Y) vahelist seost, üsna sama väärtusega kui standardiseeritud regressiooni koefitsient. See tähendab ka seda, et determinatsioonikordaja R2 on sarnase väärtusega. Ühtlasi on oluline teada, et nii korrelatsioon kui ka lihtne, lineaarne paarisregressioon ei ütle otseselt ära põhjuslikkuse suunda.

    Viimast lauset silmas pidades on oluline ära mainida, et regressiooni puhul on väga oluline see, kumb kahest muutujast – kas, meie näites, X või Y – on prediktor (ehk ennustav muutuja; ingl k predictor; sisuliselt sõltumatu muutuja) ning kumba muutujat ennustatakse (ingl k outcome variable; sisuliselt sõltuv muutuja). Regressioonianalüüsi tulemusena saadakse võrrand, mis kirjeldab iga prediktori osakaalu ennustatavas muutujas. Seesama võrrand on graafiliselt regressioonisirge võrrandiks, kus vabaliige kirjeldab y- teljega lõikumispunkti (intercept) ning sirge tõus (gradient) kirjeldab sirge paiknemist y- ja x-telje vahel (vt Fieldi õpikust lk 199). Sisuliselt üritab lineaarne regressioon läbi andmepunktide parve joonistada sirge, millest võimalikult palju väärtusi on sarnase kaugusega.
    Regressioonianalüüsi läbiviimiseks on 6 eeldust :
  • sõltuva muutuja andmed on intervall - või suhteskaalal (st on pidevtunnus);
  • muutujatevaheline suhe on lineaarne;
  • puuduvad märkimisväärsed erindid (outliers);
  • vaatluste sõltumatus;
  • püsihajuvus (homoskedastilisus; homoscedasticity);
  • jääkide normaaljaotuslikkus (normality of residuals).
    Kui 1. ja 4. eeldust saab juba lausa enne uuringu läbiviimist täita, siis eeldused 2, 3 ja 5 on testitavad hajuvusdiagrammiga, st üldist pilti on võimalik vaadelda graafiliselt. Eeldust 6 saame testida siis, kui viime läbi regressioonianalüüsi.
    • Käsklusterida:

    Analyze – Regression – Linear
    Dependent on sõltuv muutuja, Independent on prediktor.
    Statistics alt valida Estimates, Model Fit, Descriptives.
    Regressioonijääkide salvestamiseks: Save – Residuals – Unstandardized
    Pärast analüüsi läbiviimist tuleb uue, salvestatud muutujaga läbi viia normaaljaotuslik test
    • Tulemused:
      (a) kirjeldavat statistikat (nt mõlema muutuja keskmised);
      (b) muutujatevahelised korrelatsioonid;
      (c) muutujate lisamine/eemaldamine mudelisse (paarisregressiooni puhul ebaoluline);
      (d) mudeli kokkuvõte, kus on kirjeldatud mh determinatsioonikordaja R2 – korrutades seda väärtust 100-ga, saame teada, kui suure osa kogu ennustatava muutuja (siin: testitulemus) variatiivsusest kirjeldab ära prediktor (siin: vanus).
      (e) ANOVA tulemused mudeli olulisuse hindamiseks (kui Sig. 0.8.

    • Käsklusrida:

    Analyze – Scale – Reliability Analysis
    Sisestage kõik uuritavad muutujad.
    Lisaks valige aknast Statistics - Item, Scale, Scale if item deleted, Correlations.
    • Tulemus:

    Reliability Statistics
    Reliability Statistics
    Cronbach's Alpha
    Cronbach's Alpha Based on Standardized Items
    N of Items
    ,747
    ,740
    7
    Meie näite puhul on Cronbachi alfa 0.747, mis näitab head sisemist konsistentsust. Kui on soov uurida, kas skaala ikka on ühedimensionaalne, siis peaks läbi viima faktoranalüüsi.
  • FAKTORANALÜÜS
    • Käsklusrida:
      Analyze – Data Reduction - Factor

    Valida muutujateks kõik muutujad.
    Lisaks:
    Extraction. ->
    Method : Oluline on valida õige faktorite eraldamise meetod. Meie kursuse raames olgu selleks Maximum likelihood
    Extract: Based on Eigenvalue: Omaväärtus (eigenvalue) näitab kui palju andmete varieeruvusest seletab konkreetne faktor. Mida kõrgem väärtus, seda rohkem varieeruvust faktor seletab. Jätame selle väärtuseks 1. See ütleb SPSS’ile missuguse kriteeriumi alusel faktoreid hinnata – kui faktori omaväärtus on üle 1, siis loeb oluliseks.
    Scree Plot - Omaväärtuste graafik . Tuuakse ära kõigi võimalike faktorite omaväärtused. Joonise järgi saab otsustada eristatavate faktorite arvu.
    Unrotated facor solution
    Number of Factors - Eristatavate faktorite arvu saab ka ise ette anda
    Options ->
    On mõistlik määrata, et faktorkaalud oleksid järjestatud (Sorted By Size ), samuti anda ette väärtus, millest väiksemaid ei kuvata (Supress absolute values less than).
    Rotation ->
    Pööramise eesmärgiks on saavutada võimalikult lihtne faktorstruktuur, kus iga muutuja laaduks tugevalt ainult ühele faktorile ja teistele nõrgalt. Matemaatiliselt pööramine faktorlahendi põhiolemust ei muuda: summaarne seletusprotsent ja tunnuste kommunaliteedid jäävad samaks. Kuid faktorlahend muutub lihtsamini tõlgendatavaks ja omaväärtused jaotuvad faktorite vahel ühtlasemalt. Teeme faktormudeli, kus kasutame direct oblimin meetodit.
    Eristatakse kahte tüüpi pööramist: ortogonaalset ehk täisnurkset ja mitteortogonaalset ehk kaldnurkset. Enne pööramist on faktorid sõltumatud, nad ei ole omavahel korreleeritud. Ortogonaalne pööramine jätabki olukorra selliseks ; faktorite vahelised korrelatsioonid ei ole lubatud ja kõiki faktoreid pööratakse ühepalju. Kaldnurkse pööramise puhul on faktorite-vahelised korrelatsioonid lubatud ja iga faktorit võib pöörata erineval määral. Otsus kumba pööramist eelistada, peaks tuginema eelkõige teoreetilistele kaalutlustele.
    Kui me eeldame, et faktorid peaksid olema üksteisest sõltumatud, tuleks eelistada ortogonaalset pööramist (nt. varimax). Kui aga teooria ütleb, et faktorid on omavahel korreleeritud, on mõistlik valida kaldnurkne pööramine (nt. direct obliminal).
    Scores ->
    Saab teha iga faktori tulemustest uue veeru enda andmetesse. Hetkel me seda võimalust ei kasuta.
    • Tulemused:

  • Kommunaliteedid - kirjeldavad faktorite algtunnuste variatiivsuse ühist osa. Suur kommunaliteet näitab, et vaadeldav tunnus sobib faktorite leidmise protsessis hästi teiste vaadeldud tunnustega kokku.
    Communalities
    Initial
    Extraction
    Sõnavara
    ,220
    ,528
    Diagrammid
    ,378
    ,479
    Andmed
    ,290
    ,367
    Informeeritus
    ,224
    ,308
    tekst
    ,082
    ,115
    matemaatika
    ,444
    ,671
    ruumiline
    ,212
    ,266
    Extraction Method: Maximum Likelihood.
  • Total Variance Explained - iseloomustab algfaktorite ja eraldatud faktorite kirjeldusvõimet.
    Faktori kirjeldusaste e. omaväärtus - analoogline kommunaliteediga, aga käib faktorite kohta. Näitab faktori poolt kirjeldatavat varieeruvust ja selle osa koguvarieeruvusest.
    Total Variance Explained
    Factor
    Initial Eigenvalues
    Extraction Sums of Squared Loadings
    Total
    % of Variance
    Cumulative %
    Total
    % of Variance
    Cumulative %
    1
    2,812
    40,172
    40,172
    2,264
    32,347
    32,347
    2
    1,072
    15,309
    55,481
    ,469
    6,703
    39,050
    3
    ,832
    11,884
    67,366
    4
    ,699
    9,982
    77,348
    5
    ,617
    8,808
    86,156
    6
    ,547
    7,820
    93,976
    7
    ,422
    6,024
    100,000
    Extraction Method: Maximum Likelihood.
    Viimane osa tabelist – Extraction Sums of Squared Loadings– näitab faktoreid, mille omaväärtus on suurem kui 1. Näeme, et esimene faktor kirjeldab ära 32,347 koguvarieeruvusest ja teine faktor ainult 6,703 %.
  • Faktorlaadungid ehk faktorkaalud. Need arvutatakse kõikidele indikaatoritele seotuna kõikide faktoritega. Tabelis Pattern Matrix näidatakse faktorkaale pärast faktorite pööramist. Tabeli all näeme ka pööramise meetodit. Nende väärtuste järgi vaadatakse faktorite tekkimise mustrit. Sisuliselt on tegu korrelatsioonikordajaga faktori ja indikaatori vahel: mida suurem see arv on, seda tõenäolisemalt see indikaator on antud faktori poolt määratud.
    Pattern Matrixa
    Factor
    1
    2
    matemaatika
    ,841
    Andmed
    ,609
    Diagrammid
    ,598
    ruumiline
    ,524
    Sõnavara
    ,774
    Informeeritus
    ,451
    tekst
    ,328
    Extraction Method: Maximum Likelihood.
    Rotation Method: Oblimin with Kaiser Normalization.
    a. Rotation converged in 4 iterations.
    • Peakomponentide analüüs

    Peakomponentide analüüsi eesmärk on välja selgitada väiksem hulk komponente, mis vastutavad esialgsete muutujate varieeruvuse eest. Faktoranalüüs ja peakomponentide analüüs on matemaatilises mõttes erinevad. Faktoranalüüsi käigus eeldatakse, et mõõdetud muutujate varieeruvuse eest vastutavad tekkivad ühisfaktorid ja unikaalsed faktorid. Peakomponentide analüüsi käigus tekitatakse uued muutujad lihtsalt kui lineaarkombinatsioonid mõõdetud muutujatest (vaadake loengu konspektist jooniseid).
    Faktoranalüüsi on mõistlik kasutada, kui uurija on huvitatud faktoritest, mis vastutavad teatud hulga mõõdetud muutujate varieeruvuse eest. Peakomponentide analüüsi tuleks kasutada, kui uurija soovib lihtsalt andmeid taandada.
    Analüüsikäik on sarnane faktoranalüüsile. Valige nupu alt Extraction eraldamise meetodiks peakomponentide meetod ehk Principal Components. Kõik muud valikud, mis enne faktoranalüüsi jaoks tegite, jätke samaks.
    1
  • Vasakule Paremale
    Statistiline modelleerimine praktikumide juhised #1 Statistiline modelleerimine praktikumide juhised #2 Statistiline modelleerimine praktikumide juhised #3 Statistiline modelleerimine praktikumide juhised #4 Statistiline modelleerimine praktikumide juhised #5 Statistiline modelleerimine praktikumide juhised #6 Statistiline modelleerimine praktikumide juhised #7 Statistiline modelleerimine praktikumide juhised #8 Statistiline modelleerimine praktikumide juhised #9 Statistiline modelleerimine praktikumide juhised #10 Statistiline modelleerimine praktikumide juhised #11 Statistiline modelleerimine praktikumide juhised #12 Statistiline modelleerimine praktikumide juhised #13 Statistiline modelleerimine praktikumide juhised #14 Statistiline modelleerimine praktikumide juhised #15 Statistiline modelleerimine praktikumide juhised #16 Statistiline modelleerimine praktikumide juhised #17 Statistiline modelleerimine praktikumide juhised #18 Statistiline modelleerimine praktikumide juhised #19 Statistiline modelleerimine praktikumide juhised #20 Statistiline modelleerimine praktikumide juhised #21 Statistiline modelleerimine praktikumide juhised #22 Statistiline modelleerimine praktikumide juhised #23 Statistiline modelleerimine praktikumide juhised #24 Statistiline modelleerimine praktikumide juhised #25 Statistiline modelleerimine praktikumide juhised #26 Statistiline modelleerimine praktikumide juhised #27 Statistiline modelleerimine praktikumide juhised #28 Statistiline modelleerimine praktikumide juhised #29 Statistiline modelleerimine praktikumide juhised #30
    Punktid 50 punkti Autor soovib selle materjali allalaadimise eest saada 50 punkti.
    Leheküljed ~ 30 lehte Lehekülgede arv dokumendis
    Aeg2018-05-10 Kuupäev, millal dokument üles laeti
    Allalaadimisi 71 laadimist Kokku alla laetud
    Kommentaarid 0 arvamust Teiste kasutajate poolt lisatud kommentaarid
    Autor selks Õppematerjali autor

    Kasutatud allikad

    Sarnased õppematerjalid

    Andmeanalüüsi konspekt
    12
    docx

    Andmeanalüüsi konspekt

    ANVOA või regressioonanalüüs Kui meil sõltumatu muutuja koosneb kategooriatest, siis on parem kasutada ANOVA't. Kui sõltumatu muutuja on pidev tunnus, siis on parem kasutada regressiooni. ANOVA'ga hinnatakse gruppide keskmiste erinevust. Regressiooniga saab ennustada sõltuva muutuja väärtust prediktori (sõltumatu muutuja) väärtuste põhjal. Efekti suurus Efekti suurus on statistiline näitaja, mis võimaldab lisaks statistilisele olulisusele kirjeldada gruppidevahelisi erinevusi. Efekti suurust saab väljendada mitmete statistikutega; ilmselt levinuim on Cohen-i d. Kokkuleppeliselt tähistavad Cohen'i d väärtused väikest efekti väärtusel d = 0.2; keskmise suurusega efekti väärtus on d = 0.5; suure efekti väärtuse algus on d = 0.8. SPSS-is ei ole funktsiooni/käsklust, millega saaks paari kliki abil efekti suurust (st Coheni d-d) kätte.

    Andmeanalüüs
    Andmetöötlus psühholoogias
    7
    doc

    Andmetöötlus psühholoogias

    - Tunnuse, mille järgi toimub rühmitamine, valite aknasse: Factor - Aknast Post Hoc, teete linnukese kastidesse LSD ja Bonferroni (need on gruppide võrdlemise erinevad meetodid) ­ ehkki ANOVA näitab, kas gruppide vahel on erinevusi, näitavad post hoc testid, mis gruppide vahel on erinevused. - Options aknast teete linnukese Descriptive ja Homogenity of the variance test juurde EFEKTI SUURUSE ARVUTAMINE Efekti suurusvi on statistiline näitaja, mis võimaldab lisaks statistilisele olulisusele kirjeldada gruppidevahelisi erinevusi. Efekti suurust saab väljendada mitmete statistikutega; ilmselt levinuim on Cohen-i d. Kokkuleppeliselt tähistavad Cohen'i d väärtused väikest efekti väärtusel d = 0.2; keskmise suurusega efekti väärtus on d = 0.5; suure efekti väärtuse algus on d = 0.8. SPSS-is ei ole funktsiooni/käsklust, millega saaks paari kliki abil efekti suurust kätte. Seega on mõned alternatiivid ­

    Ülevaade psühholoogiast
    Statistiline modelleerimine teooria kokkuvõte 2020
    19
    docx

    Statistiline modelleerimine teooria kokkuvõte 2020

    Statistiline modelleerimine – kokkuvõte Muutujad:  Sõltuvad muutujad (dependent, outcome variables) – muutujad, mis on uurimise keskmes, millele uurija arvab, et teised muutujad mõju avaldavad. Nö katseisikust sõltuv muutuja.  Sõltumatud muutujad (independent, predictor variables) – muutujad, mille kohta uurija arvab, et neil võiks olla mõju uuritavatele muutujatele.  Statistilise analüüsi keskmes on uurida, kuidas teatud tunnused koos muutuvad.  Kui on vaja muutujat iseloomustada, on kaks põhilist viisi, kuidas seda teha: o Milline on selle muutuja tüüpiline väärtus? o Kui hästi iseloomustab see tüüpiline väärtus kõiki mõõdetud juhtumeid? Ehk kui palju on varieeruvust selle tüüpilise väärtuse “ümber”? Statistika jagunemine:  Kirjeldav statistika (descriptive stat.) meetodid andmetest kokkuvõtete tegemiseks ning kirjeldamiseks. („65-70% U

    Statistiline modelleerimine
    Gretl juhend 2016
    32
    pdf

    Gretl juhend 2016

    Gretl - Gnu Regression, Econometrics and Time Series Library Gretl on avatud koodil põhinev vabavara, mida võib legaalselt installeerida oma kodusesse arvutisse või sülearvutisse. Programmi koduleht http://gretl.sourceforge.net/ TÖÖ PROGRAMMIGA Gretl Käivitada programm – avaneb menüü 1. Andmete importimine – File → Open data → Import → nimi.xlsx. Selleks et oleks võimalik andmetabelit Gretl-isse importida tuleb tabel eelnevalt sobivale kujule viia: a) kontrollida, et Exceli tabeli esimeses reas oleksid muutujate nimed (ei peaks sisaldama täpitähti) ning teisest reast alates andmed. sulgeda Exceli fail; b) avada programm Gretl; c) valida File/Open data/Import/Excel d) otsida Exceli fail (muuta Files of type) e) valida, mitmendast veerust ja reast importimist alustatakse f) näidatakse töölehtede , muutujate ja vaatlustulemuste arv g)

    Infoharidus
    Ökonomeetriline projekt - Brutopalga sõltuvus haridustasemest-meeste osakaalust ning linlaste osakaalust maakondade lõikes
    36
    docx

    Ökonomeetriline projekt - Brutopalga sõltuvus haridustasemest, meeste osakaalust ning linlaste osakaalust maakondade lõikes

    TALLINNA TEHNIKAÜLIKOOL Majandusteaduskond Rahandus ja majandusteooria instituut Matemaatika, statistika ja ökonomeetria õppetool Laura Kallasvee, Liisi Saksakulm BRUTOPALKADE SEOS HARIDUSE, SOO JA ELUKOHAGA EESTI MAAKONDADE LÕIKES AASTATEL 2005-2008 Ökonoomeetriline projekt Juhendaja: dotsent Ako Sauga Tallinn 2014 SISUKORD SISSEJUHATUS.........................................................................................................................4 1. REGRESSIOONANALÜÜS..................................................................................................7 1.1. Ökonomeetriline mudel....................................................................................................7 1.2. Töös kasutatavad andmed..........................................

    Majandus
    Statilised järeldused
    72
    docx

    Statilised järeldused

    Statilised järeldused Isiklik veeb: www.tlu.ee/ˇkairio Kursuse veeeb: www.tlu.ee/ˇkairio/7070 Kursus hõlmab üldistavat statistikat. Tõmba SPSS 14p treial Võid ka vaadata nuditud vabavara PSPP Tunnused on väga oluline. Intervall - – väärtused on järjestatavad ning nende väärtuste vahemikud on võrdsed. Nt. sissetulek (123€, 125€, 130€, 1500€ jne.); -pikkus, kaal, avtelg, mitu eurot. Saab arvutada skeskväärtust. On anud vahemike otspunktid – siis läheb ta selle alla nt kui üks on hea ja 10 on halb, siis määramatu keskosa annab meile intervalltunnused. Järjestus- tunnused, mille väärtused moodustavad kategooriad ning neid saab omavahel järjestada. Samas ei ole nende väärtuste vahemikud võrdsed. Nt. hinnang (väga hea, hea, rahuldav) nt 0-100, 101-100 jne –vahemikud ei ole ühepikkuses, keskmist arvutada ei saa. Ka skaalad. – on olemas kindel järjekord aga v.heast heani ja heast halvani ei ole ühepikused Binaarne- sellel on ainult

    Ainetöö
    Uurmismeetodid psühholoogias
    25
    pdf

    Uurmismeetodid psühholoogias

    enama muutuja vahelise teoreetilise suhte lühikirjelduse, samuti muutujate mõõtmisviisi kirjelduse (nimetamise). (näit. Kas õppimine on efektiivsem üksinda v. väikeses grupis? Tuleks lisada, kuidas me õppimise efektiivsust mõõdame!) c) kirjanduse ülevaate koostamine; d) piloot-uuring (pilot study), et leida ja täpsustada sobivad uurimisprotseduurid; samuti sobivad sõltumatu muutuja tasemed; e) lõplik uurimiskava koostamine; f) andmete kogumine; g) andmete statistiline töötlemine; h) tulemuste interpreteerimine; i ) uurimisaruande (artikli) koostamine. 2.2. Kirjanduse ülevaate koostamine. Kuidas lugeda teaduslikku artiklit. Kirjanduse ülevaate koostamine on eelduseks iga uurimuse läbiviimisele. Pärast idee tekkimist ja hüpoteesi sõnastamist tuleks koguda võimalikult palju infot selle kohta, mis on seni antud probleemist uuritud/teada. Kasulik on see a) leidmaks, kas ja kuivõrd üldse on probleemi uuritud

    Psühholoogia
    Andmeanalüüsi konspekt
    466
    doc

    Andmeanalüüsi konspekt

    illustreerima peaks. Lugejatel on raske näha arvutuslike puude taga statistilist metsa. Seepärast ei pöörata kogu järgnevas käsitluses tähelepanu mitte valemitele ühe või teise statistiku arvutamiseks vaid püütakse selgitada statistiliste ideede (kontseptsioonide) olemust sõnade, näidete ja jooniste abil. Loengumaterjalide koostamisel on kasutatud D. Rowntree raamatut "Statistics without tears". Mis on statistika? 2.1 Statistiline mõtteviis. Statistiline mõtteviis on meile kõigile igapäevasest elust tuttav ja omane. Võtame ühe lihtsa näite: ma ütlen teile, et ma lähen täna teatrisse kahe kolleegiga, kusjuures üks neist on 190 cm pikk ja teine 165 cm pikk. Millise järelduse te võite kummagi kolleegi soo kohta kõige kindlamini teha, kui teil rohkem mingit informatsiooni ei ole? Ma arvan, et te võisite päris veendunult väita, et üks mu kolleegidest , 190 cm pikkune, on

    Andmeanalüüs i




    Meedia

    Kommentaarid (0)

    Kommentaarid sellele materjalile puuduvad. Ole esimene ja kommenteeri



    Sellel veebilehel kasutatakse küpsiseid. Kasutamist jätkates nõustute küpsiste ja veebilehe üldtingimustega Nõustun