Vajad kellegagi rääkida?
Küsi julgelt abi LasteAbi
Logi sisse

Andmeanalüüsi kordamisküsimused (0)

1 HALB
Punktid

Esitatud küsimused

  • Mis on R väljundis tunnuse unikaalsus uniqueness?
  • Keskmeid kasutatakse?
  • Mille järgi otsustatakse tema klassikuuluvus?
  • Palju mingi klassi tulemustest on false positive ?
  • Mis eesmärk on faktoranalüüsi kasutamisel?
  • Mis on tunnuse kommunaliteet?
  • Mis on R väljundis tunnuse unikaalsus uniqueness?
  • Mille alusel otsustatakse oluliste faktorite arv?
  • Milleks kasutatakse diskriminantanalüüsi?
  • Mitme diskriminantfunktsiooniga tuleb teoreetiliselt piirduda?
  • Mitme diskriminantfunktsiooniga tuleb piirduda?
  • Kuidas objektide diskriminantfunktsioonide väärtusi ja klasside keskmeid kasutatakse?
  • Kui palju mingi klassi tulemustest on false positive?
Andmeanalüüsi kordamisküsimused

Sisukord


1Põhimõisted. 3
1.1Nimetage skaalatüübid. 3
1.2Mida võimaldab mingi skaala (asenda konkreetne skaala) 3
2Ühe tunnuse analüüs 3
2.1Kvantiilid - kirjuta välja kvartiilide 1,2 ja 3 väärtused 3
2.2Millised on keskmised 3
2.3Millised on variatsiooninäitarvud 4
2.4Mis on mood? 4
2.5Mis on mediaan? 4
2.6Olukord (loengukiledelt). Millal kasutada moodi / mediaani / aritm. keskmist. mitu olukorda (nominaalskaalal, järjeskaalal, intevallskaalal) 4
3Kahe tunnuse analüüs. Sageduste risttabel . Hii-ruut-test 4
3.1Risttabelis üks lahter esile toodud (värviga). Kuidas interpreteerida (rea / veeru / üldprotsent) 3 küsimust. 4
3.2Formuleerida hii-ruut-testi nullhüpotees . Teha otsustus näite põhjal. (Lisatingimusi pole vaja arvestada) 4
4Keskmiste võrdlus 5
4.1F-test. Hüpoteeside formuleerimine varieeruvuse kohta. Otsustuse tegemine 5
4.2t-test. Hüpoteeside formuleerimine keskmiste kohta. Otsustuse tegemine (vaata kas leidub f-testist sõltuv t-testi tulemus) 5
4.3Kahe tunnuse (ühe rühma) keskmiste võrdlus. Hüpoteeside formuleerimine keskmiste kohta. Otsustuse tegemine 5
5Korrelatsioon 5
5.1Nullhüpoteesi formuleerimine. Otsustuse tegemine ühe lahtri kohta. 5
5.2Kui seos on oluline, kuidas intepreteerite seda seost (ühe lahtri alusel). 5
6Regressioon 5
6. 1Mida näitab determinatsioonikoefitsient (protsentides) 5
6.2Formuleerida nullhüpotees mudeli kui terviku kohta. Teha otsustus (F-test). 5
6.3Kuidas interpreteeritakse tunnusele vastavat regressioonikoefitsienti B ( parameter estimate) 5
6.4Nullhüpoteesi formuleerimine konkreetse sõltumatu tunnuse sobivuse kohta lineaarsesse mudelisse. Otsustus ühe sõltumatu tunnuse põhjal. 5
6.5Kui kõik tunnused sobivad mudelisse, kuid tahame ühe neist välja visata - kumma karakteristiku (parameter estimate "B", standardized estimate " beta ") järgi me otsustuse teeme (näite põhjal). 6
7Faktoranalüüs 6
7.1Mis eesmärk on faktoranalüüsi kasutamisel ? 6
7.2Mis on (tunnuse) kommunaliteet? Mis on (R väljundis ) tunnuse unikaalsus (uniqueness)? 6
7.3Kuidas intepreteerite tunnuse kommunaliteeti (pööratud) näite alusel? 6
7.4Mille alusel otsustatakse oluliste faktorite arv? 6
7.5Mida näitab/mõõdab faktorkaal ( proportion / normeeritud osakaal)? 6
7.6Mida näitab faktori panus (eigenvalue / variance explained by each factor ). Näidata kahte tabelit (ka omavektorite tabelit). 6
7.7Mida näitab omaväärtuste osakaalude (faktorite panuste) kumulatiivne summa, näite alusel. 6
7.8kuidas faktoreid interpreteeritakse (mis tegevusi selleks teha tuleb) 6
7.9millised lähtemudeli tunnused milliste faktorite külge kinnistatakse. (rotated factor pattern tabel) näite põhjal. 6
7.10millised lähtemudeli tunnused faktor 1 külge kinnistatakse, näite põhjal. 7
8Klasteranalüüs 7
8.1Mis on klaster? 7
8.2Kuidas määrata hierarhilise klasteranalüüsi korral klasside arvu dendrogrammil? 7
8.3Nimetage mõni klasterdamise (kauguse või läheduse) mõõt. 7
8.4Kas klasteranalüüsi korral objektide klassikuuluvus on eelnevalt teada? 7
8.5Mis on klasteranalüüsi kasutamise eesmärk (oodatav tulemus). 7
9Diskriminant 7
9.1Milleks kasutatakse diskriminantanalüüsi? 7
9.2Mitme diskriminantfunktsiooniga tuleb teoreetiliselt piirduda? 7
9.2.1Mitme diskriminantfunktsiooniga tuleb piirduda? Formuleerida nullhüpotees ja otsustada näite alusel. 7
9.3Kuidas objektide diskriminantfunktsioonide väärtusi ja klasside keskmeid kasutatakse? Teooriaküsimus. 7
9.4Kas diskriminantanalüüsi korral objektide klassikuuluvus on eelnevalt teada? 7
9.5Kui tuleb tundmatu objekt ja meil on selle objekti klassifikatsioonifunktsiooni väärtus kõikide klasside korral teada, siis mille järgi otsustatakse tema klassikuuluvus? 8
9.6mitu protsenti teise klassi objektidest on prognoositud õigesti (näite alusel)? 8
9.6.1Kui palju mingi klassi tulemustest on false positive ? 8
9.6.2Kui palju on false negative 8
10Meetod/tunnus/skaala tabel 9
  • Põhimõisted.

  • Nimetage skaalatüübid.


    Nominaalskaala (nimetuste skaala) – andmete hindamisel on võimalikud vaid kõige lihtsamad operatsioonid nagu ekvivalentsus ja kuulumine hulka. Pole võimalik leida ei keskmist ega mediaani, sest nende andmetega pole võimalik teostada loogilisi operatsioone nagu „suurem kui“ või „väiksem kui“.
    N: mees/naine; eestlane/soomlane/hispaanlane
    Ordinaalskaala (järjestikskaala)– näitab andmete järjekorda, seejuures intervallid ei ole ühepikkused, vaid võivad olla suhtelised väärtused.
    N: koolihinded („väga hea“ ehk „5“ kuni „mitterahuldav“ ehk „1“); suurepärane /väga hea/hea jne
    Intervallskaala (vahemikskaala)kõik vahemikus on ühepikkused ning nullpunkti asukoht on kokkuleppeline.
    N: Celsiuse temperatuuriskaala ; vanusevahemikud 15-19 / 20-24/ 25-29
    Suhteskaala – nullpunktil on sisuline tähendus.
    N: pikkusmõõt, massimõõt
  • Mida võimaldab mingi skaala (asenda konkreetne skaala)


    Nominaalskaala
    =/≠
    Ordinaalskaala
    =/≠ ;
    Intervallskaala
    =/≠ ; ; +/−
    Suhteskaala
    =/≠ ; ; +/− ; ×/÷
  • Ühe tunnuse analüüs

  • Kvantiilid - kirjuta välja kvartiilide 1,2 ja 3 väärtused


    Kvantiilid on korrastatud statistilise rea liikmed, mis jagavad rea n-ks võrdse liikmete arvuga osaks.
    Nt kvartiilid on 25%, 50% ja 75%.
  • Millised on keskmised


    Mahukeskmised:
    • Aritmeetiline kekmine
    • Harmooniline keskmine
    • Astmekeskmine
    • Geomeetriline keskmine
    Asendikeskmised:
    • Mood
    • Mediaan
    • Kvantiilid

  • Millised on variatsiooninäitarvud



  • Mis on mood?


    Mood on kõige sagedamini esinev väärtus.
  • Mis on mediaan?


    Mediaan on jaotuse keskmine liige, millest mõlemale poole jääb võrdne arv elemente. Mediaan jaotab järjestatud statistilise rea kaheks.
  • Olukord (loengukiledelt). Millal kasutada moodi / mediaani / aritm. keskmist. mitu olukorda (nominaalskaalal, järjeskaalal, intevallskaalal)


    Mood - Moodi saab kasutada nii nominaalskaala, järjestikskaala kui ka intervallskaala korral
    • Kui ülesandeks on kiiresti määrata kesktendents
    • Kui keskmise all mõeldakse tüüpilist
    Mediaan - mediaani võib kasutada järjestikskaala ja intervallskaala korral
    • Kui ülesanne nõuab rea täpse keskpunkti leidmist
    • Kui erandlikud vaatlusanded moonutavad aritmeetilist keskmist
    • Kui tegu on „veidrakujulise“ jaotusega
    Aritmeetiline keskmine - saab kasutada vaid intervallskaal korral
    • Kui tulemused on jaotunud enam-vähem sümmeetriliselt keskmise ümber
    • Kui ülesanne nõuab sellise keskmise määramist, mis on aluseks mingile teisele meetodile
    • Kui nõutakse eri gruppide sama tunnuse mõõtmisel saadud tulemuste võrdlemist
    • Kui on tarvis analüüsida populatsiooni, millest uuritav valim pärineb

  • Kahe tunnuse analüüs. Sageduste risttabel. Hii-ruut-test


  • Risttabelis üks lahter esile toodud (värviga). Kuidas interpreteerida (rea / veeru / üldprotsent) 3 küsimust.

  • Formuleerida hii-ruut-testi nullhüpotees. Teha otsustus näite põhjal. (Lisatingimusi pole vaja arvestada)


    H0: Tunnuse A ja B vahel ei esine olulist sõltuvust. => Prob (H1: Tunnuse A ja B vahel esineb oluline sõltuvus. => Prob > 0.05)
  • Keskmiste võrdlus

  • F-test. Hüpoteeside formuleerimine varieeruvuse kohta. Otsustuse tegemine


    H0: Kahe grupi tunnuse väärtuste varieeruvus ei erine oluliselt. => (Pr > F)
  • t-test. Hüpoteeside formuleerimine keskmiste kohta. Otsustuse tegemine (vaata kas leidub f-testist sõltuv t-testi tulemus)


    H0: Kahe tunnuse väärtuste keskmised ei erine oluliselt. => (Pr > |t|)
  • Kahe tunnuse (ühe rühma) keskmiste võrdlus. Hüpoteeside formuleerimine keskmiste kohta. Otsustuse tegemine


    Kui jäädakse H0 juurde, siis Equal Variance
    Kui minnakse H1 juurde, siis Unequal Variance
  • Korrelatsioon

  • Nullhüpoteesi formuleerimine. Otsustuse tegemine ühe lahtri kohta.


    H0: Kahe tunnuse vahel ei esine olulist korrelatsiooni.
  • Kui seos on oluline, kuidas intepreteerite seda seost (ühe lahtri alusel).

  • Regressioon

  • Mida näitab determinatsioonikoefitsient (protsentides)


    Determinatsioonikoefitsient näitab, kui suur osa Y varieeruvusest on kirjeldatud mudeliga Y’’.
    R2 = 0.775 => 77,5%
    Seega kui R2 = 1, siis on tegelikud väärtused regressioonisirgel.
  • Formuleerida nullhüpotees mudeli kui terviku kohta. Teha otsustus (F-test).


    H0: Regressioonimudel ei aita kirjeldada sõltuvat tunnust => (Pr > |t|)
  • Kuidas interpreteeritakse tunnusele vastavat regressioonikoefitsienti B (parameter estimate)


    y = ax1 + b
    y on sõltuv tunnus, x1, x2, jne. on sõltumatud tunnused
  • Nullhüpoteesi formuleerimine konkreetse sõltumatu tunnuse sobivuse kohta lineaarsesse mudelisse. Otsustus ühe sõltumatu tunnuse põhjal.


    H0: Antud sõltumatu tunnus ei aita oluliselt kirjeldada sõltuva tunnuse varieeruvust. => (Pr > |t|)
  • Kui kõik tunnused sobivad mudelisse, kuid tahame ühe neist välja visata - kumma karakteristiku (parameter estimate "B", standardized estimate "beta") järgi me otsustuse teeme (näite põhjal).


  • Faktoranalüüs

  • Mis eesmärk on faktoranalüüsi kasutamisel?


    Faktoranalüüsi eesmärgiks on tunnusruumi kokkusurumine , mille käigus asendatakse etteantud tunnused väiksema arvu faktortunnustega.
  • Mis on (tunnuse) kommunaliteet? Mis on (R väljundis) tunnuse unikaalsus (uniqueness)?


    Tunnuse kommunaliteet näitab, kui suures osa sellest tunnusest kirjeldavad ära kõik allesjäetud olulised faktorid . Kommunaliteet on iga tunnuse rea väärtuste ruutude summa.
  • Kuidas intepreteerite tunnuse kommunaliteeti (pööratud) näite alusel?


    Faktorite pööramine tunnuse kommunaliteeti ei muuda.
  • Mille alusel otsustatakse oluliste faktorite arv?


    Faktorite arv otsustatakse eigenvalue ehk faktori omaväärtuste alusel, mis peab olema vähemalt 1. St, antud faktor kirjeldab ära vähemalt 1 tunnuse. Omaväärtus näitab, kui palju tunnustest antud faktor ära kirjeldab.
  • Mida näitab/mõõdab faktorkaal (proportion / normeeritud osakaal)?


    Faktorkaal näitab, kui suure osa tunnuse väärtustest antud faktor ära kirjeldab.
  • Mida näitab faktori panus (eigenvalue / variance explained by each factor). Näidata kahte tabelit (ka omavektorite tabelit).


    Pööratud faktorite omaväärtused, st kui palju üksik pööratud faktor tunnustest ära kirjeldab. Pööratud faktorite omaväärtused erinevad algsete faktorite omaväärtustest.
  • Mida näitab omaväärtuste osakaalude (faktorite panuste) kumulatiivne summa, näite alusel.


    Näitab kui suure osa tunnustest (mitu tunnust) antud faktor ära kirjeldab.
  • kuidas faktoreid interpreteeritakse (mis tegevusi selleks teha tuleb)


    Need tunnused, mis on ühe faktoriga seotud, annavad sellele faktorile sisu. Faktori sisu on selle faktoriga seotud olemasolevate tunnuste sisu üldistus.
  • millised lähtemudeli tunnused milliste faktorite külge kinnistatakse. (rotated factor pattern tabel) näite põhjal.


    Iga tunnuse reast tuleb leida absoluutväärtuselt suurim faktorkaal. Kui faktorkaal on üle 0.3, siis võib seda siduda ka mitme tunnusega. Tunnus kinnitatakse suurima absoluutväärtusega faktori külge.
  • millised lähtemudeli tunnused faktor 1 külge kinnistatakse, näite põhjal.

  • Klasteranalüüs

  • Mis on klaster?


    Klaster on mingite parameetrite alusel eristatav objektide hulk; klastri objektid annavad klastile sisu. Kui klasteranalüüsi abil on leitud objektide klastrid, siis saab järgnevalt uurida erinevates klastrites paiknevate objektide sarnasusi ja erinevusi.
  • Kuidas määrata hierarhilise klasteranalüüsi korral klasside arvu dendrogrammil?


    Piir klastrite arvule tuleb vaadata klastrite liitumise kaugusi. Nö piir tuleb tõmmata sinna, kus toimub kauguste hüppeline kasv.
  • Nimetage mõni klasterdamise (kauguse või läheduse) mõõt.


    Kaugusmõõt, mis näitab kahe klastri omavahelist sarnasust . Eukleidese kaugus, mille abil mõõdetakse kahe punkti vahelist kaugust tasapinnal .
  • Kas klasteranalüüsi korral objektide klassikuuluvus on eelnevalt teada?


    Ei
  • Mis on klasteranalüüsi kasutamise eesmärk (oodatav tulemus).


    Klasteranalüüsi eesmärgiks on objekti kuulumine mingisugusse klastrisse, mille objektid annavad sellele klastrile sisu. Klastrisse kuuluvust saab nimetada uueks tunnuseks.
  • Diskriminant

  • Milleks kasutatakse diskriminantanalüüsi?


    Diskriminantanalüüsi eesmärgiks on etteantud teadaoleva klassikuuluvusega objektidele tuginedes prognoosida mudelisse lisatud sõltumatute tunnuste kuulumist mudelisse.
  • Mitme diskriminantfunktsiooniga tuleb teoreetiliselt piirduda?


  • Mitme diskriminantfunktsiooniga tuleb piirduda? Formuleerida nullhüpotees ja otsustada näite alusel.

  • Kuidas objektide diskriminantfunktsioonide väärtusi ja klasside keskmeid kasutatakse? Teooriaküsimus.

  • Kas diskriminantanalüüsi korral objektide klassikuuluvus on eelnevalt teada?


    Jah
  • Kui tuleb tundmatu objekt ja meil on selle objekti klassifikatsioonifunktsiooni väärtus kõikide klasside korral teada, siis mille järgi otsustatakse tema klassikuuluvus?


    Sõltuva tunnuse alusel
  • mitu protsenti teise klassi objektidest on prognoositud õigesti (näite alusel)?

  • Kui palju mingi klassi tulemustest on false positive?

  • Kui palju on false negative

  • Meetod/tunnus/skaala tabel


    MEETOD
    TUNNUSE LIIK
    LUBATUD SKAALA LIIK
    LUBATUD STATISTILINE NÄITAJA VÕI TEST
    KASUTATAV ANALÜÜSI VÄLJUNDI OSA
    ühe tunnuse analüüs
    nominaalskaala
    mood
    sagedustabel
    ühe tunnuse analüüs
    järjeskaala
    mood, mediaan
    sagedustabel, kvartiilid, tsentiilid
    ühe tunnuse analüüs
    intervallskaala
    kõik
    kõik
    sageduste risttabel
    nominaalskaala
    kõik
    kõik
    sageduste risttabel
    järjeskaala
    kõik
    kõik
    sageduste risttabel
    intervallskaala
    kesmiste võrdlus (t-test)
    grupeeriv tunnus
    nominaalskaala, järjeskaala, intervallskaala (unikaalseid väärtusi peab olema 2 väärtust)
    kesmiste võrdlus (t-test)
    tunnus mille keskmist vaja arvutada
    intervallskaala
    kõik
    kõik
    korrelatsioonimaatriks
    järjeskaala
    Kendall , Spearman
    Kendall, Spearman
    korrelatsioonimaatriks
    intervallskaala
    Pearson, Kendall, Spearman
    Pearson, Kendall, Spearman
    korrelatsioonimaatriks
    nominaalskaala
    - (kasuta sageduste risttabelit)
    - (kasuta sageduste risttabelit)
    regressioonanalüüs
    kirjeldatav (sõltuv) tunnus
    intervallskaala
    kõik
    kõik
    regressioonanalüüs
    kirjeldav (sõltumatu) tunnus
    intervallskaala
    kõik
    kõik
    faktoranalüüs
    intervallskaala
    kõik
    kõik
    hierarhiline klasteranalüüs
    Kõik tunnused peaksid olema sama tüüpi skaalal. Skaala tüüp sõltub kaugusmõõdust: tavaliselt intervallskaalal.
    mitmene diskriminantanalüüs
    grupeeriv (sõltuv) tunnus
    nominaalskaala, järjeskaala, intervallskaala (unikaalseid väärtusi peab olema enam kui 2 väärtust, aga mitte väga palju)
    8 / 10
  • Vasakule Paremale
    Andmeanalüüsi kordamisküsimused #1 Andmeanalüüsi kordamisküsimused #2 Andmeanalüüsi kordamisküsimused #3 Andmeanalüüsi kordamisküsimused #4 Andmeanalüüsi kordamisküsimused #5 Andmeanalüüsi kordamisküsimused #6 Andmeanalüüsi kordamisküsimused #7 Andmeanalüüsi kordamisküsimused #8 Andmeanalüüsi kordamisküsimused #9 Andmeanalüüsi kordamisküsimused #10
    Punktid 10 punkti Autor soovib selle materjali allalaadimise eest saada 10 punkti.
    Leheküljed ~ 10 lehte Lehekülgede arv dokumendis
    Aeg2014-11-01 Kuupäev, millal dokument üles laeti
    Allalaadimisi 39 laadimist Kokku alla laetud
    Kommentaarid 0 arvamust Teiste kasutajate poolt lisatud kommentaarid
    Autor nonamesuitable Õppematerjali autor
    TTÜ Andmeanalüüsi aine kordamisküsimuste vastused (T. Veskioja)

    Sarnased õppematerjalid

    Statistika kordamisküsimused
    22
    docx

    Statistika kordamisküsimused

    1. MÕÕTMINE Mõõtmine on objektide võrdlemine - Korraga saab võrrelda ainult kaht objekti omavahel. Kui objekte palju, valitakse välja üks (etalon) ning teisi võrreldakse sellega. Otsene mõõtmine ja kaudne mõõtmine – otseste mõõtmiste kaudu Nimi- ehk nominaalskaala – objektide eristamiseks – sugu, rahvus, huvid, kaubakood, ettevõtte registrinumber Järjestusskaala – võimaldab objekte järjestada mingi tunnuse alusel – nt ettevõtted: väikesed, keskmised, suured – küsitlus: "poolt", pigem poolt kui vastu", "pigem vastu kui poolt", "vastu" – intervallid skaalajaotuste vahel pole võrdsed Intervallskaala – skaalajaotuste intervallid on võrdsed  Vahemikskaala – nullpunkti asukoht kokkuleppeline – ajaskaala, Celsiuse skaala temperatuuri mõõtmiseks – võib leida vahesid, ei tohi leida suhteid  Suhteskaala – nullpunkt fikseeritud absoluutselt – objekti pikkus, kaal, töötajate arv, käive, m

    Statistika
    Statistiline modelleerimine teooria kokkuvõte 2020
    19
    docx

    Statistiline modelleerimine teooria kokkuvõte 2020

    Statistiline modelleerimine – kokkuvõte Muutujad:  Sõltuvad muutujad (dependent, outcome variables) – muutujad, mis on uurimise keskmes, millele uurija arvab, et teised muutujad mõju avaldavad. Nö katseisikust sõltuv muutuja.  Sõltumatud muutujad (independent, predictor variables) – muutujad, mille kohta uurija arvab, et neil võiks olla mõju uuritavatele muutujatele.  Statistilise analüüsi keskmes on uurida, kuidas teatud tunnused koos muutuvad.  Kui on vaja muutujat iseloomustada, on kaks põhilist viisi, kuidas seda teha: o Milline on selle muutuja tüüpiline väärtus? o Kui hästi iseloomustab see tüüpiline väärtus kõiki mõõdetud juhtumeid? Ehk kui palju on varieeruvust selle tüüpilise väärtuse “ümber”? Statistika jagunemine:  Kirjeldav statistika (descriptive stat.) meetodid andmetest kokkuvõtete tegemiseks ning kirjeldamiseks. („65-70% U

    Statistiline modelleerimine
    Andmetöötlus psühholoogias
    7
    doc

    Andmetöötlus psühholoogias

    Soo defineerimine: Variable view - soolahtrist Values... - 1=mees, 2=naine - data view - ülevalt view - value labels ette linnuke Kasvavas järjekorras järjestamine: Teed lahtri aktiivseks mida järjestada soovid - ülevalt Data - Sort cases - valid mida soovid sortida - linnuke ascending lahtri ees kindlalt ja OK Mingi väärtuse minimaalse ja maksimaalse väärtuse leidmine, standardhälve, keskmine: Analyze - descriptive statistics - descriptives/frequencies (kui vaja ekstsessi, histogrammi kellukat jn) - valid mille puhul tahad uurida - Options - valid milliseid väärtusi leida tahad ja ok, vastused ilmuvad OutPuti aknasse. Charts all on võimalik kasutada histogrammi joonistamise võimalust. Joonisel olev küsimärk käib osutatud linnukese kohta. Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel. Küsimärk on juurde tehtud, et uurida, kas sellise tabeli koostamine on vajalik. Uue muutuja arvutamine: Transform - Compute variable - kirjutad u

    Ülevaade psühholoogiast
    Andmeanalüüsi kordamisküsimused 2015
    11
    docx

    Andmeanalüüsi kordamisküsimused 2015

    Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Tuleb püstitada uurimisküsimused: mida ja kelle käest tahan teada saada; millistele küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõ

    andmeanal��s
    RAKENDUSSTATISTIKA KONSPEKT
    19
    doc

    RAKENDUSSTATISTIKA KONSPEKT

    Jaotuse järskust ehk püstakust iseloomustab juhusliku suuruse ekstsess E (kurtosis) Ekstsess on null normaaljotuse korral. Kui püstakus on suurem, on keskkoht on kitsam. Väikese püstakuse korral "sabad" kaovad. Excelis on asümmeetria kordaja leidmiseks funktsioon KURT. Asümmeetriakordaja ja ekstsessi väärtusi on mõtet arvutada vaid suurte valimite korral (N > 50). Uuritavat jaotust kirjeldavate statistiliste parameetrite leidmiseks võib Excelis kasutada ka andmeanalüüsi vahendit Descriptive Statistics (Tools, Data Analysis). Näiteks on toodud ühe poe läbimüüki kirjeldava andmekogumi statistilised parameetrid, saadud vastava Exceli andmeanalüüsivahendiga 9 3 VALIKUURINGUD 3.1 Valimid ja nende moodustamine Terve uuritava kogumi analüüsimiseks puuduvad tihti võimalused (piiratud aeg, ressursid). Sellisel juhul kasutatakse kogumi statistiliste parameetrite (kogumi

    Planeetide geoloogia
    Andmeanalüüsi kordamisküsimused
    4
    doc

    Andmeanalüüsi kordamisküsimused

    Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Uurimisprobleem, kust probleem tuleb, teooria, praktiline probleem, varasemad uurimused Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esi

    andmeanal��s
    Ökonomeetria mõisted
    5
    doc

    Ökonomeetria mõisted

    Ökonomeetria mõisted 1. Autokorrelatsioon ja heteroskedastatiivsus võivad mudelis olla kahel põhjusel: 1) mudeli spetsifikatsioon on vale. Mudelist on välja jäetud mõned olulised muutujad ja/või mudeli funktsionaalne kuju on vale. Mudel tuleb ümber vaadata. 2) Tavalise vähimruutude meetodi rakendamise protseduur võib anda standardhälvete nihkega hinnangud. Tuleb kasutada uusi lähenemisi mudeli parameetrite hindamiseks. Autokorrelatsiooni testitakse aegridade puhul. Kui juhuslikud vead korreleeruvad omavahel, siis on olemas autokorrelatsioon. Kui autok. Esineb, tuleb mudel ümber vaadata, tuleb muuta spetsifikatsiooni. 2. Asümptootilised hinnangud ­ kui juhuslike vigade normaaljaotuse eeldus ei ole täidetud, siis usalduspiirid on asümptootilised. Nad on täpsed siis, kui valimi maht on lõpmatu; lõpliku valimi mahu korral usalduspiirid on ligikaudsed.

    Majandus
    Statistika konspekt
    19
    doc

    Statistika konspekt

    KIRJELDAVAD STATISTIKUD INTERVALLITUD REAS Kirjeldav statistika on numbriliste andmete organiseerimine ja summeerimine, see on vajalik andmeanallüüsi esimesel etapil. Valimit kirjeldatakse, kuid üldistusi ei laiendata üldkogumile. Kirjeldav statistika annab järgmist informatsiooni: ­ uuritava tunnuse väärtuste vahemik ­ tunnuse kõige tüüpilisemad väärtused ­ tunnuse varieeruvus Lisaks aitab kirjeldav statistika sõnastada hüpoteese ning tõlgendada uurimistulemusi. Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust keskmisest) Need on d

    Majandus




    Kommentaarid (0)

    Kommentaarid sellele materjalile puuduvad. Ole esimene ja kommenteeri



    Sellel veebilehel kasutatakse küpsiseid. Kasutamist jätkates nõustute küpsiste ja veebilehe üldtingimustega Nõustun