Vajad kellegagi rääkida?
Küsi julgelt abi LasteAbi
Logi sisse

Andmeanalüüsi kordamisküsimused (0)

1 HALB
Punktid

Esitatud küsimused

  • Mis on R väljundis tunnuse unikaalsus uniqueness?
  • Keskmeid kasutatakse?
  • Mille järgi otsustatakse tema klassikuuluvus?
  • Palju mingi klassi tulemustest on false positive ?
  • Mis eesmärk on faktoranalüüsi kasutamisel?
  • Mis on tunnuse kommunaliteet?
  • Mis on R väljundis tunnuse unikaalsus uniqueness?
  • Mille alusel otsustatakse oluliste faktorite arv?
  • Milleks kasutatakse diskriminantanalüüsi?
  • Mitme diskriminantfunktsiooniga tuleb teoreetiliselt piirduda?
  • Mitme diskriminantfunktsiooniga tuleb piirduda?
  • Kuidas objektide diskriminantfunktsioonide väärtusi ja klasside keskmeid kasutatakse?
  • Mille järgi otsustatakse tema klassikuuluvus?
  • Kui palju mingi klassi tulemustest on false positive?

Lõik failist

Andmeanalüüsi kordamisküsimused

Sisukord


1Põhimõisted. 3
1.1Nimetage skaalatüübid. 3
1.2Mida võimaldab mingi skaala (asenda konkreetne skaala) 3
2Ühe tunnuse analüüs 3
2.1Kvantiilid - kirjuta välja kvartiilide 1,2 ja 3 väärtused 3
2.2Millised on keskmised 3
2.3Millised on variatsiooninäitarvud 4
2.4Mis on mood? 4
2.5Mis on mediaan? 4
2.6Olukord (loengukiledelt). Millal kasutada moodi / mediaani / aritm. keskmist. mitu olukorda (nominaalskaalal, järjeskaalal, intevallskaalal) 4
3Kahe tunnuse analüüs. Sageduste risttabel . Hii-ruut-test 4
3.1Risttabelis üks lahter esile toodud (värviga). Kuidas interpreteerida (rea / veeru / üldprotsent) 3 küsimust. 4
3.2Formuleerida hii-ruut-testi nullhüpotees . Teha otsustus näite põhjal. (Lisatingimusi pole vaja arvestada) 4
4Keskmiste võrdlus 5
4.1F-test. Hüpoteeside formuleerimine varieeruvuse kohta. Otsustuse tegemine 5
4.2t-test. Hüpoteeside formuleerimine keskmiste kohta. Otsustuse tegemine (vaata kas leidub f-testist sõltuv t-testi tulemus) 5
4.3Kahe tunnuse (ühe rühma) keskmiste võrdlus. Hüpoteeside formuleerimine keskmiste kohta. Otsustuse tegemine 5
5Korrelatsioon 5
5.1Nullhüpoteesi formuleerimine. Otsustuse tegemine ühe lahtri kohta. 5
5.2Kui seos on oluline, kuidas intepreteerite seda seost (ühe lahtri alusel). 5
6Regressioon 5
6. 1Mida näitab determinatsioonikoefitsient (protsentides) 5
6.2Formuleerida nullhüpotees mudeli kui terviku kohta. Teha otsustus (F-test). 5
6.3Kuidas interpreteeritakse tunnusele vastavat regressioonikoefitsienti B ( parameter estimate) 5
6.4Nullhüpoteesi formuleerimine konkreetse sõltumatu tunnuse sobivuse kohta lineaarsesse mudelisse. Otsustus ühe sõltumatu tunnuse põhjal. 5
6.5Kui kõik tunnused sobivad mudelisse, kuid tahame ühe neist välja visata - kumma karakteristiku (parameter estimate "B", standardized estimate " beta ") järgi me otsustuse teeme (näite põhjal). 6
7Faktoranalüüs 6
7.1Mis eesmärk on faktoranalüüsi kasutamisel ? 6
7.2Mis on (tunnuse) kommunaliteet? Mis on (R väljundis ) tunnuse unikaalsus (uniqueness)? 6
7.3Kuidas intepreteerite tunnuse kommunaliteeti (pööratud) näite alusel? 6
7.4Mille alusel otsustatakse oluliste faktorite arv? 6
7.5Mida näitab/mõõdab faktorkaal ( proportion / normeeritud osakaal)? 6
7.6Mida näitab faktori panus (eigenvalue / variance explained by each factor ). Näidata kahte tabelit (ka omavektorite tabelit). 6
7.7Mida näitab omaväärtuste osakaalude (faktorite panuste) kumulatiivne summa, näite alusel. 6
7.8kuidas faktoreid interpreteeritakse (mis tegevusi selleks teha tuleb) 6
7.9millised lähtemudeli tunnused milliste faktorite külge kinnistatakse. (rotated factor pattern tabel) näite põhjal. 6
7.10millised lähtemudeli tunnused faktor 1 külge kinnistatakse, näite põhjal. 7
8Klasteranalüüs 7
8.1Mis on klaster? 7
8.2Kuidas määrata hierarhilise klasteranalüüsi korral klasside arvu dendrogrammil? 7
8.3Nimetage mõni klasterdamise (kauguse või läheduse) mõõt. 7
8.4Kas klasteranalüüsi korral objektide klassikuuluvus on eelnevalt teada? 7
8.5Mis on klasteranalüüsi kasutamise eesmärk (oodatav tulemus). 7
9Diskriminant 7
9.1Milleks kasutatakse diskriminantanalüüsi? 7
9.2Mitme diskriminantfunktsiooniga tuleb teoreetiliselt piirduda? 7
9.2.1Mitme diskriminantfunktsiooniga tuleb piirduda? Formuleerida nullhüpotees ja otsustada näite alusel. 7
9.3Kuidas objektide diskriminantfunktsioonide väärtusi ja klasside keskmeid kasutatakse? Teooriaküsimus. 7
9.4Kas diskriminantanalüüsi korral objektide klassikuuluvus on eelnevalt teada? 7
9.5Kui tuleb tundmatu objekt ja meil on selle objekti klassifikatsioonifunktsiooni väärtus kõikide klasside korral teada, siis mille järgi otsustatakse tema klassikuuluvus? 8
9.6mitu protsenti teise klassi objektidest on prognoositud õigesti (näite alusel)? 8
9.6.1Kui palju mingi klassi tulemustest on false positive ? 8
9.6.2Kui palju on false negative 8
10Meetod/tunnus/skaala tabel 9
  • Põhimõisted.

  • Nimetage skaalatüübid.


    Nominaalskaala (nimetuste skaala) – andmete hindamisel on võimalikud vaid kõige lihtsamad operatsioonid nagu ekvivalentsus ja kuulumine hulka. Pole võimalik leida ei keskmist ega mediaani, sest nende andmetega pole võimalik teostada loogilisi operatsioone nagu „suurem kui“ või „väiksem kui“.
    N: mees/naine; eestlane/soomlane/hispaanlane
    Ordinaalskaala (järjestikskaala)– näitab andmete järjekorda, seejuures intervallid ei ole ühepikkused, vaid võivad olla suhtelised väärtused.
    N: koolihinded („väga hea“ ehk „5“ kuni „mitterahuldav“ ehk „1“); suurepärane /väga hea/hea jne
    Intervallskaala (vahemikskaala)kõik vahemikus on ühepikkused ning nullpunkti asukoht on kokkuleppeline.
    N: Celsiuse temperatuuriskaala ; vanusevahemikud 15-19 / 20-24/ 25-29
    Suhteskaala – nullpunktil on sisuline tähendus.
    N: pikkusmõõt, massimõõt
  • Mida võimaldab mingi skaala (asenda konkreetne skaala)


    Nominaalskaala
    =/≠
    Ordinaalskaala
    =/≠ ;
    Intervallskaala
    =/≠ ; ; +/−
    Suhteskaala
    =/≠ ; ; +/− ; ×/÷
  • Ühe tunnuse analüüs

  • Kvantiilid - kirjuta välja kvartiilide 1,2 ja 3 väärtused


    Kvantiilid on korrastatud statistilise rea liikmed, mis jagavad rea n-ks võrdse
  • Vasakule Paremale
    Andmeanalüüsi kordamisküsimused #1 Andmeanalüüsi kordamisküsimused #2 Andmeanalüüsi kordamisküsimused #3 Andmeanalüüsi kordamisküsimused #4 Andmeanalüüsi kordamisküsimused #5 Andmeanalüüsi kordamisküsimused #6 Andmeanalüüsi kordamisküsimused #7 Andmeanalüüsi kordamisküsimused #8 Andmeanalüüsi kordamisküsimused #9 Andmeanalüüsi kordamisküsimused #10
    Punktid 10 punkti Autor soovib selle materjali allalaadimise eest saada 10 punkti.
    Leheküljed ~ 10 lehte Lehekülgede arv dokumendis
    Aeg2014-11-01 Kuupäev, millal dokument üles laeti
    Allalaadimisi 39 laadimist Kokku alla laetud
    Kommentaarid 0 arvamust Teiste kasutajate poolt lisatud kommentaarid
    Autor nonamesuitable Õppematerjali autor
    TTÜ Andmeanalüüsi aine kordamisküsimuste vastused (T. Veskioja)

    Sarnased õppematerjalid

    thumbnail
    22
    docx

    Statistika kordamisküsimused

    1. MÕÕTMINE Mõõtmine on objektide võrdlemine - Korraga saab võrrelda ainult kaht objekti omavahel. Kui objekte palju, valitakse välja üks (etalon) ning teisi võrreldakse sellega. Otsene mõõtmine ja kaudne mõõtmine – otseste mõõtmiste kaudu Nimi- ehk nominaalskaala – objektide eristamiseks – sugu, rahvus, huvid, kaubakood, ettevõtte registrinumber Järjestusskaala – võimaldab objekte järjestada mingi tunnuse alusel – nt ettevõtted: väikesed, keskmised, suured – küsitlus: "poolt", pigem poolt kui vastu", "pigem vastu kui poolt", "vastu" – intervallid skaalajaotuste vahel pole võrdsed Intervallskaala – skaalajaotuste intervallid on võrdsed  Vahemikskaala – nullpunkti asukoht kokkuleppeline – ajaskaala, Celsiuse skaala temperatuuri mõõtmiseks – võib leida vahesid, ei tohi leida suhteid  Suhteskaala – nullpunkt fikseeritud absoluutselt – objekti pikkus, kaal, töötajate arv, käive, m

    Statistika
    thumbnail
    19
    docx

    Statistiline modelleerimine teooria kokkuvõte 2020

    Statistiline modelleerimine – kokkuvõte Muutujad:  Sõltuvad muutujad (dependent, outcome variables) – muutujad, mis on uurimise keskmes, millele uurija arvab, et teised muutujad mõju avaldavad. Nö katseisikust sõltuv muutuja.  Sõltumatud muutujad (independent, predictor variables) – muutujad, mille kohta uurija arvab, et neil võiks olla mõju uuritavatele muutujatele.  Statistilise analüüsi keskmes on uurida, kuidas teatud tunnused koos muutuvad.  Kui on vaja muutujat iseloomustada, on kaks põhilist viisi, kuidas seda teha: o Milline on selle muutuja tüüpiline väärtus? o Kui hästi iseloomustab see tüüpiline väärtus kõiki mõõdetud juhtumeid? Ehk kui palju on varieeruvust selle tüüpilise väärtuse “ümber”? Statistika jagunemine:  Kirjeldav statistika (descriptive stat.) meetodid andmetest kokkuvõtete tegemiseks ning kirjeldamiseks. („65-70% U

    Statistiline modelleerimine
    thumbnail
    7
    doc

    Andmetöötlus psühholoogias

    Soo defineerimine: Variable view - soolahtrist Values... - 1=mees, 2=naine - data view - ülevalt view - value labels ette linnuke Kasvavas järjekorras järjestamine: Teed lahtri aktiivseks mida järjestada soovid - ülevalt Data - Sort cases - valid mida soovid sortida - linnuke ascending lahtri ees kindlalt ja OK Mingi väärtuse minimaalse ja maksimaalse väärtuse leidmine, standardhälve, keskmine: Analyze - descriptive statistics - descriptives/frequencies (kui vaja ekstsessi, histogrammi kellukat jn) - valid mille puhul tahad uurida - Options - valid milliseid väärtusi leida tahad ja ok, vastused ilmuvad OutPuti aknasse. Charts all on võimalik kasutada histogrammi joonistamise võimalust. Joonisel olev küsimärk käib osutatud linnukese kohta. Display frequency tables annab käskluse moodustada iga pikkuse kohta sagedustabel. Küsimärk on juurde tehtud, et uurida, kas sellise tabeli koostamine on vajalik. Uue muutuja arvutamine: Transform - Compute variable - kirjutad u

    Ülevaade psühholoogiast
    thumbnail
    11
    docx

    Andmeanalüüsi kordamisküsimused 2015

    Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Tuleb püstitada uurimisküsimused: mida ja kelle käest tahan teada saada; millistele küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõ

    andmeanal��s
    thumbnail
    19
    doc

    RAKENDUSSTATISTIKA KONSPEKT

    Jaotuse järskust ehk püstakust iseloomustab juhusliku suuruse ekstsess E (kurtosis) Ekstsess on null normaaljotuse korral. Kui püstakus on suurem, on keskkoht on kitsam. Väikese püstakuse korral "sabad" kaovad. Excelis on asümmeetria kordaja leidmiseks funktsioon KURT. Asümmeetriakordaja ja ekstsessi väärtusi on mõtet arvutada vaid suurte valimite korral (N > 50). Uuritavat jaotust kirjeldavate statistiliste parameetrite leidmiseks võib Excelis kasutada ka andmeanalüüsi vahendit Descriptive Statistics (Tools, Data Analysis). Näiteks on toodud ühe poe läbimüüki kirjeldava andmekogumi statistilised parameetrid, saadud vastava Exceli andmeanalüüsivahendiga 9 3 VALIKUURINGUD 3.1 Valimid ja nende moodustamine Terve uuritava kogumi analüüsimiseks puuduvad tihti võimalused (piiratud aeg, ressursid). Sellisel juhul kasutatakse kogumi statistiliste parameetrite (kogumi

    Planeetide geoloogia
    thumbnail
    4
    doc

    Andmeanalüüsi kordamisküsimused

    Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Uurimisprobleem, kust probleem tuleb, teooria, praktiline probleem, varasemad uurimused Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esi

    andmeanal��s
    thumbnail
    5
    doc

    Ökonomeetria mõisted

    Ökonomeetria mõisted 1. Autokorrelatsioon ja heteroskedastatiivsus võivad mudelis olla kahel põhjusel: 1) mudeli spetsifikatsioon on vale. Mudelist on välja jäetud mõned olulised muutujad ja/või mudeli funktsionaalne kuju on vale. Mudel tuleb ümber vaadata. 2) Tavalise vähimruutude meetodi rakendamise protseduur võib anda standardhälvete nihkega hinnangud. Tuleb kasutada uusi lähenemisi mudeli parameetrite hindamiseks. Autokorrelatsiooni testitakse aegridade puhul. Kui juhuslikud vead korreleeruvad omavahel, siis on olemas autokorrelatsioon. Kui autok. Esineb, tuleb mudel ümber vaadata, tuleb muuta spetsifikatsiooni. 2. Asümptootilised hinnangud ­ kui juhuslike vigade normaaljaotuse eeldus ei ole täidetud, siis usalduspiirid on asümptootilised. Nad on täpsed siis, kui valimi maht on lõpmatu; lõpliku valimi mahu korral usalduspiirid on ligikaudsed.

    Majandus
    thumbnail
    19
    doc

    Statistika konspekt

    KIRJELDAVAD STATISTIKUD INTERVALLITUD REAS Kirjeldav statistika on numbriliste andmete organiseerimine ja summeerimine, see on vajalik andmeanallüüsi esimesel etapil. Valimit kirjeldatakse, kuid üldistusi ei laiendata üldkogumile. Kirjeldav statistika annab järgmist informatsiooni: ­ uuritava tunnuse väärtuste vahemik ­ tunnuse kõige tüüpilisemad väärtused ­ tunnuse varieeruvus Lisaks aitab kirjeldav statistika sõnastada hüpoteese ning tõlgendada uurimistulemusi. Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust keskmisest) Need on d

    Majandus




    Kommentaarid (0)

    Kommentaarid sellele materjalile puuduvad. Ole esimene ja kommenteeri



    Sellel veebilehel kasutatakse küpsiseid. Kasutamist jätkates nõustute küpsiste ja veebilehe üldtingimustega Nõustun