Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet). Nominaaltunnus mittearvuline tunnus, mille väärtused pole järjestatavad. 6. Juhuslik suurus ehk juhuslik muutuja suurus või muutuja, mille väärtus enne mõõtmist või katset ei ole teada. 7. Kuidas on defineeritud jaotusfunktsioon? Jaotusfunktsiooni skitseeri
1. Mis on üldkogum?..............................................................................................................3 2. Mis on valim? Esinduslik valim.........................................................................................3 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik...............................................3 4. Arvuline tunnus – pidev, diskreetne...................................................................................3 5. Mittearvuline tunnus – järjestustunnus, nominaaltunnus...................................................3 6. Mis on juhuslik suurus?......................................................................................................3 7. Kuidas on defineeritud jaotusfunktsioon? Jaotusfunktsiooni skitseerimine, graafikult lugemine (kvantiil, kvartiil, mediaan, täiendkvantiil)............................................................3 8. Mis on juhusliku suuruse p-kvantiil? Mis on juhusliku suuruse
1. MÕÕTMINE Mõõtmine on objektide võrdlemine - Korraga saab võrrelda ainult kaht objekti omavahel. Kui objekte palju, valitakse välja üks (etalon) ning teisi võrreldakse sellega. Otsene mõõtmine ja kaudne mõõtmine – otseste mõõtmiste kaudu Nimi- ehk nominaalskaala – objektide eristamiseks – sugu, rahvus, huvid, kaubakood, ettevõtte registrinumber Järjestusskaala – võimaldab objekte järjestada mingi tunnuse alusel – nt ettevõtted: väikesed, keskmised, suured – küsitlus: "poolt", pigem poolt kui vastu", "pigem vastu kui poolt", "vastu" – intervallid skaalajaotuste vahel pole võrdsed Intervallskaala – skaalajaotuste intervallid on võrdsed Vahemikskaala – nullpunkti asukoht kokkuleppeline – ajaskaala, Celsiuse skaala temperatuuri mõõtmiseks – võib leida vahesid, ei tohi leida suhteid Suhteskaala – nullpunkt fikseeritud absoluutselt – objekti pikkus, kaal, töötajate arv, käive, m
Andmeanalüüs Kordamisteemad 1) Uurimistsükkel: millised etapid eelnevad ja järgnevad andmeanalüüsile. Tuleb püstitada uurimisküsimused: mida ja kelle käest tahan teada saada; millistele küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõ
3. Sagedus, mis kogu üldkogumis peab võrduma 1-ga (Intervalli jäävate valimite arv jagatakse üldkogumi arvuga) 4. Sageduse suhteline tihendus saadakse kui sagedus jagatakse intervalli vahesummaga ( ) 5. Kumulatiivne sagedus saadakse liites väärtuste juurde järgmise rea sageduse ( ) väärtus Histogramm on astmeline kujund, mis kujundab endal ristkülikuid, mille alused on võrdsed intervalli vahesummaga ( ) ning kõrgus võrdne sageduse suhtelise tihedusega . Pindala on alati võrdne 1-ga. Kumulatiivse sageduse graafik kujundab endal ristkülikuid, mille alused on võrdsed intervalli vahesummaga ( ) ja kõrgus võrdne kumulatiivse sagedusega , kasvades 0-st 1-ni. 2. Juhuslik sündmus. Tehted sündmustega. Sündmuse sagedus ja tõenäosus.
Juhuslik sündmus on midagi, mis mingi katse tulemusel võib toimuda. Katse on mingi tingimuste kompleksi realiseerumine. Elementaarsündmused on mingid üksteist välistavad sündmused, millest iga katse korral üks tingimata toimub. Juhuslikud sündmused: *vastastikku välistuvad sündmused- ei sisalda samu elementaarsündmusi *vastastikku mittevälistuvad sündmused- sisaldavad samu elementaarsündmusi *sündmuste sisalduvus- kui toimub A, toimub ka B *vastansündmus- kõik elementaarsündmused, mis ei sisaldu sündmuses Tõenäosus iseloomustab sündmuse esinemissagedust katsetes. Tõenäousese määramisviisid: klassikalised(kombinatoorne, geomeetriline, statistiline), mtteklassikalised(subjektiivne,intersubjektiivne) Juhuslikuks suuruseks nim suurust, mis järjekordse katse tulemusel omandab mingi mittennustatava väärtuse mingist võimalikust väärtuste hulgast. Diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik Pidev juhuslik suurus: võimelike
Kui X on pidev juhuslik suurus ning teisendusfunktsiooon g(x) on monotoonne, siis avaldub y
jaotustihedus nii: fy(y)=fx[(y)]*['(y)]
Kui x on pidev juhuslik suurus ning teisendusfunktsioon g(x) pole monotoonne, tuleb g(x) jagada X
muutumispiirkonna osas monotoonsuspiirkondadeks.
Lineaarteisendus on ülalkirjeldatud juhusliku suuruse teisendamise olulisim erijuht, kus
teisendusfunktsioon saab kuju g(x)=a+bx
2. RAKENDUSSTATISTIKA ALUSED
Mediaani hinnang: kasvavalt järjestatud valimi keskelement, kasvavalt järjestatud valimi
keskelementide poolsumma.
Haare: valimi suurima ja vähima elemendi vahe.
Variatsioonirida- kasvavasse järjekorda reastatud valim
Järkstatistik: variantsioonirea liige järjekorranumbriga i.
Epiiriline jaotusfunktsioon avaldub variatsioonirea põhjal kujul: FN(x)=0, kui x
............................19 4.3.5. Hüpoteesid kahes üldkogumis binaarse tunnuse väärtuse osakaaludele.........................19 Lisa 1. Kriteeriumid sisuka hüpoteeside kontrollimiseks.......................................................20 Lisa 2. Valik Studenti t-jaotuse täiendkvantiilide väärtuseid................................................ 20 Andmetöötlus sotsiaalteadustes 3 SISSEJUHATUS Käesolevas kursuses käsitletakse uuringus kogutud andmete graafilist ja arvulist kirjeldamist, tunnustevahelise seoseid (korrelatsioon, regressioon) ning selgitatakse, kuidas saadud tulemusi üldistada üldkogumile. Seega kursuse läbinu peab oskama 1) kirjeldada kokkuvõtvalt uuringu käigus kogutud andmeid ja 2) anda selle põhjal statistiliselt usaldusväärseid üldistatud tulemusi. 1. ANDMEANALÜÜSI PÕHIMÕISTED
Kõik kommentaarid