1. Mis on üldkogum?..............................................................................................................3 2. Mis on valim? Esinduslik valim.........................................................................................3 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik...............................................3 4. Arvuline tunnus – pidev, diskreetne...................................................................................3 5. Mittearvuline tunnus – järjestustunnus, nominaaltunnus...................................................3 6. Mis on juhuslik suurus?......................................................................................................3 7. Kuidas on defineeritud jaotusfunktsioon? Jaotusfunktsiooni skitseerimine, graafikult lugemine (kvantiil, kvartiil, mediaan, täiendkvantiil)............................................................3 8. Mis on juhusliku suuruse p-kvantiil? Mis on juhusliku suuruse
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel..........................................................................................................................7 2. Val
1. Tõenäosus ja tema leidmise näiteid arvutusvalemite abil Sõltumatute katsete kordamisel saadavat suhtelise sageduse piirväärtust kutsutakse sündmuse A toimumise tõenäosuseks P (A) := lim mn n Sündmus, mille toimumise tõenäosus on 0 võib aset leida lim n1 =0 n n-1 Sündmus, mille toimumise tõenäosus on 1 ei pruugi alati toimuda lim =1 n n Tõenäosus, et toimuvad nii sündmused A kui ka B, P(A B), on leitav valemiga P(A B) = P(A|B) P(B) Kui A ja B on teineteisest sõltumatud: P(A|B)=P(A) ja P(A B) = P(A) P(B) Tõenäosus, et toimub kas sündmus A või sündmus B, P(A U B), on leitav valemiga P(A U B) = P(A)
praktikumi ise välja printida. 9. Mittestatsionaarsed aegread. 10.Paneelandmed. · Iseseisev töö 11.Tõenäosusmudelid I. Töö õppematerjalidega, interaktiivsed demod, iseseisev töö andmefailidega, enesekontrolli testid, 12.Tõenäosusmudelid II. kodutöö ökonomeetriline projekt. Täpsemalt vt laiendatud ainekava. 1 Õppetöö korraldus Praktikumide rühmad · Auditoorne töö õppenädalatel 1-12. Bakalaureuseõppe üliõpilased peavad ÕIS-is valima kuulajaskonna rühma!
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1 8 8 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5 Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: Me = 41 Haare: 2
Loenguslaidid ja videod on saadaval õpikeskkonnas Moodle. Materjalid avanevad iga nädala alguses. • Praktikumid videotena ja kontaktõppes (soovijatele). – Andmeanalüüs programmis Gretl. – Ülesannete tekstid ja andmefailid õpikeskkonnas Moodle. • Onlain konsultatsioonid igal neljapäeval kell 10:00. • Iseseisev töö – Videote vaatamine, töö õppematerjalidega, interaktiivsed demod, iseseisev töö andmefailidega, enesekontrolli testid, kodutöö ökonomeetriline projekt. Kontaktõppes praktikumid soovijatele 2.-13. õppenädal Praktikum-konsultatsioonid on mõeldud neile üliõpilastele, kes lisaks ülesannete videotele soovivad mõnd ülesannet koos õppejõuga teha. Käsitletakse eelnenud nädala teema ülesandeid. Osalejate arv on piiratud. • T 14:00-15:30 praktikum arvutiklassis SOC-409 – Õppejõud Natalia Levenko – Maksimaalne osalejate arv 15. Soovijatel registreerida Moodles ennast
KIRJELDAVAD STATISTIKUD INTERVALLITUD REAS Kirjeldav statistika on numbriliste andmete organiseerimine ja summeerimine, see on vajalik andmeanallüüsi esimesel etapil. Valimit kirjeldatakse, kuid üldistusi ei laiendata üldkogumile. Kirjeldav statistika annab järgmist informatsiooni: uuritava tunnuse väärtuste vahemik tunnuse kõige tüüpilisemad väärtused tunnuse varieeruvus Lisaks aitab kirjeldav statistika sõnastada hüpoteese ning tõlgendada uurimistulemusi. Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust keskmisest) Need on d
Statistiline modelleerimine – kokkuvõte Muutujad: Sõltuvad muutujad (dependent, outcome variables) – muutujad, mis on uurimise keskmes, millele uurija arvab, et teised muutujad mõju avaldavad. Nö katseisikust sõltuv muutuja. Sõltumatud muutujad (independent, predictor variables) – muutujad, mille kohta uurija arvab, et neil võiks olla mõju uuritavatele muutujatele. Statistilise analüüsi keskmes on uurida, kuidas teatud tunnused koos muutuvad. Kui on vaja muutujat iseloomustada, on kaks põhilist viisi, kuidas seda teha: o Milline on selle muutuja tüüpiline väärtus? o Kui hästi iseloomustab see tüüpiline väärtus kõiki mõõdetud juhtumeid? Ehk kui palju on varieeruvust selle tüüpilise väärtuse “ümber”? Statistika jagunemine: Kirjeldav statistika (descriptive stat.) meetodid andmetest kokkuvõtete tegemiseks ning kirjeldamiseks. („65-70% U
Kõik kommentaarid