Leidsid 33 sarnast õppematerjali, mis on seotud failiga "KOLLOKVIUM 3: Tõenäosusteooria ja matemaatiline statistika". Need materjalid aitavad sul teemat sügavamalt mõista.
hüpoteesid, valim, kvartiil, teststatistik, standardhälve, kovariatsioon, protsentiil, tõenäosusteooria, kriteerium, valimid, kvartiilid, haare, protsentiili, stdev, standardse, osakaalu, regressioon, kollokvium, põhimõisted, definitsioonid, average, median, järjestatud, poolsumma, quartile, kolmandaks, arvrea, varieerub, standarthälve, correlStatistika teooria I 1. Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare. Esitada definitsioonid ja osata antud andmeväärtuste puhul neid mõisteid rakendada N x + x 2 + ... + x N xi Aritmeetiline keskmine: µ = 1 = i =1 N N N-üldkogumi maht Aritmeetilise keskmise erijuht on kaalutud keskmine:
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
Majandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
· Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks). · Hüpoteeside kontrollimine: nullhüpotees, sisukas hüpotees, Listra, E. Ökonomeetria. Aegread. kriitiline väärtus, olulisuse tõenäosus. Sauga, A. Statistika õpik majanduseriala üliõpilastele. · Kovariatsioon cov(x,y) ja korrelatsioonikordaja r (x,y) TTÜ Kirjastus, Tallinn, 2017. (Statistika kordamiseks) · Regressioon. Kordamiseks võib kasutada õpikut Sauga, A. ,,Statistika õpik majanduseriala üliõpilastele", TTÜ Kirjastus 2017
küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2. Ettekavatsetud- vastavalt eelteadmistele valitud uuritavad 3
vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi Assümeetria - Asümmeetria on jaotuskõvera maksimumi kõrvalekaldumine sümmeetriateljest. Kui jaotuskõvera maksimum (mood) on sümmeetriateljest (mediaan) paremal pool, on tegemist on negatiivse ehk vasakkaldelise asümmeetriaga. Kui maksimum on sümmeetriateljest vasakul, on tegemist positiivse ehk paremkaldelise asümmeetriaga
elementaarsündmused sisalduvad ka sündmuses B (nt A: ärtu sõdur, B: ärtu piltkaart, C: piltkaart korral A B C) Vastandsündmus A : sisaldab kõik elementaarsündmused, mis ei sisaldu sündmuses A (nt A: must kaart, A : punane kaart) sündmusega seondub tema tõenäosus, mis on mingi arv nullist kuni üheni. Tõenäosus- sündmuse esinemissagedust katsetes (ka võimalikkust, osakaalu vms). Tõenäosusteooria seisukohalt on tõenäosus sündmuse mõõduks ning tõenäosuse omadused tulenevad tõenäosusteooria aksiomaatikast : 1.Normeeritusaksioom: 0 P(A) 1 2 Liitmisaksioom: vastastikkku välistuvate sündmuste loenduva summa tõenäosus võrdub nende sündmuste tõenäosuste summaga, st P( Ai ) = P( Ai ) kui AiAj = Ø (-aditiivsus) 3.Tinglik tõenäosus määratletakse seosega P(A/B) = P(AB) / P(B) (tinglik tõenäosus näitab sündmuse A
funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus on juhusliku suuruse asendikarakteristik, mille abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta. Keskväärtuse geomeetriline tõlgendus: jaotuse raskuskeskme projektsioon x-teljele. Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile nim detsiilideks, 25%kordseid protsentiile nim kvartiilideks, 50% korral mediaaniks. Mediaan on
hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea tõenäosust tähistatakse ); teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks (võetakse vastu) (sellise vea tõenäosust tähistatakse ). Hüpoteeside kontrolli tavapärased sammud on järgmised: 1) Formuleeritakse kontrollitav hüpoteesipaar {H0, H1} ja valitakse teststatistik x. 2) Valitakse olulisuse nivoo . 3) Leitakse teststatistiku x kriitiline piirkond X1 . 4) Valimi järgi arvutatakse teststatistiku x väärtus. 5) Järelduse tegemine. Kui x väärtus satub kriitilisse piirkonda X1 , siis nullhüpotees H0 lükatakse tagasi, vastasel juhul H0 võetakse vastu. Pearsoni 2 test: 2- test on üks levinumaid teste jaotushüpoteeside kontrollimisel. Testis kasutatav
Eksponentkeskmist kasutatakse, kui on tegemist: ei ole mitte 1 keskmine väärtus, vaid rea tasandamine, rea silumise meetod keskmise taseme leidmisega väga pikkades aegridades – VALE keskmise taseme leidmisega momentreas ja ajavahemikud on võrdsed - VALE, kronoloogilist keskmist kasutaks keskmise taseme leidmisega perioodreas ja perioodid ei ole võrdsed - VALE, tavalist aritmeetilist keskmist kasutaks aegreaga ja väärtuste standardhälbe arvutamise juures - VALE, standardhälve leidmisel kasutatakse aritmeetilist keskmist aegreaga ja selle tasandamise juures – ÕIGE Tugeva samasuunalise lineaarse seose y=a+bx korral regressioonikordaja on alati vahemikus 0 kuni +1 - kindlalt vale, võib olla mis iganes (nii neg kui üle ühe), näitab x ühikulist mõju y-le lineaarse kor.kordaja ja regr.funktsiooni parameetri a märgid langevad kokku regr.kordaja peab olema eranditult positiivne - õige, (muidu võib olla neg) aga loe küsimust, samasuunaline.
Lineaarne regressioonimudelil: 1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi eesmärk on: 1. dispersioonide leidmine 2. uuritava nähtuste tegurite mõju olulisuse hindamine Valimi andmete põhjal saadi järgmised tulemused: aritm.keskmine=80 ja standardhälve 20. Üldkogumi maht 1200. Kui suur peaks olema valim, et teha kindlaks üle 110 väärtusega elementide osakaalu üldkogumis täpsusega +/-4 ühikut, usaldatavusega 95%. 1. 1700 (üldkogum 1200) 2. 1280 (üldkogum 1200) 3. Ei saa arvutada, sest dispersioon ei ole teada (standarthälbe väärtus on olemas, tõstam ruutu saan dispersiooni, 2. Tahan teha kindlaks elementide osakaalu, ehk et kui dispersiooni ei tea, saan arvutada võttes maksimaalse dispersiooni)
Tugevalt ebasümmeetrilise rea korral on ta tüüpilisem kui aritmeetiline keskmine. Kui reas on paaritu arv liikmeid, siis võrdub mediaan järjestatud rea asendilt keskmise liikmega, mistõttu moodi nimetatakse ka rea keskliikmeks. Kui reas on paarisarv liikmeid, siis leitakse ta järjestuses kahe keskmise liikme aritmeetilise keskmisena, mistõttu mediaan ei pruugi võrduda ühegi rea liikmega. · Kvartiil 4 võrdset osa (xmin, q1, q2 ehk mediaan, q3 ja xmax), pentiil 5 võrdset osa, sekstiil 6 võrdset osa, detsiil 10 võrdset osa, protsentiil 100 võrdset osa. · Momentideks nimetatakse rea liikmete väärtuste ja mingi arvu vaheliste hälvete astendamisel saadud arvude aritmeetilisi keskmisi. Arvu, millega momendi leidmisel hälbeid astendatakse, nimetatakse momendi järguks. VARIATSIOONINÄITARVUD · Variatsiooniamplituud (R= Xmax-Xmin)näitab äärmuste vahet
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust keskmisest) Need on dispersioon ja standardhälve. ASENDIKARAKTERISTIKUTE ARVUTAMINE 1.1. Tabuleerimata(rühmitamata) diskreetsed andmed Keskmine- näiteks KOKKU TOOTEID/NENDES ESINENUD VIGADE ARV. Näitetabelis= 2190/1500=1,46 viga on keskmiselt. X= / Mediaan- kasutatakse kumulatiivset sagedust. Me=(n+1)/2. Mediaan näitetabelis on 750,5, sellele vastav vigade arv on 1. Samamoodi arvutatakse teisi kvartiile. Mood- kõige sagedasem suurus. Näitetabelis on kõige rohkem(440 korda) 0 viga. Mood on 0.
maht ja k mudeli parameetrite arv) ja olulisuse nivool a2, siis saab vastu võtta sisuka (alternatiivse hüpoteesi) H1, mille kohaselt parameetri hinnang erineb statistiliselt oluliselt nullist (või cst). Kui hüpoteesi H1 vastu võtta ei saa (jäädakse 0hüpoteesi juurde), siis etteantud olulisuse nivool puudub statistiliselt oluline seos muutujate Y ja X vahel . 38. Standardhälve so ruutjuur dispersioonist. Mida suurem on standardhälve, seda suurem on tunnuse kui juhusliku suuruse hajuvus. Seda suurem on tunnuse erinevus keskväärtusest. 39. Statistilistel seostel baseeruv modelleerimine, hõlmab üldiselt üksikule lähenemist. Lähenemine kehtib aegridade jaoks. Teooriat ei püüta ümber lükata, vaid analüüsitakse teooria ja andmete kooskõla. 40. Tjaotus, lk 2728. Üks kasutatavamaid jaotusi
2015 plaan : • Vähendada kodutöö kirjaliku osa mahtu • Uurida ettevõtete asemel kaastudengeid • Alustame uuringu ettevalmistust kohe esimestes seminarides Kodutöö üldteema ‘innovatsioon/ õppimisvõime’ Kvantitatiivne küsimustik Kvalitatiivne case-study – intervjuud (avatud küsimused, läheb sügavuti) Kodutöös on kohustuslik leida 25 kontakti Kvantitatiivne küsimustik: statistiline analüüs, seosed kodutööti erinevad – valim 50 Kvalitatiivne intervjuu – trantskribeerimine, within-case analüüs, märksõnade leidmine. Psühholoogilised faktorid: • Values • Traits • Beliefs • Emotions • Cognitive bias Väärtused – saavutus, võim, traditsioonid Omadused – ausus, integrity Cognitive bias – tsempion, üleoptimism, tatus quo Emotisoonid – õnnelik – kurb, excited – calm, controlling - controlled Õppimisvõime: ACAP process: • Acquisition • Assimilation • Transformation • Exploitation
Ennutused, projektsioonid: kellele ja mille põhjal Ruumis (geograafiliselt): kas on võrreldavad (seadusandlus, normid, keel) Gruppide vahel: gruppide suurused Eri probleemide võrdlus Võrdlusülesanded andmeanalüüsis Üks v mittu tunnust? Jaotuse võrdlus v mingi parameetri võrdlus Kuidas jaotusi võrrelda? Millega võrrelda? Mille alusel võrrelda? Milliseid jaotusparameetreid võrrelda? Nt: -mood, mediaan, kvantiilid -keskmine, standardhälve, dispersioon - kujuparameetrid (ekstsess ja järsakuskordaja) Tunnuse jaotus Jäotus üldarvudena v protsentidena Segadustabel, risttabel Jaotus joonisel Võrdlus normaaljaotusega Parameetrite võrdlus Mood- kõige sagedasem väärtus v väärtusklass Mediaan- punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks
Binoomjaotus: DJS jaotus, mille korral jaotustabel defineeritakse valemiga (Bernoulli valem) P ( X = k ) = C nk p k (1 - p ) n-k , k=0,1,...,n. Juhuslik suurus X on sündmuse A toimumiste arv n sõltumatul katsel, kui sündmuse toimumise tõenäosus igal katsel on p. Sündmuse mittetoimumise tõenäosus igal katsel on siis q=1-p. Binoomjaotusega on näiteks praakdetailide arv korduval võtmisel, läbipõlevate pirnide arv. Keskväärtus: EX=np, dispersioon DX=npq, standardhälve npq Poisson'i jaotus: DJS jaotus, mille korral jaotustabel defineeritakse valemiga k - P( X = k ) = e , k=0,1,... k! Sarnaselt binoomjaotusele juhuslik suurus tekib n katsel toimuvast k sündmusest, lisaks n ja p0. Näiteks kirjavigade arv masinakirjutajal/sekretäril. Rikete arv seadmes. Tööõnnetuste arv. Keskväärtus: EX= , dispersioon DX= . Poissoni piirteoreem: kui katste arv n ja p0 nii, et np= , siis koondub k -
Selle saamiseks liidetakse kokku kõigi vastajate antud tunnuste väärtused ja jagatakse saadud summa vastajate arvuga. Tulemuseks on näitaja, mida võib käsitleda kui tüüpilist või läbilõikelist vastust vaatlusalusele küsimusele. Standardhälve- iseloomustab vastuste hajuvust keskmise ümber. Standardhälbe saab, kui leida kõigi vastajate vastuste erinevus üldisest keskmisest ning arvutada nende erinevuste keskmine. Seega näitab standardhälve tüüpilist erinevust üldisest keskmisest. Kui standardhälve on suur, siis võib arvata, et vastajate vastused on enamasti üldisest keskmisest kaugel. Kui standardhälve on väike, siis on vastajate vastused antud üldise keskmise lähedale. Viimasel juhul tundub, et vastajad on olnud oma vastustes küllaltki üksmeelsed.(kui kaugel on keskmine inimene keskmisest inimesest). Dispersioon- on standardhälbe ruut. Seda kasutatakse tunnuse hajuvuse iseloomustamiseks nagu standardhälvetki.
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
keskkonnas" ümbertrükk. MS Wordi dokumendina oli ta olemas juba pool aastat enne ülalnimetatud raamatu ilmumist ja sai siis ka tudengitele kätte jagatud. Kiviste raamatut võite kasutada kui lisa siinsele õpetusele, saamaks enam statistika ja ka tõenäosusteooria alaseid algteadmisi. Põhilised andmeanalüüsi teostamise vahendid MS Exceli keskkonnas on funktsioonid ja protseduurid, aga ka Chart Wizard'i abil lisatavad joonised ja Pivot Table'iga konstrueeritavad tabelid. Järgnevad kirjeldused baseeruvad versioonil MS Excel 97,
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
osaks. Nt kvartiilid on 25%, 50% ja 75%. 2.2 Millised on keskmised Mahukeskmised: Aritmeetiline kekmine Harmooniline keskmine Astmekeskmine Geomeetriline keskmine Asendikeskmised: 3 / 10 Mood Mediaan Kvantiilid 2.3 Millised on variatsiooninäitarvud Variatsiooniulatus Keskmine lineaarhälve Dispersioon Standardhälve Kvartiilhälve 2.4 Mis on mood? Mood on kõige sagedamini esinev väärtus. 2.5 Mis on mediaan? Mediaan on jaotuse keskmine liige, millest mõlemale poole jääb võrdne arv elemente. Mediaan jaotab järjestatud statistilise rea kaheks. 2.6 Olukord (loengukiledelt). Millal kasutada moodi / mediaani / aritm. keskmist. mitu olukorda (nominaalskaalal, järjeskaalal, intevallskaalal) Mood - Moodi saab kasutada nii nominaalskaala, järjestikskaala kui ka intervallskaala korral
Regressioonianalüüsi kõige üldisem eesmärk: 1. kirjldada korrlatiivset seost metemaatika funktsioonina Pidev juhuslik suurus... 2. võib omada ükskõik milliseid väärtusi tema võimalikke väärtusi hõlmavas arvuvahemikus. 3. juhuslikku suurust nim pidevaks juhuslikuks suurusesks, kui tema võimalike väärtuste hulk on loenduv. Normaalselt jaotuvas kogumis... 1. ei toimu väärtuste varieerumist 2. standardhälve peab võrduma nulliga 3. jaotuskõver on sümmeetriline 4. mõlemasuunalised kõrvalekalded ei ole võrdvõmalikud Normaaljaotuse korral 1. aritm, keskmine ei saa olla suurem ku geom. Keskmine 2. geom. Keskmine on alati aritm. Keskmisega võrdne 3. ei ole aritm. Keskmise ja mediaanig võrdsed 4. geom. Keskmine ja aritm. Keskmne on alati sama tähendusega 5. kolmandat järku standardmoment on võrdne nulliga 6
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud
valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X).
kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle
tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima
väärtuse vahel
dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2=
standardhälve - Standardhälve on ruutjuur dispersioonist
7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
x vastavusse tõenäosuse, et Xx. Tähistame F-ga
F(x )=P(Xx ) tõenäosus, et JS kuulub paljude väärtuste korral
0 0
teatavasse piirkonda P(a
Hindepunkte 1.00/1.00 Valige üks: a. 37 b. 41 c. 39 d. 40 e. 38 Sinu vastus on õige. Küsimus 19 Leidke järgmiste variantide seast õiged paarid: Õige Hindepunkte Induktiivne statist 1.00/1.00 Teeb otsusi üldkogumi kohta, kusjuures info allikaks on valim Tegeleb reaalsete andmete kirjeldamise, organiseerimise ning visualiseerimisega kasutades kirjeldav statistika tabelid, diagrammid ja arvkarakteristikud Sinu vastus on õige.
................5 2 Andmekogumit kirjeldavad parameetrid.....................................................................7 2.1 Statistilised keskmised......................................................................................... 7 2.2 Variatsiooninäitarvud...........................................................................................8 3 Valikuuringud............................................................................................................10 3.1 Valimid ja nende moodustamine........................................................................10 3.2 Valimvaatlus ......................................................................................................11 3.2.1 Valimvaatluse tüübid ..................................................................................11 3.3 Valimvaatluse meetodid ....................................................................................11 3.3.1 Mittetõenäosuslik valim ......
2. Mis on juhuslik sündmus? 3. Millisest aspektist me tahame sündmusi uurida? 4. Sündmuse matemaatiline definitsioon (elementaarsündmus, elementaarsündmuste ruum, sündmus). Elementaarsündmus on mingi vaadeldava protsessi või läbiviidava katse tulemus. Elementaarsündmuste ruumi moodustavad kõik elementaarsündmused ehk kõikvõimalike tulemuste hulk. Sündmuseks nimetatakse mingit suvalist elementaarsündmuste ruumi alamhulka. 5. Sündmuse toimumise kriteerium. Sündmuse toimumise juures on meile oluline vaid see, kas toimub või mitte. Sündmus toimub, kui toimub sündmust määravatest elementaarsündmustest üks. 6. Mitu erinevat sündmust saab moodustada n-elemendilise elementaarsündmuste ruumi põhjal? Tõesta! N-elemendilise elementaarsündmuste ruumi põhjal saab moodustada 2 n sündmust, mille hulka on arvestatud ka tühihulk. 7. Sündmuste liigitus (kindel, võimatu, vastandsündmus)
empiirilisele väärtusele vastav olulisuse tõenäosus ja olulisuse nivoo: H1 kui olulisuse tõenäosus p-value < a olulisuse nivoo 14) Olulisuse nivoo ja kahte liiki vead: I liiki vea tõenäosuse ülempiir on olulisuse nivoo a. Olulisuse nivoo alandamine vähendab I liiki vea tõenäosust, suurenda II liiki vea tõenäosust. H0 kehtib aga lükkan H0 tagasi – I liiki viga H0 ei kehti aga võtan vastu H0 – II liiki viga 15) Kovariatsioon, selle arvutusvalem ja omadused Kovariatsioon – Kahe suuruse koos muutumine, nii positiivne kui ka negatiivne Kovariatsiooni arvutusvalem xy=E[(X -x)(Y-y)] Kovariatsiooni omadused a. Sümeetrilisus b. Kui X=Y, siis kovariatsioon on dispersiooni üldistus. Dispersioon on kovariatsiooni erijuht: kovariatsioon iseendaga c. Sõltumatute juhuslik suuruste kovariatsioon on võrdne nulliga (vastupidine ei kehti)
= n x1 x 2 ... x n , kusjuures x geom. x arit . Ruutkeskmine ruutjuur antud arvude ruutude aritmeetilisest keskmisest. x12 + x 22 + ... + x n2 x ruutk . = n Hajuvuse karakteristikud Hajuvusmõõdud on a) minimaalne element xmin ja maksimaalne element xmax; b) variatsioonrea ulatus xmax - xmin; c) alumine kvartiil ja ülemine kvartiil; d) dispersioon; e) standardhälve; f) variatsioonikordaja. Minimaalne element xmin - tunnuse väärtuste hulgast vähim väärtus. Maksimaalne element xmin - tunnuse väärtuste hulgast suurim väärtus. Variatsioonrea ulatus xmax xmin. Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on 1
xii. Mõned isikud lahkuvad riskipopulatsioonist surres, mujale kolides või edasisest osalemisest keeldudes. e.xiii. Levimuse hindamine läbilõikelistes uuringutes. e.xiv. Haigestumuse hindamine kohortuuringus. f. Populatsioon ühikute kogum, mille hulgast me leiame oma uuringu osalised. Kogum, mille kohta tahame esitada väiteid oma uuringu tulemuste põhjal. g. Valim osa populatsioonist, mida me uurime. Et valimi uurimise tulemusi saaks üldistada populatsioonile, peab olema teada iga populatsiooni liikme võimalus valimisse sattuda. Lihtsaim variant võimalus valimisse sattuda on võrdne: juhuvalim. h. Sansid- vt valemit. Kasutatakse esinemisnäitajana harva. Sansside suhe on oluline esinemise võrdlusnäitaja. i