p(zk)= p(xi) p(yj). Sõltuvate juhuslike suuruste puhul peab arvestama tinglikke tõenäosusi. 28. Mis on juhusliku suuruse mood? Diskreetse juhusliku suuruse moodiks nimetame juhusliku suuruse kõige suurema p ( xmo ) =max p(x i) tõenäosusega esinevat väärtust.Seega väärtus xmo on mood, kui x i. Vastavalt kas on üks või mitu moodi, on unimodaalne või multimodaalne. 29. Mis on juhusliku suuruse keskväärtus? Diskreetse juhusliku suuruse keskväärtuseks EX nimetatakse matemaatilist ootust ehk EX= ∑ x i p (x i) ooteväärtuseks ehk arvu x ∈X i 30. Keskväärtuse omadused. Ec=c; E(cX)=cEX; E(X+Y)=EX+EY; E(X-Y)=EX-EY; sõltumatute juhuslike suuruste korral ka E(XY)=EXEY 31. Mis on dispersioon? Diskreetse juhusliku suuruse dispersiooniks DX nimetatakse hälbe ruudu keskväärtust keskväärtuse suhtes ehk arvu DX=E(X-EX)2
juhusliku suuruse võimalikud väärtused ja nende tõenäosused pi=P(X=xi).
Tõenäosusfunktsiooni võib esitada valemina, tabelina, arvupaaridena või graafikuna.
Def: Juhusliku suuruse jaotusfunktsiooniks nimetame funktsiooni, mis seab väärtusele
x vastavusse tõenäosuse, et X
Statistika teooria I 1. Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare. Esitada definitsioonid ja osata antud andmeväärtuste puhul neid mõisteid rakendada N x + x 2 + ... + x N xi Aritmeetiline keskmine: µ = 1 = i =1 N N N-üldkogumi maht Aritmeetilise keskmise erijuht on kaalutud keskmine:
Enne katse toimumist on tundmata. Üldjuhul tähistatakse X. Diskreetne juhuslik suurus on juhuslik suurus, mille väärtuste hulk on lõplik või loenduv. Praktiliselt vaatleme ainult selliseid DJS, mille võimalikud väärtused on 0, 1, 2, ... või alamhulk eelnevast. DJS jaotusseadus on eeskiri, mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X). kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima väärtuse vahel dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2= standardhälve - Standardhälve on ruutjuur dispersioonist 7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus on juhusliku suuruse asendikarakteristik, mille abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta. Keskväärtuse geomeetriline tõlgendus: jaotuse raskuskeskme projektsioon x-teljele. Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile nim detsiilideks, 25%kordseid protsentiile nim kvartiilideks, 50% korral mediaaniks. Mediaan on
vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi Assümeetria - Asümmeetria on jaotuskõvera maksimumi kõrvalekaldumine sümmeetriateljest. Kui jaotuskõvera maksimum (mood) on sümmeetriateljest (mediaan) paremal pool, on tegemist on negatiivse ehk vasakkaldelise asümmeetriaga. Kui maksimum on sümmeetriateljest vasakul, on tegemist positiivse ehk paremkaldelise asümmeetriaga
opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus(asendikarakteristik) iseloomustab juhusliku suuruse jaotuse keskkoha asukohta. Keskväärtuse geomeetriline tõlgendus: jaotus raskuskeskme projektsioon x-teljele Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. dispersioon on standardhälve ruudus ja standardhälve on vastavalt dispersiooni ruutjuur. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile
Tunnused: 1)0 <= F(x) <=1 2)F(x)kasvab;3)F(+lõpmatus)=1 Juhuslik suurus võib alluda binoomjaotusele, Poissoni jaotusele. Pidev juhuslik suurus omandab iga väärtuse tõenäosusega 0. Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon = ( | ( ) = ) = ( = ); pi ≥ 0; ∑pi=1 Omavahelised seosed: Ω X P R [0;1] D 9. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust DEF:kindlat suurust EX = ∫ ( ) nim juhusliku suuruse X keskväärtuseks. Seega juhusliku suuruse X keskväärtus EX kui kindel suurus on arv. Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1 Jaotusfunktsiooni abil on raske otsustada juhusliku suuruse käitumise üle mingi punkti ümbruses. Seetõttu kasutatakse lisaks jaotusfunktsioonile ka sellest tuletatud tihedusfunktsiooni. 2 4. Populatsioon ja valim, standardviga Populatsioon on kõigi objektide, isendite, esemete, nähtuste või seisundite kogum, mille kohta soovitakse järeldusi teha Populatsiooni neid objekte, mida on vaadeldud või uurimiseks välja valitud, kutsutakse valimiks Valimit, kus uuritava tunnuse jaotus on samasugune kui populatsioonis, nimetatakse esindavaks valimiks Standardhälve- ruutjuur dispersioonist (dispersioon pt.2)
pöördseoseid. Suurima tõepära meetod: Meetodi aluseks on põhimõte leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise tõenäosus. Vähimruutude meetod: Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel (nt regressioonanalüüsis). Nullhüpotees- kontrollitav väide Alternatiivhüpotees- nullhüpoteesi välistav alternatiivne väide Statistiline hüpotees tekib tavaliselt mingi vaadeldava juhusliku suuruse kohta käiva väite (oletuse, hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea tõenäosust tähistatakse ); teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks (võetakse vastu) (sellise vea tõenäosust tähistatakse ). Hüpoteeside kontrolli tavapärased sammud on järgmised:
usaldusnivoole nimetatakse juhuslikku vahemikku (ã , ã + ), mis katab hinnatava parameetri a tõenäosusega : P(|ã a| < ) = Arv > 0 iseloomustab hinnangu täpsust. Usalduspiirkonna leidmine p(a) S= 0 ã- ã+ a p(a) juhusliku suuruse a tihedusfunktsioon. Usalduspiirkonna (ã , ã + ) leidmiseks tuleb: 1. Arvutada valimi põhjal punkthinnang ã; 2. Ette anda usaldusnivoo (näiteks 95%; 99%); 3. Leida seosest P(|ã a| < ) = suurus , mis määrabki usalduspiirkonna. Normaaljaotuse keskväärtuse usalduspiirkond suure valimi korral Eeldame, et valimi maht on küllalt suur (n > 30) või standardhälve on eelnevalt teada (näiteks mõõteriista täpsus on teada). Olgu X ~ N(m, ). Leiame keskväärtuse punkthinnangu aritmeetilise keskmise abil: 1n x = xi
Xi; A∈ F. Juhusliku suuruse X jaotuseks nimetatakse funktsiooni D: R → [0;1] selliselt, et D(X(A)) = P(A) Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon pi=P ( ω| X ( ω ) =xi ) =P( X =x i) ; pi ≥ 0; ∑pi = 1 Omavahelised seosed: Ω X P [0; R 1] D 8. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c E(c) = cP(X=c) = c d. Keskväärtus on adiktiivne. Olgu juhuslikud suurused X ja Y, siis
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
Binoomjaotusega juhusliku suuruse esinevad üksteisest sõltumatult (st P(I on rikkis ja II töötab) = 0,9 * 0,95 + dispersioon on:DX´=pq 5. Poissoni sisuliselt eeldame, et rikaste protsent nii 0,1 * 0,8 = 0,935 jaotusega juhusliku suuruse keskväärtus on:EX=lamda6. Ühtlase hea tervisega kui ka halva tervisega N'ide21. Urnis on 5 punast 3 sinist ja 2 jaotusega juhusliku suuruse dispersioon on: kodanike hulgas on ühesugune). Leida rohelist kuulikest. Urnist võetakse DX=(b-a)*(b-a)/12 tõenäosus, et juhuslikult valitud kodanik üksteise järel kolm kuulikest. Milline on Tõenäosuse geomeetriline tähendus
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2. Ettekavatsetud- vastavalt eelteadmistele valitud uuritavad 3
· Mõõteskaalad, keskmised (aritmeetiline, mediaan, mood), · Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks)
b 1 cdx = 1, millest cb – ca = 1 ja c = a ba . Seega tihedusfunktsioon avaldub kujul: 0, kuix a 1 f(x) = , kui a≤x≤b. ba 0, kuix a Graafiliselt on ühtlase jaotusega jaotusfunktsioon esitatav kujul: 2.5 Juhusliku suuruse keskväärtus Juhuslik suurus on täielikult iseloomustatud tema jaotus- või tihedusfunktsiooniga. Lisaks kasutatakse aga juhuslike suuruste mitmete oluliste külgede esiletoomiseks täiendavalt arvkarakteristikuid. Üks olulisemaid on keskväärtus, mille ümbergrupeeruvad juhusliku suuruse võimalikud väärtused. Diskreetse juhusliku suuruse keskväärtus ehk matemaatiline ootus n avaldub kujul: EX = x i 1 i pi .
juhusliku suuruse kõikvõimalikud väärtused ja nende omandamise tõenäosused. 14. Juhusliku suuruse keskväärtuse ja dispersiooni omadused. Juhusliku suuruse keskväärtuseks (matemaatiliseks ootuseks) nimetatakse arvu, mis on määratud eeskirjaga Keskväärtuse omadused: Olgu a ja b suvalised konstandid, siis E(aX+b)= aEX+b. Olgu X ja Y suvalised juhuslikud suurused, siis E(X+Y) = EX+EY. Dispersioon on juhusliku suuruse keskväärtuse suhtes arvutatud hälbe ruudu keskväärtus. See on arv, mis kirjeldab juhusliku suuruse hajutatust tema keskväärtuse suhtes. Dispersiooni omadused: Konstandi dispersioon on null. D(aX + b) = a2DX 15. Binoom-, Poissoni-, ühtlase- ja normaaljaotuse keskväärtused ja dispersioonid. Katsetes esineb kahesuse element, kus tulemuseks on soodsatest sündmustest moodustuv diskreetne tõenäosusjaotus, mida nim binoomjaotuseks . Keskväärtus ja dispersioon
Tõenäosus, et
juhuslik suurus satub vahemikku x...x+x:
p(x < X < x+x) = F(x+x) F(x).
Jagame selle tõenäosuse vahemiku pikkusega x ja ja lähendame x nullile. Jaotusfunktsiooni tuletist
nimetatakse jaotustiheduseks ja tähistatakse f(x). Juhusliku suuruse mingisse vahemikku sattumise
tõenäosus leitakse f(x) abil nii:
p( < X < ) = f(x)dx
Juhuslikue suuruste arvkarakteristikud:
Asendikarakteristikud : matemaatiline ootus ehk keskväärtus
diskreetsel suurusel: mx=E[X] = M[X] = i=1nxipi
pideval suurusel : E[X] = -x*f(x)dx
Keskväärtus ja mood ;
Mediaan juhusliku suuruse mediaan on tema väärtus Me, mille puhul p(X
rühmitades võimalikud väärtused klassidesse. Näiteks kaalukategooriad maadlusvõistlustel. Tulemuste statistilise töötlemisvõimaluste laiendamise huvides kasutatakse ka ordinaalskaala kodeerimist arvuliseks (kvantitatiivseks) tunnuseks (näiteks keskmise hinde leidmiseks). Nii saadud statistiliste tulemuste tõlgendamisel tuleb olla ettevaatlik (ei või näiteks väita, et keskmine hinne 4,0 on kaks korda parem kui 2,0). Üldkogum ja valim Üldkogum on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi. Valim on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Nõuded valimile: 1. Valimi maht peab olema küllalt suur. 2. igal üldkogumi indiviidil peab olema võrdne võimalus sattuda valimisse. Neid kaht nõuet rahuldavat valimit nimetatakse representatiivseks e. esindavaks.
f(x) = lim P(xXx+x) / x; F(x) = f(x) dx x0 f(x) 0; f ( x ) dx 1 7. Binomiaalne jaotus. PXn =m= Cmn pmqn-m , kus P( F) = 1- p = q ja m = 0, 1, ...., n Sündmuste järgnevus ei= A F A F A, tagasipanekuga skeem 8. Hüpergeomeetriline jaotus PN,M n, m = CmM Cn-mN-M / CnN. Tagasipanekuta skeem 9. Poisson jaotus Pt(X=x) = (axe-a) / x! = fP(x,a) 10. Ühtlane (ristkülik) jaotus f(x) = 1/(b-a)}, kui a x b 11. Normaaljaotus. Normeeritud normaaljaotus 1 1 e x a ; a 0; 1 2 / 2 2 2 f ( x) ( x) ex /2 2 2 12. Eksponentsiaalne jaotus. (Töö)kindlusfunktsioon f(x) =e-x kui x 0. R(t) = e-t 13. Gammajaotus. Beetajaotus. Logaritmiline jaotus
Aritmeetiline 1) Rühmitamata andmed 2) i =1 Rühmitatud andmed x 1 k 1 n x = f x , kus n = k f i , k rühmade arv, x -klassi esindaja n i =1 i i i x = x i=1 n i =1 i (keskpunkt), 43. Juhusliku suuruse hajuvuse mõõte (dispersioon, standardhälve, variatsiooniulatus, variatsioonikordaja). DispersioonDX = E( X - EX )2 Standardhälve = DX [ - sigma] Mõõtmistulemuste jaoks kasutame tähiseid s2 ja s: 1) Rühmitamata 2) Rühmitatud n 1 2 1 k 2 2 s = 2s = f ( x - x) ( xi - x) n - 1 i i
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
Jaotusseadus- määrab täielikult juh. Su. Omadused (2 kuju: jaotusfunktsioon ja jaotustihedus) Jaotusfunkts- def tõenäosusena, et juh. Su. Väärtus ei ületa funkts argumenti x. Tingimused: monotoonsus, normeeritud. Jaotustih- jaotusfunkts tuletis Arvkarakteristikud- jaotusseaduse järgi leitavad funktsionaalid, millega opereerimine lihtsam (infokadu) Keskväärtus enimkasut, iseloom.juh.su. jaotuse keskkoha/tsentri asukohta Dispersioon ja standardhälve enimkasut hajuvuse iseloomust, seotud, standardhdispersiooni ruutjuur Kvantiilid- juh.su. p-kvantiil väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. ka protsentiilid (detsiil, kvartiil). Mediaan- jaotuse keskpunkt, sümmeetmediaan=keskv Moment- nende põhjal saab konstr eri momentkarakt, nt asümmeetria ja ekstsess. Asümmeetria näitab jaotuse sümmeetrilisust, kui sümm, siis võrdub 0. Kui pole 0, siis märk näitab, kumb saba väljavenitatum
standardvead ei ole korrektsed ja seega ei ole korrektsed ka parameetrite hinnangute usaldusvahemikud. Fkriteeriumi hinnang ei pruugi olla õige; c) mudel võib viia uurija valedele järeldustele, kui tegemist on statistiliste hüpoteeside kontrollimisega. Kasutatakse graafilist analüüsi. Juhuslik liige ehk jääkliige ui on juhuslik suurus, mille keskväärtus ehk matemaatiline ootus on võrdne nulliga. E (ui) = 0. Kui juhuslike liikmete dispersioon pole konstantne ning tema jaotus oleneb Xst, on tegemist heteroskedestatiivsusega. Parki test kui sõltumatute muutujate ln(Xi) vastava regressioonikordaja hinnang a1 on statistiliselt olulisel määral erinev nullist, siis esialgses mudelis on heteroskedestatiivsus. 11
MATEMAATIKA ARVESTUS 1. Kombinatoorika põhiprintsiibid-liitmis ja korrutamisprintsiip. Liitmisprintsiip- ,,kas üks või teine" . kui mingit objekti A on võimalik valida n erineval viisil ja objekti B m erineval viisil ning valida tuleb kas objekt A või objekt B, siis kõigi erinevate võimalike valikute arv on n + m. Korrutamisprintsiip- ,, nii üks kui ka teine" kui mingit objekti A on võimalik valida n erineval viisil ja objekti B m erineval viisil ning valida tuleb nii objekt A kui ka objekt B, siis kõigi võimalike erinevate valikute arv on n · m. 2. Permutatsiooni permutatsioonideks n erinevast elemendist nimetatakse nende elementide kõikvõimalikke erinevaid järjestusi. Pn = n! 3. Variatsioonid Variatsioonideks n elemendist k-kaupa (k n) nimetatakse nelemendilise hulga kõigi k-elemendiliste osahulkade elementide erinevaid järjestusi. Vnk = n!/(n-k)! k 0! = 1 Variatsioonides on oluline liikmete järjestus erinevalt kombinatsioonidest. Variatsioone on 2x ro
2) Statistilise uurimistöö etapid Uuringu ettevalmistamine (eesmärk, plaan, andmete vajadus, andmete kogumisviis, töötlemisviis, võimalikud järeldused). Statistiline vaatlus (küsitlus, dokumentide läbivaatamine, ankeedi korraldamine, andmete hankimine statistilistest andmebaasidest). Vaatlusandmete kokkuvõtt ja esialgne töötlemine. Andmete analüüs, järelduste ja üldistuste sõnastamine. 3) Statistilise vaatluse vead Metodoloogilised vead – valim ei kirjelda üldkogumit adekvaatselt. – vaatluse eesmärk ja objekt pole täpselt piiritletud. – vaatlusviis on ebaõnnestunult valitud. – vaatluse juhendmaterjalid pole üheselt mõistetavad. Registreerimisvead (tahtlikult tekitatud vead; mittetahtlikud vead). tahtlikud vead – andmeid moonutatakse meelega. mittetahtlikud vead – jämedad vead (tekivad mõõtmist, vaatlust või küsitlemist segava
Kvartiilid p-protsentiil on arv, millest p protsenti andmetest on temast väiksem või võrdne ja (100-p) protsenti suurem või võrdne. 25- protsentiili nim. esimene kvartiil. Mediaan on 50-protsentiil e. teine kvartiil. 75-protsentiil nim. kolmas kvartiil. Mood arvrea suurima sagedusega liige. Dispersioon 2= ((x1-x)2+(x2-x)2+...+(xN-x)2)/N =(i=1N(xi-x)2)/N Standardhälve =2 Haare arvrea suurima ja vähima väärtuse vahe 2. Sündmus ja tõenäosus. Kindel sündmus ja võimatu sündmus. Sündmus on tõenäosusteooria põhimõiste. Tavaliselt tähistatakse sündmusi suurte tähtedega ladina tähestiku algusest:A, B, C Vajadusel kasutatakse indekseid. Sündmuse tõenäosus on sündmuse toimumise võimalikkust näitav arv lõigult (0,1), mida tavaliselt tähistatakse tähega P.
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on