praagiks, leida tõenäosus, et võetud toode pärines teisest kastist. Nagu näite põhjal näeme: Juhul kus P( H i ) = pi = const siis eelnev Bayesi valem lihtsustub kujule P( A | H i ) P( H i | A ) = k P( A | H j =1 j ) kuna hüpoteesi tõenäosust väljendava teguri saame võtta summa märgi ette ja taandada. 6 3. Bernoull'i valem n sõltumatut katset, igal katsel on sündmuse A toimumise tõenäosus P(A)=p. Tõenäosus, et sündmus toimub m korda on: Pm ,n = C nm p m (1 - p ) n-m Sündmuse tõenäoseim toimumiste arv m0: (n + 1) p - 1 m0 (n + 1) p Väga paljudes protsessides rakendatav valem aga probleem, et suurte m ja n korral arvutada kas tülikas või pole üldse võimalik (proovige taskuarvutil leida 100!). Kui n on kombinatsioonide arvutamiseks väga suur on hiljem näidatud viisid, kuidas taandada teistele valemitele (jaotustele).
i=1 20. Bayesi valem ja tema tähendus. Bayesi valem näitab tinglikku tõenäosust P(H k|A), et sündmus A toimus just nimelt P(H k )∙ P (A∨H k ) P ( H k| A )= n sündmusega Hk. ∑ (P ( H i) ∙ P ( A|H i ) ) i=1 DISKREETNE JUHUSLIK SUURUS 21. Mis on juhuslik suurus? Juhuslik suurus on suurus, mis sõltuvalt juhusest võib omandada erinevaid väärtusi. 22. Mis on erinevus diskreetse ja pideva juhusliku suuruse vahel? Diskreetseks juhuslikuks suuruseks nimetatakse juhuslikku suurust, mis võib omandada lõpliku arvu või loenduva hulga väärtusi. Pidevaks juhuslikuks suuruseks nimetatakse juhuslikku suurust, mis võib omandada lõpmatu hulga väärtusi(reaalarvud mingite reaalarvude vahemikust). 23. Mis on diskreetse juhusliku suuruse jaotus, kuidas seda anda? Diskreetse juhusliku suuruse jaotuseks nimetatakse eeskirja P(X), mis seab igale juhusliku
Majandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
Statistika teooria I 1. Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare. Esitada definitsioonid ja osata antud andmeväärtuste puhul neid mõisteid rakendada N x + x 2 + ... + x N xi Aritmeetiline keskmine: µ = 1 = i =1 N N N-üldkogumi maht Aritmeetilise keskmise erijuht on kaalutud keskmine:
.
Juhuslikuk suurus- suurust, mis järjekordse katse tulemusel omandab mingi mitteennustatava väärtus
mingist võimalikust väärtuste hulgast.
Juhusliku suuruse põhiliigid:
diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik või loenduv (nt variantide nr'id)
pidev juhuslik suurus: võimalike väärtuste hulk on pidev (nt mõõtetulemused pidevalt skaalalt)
Juhusliku suuruse omadused määrab (täielikult) tema jaotusseadus:
jaotusfunktsioon - tõenäosus, et juhuslik suurus väärtus ei ületa funktsiooni argumenti x: F(x) = P (X
statistiline), mtteklassikalised(subjektiivne,intersubjektiivne) Juhuslikuks suuruseks nim suurust, mis järjekordse katse tulemusel omandab mingi mittennustatava väärtuse mingist võimalikust väärtuste hulgast. Diskreetne juhuslik suurus: võimalike väärtuste hulk on lõplik Pidev juhuslik suurus: võimelike väärtuste hulk on kontiinum Jaotusfunktsioon on tõenäosus, et juhusliku suuruse väärtus ei ületa funktsiooni argumenti. Jaotusfunktsioon peab rahuldama järgmisi tingimusi: monotoonsus (kui b>a, siis F(b)>F(a), normeeritus (x-lõpmatus korrral lim F(x)=0, xlõpmatus lim F(x)=1) Jaotustihedus on jaotusfunktsiooni tuletis. Arvkarakteristikud kujutavad endast mingeid jaotusseaduse järgi leitavad funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud,
Tunnikontrollis: Kui juhuslik suurus X on binoomjaotusega X~B(n; p), siis tema tõenäosusfunktsioon avaldub kujul P(X=x)= Cxn px (1-p)n-x astmes x (X=x)= Poissoni jaotus: P e- x! a ma seda kasutada küll ei oska xd - keskmine õnnetuste arv muidu 3. Jaotus- ja tihedusfunktsioon Siin olid Märdil ainult erinevad funktsioonid ja 0 teksti. Jaotusfunktsioon on juhusliku suuruse universaalne iseloomustaja, mis kirjeldab võimalike väärtuste tõenäosuste jaotust. Jaotustabel x 0 1 3 P(X=x) 0,8 0,1 0,1 Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1
vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi Assümeetria - Asümmeetria on jaotuskõvera maksimumi kõrvalekaldumine sümmeetriateljest. Kui jaotuskõvera maksimum (mood) on sümmeetriateljest (mediaan) paremal pool, on tegemist on negatiivse ehk vasakkaldelise asümmeetriaga. Kui maksimum on sümmeetriateljest vasakul, on tegemist positiivse ehk paremkaldelise asümmeetriaga
objekti kohta mingi tõenäosuslik mudel, sh hinnates mudeli arvparameetreid ja kontrollides erinevaid hüpoteese objekti mudeli kohta. Mediaani hinnang: - kasvavalt järjestatud valimi keskelement (kui valimi maht on paaritu arv) - kasvavalt järjestatud valimi keskelementide poolsumma (kui valimi maht on paarisarv) Haare: valimi suurima ja vähima elemendi vahe Statistika põhiteoreem: Empiiriline jaotusfunktsioon FN(x) on teoreetilise (üldkogumi) jaotusfunktsiooni F(x) nihutamata ja mõjus hinnang. Histogramm: Histogramm on enimkasutatav (üldkogumi) jaotustiheduse hinnang. Histogrammi kasutatakse ettekujutuse saamiseks üldkogumi jaotusseadusest ning ta kujutab endast tulpdiagrammi, mille tulpade kõrgused näitavad vastavasse vahemikku sattumise sagedust. 2-jaotus on kasutusel normaaljaotusega juhusliku suuruse dispersiooni hinnangu jaoks usaldusvahemike arvutamisel.
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
tähistatakse sümboliga S.Näide 1. Katse sündmusest.Näide10. Oletame näiteks, tulemuste hulka ega tulemuste võimalikuks tulemuseks täringu viskel et meil on urnis viis kuuli-kolm vaglet ja võimalikkust. Sõltumatuse sündmuste loetakse teatava tahu pealelangemist. kaks musta. Mis ontõenäsust,et pimesi korral kehtib võrdus P(AB)=P(A)P(B). Sellel katsel on 6 võimalikku tulemust ja valides saame esimesel korral valge Liitmistulause P(ABC)=P(A)+ P(B)+ vastav elementaarsündmuste hulk on:S = kuuli?P(A)=P(valge)=3/5=0.6eht60%. P(C)- P(AB)- P(AC)- P(BC)+ P(ABC) {1, 2, 3, 4, 5, 6 }.Katsetulemuste hulk Mis on tõenäosus, et ka teisel korral ühe ja sama katse seotud moodustab elementaarsündmuste saame valge kuuli? Kui esimest kuuli sündmus.Korrutamine P(ABCD)=
Tunnused: 1)0 <= F(x) <=1 2)F(x)kasvab;3)F(+lõpmatus)=1 Juhuslik suurus võib alluda binoomjaotusele, Poissoni jaotusele. Pidev juhuslik suurus omandab iga väärtuse tõenäosusega 0. Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon = ( | ( ) = ) = ( = ); pi ≥ 0; ∑pi=1 Omavahelised seosed: Ω X P R [0;1] D 9. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust DEF:kindlat suurust EX = ∫ ( ) nim juhusliku suuruse X keskväärtuseks. Seega juhusliku suuruse X keskväärtus EX kui kindel suurus on arv. Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c
11. Grupis on 30 õpilast. Kui suur on tõenäosus, et 2 õpilasel on samal päeval sünnipäevad? P= 2/30 12. Diskreetne ja pidev juhuslik suurus, nende jaotusfunktsioonid. Juhuslikku suurust, millel on lõplik või loenduvalt lõplik võimalike väärtuste hulk, nimetatakse diskreetseks. Tõenäosusjaotus. Juhuslikku suurust, mille võimalike väärtuste hulk on mitteloenduvalt lõpmatu (st väärtuste hulgaks on teatav(ad) arvude intervall(id)), nimetatakse pidevaks. Tihedusfunktsioon. 13. Diskreetse juhusliku suuruse tõenäosusjaotus. Diskreetse juhusliku suuruse X tõenäosusjaotuseks nimetatakse funktsiooni p(x), kus p(x) = P(X = x). See funktsioon omandab positiivseid väärtusi ainult nende argumentide korral, mis on juhusliku suuruse võimalikeks väärtusteks. Tõenäosusjaotust esitatakse kas valemina või tabeli abil, milles loetletakse juhusliku suuruse kõikvõimalikud väärtused ja nende omandamise tõenäosused. 14. Juhusliku suuruse keskväärtuse ja dispersiooni omadused.
Juhuslikud suurused liigitatakse diskreetseteks ja pidevateks. Diskreetne juhuslik suurus võib katse või vaatluse tulemusena omandada lõpliku või loenduva hulga väärtusi. Näiteks: üliõpilaste arv auditooriumis, täringu viskel saadud silmade arv jne. Pidev juhuslik suurus omandab mistahes väärtusi mingist lõplikust või loenduvast vahemikust. Näiteks: mistahes seadme tööiga, auto kütusekulu 100 km. 2.2 Diskreetse juhusliku suuruse jaotusseadus Diskreetse juhusliku suuruse jaotusseaduseks nimetatakse vastavust tema kõigi võimalike väärtuste x1, x2, …,xn ja nende tõenäosuste p1,p2, …,pn vahel. Jaotusseadust on võimalik esitada kas tabeli kujul jaotusreana X x1 x2 …. xn p p1 p2 …. pn Või graafiliselt jaotuspolügoonina n
2) Statistilise uurimistöö etapid Uuringu ettevalmistamine (eesmärk, plaan, andmete vajadus, andmete kogumisviis, töötlemisviis, võimalikud järeldused). Statistiline vaatlus (küsitlus, dokumentide läbivaatamine, ankeedi korraldamine, andmete hankimine statistilistest andmebaasidest). Vaatlusandmete kokkuvõtt ja esialgne töötlemine. Andmete analüüs, järelduste ja üldistuste sõnastamine. 3) Statistilise vaatluse vead Metodoloogilised vead – valim ei kirjelda üldkogumit adekvaatselt. – vaatluse eesmärk ja objekt pole täpselt piiritletud. – vaatlusviis on ebaõnnestunult valitud. – vaatluse juhendmaterjalid pole üheselt mõistetavad. Registreerimisvead (tahtlikult tekitatud vead; mittetahtlikud vead). tahtlikud vead – andmeid moonutatakse meelega. mittetahtlikud vead – jämedad vead (tekivad mõõtmist, vaatlust või küsitlemist segava
võimalikust näitav arv lõigul [0,1], mida tavaliselt Suhtelise sageduse omadused: 1. Sündmuse suhteline tähistatakse P. Võimatu sündmuse V tõenäosus P(V)=0, sagedus on mittenegatiivne. 2. Kindla sündmuse suhteline 17. Binoomjaotusega juhuslik suurus, selle kindla sündmuse K tõenäosus P(K)=1. Ülejäänud sagedus on 1 3. Võimatu sündmuse suhteline sagedus on jaotustabel, keskväärtus (tõestusega) ja dispersioon sündmused on juhuslikud sündmused. (tõestusega) Sündmuse A toimumise arv X kirjeldatud 0 4. Sündmuse A vastandsündmuse suhteline sagedus on 2. Tehted sündmustega
vea mõistet) 14. Mõõtemääramatus: allikad, käsitlus, hindamise meetodid Mõõtemääramatus on mõõtetulemusega seonduvparameeter, mis iseloomustab mõõtesuurusele põhjendatud omistavate väärtuste tõenäosust. Praktika näitab, et ühtki mõõtmist ei saa teha absoluutselt täpselt. Ja seda vahemikku, kuhu mõõdetava suuruse tõeline väärtus jääb, nimetataksegi mõõtemääramatuseks. Parameetriks võib olla näiteks standardhälve, mida nimetatakse standardmääramatuseks. Mõõtemääramatus sisaldab üldjuhul palju omponente. Mõnda neist saab hinnata määramatuse A-tüüpi(statistilisel viisil) hindamismeetodil mõõdiste seeriate statistilise jaotusega ja iseloomustada standardhälbega. Teisi komponente, mida saab hinnata määramatuse B- tüüpi(muul viisil) hindamismeetodil, saab samuti iseloomustada standardhälvetega, hinnatud tõenäosusjaotuste alusel, mis põhinevad kogemusel või täiendaval infol
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
Kvartiilid p-protsentiil on arv, millest p protsenti andmetest on temast väiksem või võrdne ja (100-p) protsenti suurem või võrdne. 25- protsentiili nim. esimene kvartiil. Mediaan on 50-protsentiil e. teine kvartiil. 75-protsentiil nim. kolmas kvartiil. Mood arvrea suurima sagedusega liige. Dispersioon 2= ((x1-x)2+(x2-x)2+...+(xN-x)2)/N =(i=1N(xi-x)2)/N Standardhälve =2 Haare arvrea suurima ja vähima väärtuse vahe 2. Sündmus ja tõenäosus. Kindel sündmus ja võimatu sündmus. Sündmus on tõenäosusteooria põhimõiste. Tavaliselt tähistatakse sündmusi suurte tähtedega ladina tähestiku algusest:A, B, C Vajadusel kasutatakse indekseid. Sündmuse tõenäosus on sündmuse toimumise võimalikkust näitav arv lõigult (0,1), mida tavaliselt tähistatakse tähega P.
determinandid. Epidemioloogia on tõenduspõhise meditsiini kui täpsusega, iseloomustab hetkeseisu. Levimusmäär PR (prevalence 6 Andmete tüübid. Üldkogum ehk populatsioon objektid, tõenduspõhise rahvatervise põhialuseks.) Kiirhinnangu meetod- on rate)-arvväärtused 0 ja 1 (0% ja 100%) vahel. kellele või millele üldistatakse uurimuse tulemusi. Valim uurija intensiivne meeskonnapõhine uurimismetoodika, kasutatakse esmase Kumulatiivnehaigestumus ehk CIR- isikute propotsioon, kes mingil käsutuses olevate objektide hulk. Objekt uurimisalune ühik, ülevaate andmiseks (sh sekkumiste efektiivsuse hindamiseks) ja selleks ajavahemiku algul on haigusvabad, kuid selle ajajooksul haigestuvad / üksikindiviid. Tunnus objektil mõõdetav näitaja. Andmestik
Lihtsustamise põhilised printsiibid. Kui kahe objekti (süsteemi) vahel on võimalik tuvastada pisemgi sarnasus, siis on nendel objektidel originaali mudeli vahekord: ühte objektidest võime käsitleda originaalina, teist aga mudelina. Objektide A ja B sarnasust tähistatakse A~B. Mudel peegeldab objekti alati lihtsustatult. Mudelid on kas materiaalsed või abstraktsed. Mudelites nagu süsteemideski, võib üheks muutujas olla aeg. Sellest tulenevalt on mudelid pideva ajaga või diskreetse ajaga. Ulatuslikult kasutatakse matemaatilisi mudeleid. Põhilised lihtsustamise printsiibid: muutujate agregeerimine, ekvivalenteerimine, sõltuvuste lihtsustamine, süsteemi dekomponeerimine 7. Protsessid. Determineeritud protsesside klassifitseerimine ja kirjeldamisviisid. Protsessid on üldjuhul olekud ja operaatorid ehk ajas muutuvad suurused, vektorid ja sündmused. Determineeritud protsess on protsess , mille tulevikku on võimalik täpselt prognoosida, vaja on vaid teada
küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2. Ettekavatsetud- vastavalt eelteadmistele valitud uuritavad 3
standardvead ei ole korrektsed ja seega ei ole korrektsed ka parameetrite hinnangute usaldusvahemikud. Fkriteeriumi hinnang ei pruugi olla õige; c) mudel võib viia uurija valedele järeldustele, kui tegemist on statistiliste hüpoteeside kontrollimisega. Kasutatakse graafilist analüüsi. Juhuslik liige ehk jääkliige ui on juhuslik suurus, mille keskväärtus ehk matemaatiline ootus on võrdne nulliga. E (ui) = 0. Kui juhuslike liikmete dispersioon pole konstantne ning tema jaotus oleneb Xst, on tegemist heteroskedestatiivsusega. Parki test kui sõltumatute muutujate ln(Xi) vastava regressioonikordaja hinnang a1 on statistiliselt olulisel määral erinev nullist, siis esialgses mudelis on heteroskedestatiivsus. 11
Xi; A∈ F. Juhusliku suuruse X jaotuseks nimetatakse funktsiooni D: R → [0;1] selliselt, et D(X(A)) = P(A) Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon pi=P ( ω| X ( ω ) =xi ) =P( X =x i) ; pi ≥ 0; ∑pi = 1 Omavahelised seosed: Ω X P [0; R 1] D 8. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c E(c) = cP(X=c) = c d. Keskväärtus on adiktiivne. Olgu juhuslikud suurused X ja Y, siis
keskväärtust ja standardhälvet (dispersiooni). 3. Statistiliste hüpoteeside kontrollimine Tunnused Katsel jälgitakse tavaliselt juhuslikke suurusi , mis väljendavad uuritava nähtuse omadusi ning avalduvad reeglina mõõtmis- või vaatlustulemustena. Neid omadusi nimetatakse tunnusteks. Katsel registreeritavad tunnused võivad olla kvalitatiivsed või kvantitatiivsed. Kvalitatiivsel tunnusel ei ole arvulisi näitajaid. Näiteks võib katsel kontroll-lamp süttida või mitte. Inimese silmade värv võib olla pruun, sinine, roheline, ... Kvantitatiivse tunnuse puhul saab katse käigus alati arvulise näitaja. Näiteks taevakeha heleduse mõõtmise tulemus, reisijate arv lennukis, saavutatud koht võistlustel jne. Tunnuste mõõtmisskaalad (I) Nominaalskaala koosneb üksteisest sõltumatutest klassidest, mida ei saa loogiliselt järjestada (rahvus, eriala, mullatüüp, elektrilaengu polaarsus ("+" või "-") ...)
Sündmus A ei ilmne kui esineb sündmus A. Sündmus A on sõltumatu sündmusest B kui tema tingimuslik on võrdne mittetingimusliku tõenäosusega. 3. Sündmuste algebralised operatsioonid. Sündmuste summa ja korrutis Summa: Sündmus C, mis ilmneb igal juhul kui ilmneb vähemalt üks sündmustest A või B. C = A B, Korrutis: On sündmus C, mis ilmneb juhul kui ilmnevad mõlemad sündmused A ja B. C = A B , A 4. Juhusliku suuruse mõiste X = X(e) 5. Jaotusseadus ja selle esitamine. Jaotusfunktsioon F(x) ja tema põhiomadused 6. Tõenäosuse tihedusfunktsioon f(x) ja tema põhiomadused jaotuse tõenäosuste tihedus: f(x) = lim P(x X < x+x)/ x omadused: 1. f(x) 0 on positiivne arv. 2. 3. Eksisteerib kasvõi üks väärtus (x, x+x), millele kehtib P(x X < x+x) = F(x) = f()dx - ksii). 7. Binomiaalne jaotus 1. JS nimetatakse binomiaalselt jaotuvaks (ka Bernoulli jaotus) parameetritega n ja m, kui ta võtab võimalikud väärtused 0, 1, ...., n tõenäosusega P(n, m) valemiga
Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika uurib statistika teoreetilisi aluseid, ta uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Üldkogum on kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi(Populatsioon).Valimiks nimetatakse mõõtmiseks võetud üldkogumi osa. Juhuslik valim, valimisse kuuluvad objektid valitakse välja täiesti juhuslikult üldkogumi kõigi objektide hulgast. Planeeritud valim valimisse kuuluvad objektid määratakse katseplaani järgi. Kõikne valim, valim langeb ühte üldkogumiga. Valim peab olema:*küllalt arvukas *igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Objekt-tunnustabel saab kasutada:* andmed õpilaste kohta* riigiakadeemiasse sisseastumiskatsed. Arvulised tunnused:*Pidev tunnus võib omandada kõiki
Määramisviisid: A)klassikalised (kombinatoorne, geomeetriline, statistiline) B) mitteklassikalised (subjektiivne/intersubjektiivne, kuuluvusfunkts väärtus..) Juh. Su suurus, mis järjekordse katse tulemusel omandab mingi mitteennustatava väärtuse mingist võimalikust väärtuste hulgast. Liigid: diskreetne ( võimalike väärtuste hulk lõplik/loenduv, , tingimused: mittenegatiivsus, normeeritus) ja pidev (kontiinum) Jaotusseadus- määrab täielikult juh. Su. Omadused (2 kuju: jaotusfunktsioon ja jaotustihedus) Jaotusfunkts- def tõenäosusena, et juh. Su. Väärtus ei ületa funkts argumenti x. Tingimused: monotoonsus, normeeritud. Jaotustih- jaotusfunkts tuletis Arvkarakteristikud- jaotusseaduse järgi leitavad funktsionaalid, millega opereerimine lihtsam (infokadu) Keskväärtus enimkasut, iseloom.juh.su. jaotuse keskkoha/tsentri asukohta Dispersioon ja standardhälve enimkasut hajuvuse iseloomust, seotud, standardhdispersiooni ruutjuur Kvantiilid- juh.su
Matemaatilise statistika kordamisküsimused õpikust 1. Selgita, millega tegeleb statistika, millega matemaatiline statistika. Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemiste meetodeid. 2. Mis on üldkogum, mis valim? Too näiteid. Üldkogum on looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Üldkogumi osa nimetatakse valimiks. Valim: - Igal üldkogumi objektil peab olema võimalus valimisse sattuda. -Valim peab olema arvukas. Kõikne valim ehk üldkogum. 3. Mis on planeeritud valim, mis juhuslik valim? Millist valimit nimetatakse kõikseks valimiks?
.......................................................................5 2. Tunnuste liigid.................................................................................................................... 5 3. Risttabel, filtreerimine........................................................................................................ 5 4. Rühmitamine.......................................................................................................................6 5. Jaotushistogramm, jaotusfunktsioon...................................................................................7 6. Kvantiil, täiendkvantiil .......................................................................................................8 7. Karakteristikud....................................................................................................................9 8. Lähendamine normaaljaotusega........................................................................................10 9