Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Andmeanalüüsi kordamisküsimused 2015". Need materjalid aitavad sul teemat sügavamalt mõista.
hüpotees, valim, statistik, juhu, üldkogum, nullhüpotees, alternatiiv, normaaljaotus, risttabel, vastaja, hüpoteesid, risttabeli, nominaal, arvtunnus, usaldusnivoo, nominaaltunnus, standardhälve, usaldusvahemik, juhuslikud, järjestustunnus, usalduspiirid, kordajad, vastusevariandid, kvartiil, hajuvus, sisukas, astak, vaatlus, arvuline, hinnangudVõimalikult lühike, viisakalt sõnastatud, lihtsa grammatikaga, sisaldab infot ühe teema kohta, sama tähendusega kõigi jaoks, sobival spetsiifilisuse tasemel Ankeedi struktuur, sissejuhatus, miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed, tänud juba ette, lihtsamad küsimused, avaküsimused, keerulised ja põhiküsimused. Sotsiaal-demograafilline osa, lõpusõna ja tänud. Küsimuste tüübid: Avatud ( vastaja vastab oma sõnadega) Suletud (vastajale on ette antud vastuse variandid) Vastuste variandid: Selged ja täpsed, ei tohi kattuda, peavad sellegipoolest ära katma kõik vastuse variandid. 3) Tunnuste tüübid, näited selle kohta. Nominaalskaala ehk nimeskaala ( Esitab või võimaldab esitada vastuse nimetuse või kirjeldusena nt vastaja rahvus, lemmikvärv ja perekonnaseis)
Eri probleemide võrdlus Võrdlusülesanded andmeanalüüsis Üks v mittu tunnust? Jaotuse võrdlus v mingi parameetri võrdlus Kuidas jaotusi võrrelda? Millega võrrelda? Mille alusel võrrelda? Milliseid jaotusparameetreid võrrelda? Nt: -mood, mediaan, kvantiilid -keskmine, standardhälve, dispersioon - kujuparameetrid (ekstsess ja järsakuskordaja) Tunnuse jaotus Jäotus üldarvudena v protsentidena Segadustabel, risttabel Jaotus joonisel Võrdlus normaaljaotusega Parameetrite võrdlus Mood- kõige sagedasem väärtus v väärtusklass Mediaan- punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks Kvantiilid Aritmeetiline keskmine e keskväärtus Standardhälve kui kaugel on keskmine inimene keskmisest Dispersioon standardhälbe ruut
Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed tänud juba ette või lõpus · Lihtsamad küsimused, avaküsimused · Keerulisemad küsimused, põhiküsimused
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest. Selle korral on konkreetse üksiku väärtuse esinemise tõenäosus 0 Jaotustihedus jaotusfunktsiooni tuletis:
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
Mult.Kollineaarsuse avastamiseks viiakse lisaks regressioonianalüüsile läbi ka korrelatsioonianalüüs. St leitakse paarikaupa kõigi tunnuste korrelatsioonikordajad ja võrreldakse sõltuvate tunnuste omavahelist korrelatsiooni ja korrelatsiooni sõltuva tunnusega. Nihketa hinnang hinnangu keskväärtus võrdub parameetri tegeliku väärtusega. 27. Negatiivne korrelatsioon -- ühe suuruse kasvades teine suurus kahaneb. 28. Normaaljaotus On pidev jaotus. Kirjeldatav 2 parameetriga: keskväärtusega (müü ) ja dispersiooniga ( 2 st. ruut). Normaaljaotuse korral keskväärtus, mood ja mediaan ühtivad. Sobib tunnuste kirjeldamiseks, millel on teatud keskmine tase. Selle keskmise taseme lähedased väärtused esinevad tihti, suuri kõrvalekaldeid keskmisest väärtusest on harva. Graafiku joon: siil vaiba all sümmeetriline keskväärtuse suhtes. PS
● Statistiliste meetoditega hinnatavad mudeli parameetrid (b). ● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1 Jaotusfunktsiooni abil on raske otsustada juhusliku suuruse käitumise üle mingi punkti ümbruses. Seetõttu kasutatakse lisaks jaotusfunktsioonile ka sellest tuletatud tihedusfunktsiooni. 2 4. Populatsioon ja valim, standardviga Populatsioon on kõigi objektide, isendite, esemete, nähtuste või seisundite kogum, mille kohta soovitakse järeldusi teha Populatsiooni neid objekte, mida on vaadeldud või uurimiseks välja valitud, kutsutakse valimiks Valimit, kus uuritava tunnuse jaotus on samasugune kui populatsioonis, nimetatakse esindavaks valimiks Standardhälve- ruutjuur dispersioonist (dispersioon pt.2)
.. 200-300 200-300 250 28 7000 38 -179,5 32220,25 ... 300-400 300-400 350 42 14700 80 -79,5 6320,25 ... 400-600 400-600 500 50 25000 130 70,5 4970,25 ... Üle 600 600-1000 800 20 16000 150 370,5 137270,3 ... Kokku 150 64425 4822025 USALDUSINTERVALLID Usaldusintervalle on vaja selleks, et hinnata valimi ja üldkogumi vastavust. Valim on juhuslik,võib esineda erinevaid tulemusi. Tehes üldistusi üldkogumile,peame veaga arvestama. Usaldusintervalle kasutataksegi selle vea hindamiseks. Keskmine esindusviga. Valimi suurenedes esindusviga väheneb. Selle leidmiseks on erinevad valemid lähtuvalt sellest, kas üldkogumi suurus on teada või ei ole.(valimi mahu võtmisel ei arvestata missing lahtrit) Piiresindusviga. Jälle kaks valemit lähtuvalt üldkogumist. Kasutatakse t-jaotuse täiendkvantiili
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
xii. Mõned isikud lahkuvad riskipopulatsioonist surres, mujale kolides või edasisest osalemisest keeldudes. e.xiii. Levimuse hindamine läbilõikelistes uuringutes. e.xiv. Haigestumuse hindamine kohortuuringus. f. Populatsioon ühikute kogum, mille hulgast me leiame oma uuringu osalised. Kogum, mille kohta tahame esitada väiteid oma uuringu tulemuste põhjal. g. Valim osa populatsioonist, mida me uurime. Et valimi uurimise tulemusi saaks üldistada populatsioonile, peab olema teada iga populatsiooni liikme võimalus valimisse sattuda. Lihtsaim variant võimalus valimisse sattuda on võrdne: juhuvalim. h. Sansid- vt valemit. Kasutatakse esinemisnäitajana harva. Sansside suhe on oluline esinemise võrdlusnäitaja. i
· Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks). · Hüpoteeside kontrollimine: nullhüpotees, sisukas hüpotees, Listra, E. Ökonomeetria. Aegread. kriitiline väärtus, olulisuse tõenäosus
Majandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
Me võime veendunult öelda, et seda tüüpi olukorras on see lahenduseks. Uurimus teeb järelikult meie elu kergemaks, mitte ainult äris, vaid üldiselt. Äriuuringud ei erine palju praktilisest probleemide lahendamisest. KVALITATIIVNE JA KVANTITATIIVNE UURING KVALITATIIVSED MEETODID KVANTITATIIVSED MEETODID · Rõhk arusaamisel · Rõhk testimisel ja tõestamisel · Fookus vastaja vaatenurgal · Fookus sündmuste faktidel ja/või põhjustel · Interpretatsioon ja ratsionaalne lähenemine · Loogiline ja kriitiline lähenemine · Vaatlused ja mõõtmised loomulikus ümbruses · Kontrollitud mõõtmine · Subjektiivne asjaosalise vaatekoht ja lähedus · Objektiivne kõrvalseisja vaatekoht distantsiga andmetele andmetest
normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud normaaljaotuse kohaselt: kui juhuslik suurus Y on jaotunud normaaljaotuse järgi, siis juhuslik suurus X=expY on jaotunud lognormaalse jaotusseaduse järgi
19. 15, binoomjaotus, parameetrid, parameeter Test 6 pidev, diskreetne, poissoni jaotus, jaotusseadus jaotusseadus, eksponentjaotus normaaljaotus, normaaljaotus normaaljaotus negatiivne väärtus poissoni jaotus Test 7 kogum, klastervalik, kihtvalik, lihtne juhuvalik, süstemaatiline valik tõenäosuslik valikumeetod, empiiriline valik fikseeritud samm, süstemaatiline valik, punkthinnang nihketa, efektiivne, optimaalne keskväärtus, normaaljaotus, suur valim keskväärtuse standardviga standardhälve standardviga, keskväärtuse usalduspiirid valimvaatlus usaldatavus suur valim, usaldatavus suurem üldkogumi keskväärtuse usaldusvahemiku laius, vabadusastmete arv studenti jaotus mediaani usalduspiiride leidmisel kasutatakse binoomjaotust, loend on ülekaetud ankeetküsitluse läbiviimisel, mõõtmisvahendi viga Test nr 8 sisukas hüpotees, järeldus peale parameetri empiirilise väärtuse võrdlust
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
Hüpoteeside koltrollimine 1. Oletus, väide 2. Sobiv hüpoteeside paar (millised tunnused on vaja võrrelda) 3. Olulise tõenäosus (p) 4. Järeldus (p>0,05 H0, p<0,05 H1) 5. Lõppvastus (sama, mis oli küsitud hüpoteesis) T-test sobivad valemid 1. T-test H0: keskmised võrdsed H1: keskmised erinevad 2. F-test sõltumatud valemid H0: dispersioonid võrdsed H1: dispersioonid erinevad P>a H0, P<0,05 H1 Võrdsete disp mittevõrdsete disp t-test t-test 3. Olulisuse tõenäosus 4. Lõppvastus (p<0,05 H0) Vormistus nii nagu iseseisvates töös Ülesanne Eesmärk Tunnusetüüp 1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, millel on vähe
muutumisvahemiku sees kõik juhusliku suuruse väärtused on tekke mõttes samaväärsed. Jaotuse parameetriteks on juhusliku suuruse muutumisintervalli alumine piir a ja ülemine piir b. Eksponentjaotus (pidev) kirjeldab mingi sündmuse toimumisaja jaotust eeldusel, et sündmuse tekkimise jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
Andmeanalüüs MS Exceli abil Andmeanalüüs MS Exceli abil Järgnev õpetus püüab võimalikult 'puust ja punaselt' ette näidata elementaarse andmeanalüüsi teostamise võimalused MS Excelis. Samas ei ole see materjal mõeldud matemaatilise statistika konspektiks, vastavad teadmised/materjalid eeldatakse kasutajal enesel olemas olevat. Seetõttu pole ka eriti tegeletud konkreetsete näidetega ega tulemuste tõlgendamisega. See konspekt ei ole Andres Kiviste 1998 aastal ilmunud vihiku "Matemaatilise statistika algteadmisi ja rakenduslikke näiteid MS Exceli keskkonnas" ümbertrükk. MS
kehtivad (false negative) Hüpoteeside testimine ehk keskmiste võrdlemine: Vaja vastata küsimustele: (1) kas rühmad (või valimid ja nende jaotused) on nii sarnased, et võime öelda, et nad kuuluvad samasse üldkogumisse või (2) on nad nii erinevad, et esindavad kahte erinevat üldkogumit? (Nt. Kas naissoost üliõpilased saavad sõnavaratestis paremaid tulemusi kui meessoost üliõpilased?) Hüpoteesi kontrollimine: püstitada nullhüpotees (nt erinevust ei ole) ning alternatiivne e. sisuline hüpotees (erinevus on) defineerida testimise protseduur, sealhulgas olulisuse nivoo (psühholoogias 95%) otsustada, millist keskmiste erinevuste testi kasutada arvutada teststatistikud ja nendega seotud olulisuse tõenäosused arvutada efekti suuruse näitajad teha järeldus, kas andmed on kooskõlas nullhüpoteesiga või mitte Nullhüpotees ja alternatiivne hüpotees:
pöördseoseid. Suurima tõepära meetod: Meetodi aluseks on põhimõte leida sellised jaotuse parameetrite väärtused, et antud konkreetse valimi jaoks oleks suurim just nimelt selle valimi saamise tõenäosus. Vähimruutude meetod: Vähimruutude meetod on tavalisim meetod erinevate juhuslike suuruste seosemudelite parameetrite leidmisel (nt regressioonanalüüsis). Nullhüpotees- kontrollitav väide Alternatiivhüpotees- nullhüpoteesi välistav alternatiivne väide Statistiline hüpotees tekib tavaliselt mingi vaadeldava juhusliku suuruse kohta käiva väite (oletuse, hüpoteesi, ...) formaliseerimisel. esimest liiki viga tekib, kui H0 on õige, ent kontrollil loetakse õigeks (võetakse vastu) H1 (sellise vea tõenäosust tähistatakse ); teist liiki viga tekib, kui H0 pole õige, ent kontrollil loetakse H0 õigeks (võetakse vastu) (sellise vea tõenäosust tähistatakse ). Hüpoteeside kontrolli tavapärased sammud on järgmised:
.. f2(ym) Kovariatsioon cov(X,Y)=E[(X-EX)(Y-EY)] cov( X , Y ) Korrelatsioonikordaja = -1 1 DX DY Statistika teooria III 1. Matemaatilise statistika põhiülesanne. Lihtne juhuvalik. Matemaatilise statistika põhiülesanne on üldkogumi parameetrite hindamine valimi põhjal. Klassikalises matemaatilises statistikas loetakse üldkogum reeglina lõpmatuks ja üldkogumi elementidel mõõdetud tunnust käsitletakse juhusliku suurusena. Lihtne juhuvalik: · Valimi iga element võetakse samast üldkogumist. · Üldkogumi igal elemendil on võrdne võimalus sattuda valimisse. · Elemendi valimisse sattumine on sõltumatu mistahes teise elemendi valimisse sattumisest/mittesattumisest. 2. Valimkeskmine kui üldkogumi keskmise punkthinnang. Valimkeskmise kui juhusliku suuruse jaotus.
−∞ 2 12. Leida pideva ühtlase jaotuse dispersioon. 2 2 (a−b) Pideva ühtlase jaotuse dispersioon on DX =EX 2−( EX ) = 12 NORMAALJAOTUS 13. Defineerida normaaljaotus. Normaaljaotus on reaalarvulise juhusliku suuruse jaotus, mille tihedusfunktsioon avaldub 2 −(x−μ) 1 2σ 2 kujul φ ( x )= e , kus jaotuse parameeter σ > 0 (hajuvus) ja μ on σ √2 π reaalarv(keskväärtus). Tähistatakse X~N(μ,σ). 14. Kuidas avalduvad normaaljaotusega juhusliku suuruse keskväärtus ja dispersioon?
1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi eesmärk on: 1. dispersioonide leidmine 2. uuritava nähtuste tegurite mõju olulisuse hindamine Valimi andmete põhjal saadi järgmised tulemused: aritm.keskmine=80 ja standardhälve 20. Üldkogumi maht 1200. Kui suur peaks olema valim, et teha kindlaks üle 110 väärtusega elementide osakaalu üldkogumis täpsusega +/-4 ühikut, usaldatavusega 95%. 1. 1700 (üldkogum 1200) 2. 1280 (üldkogum 1200) 3. Ei saa arvutada, sest dispersioon ei ole teada (standarthälbe väärtus on olemas, tõstam ruutu saan dispersiooni, 2. Tahan teha kindlaks elementide osakaalu, ehk et kui dispersiooni ei tea, saan arvutada võttes maksimaalse dispersiooni) 4. Ei ükski eelpool toodud valikutest
Kaup Esimene periood Teine periood hind kogus Hind kogus A 8 EEK 450 10 EEK 430 B 14 EEK 600 13 EEK 680 V: Käive oleks suurenenud 7,4% 2.) Valimi andmete põhjal saadi järgmised tulemused: aritm.keskmine=80 ja standardhälve 20. Kui suur peaks olema valim +/-3 ühikut, usaldatavusega 95%. V: Tuleb kasutada lühikest valimit, kuna üldkogum ei ole teada: N=2²*sigma²/D² 3.) 3 aasta pikkuse aegrea algtase oli 100 ja lõpptase 200. Milline oli juurdekasvutempo? 1. 240 2. 170 4.) Kümne aasta pikkuse aegrea algtase 100 ja lõpptase 200. Milline oli rea keskmine absoluutne juurdekasv? 1. ei saa arvutada, sest dispersioon ei ole teada 2. 10 ühikut 3. 11,1 ühikut 4. 9,2 ühikut 5
3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24 Kriitiline t-statistiku väärtus t0.95(24) = 1.711 Kuna t < , siis võtame hüpoteesi H0 vastu. 3.2. H0: 2 = 800; H1: 2 800 Kontrollimiseks kasutame 2-statistikut: Kriitilised väärtused: 20.05(24) = 13.848 20.95(24) = 36.415 Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 21-40, 41- 60, 61-80 ja 81-100 ning kontrollida 2- testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese. Intervalli Vahemi element tõenäosus intervalli nr k e pi* keskmine k ni xi
Standardhälve ON ALATI varieeruvas kogumis keskmisest lineaarhälbest suurem. Normaaljaotuse üks parameetritest on standardhälve ehk sigma. Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe. NORMAALJAOTUS · Jaotuse püstakuse ehk ekstessi mõõtmisel tuginetakse neljandat järku normeeritud momendile ning jaotust võrreldakse normaaljaotusega (selle neljandat järku normeeritud moment on 3). · Normaaljaotus kirjeldab tunnust, mille käitumine on normaalne. Normaaljaotus on piirjaotus, millele lähenevad paljud teised jaotused. · Normaaljaotuse üks parameetritest on standardhälve ehk sigma. · Normaaljaotuse omadused: * normaaljaotus on pidev jaotus *normaaljaotus on täielikult kirjeldatav kahe parameetriga: keskväärtusega ja dispersiooniga 2 *normaaljaotusele vastav kõver on sümmeetriline keskväärtuse suhtes * normaaljaotuse keskväärtus, mood ja mediaan ühtivad.
Valimvaatluse korral valitud usaltatavus avaldab mõju moodustavva valimi suurusele Usalduspiiride laius sõltub väärtuste varieerumisest Väljavõtukogumi suurus ei tohi sõltuda üldkogumi keskmisest väärtusest Vahemikhinnangu andmisel usalduspiiris on suurema valitud usaltatavuse puhul laiemad Hüpoteeside kontrollimisel: On võimalik I tüüpi vea tekkimine kui lükatakse tagasi nullhüpotees Kui kasutada otsuste langetamisel väiksemat valimit, siis vea tekkimise võimalus suureneb Valimi suurus mõjutab hüpoteesi kontrollimisel tehtavad otsust Hüpoteesi kontrollimisel viga saab tekkida: kuna anname hinnangu valimi põhjal ja valim on moodustatud juhuväljavõtu teel Statistilite hüpoteeside kontrollimisel: võrreldakse empiirilistel andmetel leitud statistikut kontrollstatistikuga Normaalselt jaotuvad kogumis: ei ükski;