Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Statilised järeldused". Need materjalid aitavad sul teemat sügavamalt mõista.
valim, kursus, hüpotees, astra, keskväärtus, hajuvus, intervall, silva, hajuvuse, anud, percent, üldistada, andmestik, value, valid, calc, vahemikud, tabelid, järjesta, valimite, normaaljaotus, intervallskaala, kairio, spss, total, sisesta, standardhälve, gruppe, valimid, nullhüpotees, kirjutata, tegin, heast, andmevaade, numbreid, numbridTehakse järeldusi, aga ainult nende andmete kohta, mida kogusime. Üldkogumi all mõeldakse kõiki juhtumeid või objekte, mille kohta meie poolt püstitatud järeldused, oletused kehtivad. Mõõtmiseks valitud (uuringusse kaasatud) üldkogumi osa nimetatakse valimiks. Valimi tingimused: Juhuslik – kõigil üldkogu liikmeil on võrdne võimalus sattuda valimisse. Esinduslik – samad proportsioonid, mis on üldkogus, peavad olema ka valimis. Piisavalt arvukas. Tunnused- nimi, järjestus, intervall, binaarne. Võtmeküsimused: Kas väärtused on järjestatavad? Kas skaalavahemikud on võrdsed? Nimitunnused nimi, sugu, perek. seis, elukoht, maakond. Väärtused ei ole üheselt järjestatavad Järjestustunnused rahulolu, haridustase. Järjestustunnuste puhul on tunnuse vastusevariandid intensiivsuse põhjal järjestatavad. Samas ei pea skaalapunktide vahed tingimata võrdsed olema. Tüüpilisteks järjestustunnuse näideteks on haridustase, igasugused meeldivuse ja rahulolu hinnangud
nullpunkt (nt raha) o Lickerti skaalal tehtud mõõtmisi on lubatud käsitleda vajadusel pideva muutujana Jaotused (normaaljaotus, negatiivne asümmeetria, positiivne asümmeetria): Andmetöötluse alused: Valemid ja tähised n või N – juhtumite arv x – muutuja X̅ või µ – keskmine i – indekseerimistähis σ või SD – standardhälve (standard deviation) σ2 või SD2 – hajuvus Σ – summeerimine Standardhälve Näitab, kui hästi keskmine esindab mõõdetud andmeid. Muutjal on keskmine väärtus ja iga juhtum on sellest teatud kaugusel: x1- X̅ Hajuvus on keskmine ruutkaugus, seega standardhälve on nö keskmine kaugus keskmisest: Normaaljaotuse puhul paikneb kõigist mõõtetulemustest 68,27% ±1SD, 95,45% ±2SD ja 99,73% ±3SD kaugusel keskmisest. Kaugus keskmisest (indiv
.. 200-300 200-300 250 28 7000 38 -179,5 32220,25 ... 300-400 300-400 350 42 14700 80 -79,5 6320,25 ... 400-600 400-600 500 50 25000 130 70,5 4970,25 ... Üle 600 600-1000 800 20 16000 150 370,5 137270,3 ... Kokku 150 64425 4822025 USALDUSINTERVALLID Usaldusintervalle on vaja selleks, et hinnata valimi ja üldkogumi vastavust. Valim on juhuslik,võib esineda erinevaid tulemusi. Tehes üldistusi üldkogumile,peame veaga arvestama. Usaldusintervalle kasutataksegi selle vea hindamiseks. Keskmine esindusviga. Valimi suurenedes esindusviga väheneb. Selle leidmiseks on erinevad valemid lähtuvalt sellest, kas üldkogumi suurus on teada või ei ole.(valimi mahu võtmisel ei arvestata missing lahtrit) Piiresindusviga. Jälle kaks valemit lähtuvalt üldkogumist. Kasutatakse t-jaotuse täiendkvantiili
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
Sõnavara mees ,091 608 ,000 ,988 608 ,000 naine ,071 742 ,000 ,989 742 ,000 a. Lilliefors Significance Correction Selleks, et vastata küsimusele kas on tegemist normaaljaotusega või mitte peame esmalt välja nuputama, millist testi vaatame. Kolmogorov-Smirnov testi on mõttekas vaadata siis, kui valim on väga suur (tuhanded indiviidid), Shapiro-Wilk test on kohane väikese valimi puhul (u 50-2000 indiviidi). Meie andmestikus on 1350 inimest, seega võiks kasutada Shapiro-Wilk testi. Juurde tasub aga märkida, et mõlemad testid on üsna tundlikud äärmuslike väärtuste ning valimi suuruse suhtes, mistõttu teatud olukordades ei pruugi nende testi alusel tehtud otsustused olla täpsed! Järgnevalt tuleb vaadata Sig.-i (olulisuse tõenäosus)
Smirnov (n > 2000) - Analyze -> Descriptive Statistics - > Explore -> Plots - Kui p > .05 siis on normaaljaotusega (st nullhüpotees on normaaljaotusega) - NB! kui asümmeetriakordaja (ingl. k. skewness) ja ekstsess (ingl. k. kurtosis) on vahemikus -1 kuni 1, siis võib pidada andmeid normaaljaotusele vastavaks ANOVA vs T-test - Esimest liiki viga tekib siis, kui võetakse vastu alternatiivne hüpotees, aga tegelikult on õige nullhüpotees (raske viga; näidatakse erinevuse või seose olemasolu, mida tegelikult pole). - Teist liiki viga tekib siis, kui jäädakse nullhüpoteesi juurde, ehkki tegelikult on õige alternatiivne hüpotees. See on kergem viga, mis tihti tähendab, et alternatiivse hüpoteesi tõestamiseks tuleb andmeid juurde koguda. - - Iga kord kui teete t-testi on I tüüpi vea tõenäosus 5 % (olulisusnivoo 0.05)
muutujateks ruumiline mõtlemine ja sõnavara ning sõltumatuks muutujaks sugu) Plots-> Normality Plots with tests Võite ära märkida, et tahate joonist histogrammi kujul. Kui olete need sammud ära teinud, peaks teile ilmuma tabel. Selleks, et vastata küsimusele kas on tegemist normaaljaotusega või mitte peame esmalt välja nuputama, millist testi vaatame. Kolmogorov-Smirnov testi on mõttekas vaadata siis, kui valim on väga suur (tuhanded indiviidid), Shapiro- Wilk test on kohane väikese valimi puhul (u 50-2000 indiviidi). Meie andmestikus on 1350 inimest, seega võiks kasutada Shapiro-Wilk testi. Järgnevalt tuleb vaadata Sig.-i. Kui Sig on väiksem kui 0.05, siis ei ole andmed normaaljaotuslikud. Sageduste võrdlemine: (Analyze Descriptive Statistics ->Crosstabs). Lisaks on võimalik tellida statistik (Statistics -> Chi-
Tunnuse jaotus Jäotus üldarvudena v protsentidena Segadustabel, risttabel Jaotus joonisel Võrdlus normaaljaotusega Parameetrite võrdlus Mood- kõige sagedasem väärtus v väärtusklass Mediaan- punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks Kvantiilid Aritmeetiline keskmine e keskväärtus Standardhälve kui kaugel on keskmine inimene keskmisest Dispersioon standardhälbe ruut Võrdlusülesanded Tunnuse jaotuse võrdlus: risttabelid ja seosekordajad Tunnuste keskmine väärtuste võrdlus kirjeldaval tasemel: keskmine ja selle usalduspiirid Ühe tunnuse keskmine väärtuse võrdlus kahes gruppis: t-test Kahe tunnuse keskmine väärtuste võrdlus: t-test Ühe tunnuse keskmiste väärtuste võrdlus kahes v rohkemas grupis:
Pidev suurus - väärtused täidavad mingi vahemiku täielikult ära Jaotusseadus - Diskreetse juhusliku suuruse X jaotusseaduseks nimetatakse vastavust suuruse kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
Hüpoteeside koltrollimine 1. Oletus, väide 2. Sobiv hüpoteeside paar (millised tunnused on vaja võrrelda) 3. Olulise tõenäosus (p) 4. Järeldus (p>0,05 H0, p<0,05 H1) 5. Lõppvastus (sama, mis oli küsitud hüpoteesis) T-test sobivad valemid 1. T-test H0: keskmised võrdsed H1: keskmised erinevad 2. F-test sõltumatud valemid H0: dispersioonid võrdsed H1: dispersioonid erinevad P>a H0, P<0,05 H1 Võrdsete disp mittevõrdsete disp t-test t-test 3. Olulisuse tõenäosus 4. Lõppvastus (p<0,05 H0) Vormistus nii nagu iseseisvates töös Ülesanne Eesmärk Tunnusetüüp 1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, millel on vähe
mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang Hinnangu nihe võrdub parameetri hinnangu keskväärtuse ning parameetri tegeliku väärtuse vahega. Iseloomustab süstemaatilist viga. Nihketa hinnang – Parameetri hinnang on nihketa kui hinnangu keskväärtus võrdub parameetri tegeliku väärtusega. 8) Hinnangu efektiivsus, efektiivne hinnang: Hinnangu efektiivsus – Parameetri nihketa hinnang, kus dispersioon on väiksem on efektiivseim. Kasutatakse hinnangute võrdlemisel. Efektiivne hinnang – nihketa vähima dispersiooniga hinnang kõigi nihketa hinnangute seas. Iseloomustab hinnangute hajuvust. 9) Mõjus hinnang- Hinnang on mõjus, kui ta koondub tõenäosuse järgi parameetri tegelikuks väärtuseks
xii. Mõned isikud lahkuvad riskipopulatsioonist surres, mujale kolides või edasisest osalemisest keeldudes. e.xiii. Levimuse hindamine läbilõikelistes uuringutes. e.xiv. Haigestumuse hindamine kohortuuringus. f. Populatsioon ühikute kogum, mille hulgast me leiame oma uuringu osalised. Kogum, mille kohta tahame esitada väiteid oma uuringu tulemuste põhjal. g. Valim osa populatsioonist, mida me uurime. Et valimi uurimise tulemusi saaks üldistada populatsioonile, peab olema teada iga populatsiooni liikme võimalus valimisse sattuda. Lihtsaim variant võimalus valimisse sattuda on võrdne: juhuvalim. h. Sansid- vt valemit. Kasutatakse esinemisnäitajana harva. Sansside suhe on oluline esinemise võrdlusnäitaja. i
ossa, pooled on mediaanist suuremad ja pooled väiksemad. Aritmeetiline keskmine (keskväärtus) kirjeldab jaotuse keskmist taset. Moonutatud pilti keskmisest tasemest näitab siis kui jaotusel esinevad erandlikud väärtused. Sel juhul tuleks koos keskväärtusega keskmise taseme kirjeldamiseks kasutada ka mediaani. 1.2. Andmete paiknemist kirjeldavad arvnäitajad. Kvartiilid - jagavad vaatlustulemused nelja võrdsesse ossa. Standardhälve – hajuvuse näitaja, mis arvestab kõiki vaatlustulemusi ning näitab kui palju üksikud tulemused erinevad keskmisest. Mida suurem on hajuvus, seda rohkem nad erinevad ning seda suurem on standardhälve. Kui kõik vaatlustulemused on ühesugused (Nt. kõik tudengid said kontrolltööl 15 palli), siis hajuvust ei ole ja standardhälve on 0. (standardhälve ei ületa tavaliselt poolt jaotuse ulatusest) 2. Kirjeldavate arvnäitajate arvutamine programmis SPSS
Array1 on ühe valimi andmed, Array2 teise valimi andmed. Arvutatakse v 11 62 48 kahepoolse kui ühepoole hüpoteesi jaoks. Testi läbiviija peab valima, kum 12 38 42 13 41 37 keskväärtus dispersioon vaatluste arv pearsoni korrelatsioonikoefitsient nullhüpotees vabadusastmete arv parameetri empiiriline väärtus
Teiseks on kõigi enamkasutatavate arvkarakteristikute leidmiseks MS Exceli funktsioon, näiteks AVERAGE - aritmeetiline keskmine, STDEV - standardhälbe valimhinnang, SKEW - asümmeetriakordaja jne. Kõigi nende funktsioonide argumendiks on uuritava tunnuse väärtusi sisaldav andmeblokk. Tunnuse 'Pikkus' keskväärtus leituna funktsiooni AVERAGE abil. http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/arvkar.html (1 of 5)29.05.2006 15:08:55 Andmeanalüüs MS Exceli abil - sagedustabelid Funktsiooni argumentidena on ette antud lahtrid B1-J1, mis sisaldavad uuritava tunnuse väärtusi. NB! Funktsioonide korral sisestatakse andmeblokk ilma
Eesti Maaülikool Metsandus- ja maaehitusinstituut Geomaatika osakond Matemaatika andmestiku analüüs Aruanne õppeaines matemaatiline statistika Koostajad: Juhendaja: Eve Aruvee Tartu Sisukord Sissejuhatus....................................................................................................................... 3 Tunnuste esmaanalüüs.......................................................................................................4 Seoste analüüs................................................................................................................... 8 Mudeli koostamine.......................................................................................................... 13 Kokkuvõte.......................................................................................................................
Biomeetria eksamiks ·Konstrueerige sagedustabel tunnusele"hommik" ---- insert PivotTable, joonise tegemisel copy andmed kõrvale (ilma grand total lahtrita) ·Diagrammi kujundamine - kustutada legend ja joonise pealkiri; y-telje põhikoordinaatjooned helehallid katkendlikud; y-teljele nimetus 'Tudengite arv'; x- teljele nimetus 'Mida te tavaliselt hommikul sööte?' ja tõstke see joonise sisse; telgede ühikute kirjasuurus 10 ja nimetustel 12 punkti; y-telje maksimum 29 ja miinimum 0 ühikut ning ühikute vahe (major unit) 5; tulpade vahe 120%; jooniseala (Chart Area) ümbert hall kastijoon kustutada; hall kastijoon teha ümber jooniseala (Plot Area) ·Suhteline sagedus grupi vaatluste arv/kõigi vaatluste arv. Home sakil saab teha protsendiks ·Pidevate arvtunnuste jaoks on vaja klasse. Klasside arvu leiab võttes vaatluste arvust ruutjuure, klassid peavad olema ühepikkused. Klasside intervalli leidmisek
jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus on juhusliku suuruse asendikarakteristik, mille abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta. Keskväärtuse geomeetriline tõlgendus: jaotuse raskuskeskme projektsioon x-teljele. Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile nim detsiilideks, 25%kordseid protsentiile nim kvartiilideks, 50% korral mediaaniks. Mediaan on jaotuse keskpunktiks tõenäosuse järgi: mediaanist nii vasakule kui paremale sattumise tõenäosus on võrdelt 0.5
Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus(asendikarakteristik) iseloomustab juhusliku suuruse jaotuse keskkoha asukohta. Keskväärtuse geomeetriline tõlgendus: jaotus raskuskeskme projektsioon x-teljele Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. dispersioon on standardhälve ruudus ja standardhälve on vastavalt dispersiooni ruutjuur. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile nim detsiilideks, 25%kordseid protsentiile nim kvartiilideks, 50% korral mediaaniks. Mediaan on
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
C) Väline valiidsus mil määral võime tulemusi üldistada taolistele sarnastele olukordadele; või valimi tulemuste üldistus kogu populatsioonile. Mõõtmise usaldusväärsust mõjutab valimi (sample) suurus. Me ei uuri tavaliselt kunagi kogu populatsiooni, kuid selleks et teha õigustatud järeldusi populatsiooni kohta, tuleb koostada küllalt suur (reliaabluse aspekt!) ja esinduslik (valiidsuse aspekt!) valim. Statistilised testid on samuti sõltuvad valimi suurusest. Valim peab olema valiidne, s.t. esindama kogu populatsiooni võimalikult paljude tunnuste osas. Põhiline meetod valimi koostamiseks on juhuslik valik. (Juhuslik valik tähendab sisuliselt seda, et igal antud populatsiooni liikmel on võrdne võimalus saada valitud.) Teine sagedasem viis on stratifitseeritud valimi koostamine. D) Sisemine valiidsus - Sisemine valiidsus on kõrge uurimusel, mis on läbi viidud nii korrektselt, et muutused sõltuva muutuja
MEM5220 Magistriõpe, TARM12 · Vastuvõtuajad (vajalik eelnev registreerimine õppejõu kodulehel): Ako Sauga Paaritu nädal N 19:00 20:00 Paarisnädal E 16:00 17:00 Loengukava Kellele see kursus on mõeldud? Bakalaureuseõppe TAAB 2. kursus (uus õppekava) · Sissejuhatus (programm, TES0040 Bakalaureuseõppe TAAB 3. kursus (vana õppekava) hindamismeetodid, õppematerjalid). Õppejõud Ako Sauga.
küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2. Ettekavatsetud- vastavalt eelteadmistele valitud uuritavad 3
Kui autok. Esineb, tuleb mudel ümber vaadata, tuleb muuta spetsifikatsiooni. 2. Asümptootilised hinnangud kui juhuslike vigade normaaljaotuse eeldus ei ole täidetud, siis usalduspiirid on asümptootilised. Nad on täpsed siis, kui valimi maht on lõpmatu; lõpliku valimi mahu korral usalduspiirid on ligikaudsed. 3. Determinatsioonikordaja (D=R²) väljendab regressioonimudeli poolt kirjeldatud hajuvuse suhet (ESS explained sum of squares) modelleeritava näitaja (endogeense muutuja) koguhajuvusse (TSS total sum of squares). 4. Dispersioon iseloomustab juhusliku suuruse Xi erinevust keskväärtusest, seega iseloomustab tunnuse hajuvust. Valimi dispersiooni kui üldkogumi dispersiooni hinnangu tähiseks on tavaliselt Sruut, üldkogumi dispersiooni tähiseks ruut (kasutatakse teisi tähiseid
i =1 i 2 x g =n x1 x 2..... x n xr = Geomeetriline keskmine - Ruutkeskmine - n Standardhälve ruutkeskmine hälve, mis on hajuvuse statistiline mõõt. Variatsioonikoefitsient mõõdab suhtelist varieeruvust kogumi aritm. keskmisest. Väljendus %- R d VR = Vd = V = des. x x x Keskmine lineaarhälve - rea liikmete väärtuste keskmine kaugus aritmeetilisest keskmisest 2 ( xi - x ) 2 s = valim; n -1 d= xi - x
Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1 Jaotusfunktsiooni abil on raske otsustada juhusliku suuruse käitumise üle mingi punkti ümbruses. Seetõttu kasutatakse lisaks jaotusfunktsioonile ka sellest tuletatud tihedusfunktsiooni. 2 4. Populatsioon ja valim, standardviga Populatsioon on kõigi objektide, isendite, esemete, nähtuste või seisundite kogum, mille kohta soovitakse järeldusi teha Populatsiooni neid objekte, mida on vaadeldud või uurimiseks välja valitud, kutsutakse valimiks Valimit, kus uuritava tunnuse jaotus on samasugune kui populatsioonis, nimetatakse esindavaks valimiks Standardhälve- ruutjuur dispersioonist (dispersioon pt.2)
gdt nõudlusfunktsioon qli 79,3 0, 540 pli 0,195 psi ui H0 kõik seletavate tunnuste kordajad on nullid, b2=b3=... =bk =0 H1 vähemalt üks kordaja b2, b3 ...., bk on nullist erinev Nullhüpotees: Y on määratud oma keskväärtusega: Sisukas hüpotees yi b1 ui y ui F- statistiku empiirilist väärtust võrreldakse F jaotuse kriitilise väärtusega (või empiirilisele väärtusele vastavat olulisuse tõenäosust p võrreldakse olulisuse nivooga ). p=0,000291 < 0,05 Kui empiiriline väärtus ületab kriitilise (p<), võetakse vastu sisukas
Rakendusstatistika arvutusgraafilise AGT-1 andmed ja lahenduse kontrollelemendid MHT/2013 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: 21.11.2013 Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs, aegrida ) 37 54 94 32 19 33 69 51 89 43 18 88 9 30 62 41 81 54 49 54 15 94 85 43 87 Andmed-B: valimid B1 ja B2 ( korrelatsioon, regressioonimudeli leidmine ja analüüs) xi 1,1 2,8 2,2 5,1 3,7 yi 7,2 8.9 6,8 19,3 13,1
Tunnused: 1)0 <= F(x) <=1 2)F(x)kasvab;3)F(+lõpmatus)=1 Juhuslik suurus võib alluda binoomjaotusele, Poissoni jaotusele. Pidev juhuslik suurus omandab iga väärtuse tõenäosusega 0. Jaotust (diskreetsel juhul) kirjeldab tõenäosusfunktsioon = ( | ( ) = ) = ( = ); pi ≥ 0; ∑pi=1 Omavahelised seosed: Ω X P R [0;1] D 9. Keskväärtus ja dispersioon. Definitsioonid. Tõestada vähemalt 3 nende omadust DEF:kindlat suurust EX = ∫ ( ) nim juhusliku suuruse X keskväärtuseks. Seega juhusliku suuruse X keskväärtus EX kui kindel suurus on arv. Diskreetse juhusliku suuruse X keskväärtus: E(X) = ∑xipi Omadused: a. min(xi) ≤ E(X) ≤ max(xi) E(X) = ∑xipi ≤ ∑maxxipi = maxxi∑pi = maxxi b. Homogeensus: E(cX) = cE(X), c = const E(cX) = ∑xiP(cX=cxi) = c∑xiP(X=xi) = cE(X) c. E(c) = c
Rakendusstatistika arvutusgraafilise töö andmed ja lahenduse kontrollelemendid MHT/2010 Üliõpilane: Üliõpilaskood: Lahenduse esitamiskuupäev: Andmete kood: Andmed Andmed-A: valim A mahuga N=25 (arvkarakteristikud, jaotuse analüüs, dispersioonanalüüs) 16 35 38 49 51 69 1 69 19 87 3 44 24 84 7 41 41 10 79 15 87 82 5 76 1 8 8 Andmed-B: valimid B1 ja B2 (regressioonimudeli leidmine ja analüüs) xi 4,0 1,0 5,0 3,0 2,0 yi 0,1 5,5 0,2 1,2 3,5
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 1 2 17 81 97 75 22 21 94 62 81 73 74 52 79 45 14 70 2 71 48 79 77 39 19 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: = 51,8 Dispersioon: s x² = 968,58 Standardhälve: s x = 31,12 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 62 Haare: