Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Statistika ülesanned 4. Andmetöötlus.". Need materjalid aitavad sul teemat sügavamalt mõista.
male, female, suse, hüp, hüpotees, valim, empiiratisti, nullhüpotees, keskväärtusatistik, ample, empiiriline, mean, usaldusnivoo, tail, usaldusinterv, kriitilise, alpha, võrd, usaldusintervall, ooteaeg, nivool, dispersioonid, count, usalduspiir, friends, tools, teststatistik, confidence, usaldusnivool, sisukas, analysis, patsienti, criticalHüpoteeside koltrollimine 1. Oletus, väide 2. Sobiv hüpoteeside paar (millised tunnused on vaja võrrelda) 3. Olulise tõenäosus (p) 4. Järeldus (p>0,05 H0, p<0,05 H1) 5. Lõppvastus (sama, mis oli küsitud hüpoteesis) T-test sobivad valemid 1. T-test H0: keskmised võrdsed H1: keskmised erinevad 2. F-test sõltumatud valemid H0: dispersioonid võrdsed H1: dispersioonid erinevad P>a H0, P<0,05 H1 Võrdsete disp mittevõrdsete disp t-test t-test 3. Olulisuse tõenäosus 4. Lõppvastus (p<0,05 H0) Vormistus nii nagu iseseisvates töös Ülesanne Eesmärk Tunnusetüüp 1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, millel on vähe
Teiseks on kõigi enamkasutatavate arvkarakteristikute leidmiseks MS Exceli funktsioon, näiteks AVERAGE - aritmeetiline keskmine, STDEV - standardhälbe valimhinnang, SKEW - asümmeetriakordaja jne. Kõigi nende funktsioonide argumendiks on uuritava tunnuse väärtusi sisaldav andmeblokk. Tunnuse 'Pikkus' keskväärtus leituna funktsiooni AVERAGE abil. http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/arvkar.html (1 of 5)29.05.2006 15:08:55 Andmeanalüüs MS Exceli abil - sagedustabelid Funktsiooni argumentidena on ette antud lahtrid B1-J1, mis sisaldavad uuritava tunnuse väärtusi. NB! Funktsioonide korral sisestatakse andmeblokk ilma
Array1 on ühe valimi andmed, Array2 teise valimi andmed. Arvutatakse v 11 62 48 kahepoolse kui ühepoole hüpoteesi jaoks. Testi läbiviija peab valima, kum 12 38 42 13 41 37 keskväärtus dispersioon vaatluste arv pearsoni korrelatsioonikoefitsient nullhüpotees vabadusastmete arv parameetri empiiriline väärtus
Pidev suurus - väärtused täidavad mingi vahemiku täielikult ära Jaotusseadus - Diskreetse juhusliku suuruse X jaotusseaduseks nimetatakse vastavust suuruse kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest
Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1 Jaotusfunktsiooni abil on raske otsustada juhusliku suuruse käitumise üle mingi punkti ümbruses. Seetõttu kasutatakse lisaks jaotusfunktsioonile ka sellest tuletatud tihedusfunktsiooni. 2 4. Populatsioon ja valim, standardviga Populatsioon on kõigi objektide, isendite, esemete, nähtuste või seisundite kogum, mille kohta soovitakse järeldusi teha Populatsiooni neid objekte, mida on vaadeldud või uurimiseks välja valitud, kutsutakse valimiks Valimit, kus uuritava tunnuse jaotus on samasugune kui populatsioonis, nimetatakse esindavaks valimiks Standardhälve- ruutjuur dispersioonist (dispersioon pt.2)
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud
· Mõõteskaalad, keskmised (aritmeetiline, mediaan, mood), · Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks)
3. Kontrollime hüpoteese keskväärtuse ja dispersiooni kohta, eeldades üldkogumi normaaljaotust, ja kasutades usaldusnivood = 0.10 3.1 H0: = 50; H1: 50 Kontrollimiseks kasutame t-statistikut: f = N 1 = 24 Kriitiline t-statistiku väärtus t0.95(24) = 1.711 Kuna t < , siis võtame hüpoteesi H0 vastu. 3.2. H0: 2 = 800; H1: 2 800 Kontrollimiseks kasutame 2-statistikut: Kriitilised väärtused: 20.05(24) = 13.848 20.95(24) = 36.415 Et hüpotees vastu võetaks peab jääma kahe kriitilise punkti vahele seega hüpotees võetakse vastu. 4. Leida valimile vastav empiiriline histogramm võrdlaiade vahemikega 0-20, 21-40, 41- 60, 61-80 ja 81-100 ning kontrollida 2- testi järgi olulisuse nivool = 0,10 järgmisi hüpoteese. Intervalli Vahemi element tõenäosus intervalli nr k e pi* keskmine k ni xi
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X~N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud normaaljaotuse
Kokku 110 130 240 Kokku 110 130 240 Kas feromoonpüünis aitas oluliselt kaasa taimede kasvamaminekule? Esitage ka teoreetilised sagedused. 18) Mis on hüpoteesid H0 ja H1? H0-nullhüpotees-väljendab uurijat mittehuvitavat juhtu, seda ei ole võimalik tõe 19) Mis on 1. liiki viga? Tekib siis, kui võetakse vastu sisukas hüpotees, aga tegelikult on õige nullhüpo 20) Kui suur antakse ette tavaliselt 1. liiki vea tõenäosus? 0.05 21) Mis on olulisuse nivoo? Esimest liiki vea tegemise suurim lubatud tõenäosus 22) Mis on olulisuse tõenäosus? P-väärtus, vähim olulisuse nivoo, mille korral saab konkreetse valimi põhjal sis 23) Millal kasutatakse kahepoolset hüpoteesi ja millal ühepoolset? Kahepoolsete hüpoteeside korral kontroll
Eesti Maaülikool Metsandus- ja maaehitusinstituut Geomaatika osakond Matemaatika andmestiku analüüs Aruanne õppeaines matemaatiline statistika Koostajad: Juhendaja: Eve Aruvee Tartu Sisukord Sissejuhatus....................................................................................................................... 3 Tunnuste esmaanalüüs.......................................................................................................4 Seoste analüüs................................................................................................................... 8 Mudeli koostamine.......................................................................................................... 13 Kokkuvõte.......................................................................................................................
e kindlasse vahemikku, milleks enamasti võetakse keskväärtusest mõlemale poole ühe satandarthälve kaugusele ulatuv vahemik. s meie teadmiste täpsust uuritava üldkogumi keskmisest, mida täpsem on meie teadmine, seda väiksem on SE. SE sõltub seeg hinnangute täpsust. (S_x/m)^2 n=((S_x P_x)/ (100x ))^2 kaugusele ulatuv vahemik. väiksem on SE. SE sõltub seega a) üldkogumi dispersioonist; b) valimi suurusest. Mida suurem on valim, seda väiksem on S m on valim, seda väiksem on SE. Valimi suurenedes läheneb SE nullile. See on siis oluline erinevus SD-st. Hüpoteeside kontroll 13) Võrdleme teie proovitükil mõõdetud andmeid proovitükiga 64. Selleks arvutame proovitükil 64 kahes suunas mõõdetud diameetri keskmise. Seejärel filtreerime proovitükilt 64 välja 1. rinde sama puuliigi diameetrid, mis oli teie proovitükil 1. rinde peapuuliik. Kui suur tuli vaatluste arv (prtk. 64)? Kopeerime need diameetrid teisele töölehele.
Kahjus- 21,5 25,5 4 tatud 7 Hukkunu 23,4 27,6 5 d 1 Kokku 110 130 2 4 0 18) H0 -nullhüpotees väljendab uurijat mittehuvitavat juhtu. Nullhüpoteesi pole võimalik tõestada ning kui uurija tahab mingisugust erinevust tõestada siis tuleb tal uurimist jätkata H1-sisukas hüpotees, mida uurija soovis tõestada. Hüpoteeside kontrollimisel püütakse tõestada sisukas hüpotees nullhüpoteesi kummutamise teel. 19) 1. liiki viga tekib siis, kui võetakse vastu sisukas hüpotees aga tegelikult on tegemist nullhüpoteesiga.Tegemist on raske veaga, mis tekib siis kui uurija tahab tõestada erinevust või seost mida tegelikult ei ole. 20) Tavaliselt antakse metsanduslikes uurimustöödes 1. liiki vea tõenäosuseks =0,05.
kehtivad (false negative) Hüpoteeside testimine ehk keskmiste võrdlemine: Vaja vastata küsimustele: (1) kas rühmad (või valimid ja nende jaotused) on nii sarnased, et võime öelda, et nad kuuluvad samasse üldkogumisse või (2) on nad nii erinevad, et esindavad kahte erinevat üldkogumit? (Nt. Kas naissoost üliõpilased saavad sõnavaratestis paremaid tulemusi kui meessoost üliõpilased?) Hüpoteesi kontrollimine: püstitada nullhüpotees (nt erinevust ei ole) ning alternatiivne e. sisuline hüpotees (erinevus on) defineerida testimise protseduur, sealhulgas olulisuse nivoo (psühholoogias 95%) otsustada, millist keskmiste erinevuste testi kasutada arvutada teststatistikud ja nendega seotud olulisuse tõenäosused arvutada efekti suuruse näitajad teha järeldus, kas andmed on kooskõlas nullhüpoteesiga või mitte Nullhüpotees ja alternatiivne hüpotees:
854 haare= 1532 1388 klassisamm= 194,5642 200 1074 549 1049 1178 1159 456 461 525 544 895 726 summa: 1010 622 842 Tunnuse kirjeldus: 797 Tegemist on diskreetse tunnusega, mille väärtused kuuluvad vahemikku 400-2000. 914 Keskväärtus on 842,42. 1009 Andmete mediaan on 832,5. 744 Mediaani ja keskväärtust võib lugeda ligilähedaselt võrdseteks. 617 Tegemist ei ole normaaljaotusega. 754 570 1353 908 733 417 847 454 495 660 531 1031 865 1051 1074 860 614 1389 451 454 reetne tunnus. aani võib lugeda ligilähedaseks, mis tähendab, et on tegemist sümmeetrilise jaotusega. klassipiirid FrequencyCumulative % 400 2 3,23%
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A 1. Valim mahuga N = 25 jrk ni xi ni * xi ni * 2088, 1 1 2 2 2089,25 49 1909, 2 1 4 4 1910,42 69 1656, 3 1 7 7 1657,17 49 1576, 4 1 8 8 1576,75 09
Tõeline keskväärtus on tähisega µ. ̅̅̅ 𝑥𝑘 − 𝜇 𝑡𝑒𝑚𝑝 = ∗ √𝑛 = 0.461 𝑆𝑐 𝑇𝑎𝑏𝑒𝑙𝑖𝑠𝑡: 𝑡𝑘𝑟 (𝑡95 ; 60) = 2.000 0.461 < 2.000 Hüpotees kehtib 3.2 H0: teor2 = 800 alternatiiviga H1: teor2 800, (kahepoolne kriitiline väärtus) (𝑛 − 1) ∙ 𝑆𝑐 2 𝜒2 = 2 = 50.021 𝜎𝑡𝑒𝑜𝑟 χ^2vasak (60;0,05) = 43.19 χ^2parem (60;0,95) = 79.08 χ^2vasak < χ^2 < χ^2parem 43.19 < 50.021 < 79.08 Hüpotees kehtib 4
f korrutis dispersiooni hinnanguga, aga jagatuna 2/2(f)-ga. 3. Eeldades, et kogum on normaaljaotusega ja et =0,10, kontrollisin hüpoteesi H 0: =50. Selleks arvutasin t-statistiku, jagades keskväärtuse hinnangu ja antud keskväärtuse vahe standardhälbe hinnanguga ja korrutades saadu ruutjuurega valimi mahust. Tabelist võtsin kriitilise kvantiili t1-/2(f), f=N-1, ja kuna t tkr, võetakse nullhüpotees 16 vastu. Kontrollimaks hüpoteesi H0: 2=800, leidsin 2-statistiku, korrutades f dispersiooni hinnanguga ja jagades saadu antud dispersiooniga. Tabelist võtsin kriitilised kvantiilid 2/2(f) ja 21-/2(f) ning kuna 2/2(f) 2 21-/2(f), siis võetakse nullhüpotees vastu. 4. Kontrollimaks Pearsoni 2-testi järgi olulisuse nivool = 0,10, et kogumi jaotuseks on
gdt nõudlusfunktsioon qli 79,3 0, 540 pli 0,195 psi ui H0 kõik seletavate tunnuste kordajad on nullid, b2=b3=... =bk =0 H1 vähemalt üks kordaja b2, b3 ...., bk on nullist erinev Nullhüpotees: Y on määratud oma keskväärtusega: Sisukas hüpotees yi b1 ui y ui F- statistiku empiirilist väärtust võrreldakse F jaotuse kriitilise väärtusega (või empiirilisele väärtusele vastavat olulisuse tõenäosust p võrreldakse olulisuse nivooga ). p=0,000291 < 0,05 Kui empiiriline väärtus ületab kriitilise (p<), võetakse vastu sisukas
teoreetiline ja hii-ruut-t väärtus= rea summ $E7*C$11/$E$11 Kas liiklusõnnetustesse sattumine sõltub juhi vanusest? Vastus: Kui hii ruut empiiriline on suuremvõrdne kui teoreetiline, siis tuleb võtta hüpotees H1 (H7-C7)^2/H7 Suhtumine messi sõltub külastaja soost 4. Vastus: Liiklusõnnetusse sattumine ei sõltu juhi vanusest, sest hii-ruut-teoreetiline(12,05) on suuremvõrdne kui hii-ruut-em 14,337 12,05 .1 s: 3) Kopeerida fail hypoteesid.xls. Hoidke fail alles! dada järgmine ülesanne: 1-l rühmitada andmed. Kasutades hii-ruut testi
90,00 1,645 0,4505 39,31 13,10 3,00 -36,31 1318,19 33,54 X2 -27,72787048 statistik Vabadusastmete arv k = m 1 r = 5 1 1 = 2 X2kr (0,1;2) = 4,605 Kuna kriitiline teststatistik on suurem kui teststatistik, siis peab hüpotees paika. 4.2 põhikogumi jaotuseks on eksponentjaotus (mille parameeter tuleb hinnata valimi järgi) k xm ni F0(m) pi ni' ((ni-n'i)2)/n'i 1 20,00 6,00 0,29 0,29 7,25 0,215517241 2 40,00 7,00 0,50 0,21 5,15 0,664563107 3 60,00 4,00 0,64 0,15 3,65 0,033561644
Ordinary Least Squares hindamismeetodid Valim ( xi , yi ) i = 1,..., n Silutud väärtused y^ i = ax ^ i + b^ · Vähimruutude meetod: Silutud väärtuste y^ i erinevus vaatlusandmetest yi on hälbed ehk jäägid kõige tuntum;
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
Seejuures on brutopalga varieeruvus 467,1 eurot (minimaalne väärtus 381.384 eurot ja maksimaalne väärtus 848.48 eurot). Standardhälve ehk keskmine kõrvalekalle keskmisest brutopalgast on 103,68 eurot. See näitab, et Eestis on keskmiste brutopalkade vahe maakondade lõikes suhteliselt suur. Tabel 1. Kirjeldav statistika (brutopalk toodud eurodes, ülejäänud näitajad osakaaludena) Kesk- Miini- Maksi- Varieeru Standard Valim Mediaan väärtus mum mum -vus -hälve Brutopalk 60 541.915 538.981 381.384 848.484 467.1 103.68 (Y) Kõrgharitu 0.32438 60 0.168530 0.153426 0.080000 0.244 0.0607 d (X1) 5
Sõnavara mees ,091 608 ,000 ,988 608 ,000 naine ,071 742 ,000 ,989 742 ,000 a. Lilliefors Significance Correction Selleks, et vastata küsimusele kas on tegemist normaaljaotusega või mitte peame esmalt välja nuputama, millist testi vaatame. Kolmogorov-Smirnov testi on mõttekas vaadata siis, kui valim on väga suur (tuhanded indiviidid), Shapiro-Wilk test on kohane väikese valimi puhul (u 50-2000 indiviidi). Meie andmestikus on 1350 inimest, seega võiks kasutada Shapiro-Wilk testi. Juurde tasub aga märkida, et mõlemad testid on üsna tundlikud äärmuslike väärtuste ning valimi suuruse suhtes, mistõttu teatud olukordades ei pruugi nende testi alusel tehtud otsustused olla täpsed! Järgnevalt tuleb vaadata Sig.-i (olulisuse tõenäosus)
.. 200-300 200-300 250 28 7000 38 -179,5 32220,25 ... 300-400 300-400 350 42 14700 80 -79,5 6320,25 ... 400-600 400-600 500 50 25000 130 70,5 4970,25 ... Üle 600 600-1000 800 20 16000 150 370,5 137270,3 ... Kokku 150 64425 4822025 USALDUSINTERVALLID Usaldusintervalle on vaja selleks, et hinnata valimi ja üldkogumi vastavust. Valim on juhuslik,võib esineda erinevaid tulemusi. Tehes üldistusi üldkogumile,peame veaga arvestama. Usaldusintervalle kasutataksegi selle vea hindamiseks. Keskmine esindusviga. Valimi suurenedes esindusviga väheneb. Selle leidmiseks on erinevad valemid lähtuvalt sellest, kas üldkogumi suurus on teada või ei ole.(valimi mahu võtmisel ei arvestata missing lahtrit) Piiresindusviga. Jälle kaks valemit lähtuvalt üldkogumist. Kasutatakse t-jaotuse täiendkvantiili
codes for a (specific), polypeptide / protein / RNA; max 1 allele alternative form of a gene; found at a, locus / particular position on, a chromosome; max 1 (ii) assume allele refers to coat colour allele (coat colour) gene / alleles, only on X chromosome; A no (coat colour), gene / allele, on Y chromosome male cats, XY / only have one X chromosome; males have only one (coat colour) allele / cannot have two (coat colour) alleles; need black and orange alleles for tortoiseshell colour; 2 r r w w (b) parental genotypes C C × C C ; r w gametes C , C ; F1 genotypes and phenotypes 1 mark: r w
Tõug Lakt Mass Piim Rasv_% Valk_% Piimakl EHF 1 492.9 6771.6 4.30 3.14 kõrgem Tunnuste kirjeldus EHF 1 547.8 9695.9 3.42 3.45 esimene EHF 1 506.5 10601.0 3.50 3.20 esimene Tõug - EHF 1 488.3 15697.9 3.52 3.52 esimene EHF eesti mustakirju holstein EHF 1 565.5 9419.2 3.41 3.63 sorditu EPK eesti punane tõug EHF 1 542.6 10558.3 3.72 3.37 kõrgem RHF eesti punasekirju holstein EHF 1 599.5 9806.6 3.55 3.39 kõrgem EHF 1 600.1 10152.1 3.65 3.00 kõrgem Lakt - lehma laktatsiooninumber EHF 1 630.3 9232.4 3.84 3.19 kõrgem Mass - lehma kehamass, kg EHF 1 556.2 11892.5 3.61 3.56 kõrgem Piim - lehma piima kogutoodang lüpsiperio EHF 1 617.3 8803.9 4.26 3.71 esimene Rasv_% - rasvasisaldus, % EHF 1 585.
C) Väline valiidsus mil määral võime tulemusi üldistada taolistele sarnastele olukordadele; või valimi tulemuste üldistus kogu populatsioonile. Mõõtmise usaldusväärsust mõjutab valimi (sample) suurus. Me ei uuri tavaliselt kunagi kogu populatsiooni, kuid selleks et teha õigustatud järeldusi populatsiooni kohta, tuleb koostada küllalt suur (reliaabluse aspekt!) ja esinduslik (valiidsuse aspekt!) valim. Statistilised testid on samuti sõltuvad valimi suurusest. Valim peab olema valiidne, s.t. esindama kogu populatsiooni võimalikult paljude tunnuste osas. Põhiline meetod valimi koostamiseks on juhuslik valik. (Juhuslik valik tähendab sisuliselt seda, et igal antud populatsiooni liikmel on võrdne võimalus saada valitud.) Teine sagedasem viis on stratifitseeritud valimi koostamine. D) Sisemine valiidsus - Sisemine valiidsus on kõrge uurimusel, mis on läbi viidud nii korrektselt, et muutused sõltuva muutuja
RIIK SUGU PIKKUS MASS PEA_P JALANR ODE_VEND MAT_HINNE Eesti M 186 95 59 44 1 4 Eesti N 170 85 57 42 6 4 Eesti N 169 50 54 38 1 3 Eesti M 180 70 56 43 0 3 Eesti 179 72 55 40 1 4 Eesti N 170 55 55 37 1 4 Eesti N 160 58 55 38 1 5 Eesti N 161 57 55 39 1 4 Eesti N 171,5 59 57 38 1 4 Eesti N 180 63 58 41 2 5 Eesti N 168 54 57 38 1 4 Eesti N 170 57 52 40 2 3 Eesti N 163 61 57,5 39 0 4 Eesti M 172 66 54 42 1 4 Eesti M 183 73 54,5 44 4 Eesti M 185 72 56 44