1 Kaia Philips Maj.teaduskond bakalaureus I kursus SUGU Alternatiivne e.kaheväärtuseline binaarne tunnus-sugu on tunnus, millel on ainult 2 võimalikku väärtust Andmebaasis mittearvuline tunnus on kodeeritud 0=mees, 1=naine. Antud ettevõttes töötab kokku 474 inimest - 46%töötajatest(mean) e. 216 (sum) on naised. Mehi on rohkem, kui naisi. Standardviga ±2% . VANUS- Pidev tunnus-mõõdetav arvtunnus Keskmine töötajate vanus 37,19 aastat(mean). Standardviga keskmisel vanusel ±0,5 aastat(standard error). 50% töötajatest on nooremad ja 50% vanemad, kui 32 aastat. Nooremaid inimesi on rohkem kui vanemaid(skewness-assümeetria näitaja). Kõige rohkem on 30,33 aastaseid(mode).. Noorim töötaja on 23 aastane(min), vanim 64,5 aastane(max). Vanimast kolmas töötaja on 64,25 aastane(largest) ja noorimast viies 23,42 aastane(smallest).
....................................4 3.1 Mitut puud tuleks mõõta et saada keskväärtuse hinnang veaga 0,3 cm..................4 3.2 Mitut puud tuleks mõõta, et saada keskväärtuse hinnang veaga 1%.......................4 4. Usaldusnivoo................................................................................................................. 5 5. Usalduspiirid..................................................................................................................5 6. Standardviga.................................................................................................................. 5 7. Katsetäpsus.................................................................................................................... 5 8. Vaatluste arvu leidmine, kui on teada standardviga......................................................5 9. Vaatluste arvu leidmine kui on teada katsetäpsus......................................................... 6 11
Aritmeetiline keskmine üldkogumi keskväärtus Ruutkeskmine teisenduseks ruutfunktsioon Geomeetriline keskmine teisenduseks logaritmfunktsioon Harmooniline keskmine teisenduseks pöördfunktsioon Kaalutud keskmine juhusliku suuruse iga väärtus Xi korrutatakse mingi kaaluga Wi, summeeritakse korrutised ning jagatakse tulemus kaalude summaga Tinglik keskmine juhusliku suuruse selliste väärtuste arit. Keskmine mis rahuldab teatud tingimust. 15. Mis on standardhälve, standardviga, asümmeetriakordaja, ekstsess, dispersioon? Dispersioon on juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus varieerub. Mida suurem aga dispersioon on, seda enam erinevad katsete tulemused üksteisest. Standardhälve on ruutjuur dispersioonist. Mõõdetava suuruse standardhälbe ühikuks on selle sama mõõdetava suuruse ühik. Standardviga dispersiooni hinnangu positiivne ruutjuur. Standardviga kirjeldab valimi põhjal antud hinnangute hajuvust
Test 6 pidev, diskreetne, poissoni jaotus, jaotusseadus jaotusseadus, eksponentjaotus normaaljaotus, normaaljaotus normaaljaotus negatiivne väärtus poissoni jaotus Test 7 kogum, klastervalik, kihtvalik, lihtne juhuvalik, süstemaatiline valik tõenäosuslik valikumeetod, empiiriline valik fikseeritud samm, süstemaatiline valik, punkthinnang nihketa, efektiivne, optimaalne keskväärtus, normaaljaotus, suur valim keskväärtuse standardviga standardhälve standardviga, keskväärtuse usalduspiirid valimvaatlus usaldatavus suur valim, usaldatavus suurem üldkogumi keskväärtuse usaldusvahemiku laius, vabadusastmete arv studenti jaotus mediaani usalduspiiride leidmisel kasutatakse binoomjaotust, loend on ülekaetud ankeetküsitluse läbiviimisel, mõõtmisvahendi viga Test nr 8 sisukas hüpotees, järeldus peale parameetri empiirilise väärtuse võrdlust kriitilisega
Keskmine väärtus on alati 0 või väga lähedal 0-le. Standardhälve on täpselt 1. Skewness – asümmeetriakordaja • Kokkuleppeliselt on tegemist normaaljaotusega, kui asümmeetriakordaja väärtus on vahemikus [-2; 2], konservatiivsemalt ka [-1; 1] Kurtosis – järsakuskordaja ehk ekstsess • Kokkuleppeliselt on tegemist normaaljaotusega, kui järsakusastmekordaja väärtus on vahemikus [-2; 2], konservatiivsemalt ka [-1; 1] • Standardviga SEM Hindab, kuidas on KI testi tulemused kordusmõõtmistel jaotunud tema nö tõelise tulemuse ümber. Näitab, kui palju meie ennustused mudeli parameetrite kohta võivad varieeruda. Valimite aritmeetiliste keskmiste jaotuse standardhälve. Lihtsustatult: SEM= σ / √nn, ehk valimi standardhälve jagatuna valimi suuruse ruutjuurega. Üksiktulemuste puhul SEM = σx √n 1- rxx, kus SEM on funktsioon testi reliaablusest
regressioonikordaja b märgid langevad kokku või peavad olema erinevad? Miks? Determinatsioonikordaja näitab selgitusvõimet ja on alati positiivne. Regressioonikordaja näitab, kas toimub kasvamine või kahanemine. (nt y=10+0,2x või y=10-0,2x) Tegemist on erinevate sündmustega, seaduspärasust ei ole. Märgid ei pruugi kokku langeda. Kui kasutame hinnagute andmisel järjest suuremaid valimeid, siis hinnangu statistiline olulisus hakkab vähenema aga standardviga suurenema Valimi suurenedes stastiline olulisus hakkab suurenema ning standardviga suure valimi mahu tõttu hakkab vähenema. Väide oleks, kui hinnangu statistiline olulisus suureneks ning standardviga vähenes. Kui me kasutame hinnangute andmisel järjest suuremaid valimeid, siis hinnangu stat. olulisus hakkab suurenema ja standardviga väheneb, kuna hinnang läheb täpsemaks. Standardviga saab suureneda juhul, kui andmed valimites hakkavad suuresti hajuma ja sellega stat. olulisus väheneb.
nulli kriteerium, mis oma olemuselt tähendab seda, et kui vaadeldavas valimis esinevad ainult normaaljaotusega juhuslikud vead, siis vigade aritmeetiline keskmine on null. Kriteeriumi kontrolliks tuleb valimi põhjal leida vigade aritmeetiline keskmine y , 1 Sy standardhälve S ja aritmeetilise keskmise standardhälve e. standardviga. Lisaks Sy veel kahekordne standardviga 2 . y = 0,76; S=0,87; Sy Vastavalt etteantud valimile on leitavad suurused järgmised: Sy = 0,22; 2 = 0,44. Nende põhjal saame vastavaid võrdusi kasutades hinnata süstemaatiliste vigade olemasolu. Võrdused on toodud järgnevalt:
keskväärtuse hinnang (aritmeetiline keskmine), 4.921 dispersioon, 7.352 standardhälve, 2.712 standardhälbe viga 0.183 valimi maht, 110 standardviga, 0.259 variatsioonikordaja, 55.097 variatsioonikordaja viga, 3.715 suhteline standardviga e katsetäpsus. 5.253 2) Leida diameetri usalduspiirid: keskväärtuse 95%lised usalduspiirid, 4.409 5.434
16,85 22,8 Eeldame, et teie proovitükil mõõdetud andmete põhjal tahame teha järeldusi samalaadse 18 üldkogumi kohta 23,75 Selleks arvuta järgmised statistikud oma proovitüki kohta 24,85 1) Leida 1. rinde enamuspuuliigi diameetri kohta (rühmitamata andmetest) järgmised suurused: 21,7 aritmeetiline keskmine, 18,05 dispersioon, 19 standardhälve, 25,35 valimi maht, 20,4 standardviga, 21,5 variatsioonikordaja, 21,4 suhteline standardviga e katsetäpsus. 17,5 2) Leida diameetri usalduspiirid: 20,25 aritmeetilise keskmise 95%lised usalduspiirid, 21,74 25,25 aritmeetilise keskmise 90%lised usalduspiirid, 21,88 19,35 dispersiooni 95%lised usalduspiirid, 18,39
Statistics abil. Usalduspiirid (protseduur Descriptive Statistics) Vaatluste arv- f- Statistical- Count Keskmine väärtus - =AVERAGE(Alguskoordinaat:Lõppkoordinaat) Mediaan - =MEDIAN(Alguskoordinaat:Lõppkoordinaat) Standardhälve - = STDEV.S (Alguskoordinaat:Lõppkoordinaat) Minimaalne väärtus - =MIN(Alguskoordinaat:Lõppkoordinaat) Maksimaalne väärtus - =MAX(Alguskoordinaat:Lõppkoordinaat) Standardviga =Sthälve/SQRT(vaatluste arv) Lisage andmetabelisse kehamassi veeru järele tühi veerg, kirjutage esimesse lahtrisse tunnuse nimeks 'KMI' (kehamassiindeks) ja arvutage selle väärtused kõigile tudengitele valemiga KMI = Kehamass, kg / (Pikkus, m)2. Arvutage tudengite pikkuse, massi, kehamassiindeksi, peaümbermõõdu ja jalanumbri kohta nii palju arvkarakteristikud, kui protseduur Descriptive Statistics (Data sakk Data Analysis) võimaldab.
Maksimum 903 2 212 2 420 See tabel näitab karakteristukat kogu Eesti lõikes. Kui vaadata eraldi linna ja maad, siis on andmed vastavad: Põhiharidus Linnalised asulad Keskharidus Kõrgharidus või madalam Keskmine väärtus 248,00 837,33 715,50 Standardviga 78,89 253,86 296,49 Mediaan 262,5 993 488 Standardhälve 193,24 621,83 726,25 Haare e. 506 1471 1834 variatsiooniulatus Miinimum 8 85 0
Leia E(X2): 02x0,8+12x0,1+32x0,1= 1 1 Jaotusfunktsiooni abil on raske otsustada juhusliku suuruse käitumise üle mingi punkti ümbruses. Seetõttu kasutatakse lisaks jaotusfunktsioonile ka sellest tuletatud tihedusfunktsiooni. 2 4. Populatsioon ja valim, standardviga Populatsioon on kõigi objektide, isendite, esemete, nähtuste või seisundite kogum, mille kohta soovitakse järeldusi teha Populatsiooni neid objekte, mida on vaadeldud või uurimiseks välja valitud, kutsutakse valimiks Valimit, kus uuritava tunnuse jaotus on samasugune kui populatsioonis, nimetatakse esindavaks valimiks Standardhälve- ruutjuur dispersioonist (dispersioon pt.2)
1118 2008 135 1 MA 207,0 14,4 14,3 D2 H HV HKO 18,7 0,0 0,0 0,0 18,4 0,0 0,0 0,0 13,3 0,0 0,0 0,0 13,8 14,6 9,6 2,4 Dispersioon 10,5 12,2 8,1 3,0 Standardhälve 17,3 17,6 9,2 3,2 standardhälve viga 18,6 0,0 0,0 0,0 standardviga 11,8 0,0 0,0 0,0 variatsioonikordaja 13,0 0,0 0,0 0,0 variatsioonikordaja viga 9,4 0,0 0,0 0,0 katsetäpsus 14,1 0,0 0,0 0,0 13,9 11,7 6,4 3,1 13,0 0,0 0,0 0,0 13,5 0,0 0,0 0,0 17,1 0,0 0,0 0,0 13,6 13,1 8,6 1,1 5,2
Varieerumisulatus näitas katsealal puude tunnuste miinimumi ja maksimumi vahelist varieerumist vahemikuna. Dispersioon näitab, kui palju uuritavad suurused varieeruvad. Samade väärtustega katsete dispersioon on võrdne nulliga ning mida suurem on erinevus, seda suurem on ka dispersioon. Standardhälve näitab aga erinevust aritmeetilisest keskmisest. Variatsioonikordaja näitab hajuvust keskväärtuse ümber protsentuaalselt ja mida väiksem on nimetatud väärtus, seda ühtlasem on valim. Standardviga on hinnang mõõtmaks sarnasust aritmeetilisele keskmisele. Katsetäpsus on standardviga aritmeetilisest keskmisest protsentides. Student´i kriteerium näitab, kas erinevus kahe sama tunnuse väärtuse vahel on oluline (vt Tabel 2). Tabel 1. Variatsioon-statistilise analüüsi tulemused I katseala II katseala III katseala
arvutamisel. SEOSED JA DISPERSIOONANALÜÜS: Selleks et väljavõtukogumi alusel tehtavad järeldused oleksid usaldatavad peab väljavõtukogum olema ESINDUSLIK. Esinduslikkuse tagamiseks tuleb kasutada JUHUVÄLJAVÕTTU. Juhuväljavõtuga on tegemist, kui igal uuritaval kogumi liikmel on ühesugune tõenäosus sattuda väljavõtukogumisse. Keskmine esindusviga on väljavõtukeskmiste standardhälve. Keskväärtuse hindamisel võrdub keskmine esindusviga e. standardviga (sigma) väljavõtukskmiste standardhälbega. Kus kasutatakse diskreetset ehk sõredat tunnust? Näit: Laste arv peres Pidevat tunnust? Näit: mistahes reaalarv, inimeste kasv Seose hindamisel tuleb leida kaks lineaarset regressioonifunktsiooni ning regressioonikordajate geomeetriline keskmine. Lineaarne regressioonimudelil: 1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4
.............................................................. 3. Statsionaarsuse ja mittestatsionaarsuse mõjutamine statistikale................................ 4. Statsionaarsuse ja mittestatsionaarsuse aegreadede statistika saamiseks näited........ Aegrea karakteristikud Kui meil on juba antud vaid üks realisatsiooni protsess - aegrida, siis ei ole meil võimalik täpselt aru saada stohhastilise protsessi karakteristikuid. Kuid me saame vaadelda aegrea keskmist väärtust, standardviga ning k-järku autokorrelatsioonikordajad statsionaarse juhuslikku protsessi keskväärtusse, dispersiooni ja autokorrelatsiooni funktsiooni hinnangutena. Kui aegread sisaldavad arengutendentsi, trendi, siis need karakteristikud on kindlasti suhteliselt väheinformatiivsed aegrea iseloomustamiseks, kuna nende väärtused sõltuvad oluliselt vaadeldava ajaperioodi pikkusest. Üheks oluliseks aegrea omaduse jaoks on aegrea
8. regressioon ei pea olema 0 ja 1 vahel Selleks et väljavõtukogumi alusel tehtavad järeldused oleksid usaldatavad peab väljavõtukogum olema ESINDUSLIK. Esinduslikkuse tagamiseks tuleb kasutada JUHUVÄLJAVÕTTU. Juhuväljavõtuga on tegemist, kui igal uuritaval kogumi liikmel on ühesugune tõenäosus sattuda väljavõtukogumisse. Keskmine esindusviga on väljavõtukeskmiste standardhälve. Keskväärtuse hindamisel võrdub keskmine esindusviga e. standardviga (sigma) väljavõtukskmiste standardhälbega. Üliõpilasel on antud ülesanne leida seos kahe valimi vahel. Mida ta peab tegema? 4. kahe valimi vahel ei saa seost leida 5. kahe valmi vahel saab seost leida.. 6. korrelatsioonisuhte, ülddispersiooni leidma Kus kasutatakse diskreetset ehk sõredat tunnust? Näit: Laste arv peres Pidevat tunnust? Näit: mistahes reaalarv, inimeste kasv
Transport y = -464 + 0, 247 x + u 1500 n-2 n-2 1000 Side y = 97 + 0,0277 x + u 500 Mudeli standardviga se = s 2 standard error of regression 0 Parameetrite hinnangute standardvead: 0 5000 10000 Kulud kokku, eurot
test Hulgi- Kinnisvara ja kaubandus äriteenindus 3144 26655 1. h0: tootlikkus ühe tööt5aja kohta neid valdkondades ei ole erine 5183 19822 h1: tootlikkus ühe töötaja kohta neis valdkondades on erinev 5749 1700 2107 1098 2. Temp #NAME? 2869 16179 standardviga #NAME? 2009 237 3200 26067 3. Tcrit #NAME? #NAME? 1887 703 4359 2840 4. #NAME? > #NAME? 2636 839 3525 1612 5. võtan vastu H0 2340 1306 3591 694 4071 4379 2125 1048 7578 875 15 17 n1 n2
mudel sobib matemaatika ärevuse prognoosimiseks. Kuna antud mudeli puhul on olulisuse tõenäosus on 0,00 väiksem kui 0,05 võib öelda, et sõltumatute tunnuste mõju sõltuvale tunnusele on statistiliselt oluline. Tabelis 2 on ära toodud mudeli parameetrid, mis annavad ülevaate mudeli „headuse“ ja prognoosi täpsuse kohta. Mudeli “headust” hinnatakse selle põhjal kui tugev on seos sõltumatute tunnuste komplekti ja sõltuva tunnuse vahel ja standardviga. Kirjeldav mudel ning prognoos on seda täpsem, mida tugevamini sõltumatu(d) tunnus(ed) sõltuva tunnusega seotud on. Antud juhul on determinatsioonikordaja R² väärtus 0,213, mis tähendab, et seos sõltuva ja sõltumatute tunnuste vahel on olemas (0≤ R² ≤1). Kasutades korrelatsioonanalüüsi (Pearson), uurisin tegurite omavahelisi lineaarseid korrelatsioone. Sotsiaalteaduste puhul võib küllaltki tugevaks seoseks pidada juba
Üldkogumi dispersiooni σ^2 punkthinnang: Tsentraalne piirteoreem: Küllalt suure valimi mahu n korral alluvad valimite keskväärtused normaaljaotusele keskväärtusega µ ja standardhälbega σ/ √n, kus σ on kogumi standardhälve. Valimjaotusi standardhälve σ/sqrt n iseloomustab valimite (maht n) keskväärtuste hajuvust, see on valimi keskväärtuse valimjaotuse standardhälve. Kogumi standardhälbe hinnang. Iseloomustab üksikute objektide hajumist Standardviga - Praktikas pole meil üldkogumi standardhälbe tegelik väärtus σ teada ning kasutatakse selle hinnangut, valimi standardhälvet s. Keskväärtuse valimjaotuse standardhälbe hinnang. Iseloomustab valimite keskväärtuste hajumist Tsentraalne piirteoreem kehtib, kui kogumi maht N → ∞ ,siis valimjaotuse dispersiooni hinnang Kui kogumi maht N on lõplik ja väheneb valimi tegemisel, siis Lõpliku kasutada siis, kui n/N>0,05
2 3 1. Hüpoteesi püstitamine 3 21 Null hüpotees: 4 6 Sisukas hüpotees: 5 25 6 4 7 18 2. Vaatlusandmetest parameetri empiirilise väärtuse leidmine 8 8 Valimi maht 9 2 Valimi keskmine 10 14 Valimi standardhälve 11 7 12 7 standardviga 13 15 teststatistiku empiiriline väärtus 14 3 15 24 3. Kriitilise väärtuse leidmine antud olulisuse nivool 16 14 olulisuse nivoo 17 13 teststatistiku kriitiline väärtus 18 7 19 14 4. Parameetri empiirilise väärtuse võrdlemine kriitilisega 20 16
väärtuste tõenäosuste summa peab olema 1. Juhusliku suuruse X väärtustest ligikaudu 12. Missugused on juhusliku suuruse hajuvuse karakteristikud (nimeta vähemalt 4). Definitsioonid. 13. Missugused karakteristikud iseloomustavad tihedusfunktsiooni kuju (nimeta 2). Definitsioonid. 14. Nimeta erinevad valimi keskmised. Aritmeetiline keskmine jne. Mis on neil erinevused? 15. Mis on standardhälve, standardviga, asümmeetriakordaja, ekstsess, dispersioon? 16. Pidevad ja diskreetsed jaotused. 17. Mis on usaldusnivoo? usaldusnivoo - see on tõenäosus, millega üldkogumi väärtus paikneb teatud vahemikus. Tavaliselt võetakse usaldusnivooks 0,95 (ehk 95%), kus siis olulisuse nivooks on 0,05 (ehk 5%). 18. Mis on usalduspiirid? Usalduspiir- jaotuse baasil valemist . Kuna t-jaotus on lamedam, on rohkem kui aasta tagasi funktsiooniga CONFIDENCE. 19. Mis on nullhüpotees
Juhuslik varieeruvus ei arvutatakse keskmine eeldatav eluiga. (Matemaatiline tehe `1- sellest, kas tegu asümptomaatilise rahvastikuga või juba teatud ole välditav, allub tõenäosusteooria reeglitele ja tema võimalikku suremistõenäosus') Keskmine eeldatav eluiga sünnimomendil ehk sümptomitega inimestega; Optimaalse piiri leidmiseks kasutatakse nn ulatust saab hinnata. Protsendi standardviga- keskmine kaugus keskmine eluiga osutab inimese keskmisele eluea pikkusele, oletades, ROC-kõveraid: tundlikkuse ja valepositiivse tõenäosuse (1 - üldkogumi protsendist, iseloomustab valimiprotsendi varieeruvust üle et suremus jääb samaks. Sündimuse, suremuse ja rände koostoime spetsiifilisus) graafikuid. Kasutul testil on tundlikkus võrdne kõikvõimalike valimite samast üldkogumist. 95% tõenäosusega asub
5. Kas on õige väide: kogumi keskväärtuse punkthinnang on juhuslik suurus. Tõene 6. Kui parameetri hinnangu keskväärtus võrdub tegeliku väärtusega, siis hinnang on nihketa. 7. Joonisel on toodud tunnuse X jaotuskõver kolmes erinevas kogumis. Millisel juhul alluvad vastavast kogumist võetud valimite keskväärtused normaaljaotusele? kõigi kogumite korral, kui valimid on piisavalt suured. 8. Mis on keskväärtuse standardviga? keskväärtuse valimjaotuse standardhälve. 9. Tsentraalne piirteoreem ütleb, et küllalt suure valimite mahu n korral alluvad valimite keskväärtused normaaljaotusele. Kui on üldkogumi standardhälve, siis milline on valimite keskväärtuste jaotuse standardhälve? . 10. Kui valimi mahtu suurendada 9 korda, siis üldkogumi keskväärtuse hinnangu standardviga väheneb 3 korda. 11
MoveBufferArea (Int32, Int32, Int32, Koopiad konkreetsest allikast ekraani pindala puhverlahust Int32, Int32, Int32) ettenähtud sihtkohta piirkonnas. MoveBufferArea (Int32, Int32, Int32, Koopiad konkreetsest allikast ekraani pindala puhverlahust Int32, Int32, Int32, Char, ettenähtud sihtkohta piirkonnas. ConsoleColor, ConsoleColor) OpenStandardError () Omandab standardviga oja. OpenStandardError (Int32) Omandab standardviga oja, mis on määratud puhvri suurust. OpenStandardInput () Tagastab standardsisendit oja. OpenStandardInput (Int32) Tagastab standardsisendit oja, mille jaoks nimetatud puhvri suurust. OpenStandardOutput () Tagastab standardväljundisse oja. OpenStandardOutput (Int32) Tagastab standardväljundisse oja, mille jaoks nimetatud puhvri suurust.
Intervallide arv ei tohi olla liiga suur! Saadakse histogramm pideva tunnuse jaotumise kirjeldamiseks (järjestikuste tulpade vahele vahesid ei jäeta). · Suhteline sagedus · Protsent · Keskmine vt valemit. Keskväärtuse puuduseks on tema suur tundlikkus üksikute äärmuslike vaatluste suhtes. Kui selliseid vaatlusi esineb, on mõttekam kasutada mediaani · Standardhälve leitakse kui ruutjuur dispersioonist vt valemit. · Standardviga · Mediaan ehk teine kvartiil- järjestatud valimi keskpunkt väärtus, millest nii suuremaid kui väiksemaid väärtusi on valimis 50%. Kui valimi suurus on paaritu, siis on mediaaniks keskmine vaatlus järjestatud valimis. Kui tegu on paarisarvulise suurusega valimis, siis on mediaaniks kahe keskmise väärtuse aritm kesk. · Kvartiilid saab hinnata valimi varieeruvust. Alumine kvartiil on tunnuse selline väärtus,
ühesugustes keskkondades, siis on tunnuse rühmadevaheline variatsioon tingitud geneetilistest erinevustest loomadevahel. epigeneetilised faktorid tunnuse avaldumisel ii. Keskkond -sööda kvantiteet ja kvaliteet, keskkonna temperatuur, päikesekiirgus, patogeensed faktorid, pidamistingimused jne iii. Epigeneetilised faktorid c. Fenotüüpide jaotus populatsioonis variatsioonirida normaaljaotus aritmeetiline keskmine standardviga d. Päritavuskoefitsient- ehk heritaablus, tähis: h2; arvuliselt väljendatav geneetilise muutlikkuse suhtosa tunnuse üldises populatsioonisiseses (individuaalses) muutlikkuses antud keskkondlikes tingimustes. Üldjuhul defineeritakse geneetilise dispersiooni suhtena tunnuse kogudispersiooni: h2 = Vg/Vp. Päritavuse sisu õigeks mõistmiseks on vaja arvestada, et päritavuskoefitsient hindab tunnuse geneetilise muutlikkuse
korrelatsioone ja need on head, siis on ta usaldusväärne test. 4. sisemise konsistentsuse / sisereliaabluse hindamine - Sisereliaablus põhineb testiküsimuste arvul k ja nende omavahelisel keskmisel korrelatsioonil r_{ij}. Leitakse kõigi küsimuste vahelised korrelatsioonid ning nende keskmine. (kasut.sageli) * Tavaliselt arvutatakse Cronbachi alfa * õige/vale vastustega testides saab arvutada ka KR20, kasutades Kuder- Richardsoni valemit 13. Mõõtmise standardviga (kuidas me saame selle abil õigesti määratleda tegelikku tulemust). Mõõtmise standardviga SEM (standard error of measurment) = SD_x x sqrt(1 - r_{xx'}) * Suurust SEM interpreteeritakse kui üksikmõõtmiste jaotuse standardhälvet, st 68% võimalikest kordustulemustest jääks vahemikku x +/- SEM. * Kuna tüüpiline on 95% usalduspiiride kasutamine, siis tuleks leida vahemik x +/- 1,96 x SEM 14. Mis on põhjused, kui kordustesti reliaablus on madal? .. kui parallelletesti
o. kaks arvu mille vahel asub üldkogumi parameeter tõenäosusega 1-. 7) Standartveaks nimetatakse aritmeetlise keskmise kui keskväärtuse hinnangu standarthälvet. 8) Katsetäpsuseks nimetatakse suhtelist standartviga protsentides. 9) Standardvea arvutamise valem (Equation Editoriga) sx sx = N 10) Katsetäpsuse arvutamise valem sx sx V = 100 = x Px = 100 x N x N 11) N leidmise valem, kui on ette antud standardviga 12) N leidmise valem, kui on ette antud katsetäpsus Hüpoteeside kontroll 13) Edasi võrdlesin enda proovitükil mõõdetud andmeid proovitükiga 64. Selleks arvutasin proovitükil 64 kahes suunas mõõdetud diameetri keskmise. Seejärel filtreerisin proovitükilt 64 välja 1. rinde sama puuliigi( MA) diameetrid ning leidin vaatluste arvu. Proovitüki nr. 64 vaatluste arv tuli N=64 14Edasi leidsin mõlema proovitüki diameetri dispersioonid vastaval 1. rinde puuliigile
leidmiseks korrutatakse kõik väärtused (n väärtust) omavahel ja võetakse saadud korrutisest n-juur. Näiteks saab geomeetrilise keskmise abil arvutada palkade keskmise kasvutempo kasvuindeks (kasvutempo). harmooniline keskmine, - pöördvõrdeline 18. Valimi dispersiooni hinnang, - standardhälbe hinnangud, - s = ruutjuur dispersiooni hinnangust standardviga - 19. Absoluutne sagedus - Absoluutset sagedust kutsutakse üldjuhul lihtsalt sageduseks. Absoluutne sagedus on vastava tunnuse väärtusega objektide arv ning see on alati täisarv suhteline sagedus, - Suhteline sagedus on sageduse jagatis koguarvuga ning seda väljendatakse tihti protsentides kumulatiivne absoluutne (suhteline) sagedus. - Kumulatiivne sagedus saadakse absoluutsete sageduste liitmisel kuni käesoleva väärtuse sageduseni (kaasa arvatud). n1+n2+n3
R Square 0,0398156552 determinatsioonikordaja tugevusega seos. Determinatsioonikordaja populatsioonil ja Adjusted R Square 0,0198118147 korrigeeritud determinatsioonikordaja immigratsioonil on võrdne ligikaudu 3,98%,. Standard Error 240384591,86 mudeli standardviga Korrigeeritud determinatsioonikordaja on Observations 50 vaatluspunktide arv 1,98%. ANOVA df SS MS F Significance F Regression 1 1,15015E+017 1,2E+017 1,990401 0,1647474991 Residual 48 2,77367E+018 5,8E+016 Total 49 2,88868E+018
6 57 169.2 58 167.2 59 170.4 60 168 61 171.5 62 169.9 63 168.2 64 170.5 65 167.6 66 165.2 67 169 68 169.8 69 167.8 70 167.8 71 166.4 72 167.2 73 165.6 74 167 75 171.4 76 179 77 175 78 176.4 79 177.4 80 174.4 81 173.8 82 168 83 165.4 84 166.4 85 167.6 86 167.6 87 166 88 167 89 168 90 172.4 keskmiste keskmine: 169.69 üldkogumi keskmine: 168.72 keskmiste standardhä 3.47 üldkogumi standardhälve: standardviga: 2.64 Kehakaal Jalanumber 71.25641 41.61538462 67 41 173 58 38 105 46 170.5 60.5 39 181.5 80 44 11 19.5 5 167.6 57.4 38 189.4 91.2 45
Lineaarne regressioonianalüüs Mudeli kirjeldatuse taset näitab R ruut, mis antud juhul on ,911. Kirjeldatuse tase on seega väga hea. Täpsemalt näitab R ruut kui suure osa riietele ja jalanõudele tehtavate kulutuste hajuvusest suudab koostatud mudel ära kirjeldada. Tabel 4. Kirjeldatuse tase. Model Summary Mudel R R ruut Kohandatud Hinnangu standardviga R ruut a 1 ,911 ,830 ,821 153,444 a. Predictors: (Constant), töötus, kaalutud_hinnad_HICP, SKP_pc Tabel 5 näitab mudeli olulisust. Kui sig ≤ 0,05, siis on mudel statistiliselt oluline. Praegusel juhul sig=0,000 s.t mudel on statistisliselt oluline. Tabel 5. Mudeli olulisus.
Kui suur osa koguhajuvusest on mudeliga seletatud, näitab ikka tavaline determinatsioonikordaja R2 . Korrigeeritud determinatsioonikordaja on vaid üks kvantitatiivne näitaja, mida kasutatakse erinevat arvu tunnuseid sisaldavate mudelite võrdlemiseks. 34. Parameetrite mitteolulisuse võimalikud põhjused. 1. Tunnus ei sobi mudelisse. 2. Teooriast lähtudes peaks tunnus suurust Y mõjutama ja mudelis olema, kuid valimi maht on liiga väike ja standardviga tuleb liiga suur. 3. Esineb multikollineaarsus. • Mudelisse võetud tunnused on omavahel tugevas korrelatsioonis, ei ole sõltumatud. • Parameetrite standardvigade hinnangud tulevad sel juhul suured. 4. Vabadusastmete arv n-k liiga väike, st kui tunnuste arv on suur ja valimi maht n väike. • Soovitatav, et parameetrite arv k on oluliselt väiksem valimi mahust n. 35. Klassikalise lineaarse mudeli eeldused. 1. Eeldus: mudel on lineaarne parameetrite suhtes Eristada tuleb:
väga plaju erinevaid) ja selle tulemusi õigesti interpreteerida. Seletav tunnus ehk kirjeldav tunnus ehk argumenttunnus ehk sõltumatu tunnus. Prognoositav tunnus ehk funktsioontunnus ehk sõltuv tunnus. Sõltuv tunnus sõltub sõltumatust. Vabadusastmete arv (degree og freedom, df) – sõltumatute muutujate arv. SAGEDUS- JA JAOTUSTABELID Keskmised – Mediaan - Mood - Kvartiilid - Dispersioon - Standardhälve - Variatsioonikoefitsient - Standardviga - Usalduspiirid keskmisele - 4.LOENG STATISTILISED TESTID Hii-ruut test - Võimaldab otsustada juhuslike suuruste jaotuste erinevuse ja sarnasuse üle. Annab vastuse küsimustele: kas erinevus (kahe) grupi sagedusjaotuses on statistiliselt oluline või mitte. T-testid – kõige lihtsam meetod uurida pidev tunuse keskmiste erinevust rühmiti. T-tesi puhul on neid rühmi kaks või üks. Küsimus kas vaadeldav (valimis esinev) kahe rühma
41 1 42 1 43 2 44 1 45 0 46 0 47 3 48 1 Vanus 17 Aritmeetiline keskmine Mean 25,7453936 17 Standardviga Standard Error 0,21259365 17 Mediaan Median 25 17 Mood Mode 28 17 Standardhälve Standard Deviation 5,19442458 17 Dispersioon Sample Variance 26,9820467 18
tõenäosus p 0.001 on väiksem kui 0.05. Mudeli sõltumatud muutujad kirjeldavad ära 82% tarbimise varieeruvusest. b) Kuna muutujate X ja D t-statistikute absoluutväärtused on suuremad kui kriitiline väärtus ( 22.54 1.99; 2.34 1.99) , siis statistiliselt olulised muutujad mudelis on muutuja X ja muutuja D. Muutujate X ja D koostoimemuutuja DX on statistiliselt ebaoluline c) Usalduspiiride leidmiseks on esmalt vaja leida parameetri hinnangu standardviga ˆ vastavalt valemile se ˆ . Antud juhul se 0.93 / 22.54 0.041 . Parameetri t hinnangu usalduspiirid avalduvad valemiga ˆ se ˆ t / 2, nk . Seega muutuja X ees oleva kordaja usalduspiirid on 0.93 1.99 * 0.041 Ülesanne 2.
SELLEST EI OLNU TEGELIKULT VAJA ARU SAADA Kui on erinevus valimi keskmiste puhul väga väike ei saa üldkogumi kohta midagi väga öelda. Suurte valimite puhul on t-testi kõver normaaljaotuskõvera sarnane, väikeste valimite korral on kõver lamedam. T kõver varieerub vastavalt valimile. Kuhu tõmmata piirid? – t-jaotuse täiendkvantiilid on selle jaoks vt konspekte. Df=n-1 Vabadusastmete arv on indikaator (Df). Paaride erinevuste jaotus. –keskmine, standardhälve, standardviga ja selle usalduspiirid. See on oluline järelduste tegemisel vt p7 lehel. Ehksiis eelnev jutt oli selleks, kui keegi magistritöös küsib, et mis on t-statistic siis tead. Antud juhul on ta t(16)=- 6.37 (sulgudes on vabadusastmete arv). Erinevust valimi keskmiste sõltuvalt t jaotusest. Kuna normaaljaotus on liiga jäik ja ei sõltu valimist, siis mõeldigi välja see t jaotus, mis muutub vastavalt valimi väärtusele. Järelduse pärast me seda kõik tegime, et kumb hüpotees on õige
b. võrreldes dispersioone c. võrreldes variatsioonamplituude Õige Selle esituse hinded: 1/1. Question 10 Hinded: 1 Kui variatsioonreas esinevad väikesed ekstremaalsed väärtused, siis Vali üks vastus. a. aritmeetiline keskmine < mediaan < mood b. mood < aritmeetiline keskmine < mediaan c. mood < mediaan < aritmeetiline keskmine Vale Selle esituse hinded: 0/1. Hinded: 1 Kui valimi mahtu suurendada 9 korda, siis üldkogumi keskväärtuse hinnangu standardviga Vali üks vastus. a. väheneb 3 korda b. väheneb 9 korda c. suureneb 9 korda Õige Selle esituse hinded: 1/1. Question 2 Hinded: 1 Aritmeetiline keskmine on Vali üks vastus. a. 2. järku keskmoment b. 1. järku keskmoment c. 1. järku algmoment Õige Selle esituse hinded: 1/1. Question 3 Hinded: 1 Kui variatsioonreas esinevad väikesed ekstremaalsed väärtused, siis Vali üks vastus. a. mood < mediaan < aritmeetiline keskmine b
võrreldes dispersioone c. võrreldes variatsioonamplituude Õige Selle esituse hinded: 1/1. Question 10 Hinded: 1 Kui variatsioonreas esinevad väikesed ekstremaalsed väärtused, siis Vali üks vastus. a. aritmeetiline keskmine < mediaan < mood b. mood < aritmeetiline keskmine < mediaan c. mood < mediaan < aritmeetiline keskmine Vale Selle esituse hinded: 0/1. Hinded: 1 Kui valimi mahtu suurendada 9 korda, siis üldkogumi keskväärtuse hinnangu standardviga Vali üks vastus. a. väheneb 3 korda b. väheneb 9 korda c. suureneb 9 korda Õige Selle esituse hinded: 1/1. Question 2 Hinded: 1 Aritmeetiline keskmine on Vali üks vastus. a. 2. järku keskmoment b. 1. järku keskmoment c. 1. järku algmoment Õige Selle esituse hinded: 1/1. Question 3 Hinded: 1 Kui variatsioonreas esinevad väikesed ekstremaalsed väärtused, siis Vali üks vastus. a
väiksem kui olulisuse nivoo ), on vastav parameeter oluliselt nullist erinev: tunnuse lülitamine mudelisse on põhjendatud. Vastupidisel juhul tuleks tunnus mudelist eemaldada ja viia läbi uue mudeli hindamine. Väiksem valim -> suuremad standardvead -> tekib mitteolulisus. 37. Parameetrite mitteolulisuse võimalikud põhjused. 1. Tunnus ei sobi mudelisse. 2. Teooriast lähtudes peaks tunnus suurust Y mõjutama ja mudelis olema, kuid valimi maht on liiga väike ja standardviga tuleb liiga suur. 3. Esineb multikollineaarsus · Mudelisse võetud tunnused on omavahel tugevas korrelatsioonis, ei ole sõltumatud · Parameetrite standardvigade hinnangud tulevad sel juhul suured. 4. Vabadusastmete arv n-k liiga väike, st kui tunnuste arv on suur ja valimi maht n väike. · Soovitatav, et parameetrite arv k on oluliselt väiksem valimi mahust n 38. Mis juhtub parameetrite hinnangutega, kui vealiikmete keskväärtus ei ole 0?
Kasutatakse mudelite võrdlemisel kui lisatakse või eemaldatakse tunnuseid. Mida suurem korrigeeritud determinatsioonikordaja seda täpsem/parem mudel. Mudelite võrdlemiseks tunnuste lisamisel. Kui R suureneb uue tunnuse lisamisel, siis mudel paranes ja on õigustatud 34) Parameetrite mitteolulisuse võimalikud põhjused Tunnus ei sobi mudelisse Teoorias peaks tunnus mõjutama suurust Y ja mudelis olema, aga valimi maht liiga väike (standardviga liiga suur) Multikollineaarsus (parameetrite standardvigade hinnangud tulevad suured) Vabadusastmete arv n-k liiga väike. Tunnuste arv liiga suur ja valimi maht väike (valimi maht vähemalt 2 korda suurem kui tunnuste summa) 35) Klassikalise lineaarse mudeli eeldused (loeng 3) mudel on lineaarne parameetrite suhtes, vaatluste arv ei tohi olla väiksem kui hinnatavate parameetrite arv (n>=k), regressori väärtused valimis ei tohi olla
Üldkogumi parameetri vahemikhinnang on piirkond arvteljel, millesse hinnatav parameeter jääb teatud usaldatavusega. Vahemikhinnangul on mõned olulised omadused: usaldatavuspiirkond on seda laiem, mida suurem on usaldatavus ja seda väiksema täpsusega on määratud hinnatav parameeter. Mida suurem on väljavõtukogum, seda kitsam on usaldatavuspiirkond ja seda täpsemalt on määratud hinnatav parameeter. · Keskväärtuse hindamisel võrdub keskmine esindusviga ehk standardviga väljavõtukeskmiste standardhälbega. · Valimi kaalumist kasutatakse valimi esinduslikkuse parandamiseks. Kui valim vajab kaalumist mitme erineva tausttunnuse järgi, siis objektidele kaalude omistamisel korrutatakse omavahel erinevate tausttunnuste järgi saadud kaalud. · Valimi keskmise leidmisel kasutatakse aritmeetilist keskmist. · Vea komponendid: valikuviga, loendiviga, kaoviga, objektide asendamise viga, mõõtmisviga, töötlusviga.
Std. Error Sugu N Mean Std. Deviation Mean matemaatika 1 608 9.46 4.516 .183 2 742 7.35 3.856 .142 Esimeses tabelis tuuakse ära mõlema grupi valimi suurus, aritmeetiline keskmine, standardhälve ja aritmeetilise keskmise standardviga. Teise tabeli esimeses pooles tuuakse ära Levene'i test gruppide dispersioonide võrdlemiseks: Teise tabeli teises pooles on info gruppide keskmiste võrdlemiseks: 7 Statistikas on saanud traditsiooniks kasutada olulisusnivoosid 0.01 (ehk 1%) ja 0.05 (ehk 5%). Valides olulisusnivooks 0
Millal võib tekkida mitteolulisus? Mida mudeli hindamisel esimesena vaadatakse? 1. Tunnus ei sobi mudelisse. 1. Kas mudel on statistiliselt oluline, st kas F - testi olulisuse 2. Teooriast lähtudes peaks tunnus suurust Y mõjutama ja tõenäosus p < ? mudelis olema, kuid valimi maht on liiga väike ja 2. Kas parameetrite hinnangud on statistiliselt olulised, st kas standardviga tuleb liiga suur. parameetrite t-testi olulisuse tõenäosused p < ? 3. Esineb multikollineaarsus. Mitteolulised tunnused eemaldatakse ühekaupa mudelist: viiakse · Mudelisse võetud tunnused on omavahel tugevas korrelatsioonis, läbi uue mudeli hindamine ilma nende tunnusteta. ei ole sõltumatud. 3
∑ n i=1 ¿=¿ 2 ∑ ¿ n i=1 ´ D X=D ¿ N 1 2 D x i=E (x i−E x i) = ∑ (x −μ)2=σ 2 ] ja standardviga on ruutjuur sellest ehk N k=1 k σ σ X´ = √n . 27. Milline on valimikeskmise jaotus? Valimikeskmise jaotus on vaadeldav vastavalt tsentraalsele piirteoreemile valimikeskmise ja aritmeetilise keskmise piisavalt suure liidetavate arvu korral ehk piisavalt suure valimi σ X´ N ( E X´ , σ X´ ) =N ( μ , ) korral. √n 28
otsustusi EST juhtude sageduse põhjal. Esiteks saame hinnata, milline on tõenäosus, et EST grupi liikmed juhuslikult arvasid ära õige kaardi. Kuna 2 vastust10, siis 50 % oleks juhusliku äraarvamise tulemus. Kas number erineb juhuslikust keskmist. Valimjaotus (sampling distribution) kirjeldab paljukordsete katsetulemuste jaotumist. Valimjaotuse keskmine [müü] võrdub populatsiooni keskmisega (population mean). Antud näite puhul =50. Valimjaotuse standardhälve=keskmise standardviga (standard error of the mean - sem) xx . Keskmise standardviga esindab kõigi nende väärtuste variatiivsust valimi keskmise leidmisel, mida võiks oodata, kui me valiksime korduvalt juhuslikud, kindla suurusega valimid kogu populatsioonist. Keskmise standardviga sõltub populatsiooni st.hälbest ja valimi suurusest (korduste arv) järgmiselt: xx ( = : / n (valimi suurus) Teades valimjaotuse keskmist ja SD-d saab statist
000 0.933 1.869 0.933 1.869 atistiliselt oluline. Kui tihti külastat e nädalas toidukau Kehakaal plust? 3 1 Arv-ja järjestustunnuste usaldusintervall 5 4 2 3 Kaal 5 2 Standradhälve 1.56 2 1 Aritmeetiline keskmine 3.49 4 4 Keskväärtuse standardviga (SE) 95 0.19 1 5 2*SE 0.37 6 3 4 3 Usaldusintervall 95% 3.31 6 4 alumine piir 3.12 2 1 ülemine piir 3.87 3 2 2 1 2 1 Usaldusintervall(kaal) 5 2 Usaldusintervall(toidukaupluse külastamine) 5 4 6 3 4 3 1 2
Whitney U Test. Analyze Nonparametric Tests Legacy Dialogues 2 Independent Samples. 5. PRAKTIKUM 1) KAHE SÕLTUMATU GRUPI KESKMISTE VÕRDLEMITE PARAMEETRILISE TESTIGA Käskluserida: Analyze Compare Means Independent Samples T Test Independent Samples T-testi tulemused ja nende tõlgendamine: a) Esimeses tabelis tuuakse ära mõlema grupi valimi suurus, aritmeetiline keskmine, standardhälve ja aritmeetilise keskmise standardviga. Group Statistics Std. Error Sugu N Mean Std. Deviation Mean matemaatika 1 608 9.46 4.516 .183 2 742 7.35 3.856 .142 b) Teise tabeli esimeses pooles tuuakse ära Levene'i test gruppide dispersioonide võrdlemiseks: