ERINEVAD SEOSEKORDAJAD 3 1. PEARSONI KORRELATSIOONIKORDAJA enimkasutatav korrelatsioonikordaja. n (x i x )( y i y ) r i 1 n n (x i 1 i x ) 2 ( yi y ) 2 i 1 2. SPEARMANNI JA KENDALLI KORRELATSIOONIKORDAJAD Järjestustunnuse puhul. Arvulise tunnuse puhul. Normaaljaotuse eeldus puudub. n 6 d i2 rS 1 i 1 n( n 2 1) d i si ti Spearmanni korrelatsioonikordaja d – astakute vahe
Toimi nagu diagrammi tegemisel(insert-scatter). Leia oma klassi õpilaste pikkuse ja kehakaalu korrelatsioonikordaja ning jalanumbrite ja pikkuse korrelatsioonikordaja. Erinevalt eelmisest punktist, tuleb nüüd märgistada mõlemad kogumid: üks reale Array1 aj teine reale Array2. Kumb seos on tugevam? 4. Leia oma klassi antud ainete keskmised hinded ja standardhälbed. Leia 5 ainepaari kohta korrelatsioonikordajad. Missuguste ainete hinded on omavahel kõige tugevamas seoses? Missuguse aine keskmine hinne erineb tütarlastel ja noormeestel kõige rohkem?
teststatistiku f väärtus toodud anova tabeli korral funktsioontunnus faktor korrelatsioonimaatriks negatiivne kovariatsioon, autokorrelatsioon, spearmani korrelatsioon summaarne dispersioon arvutusvalemis, kovariatsioon õige hajumisdiagramm hajumisdiagramm, tunnuste vaheline seos kõige tugevam korrelatsioonikordaja ja kovariatsioon hajumisdiagramm, esitatud seos positiivne korrelatsioon, negatiivne korrelatsioon, pearsoni korrelatsioonikordaja, lineaarne korrelatsioonikordajad, tunnuste vahel on kõige tugevam seos, monotoonne seos, spearmani korrelatsioonikordaja tõene, väär, suurendades suurust x suureneb ka y, korrelatsioonikordaja Test 9 regressioonanalüüs, regressioonmudeli parameetrite hinnang, vähimruutude meetod, jäägid, kriipsukesed determinatsioonikordaja determinatsioonikordaja näitab vaatluste arv, korrigeeritud determinatsioonikordaja, kordaja a, vabaliige b, kordaja a standardviga
dispersion erinevad. Statsionaarsuse testimiseks on välja töötatud ka mitmeid formaalseid teste (ühikjuure testid), mida vaatleme hiljem. Näide 1 Vaatleme USA agregeeritud tarbimist aastatel 1966-2007 (kvartaalsed andmed). Joonistel 2, 1 ja 3 on toodud vastavalt aegrea ning tema esimest ja teist järku diferentside korrelogrammid. Näeme, et aegrida on mittestatsionaarne, kuid tema esimest järku diferentsid on statsionaarsed. Aegrea edasisel diferentsimisel hakkavad korrelatsioonikordajad aga kasvama. Joonis 2 USA agregeeritud tarbimise (1966-2007, kvartaalsed andmed) korrelogramm. Joonis 3 USA agregeeritud tarbimise (1966-2007, kvartaalsed andmed) teist järku diferentside korrelogramm.
Essee "Diplomitöö analüüs" Minu essee eesmärk on analüüsida minuga valitud diplomitööd. Diplomitöö analüüs on teemal ,,Tarbijate valikukriteeriumid nutitelefonide ostmisel", mille autor on Tallinna Tehnikaülikooli rahvusvahelise majanduse ja ärikorralduse õppiv üliõpilane Kaarel Kosk. Lõputöö eesmärgiks autor seadis, kui oluliseks peavad tarbijad nutitelefoni valikul ostuotsuse langetamisel seadme erinevaid füüsilisi parameetreid ja milliseid toiminguid kõige enam nutitelefoniga igapäevaselt teostatakse. Üliõpilase töö omab praktilist väärtust ja on kindlasti osaliselt kasutatav õppematerjalina. Autori teema valik on väga hästi selgitatud sissejuhatuses. Teema on teoreetiline, seega annab probleemide selgitamist, võrdlemist või edasiarendamist. Pole kahtlust, et nutitelefoni valik tänapäeval on väga aktuaalne ja praktiline teema, kuna nutitelefon on...
sektordiagrammid) statistiliselt/sisuliselt korrektne tulem, mis vastab püstitatud andmeanalüüsi küsimusele. b) Otsustada, milline valitud õigetest tulemitest on parim antud tulemuste esitamiseks KORRELATSIOONANALÜÜS Kuidas on kaks tunnust seotud? Reeglina mõõdetakse seost kahe intervalltunnuse (või järjestustunnuse) vahel. On oluline, et mõlemad mõõdetavad tunnused moodustaksid mingi järjestuse. Korrelatsioonanalüüs KORDAJAD Enamlevinud korrelatsioonikordajad Pearsoni kordaja puudused • Lineaarne seos: tunneb punktipilve, mis on venitatud piki sirget. • Tundlik erandite suhtes: paar üksikut erandit väikeses valimis kahekordistavad kordaja väärtust. Spearman e. astakkorrelatsioonikordaja • Pidevad tunnused ei ole normaaljaotusega (ka erandlikud väärtused) • Järjestustunnus • Spearmanni kordaja > Pearsoni kordaja (tavaliselt) Kendall • Vähemalt järjestustunnused • Samasuunaliste ja vastassuunaliste paaride analüüs
Kui nende tabelite erinevus on suur, siis on ka hii-ruut-statistik suure väärtusega. Kui need tabelid on täpselt ühesugused, on hii-ruut-statistiku väärtuseks 0. Seega: leitakse, kui palju tegelik jaotus erineb hüpoteetilisest jaotusest. Crameri V: Kui tunnused on sõltumatud, siis 0; tugevaim seos 1. Saab kasutada sagedustabeli kuju ja kogumi suurust arvesse võtmata. 14) Hajuvusdiagramm ja korrelatsioonikordajad seose uurimiseks kahe arvtunnuse vahel. Probleemid korrelatsioonikordajate kasutamisel. Kasvav seos Ühe tunnuse suured väärtused esinevad sageli koos teise tunnuse suurte väärtustega. Ühe tunnuse väikesed väärtused esinevad koos teise tunnuse väikeste väärtustega. Kahanev seos Ühe tunnuse suur väärtus esineb koos teise tunnuse väikese väärtusega. Seos puudub, tunnused on sõltumatud See, milline on ühe tunnuse väärtus, ei mõjusta teise tunnuse väärtust.
väärtustest. Näiteks kui inimese valimiseelistus sõltuks tema soost. · Uurides seost nominaaltunnuste vahel võetakse appi risttabel. · Seost risttabelis mõõdetakse hii-ruut-statistiku (c²-statistiku) abiga. Crameri V - Kui tunnused on sõltumatud, siis 0; tugevaim seos 1. · Saab kasutada sagedustabeli kuju ja kogumi suurust arvesse võtmata. 14) Hajuvusdiagramm ja korrelatsioonikordajad seose uurimiseks kahe arvtunnuse vahel. Spearmani korrelatsioonikordaja järjestustunnuste korral. Probleemid korrelatsioonikordajate kasutamisel. Hajuvusdiagrammi põhjal saab anda esialgse hinnangu tunnustevahelise seose tugevusele. Vastavalt sellele, milline on korrelatsioonikordaja märk, räägitakse positiivsest ja negatiivsest korrelatsioonist tunnuste vahel. Kui tunnuste vahel on kasvav seos, on korrelatsioonikordaja positiivne.
Populatsioonigeneetikast, aretusest ja selektsioonist Mida mõõdavad päritavuskoefitsient ja geneetilised korrelatsioonikordajad? päritavuskoefitsient - Koefitsient, mis iseloomustab tunnuse päritavust populatsioonis. valem h2=g2/2p näitab,mil määral erinevused isendite genotüüpides peegelduvad nende fenotüübi väärtuste erinevustes.varieerumine 0 ja 1 vahel. geneetiline korrelatsioonikordaja- nähtus, mille puhul ühe tunnuse muutusega kaasneb teise (korreleeruva) tunnuse muutus Mis asi on aretusväärtus? põllumajandusloomalt tema järglastele edasiantav geenide
Kui VIF on suurem kui 5 või 10 ja Tolerance väiksem kui 0,1, siis võib esineda, muidu mitte. Kui konditsiooniindeks CI väärtus on 10 ja 30 vahel, siis on mudelis mul.kollineaarsuse oht. Kui see on üle 30, siis on suur oht. Mult.Kollineaarsuse avastamiseks viiakse lisaks regressioonianalüüsile läbi ka korrelatsioonianalüüs. St leitakse paarikaupa kõigi tunnuste korrelatsioonikordajad ja võrreldakse sõltuvate tunnuste omavahelist korrelatsiooni ja korrelatsiooni sõltuva tunnusega. Nihketa hinnang hinnangu keskväärtus võrdub parameetri tegeliku väärtusega. 27. Negatiivne korrelatsioon -- ühe suuruse kasvades teine suurus kahaneb. 28. Normaaljaotus On pidev jaotus. Kirjeldatav 2 parameetriga: keskväärtusega (müü ) ja dispersiooniga ( 2 st. ruut). Normaaljaotuse korral keskväärtus, mood ja mediaan ühtivad.
= |1| siis on tegemist funktsionaalse seosega > |0,7| - siis on tegemist tugeva seosega < |0,3| siis seos praktiliselt puudub =0 siis nähtuste vahel seost ei ole Paariskorrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja (arvtunnused, lineaarne seos) Järjestustunnuste korral kasutatavad seosekordajad on: Spearmanni korrelatsioonikordaja, Fechneri korrelatsioonikordaja, Kordaja , Somersi d, Kendalli korrelatsioonikordaja ja Kendalli Kendalli korrelatsioonikordajad: Kui tunnustel ei ole korduvaid väärtusi, saame välja arvutada Kendalli korrelatsioonikordaja. Kui esineb võrdseid tunnuseid, kasutatakse Kendalli . d = R 2 = r 2 Determinatsioonikordaja näitab, millise osa üldvariatsioonist on kirjeldatud argumenttunnuse muutumisega. Seose kuju uurimist nimetatakse regressioonanalüüsiks. Seose kuju uurimisel kasutatakse vähimruutude meetodit. Seoste uurimise puhul määratakse kindlaks sõltumatu tunnus (x) ja sõltuv tunnus (y).
· Hii-ruut-statistiku kasutamisel oleks vajalik, et selle aluseks olevas tabelis ei oleks tühje (või väga väikese vastajate arvuga) lahtreid. · Et neid vältida, on vahel kasulik tunnuseid ümber kodeerida: liita mõned väga väheste vastajate arvudega grupid või kategooriad kokku. Ümberkodeerimise puhul tuleb aga silmas pidada, et liidetud gruppide sees ilmnenud erinevused lähevad siis kaotsi. 14) Hajuvusdiagramm(HD) ja korrelatsioonikordajad seose uurimiseks kahe arvtunnuse vahel. Probleemid korrelatsioonikordajate kasutamisel. HD- mitteteaduslikes töödes, punktid, kuhu poole kaldu, kasvav - suundumus alt üles. Kui punktid kindlalt kuskile poole välja veninud, siis tugev seos. ·Kasvav seos Ühe tunnuse suured väärtused esinevad sageli koos teise tunnuse suurte väärtustega. Ühe tunnuse väikesed väärtused esinevad koos teise tunnuse väikeste väärtustega. ·Kahanev seos
inimese kohta, kuid regressioonimudelis tulid need muutujad ebaolulised. Samuti on mudelis SKP inimese kohta ebaloogilise märgiga. b) Mudelis on (väga) suur multikollineaarsus, mis on põhjustatud palga ja SKP (inimese kohta) tugevast omavahelisest seosest. Sellele viitab SKP ja palga vaheline korrelatsioonikordaja, mis on suurem kui 0.9. Samuti on SKP ja palga vaheline korrelatsioonikordaja suurem kui autode müügi ja SKP ning autode müügi ja palga vahelised korrelatsioonikordajad. Tugevat multikollineaarsust näitavad ka VIF väärtused, mis SKP ja palga korral on suuremad kui 10 ning suurim konditsiooniindeks, mis on suurem kui 30. c) Jätta mudelist välja kas palk või SKP inimese kohta. Ülesanne 13. Analüüsime ülesande 2 regressioonimudelit: ln(Yi ) 2 0.93 ln( X i ) 1.20 Di 0.02 Di ln( X i ) uˆ i , i 1,2,..,100 , kus Yi – i-nda küsitletu tarbimine, Xi – i-nda küsitletu sissetulek ning Di1 – küsitletu sugu
iii. Täielik sõltumatus, multikollineaarsus puudub. 54. Tugeva ligikaudse multikollineaarsuse ilmingud. Tugev ligikaudne multikollineaarsus tähendab, et sõltumatute tunnuste vahel on tugev, kuid mitte perfektne lineaarne seos. Kui seos on tugev, siis selle determinatsioonikordaja R2 suur. · Mudel on statistiliselt oluline, F-testi olulisuse tõenäosus on väike, aga enamus tunnuseid statistiliselt mitteolulised, tunnuste standardvead suured. · Korrelatsioonikordajad sõltumatute tunnuste vahel on väga suured, suuremad kui nende korrelatsioonikordaja sõltuva muutujaga. · Parameetrite märgid ebaloogilised. · Parameetrite hinnangud väga tundlikud üksikute tunnuste lisamise või eemaldamise suhtes; vaatluste arvu suurenedes või vähenedes. 55. Multikollineaarsuse tugevuse hindamine: tolerantsuse näitaja TOL ja dispersiooni inflatsioonitegur VIF, nende arvutamine. Gretl, suuremad kui +1, siis esineb multikollineaarsus. 56
Täielik sõltumatus - multikollineaarsus puudub Kui mudel on statistiliselt oluline (pKorrelatsioonikordajad sõltumatute tunnuste vahel väga suured, suuremad kui nende korrelatsioonikordaja sõltuva muutujaga. Parameetrite märgid ebaloogilised Parameetrite hinnangud väga tundlikud -üksikute tunnuste lisamise/eemaldamise suhtes -vaatluste arvu suurenemisel/vähenemisel 69) Multikollineaarsuse tugevuse hindamine: variatsiooniindeks VIF ja selle arvutamine Korrelatsioonimaatriks -suure arvu regressorite korral ebamugav; näitab vaid paarikaupa esinevat kollineaarsust
Millised väited kehtivad hajumisdiagrammil esitatud seose korral? Õige vastus on: Spearmani korrelatsioonikordja =1, Pearsoni korrelatsioonikordaja absoluutväärtus < 1, Seos on positiivne. 14. Kui tunnuse X suurematele väärtustele vastavad tunnuse Y väiksemad väärtused, siis nende suuruste vahel esineb negatiive korrelatsioon. 15. Pearsoni korrelatsioonikordaja on sama, mis lineaarne korrelatsioonikordaja. 16. Korrelatsioonanalüüsil saadi järgmised korrelatsioonikordajad (sulgudes on tunnuste tähistused): r(A;B)= -0,89; r(C;D)= 0,23; r(E;F)= 0,55 Milliste tunnuste vahel on kõige tugevam seos? A ja B 17. Monotoonse seose tugevuse hindamiseks kasutatakse Spearmani korrelatsioonikordajat. 18. Kahe tunnuse X ja Y vaheline korrelatsioonikordaja on 0,9. Kas on õige väita, et suurendades suurust X, suureneb ka Y? Väär Seose olemasolu ei tähenda, et suurused on omavahel põhjuslikult seotud, et ühe suuruse muutmine
6% ja maksimumiks 90.3%) ning keskmine hajuvus on 17,4%. Keskmine meeste osakaal tööjõus on 51,4%, sealjuures varieeruvus 16,5% (miinimum on 43,8% ja maksimum 60,3%). Standardhälve keskmisest on 2.9%. 1.3. Esialgse regressioonimudeli hindamine Korrelatsioonkordajate tabelist (vt lisa 5) ja vastavate olulisuse tõenäosuste tabelist (vt lisa 6) näeme, et keskmisel brutopalgal on statistiliselt oluline seos nii kõrgharidusega kui ka fiktiivsete muutujatega D1 ja D2, kus korrelatsioonikordajad ja vastavad olulisuse tõenäosused on r=0,4201 (p=0,001), r=-0,6028 (p=0,000) ja r=-0,2652 (p=0,0406). Meeste osakaal tööjõust ja linlaste osakaal keskmise brutopalgaga statistiliselt olulist seost ei oma. Samal ajal on tugev korrelatsioon ka osade sõltumatute muutujate vahel, näiteks kõrghariduse ja linnalises asulas töötajate vahel (r = 0,5873) ja fiktiivsete muutujate D1, D2 ja D3 vahel (kõigi fiktiivsete muutujate vahel r = -0,3333).
· Funktsionaalse (põhjusliku) seose korral vastab argumendi x mingile väärtusele üks ja ainult üks funktsiooni y väärtus. · Korrelatiivse (statistilise) seose puhul võib ühe suuruse X mingile väärtusele vastata mitu teise suuruse Y väärtust, mida täpselt ei saa kindlaks määrata. Statistiline seos väljendub ühe juhusliku suuruse Y keskväärtuse sõltuvuses teise juhusliku suuruse X väärtustest. Enamlevinud korrelatsioonikordajad: · Pearsoni kordaja Lineaarne seos: tunneb punktipilve, mis on venitatud piki sirget. Tundlik erandite suhtes: paar üksikut erandit väikeses valimis kahekordistavad kordaja väärtust. · Spearman ehk astakkorrelatsioonikordaja Pidevad tunnused ei ole normaaljaotusega (ka erandlikud väärtused) Järjestustunnus (kui vähemalt üks uuritavatest tunnustest on järjestustunnus) · Kendall kordaja Vähemalt järjestustunnused
iseloomustatakse neid kolmest põhilisest küljest, kõneldes vastavalt: 1. seose rangusest ehk tugevusest; 2. seose kujust ja 3. seose suunast. 43. Fechner’i hälbimissuundade kooskõlakordaja Fechneri korrelatsioonikordaja/Fechneri hälbimissuundade kooskõla kordaja Fechner võttis kasutusele lihtsa seose näitarvu, mis iseloomustab seose rangust ja suunda: CH K CH Spearmani ja Fechneri korrelatsioonikordajad on samade lähteandmete alusel arvutatuna tavaliselt küllalt erinevad ning see juhib tähelepanu asjaolule, et nad pole võrreldavad. 44. Spierman’i järjekorranumbrite korrelatsioonikordaja Spearmani järjekorranumbrite korrelatsiooni kordaja Nähtustevahelise korrelatiivse seose ranguse ja suuna mõõtmise üks lihtsamaid viise on inglise statistiku C. Spearmani poolt välja töötatud meetod, mille kohaselt muutujate arvväärtused asendatakse
● Prefektne multikollineaarsus - kaks või rohkem tunnust on omavahel lineaarselt seotud ● Ligikaudne multikollineaarsus - Multikollineaarsuse all mõeldakse tavaliselt just seda; ökonomeetriliste mudelite korral kõige problemaatilisem 68. Tugeva ligikaudse multikollineaarsuse ilmingud. ● Mudel on statistiliselt oluline, F-testi olulisuse tõenäosus on väike, aga enamus tunnuseid statistiliselt mitteolulised, tunnuste standardvead suured ● Korrelatsioonikordajad sõltumatute tunnuste vahel on väga suured, suuremad kui nende korrelatsioonikordaja sõltuva muutujaga. ● Parameetrite märgid ebaloogilised. ● Parameetrite hinnangud väga tundlikud ○ üksikute tunnuste lisamise või eemaldamise suhtes ○ vaatluste arvu suurenedes või vähenedes Tugev ligikaudne multikollineaarsus tähendab, et sõltumatute tunnuste vahel on tugev, kuid mitte perfektne lineaarne seos
piima proovides on ulatunud 12,4 g/kg . Paljudes riikides kehtivad piima lubatud aflatoksiin M1 konsentratsioonile limiidid ning paljud teadlased on püüdnud leida mudeleid, mille alusel saaks arvutada toksiinikogused söödas, mille tarbimise korral toksiin piima ülenormatiivses koguses ei jõua. Vastavalt nendele mudelitele ongi mõnel pool määratud maksimaalsed lubatavad aflatoksiin B1 kogused piimakarjade söödas. Erinevates uuringutes saadud korrelatsioonikordajad aga erinevad, samuti ei klapi paljud hilisemad vaatlusuuringud mudelitesse. Võttes ekskretsiooni määraks tavapärase 2% asemel suuruse 6% (kõrgetoodanguliste loomade puhul esineda võiv halvim stsenaarium), ületab enamiku mudelite alusel arvutatud piima mükotoksiinide sisaldus lubatud piirlimiite ka söödas lubatud koguste korral (Fink-Gremmels, 2008) 5.2. Teised mükotoksiinid T-2 toksiin eritub piima 0,2% (0,05-2%) ulatuses. See tähendab, et söödaga tarbitud doos 0
Aretusrühma valitakse ainult need loomad, kes ületavad kõiki nõudeid. 1.2.3. sõltuvate piiridega valik ehk selektsioonindeksi meetod (SI) SI on suhtarv, mis näitab üksiklooma suhtelist aretusväärtust võrreldes teiste loomadega. Enne SI arvutamist määratakse kindlaks kõik valikutunnused. Seejärel leitakse nende tunnuste geneetilised parameetrid (päritavus, fenotüübiline standardhälve, tunnustevahelised geno- ja fenotüübilised korrelatsioonikordajad) ning tunnuste aretusväärtused isendi enda ja sugulaste fenotüübiliste tunnuste alusel. Igale tunnusele leitakse ka selle tunnuse ökonoomiline (majanduslik) kaal lähtuvalt selle tunnuse majanduslikust tähtsusest. SI arvutamisel on iga valikutunnuse suhtelise ökonoomiliste kaalude määramine olulise tähtsusega. Kaalude arvutamise aluseks võib olla: a) lisatulu tunnuse suurenemisel ühe ühiku võrra (rahalises väljenduses arvestades turuhindu)