korrellatsioonikordaja. Alati ei piisa ainult korrelatsioonikordaja väärtuse leidmisest, tuleb vaadata ka algandmeid, mis annavad infot, miks selline korrelatsioonikordaja väärtus tuli ehk siis tuleb joonistada hajuvusdiagramm. Enimkasutatavad korrelatsioonikoefitsiendid mõõdavad enamasti lineaarset seost, korrelatsioonanalüüs ei näita põhjuslikku seost. Pidevad andmed- Pearson, Spearman, Kendall. Pidevate andmete puhul kasutatakse tavaliselt Pearsoni korrelatsioonikordajat, nimetatakse ka lineaarseks korrelatsioonikordajaks, mis tähendab, et see mõõdab vaid lineaarset seost, näiteks, kui meie andmed on mõne teise kujuga seoses, siis alahindab Pearsoni korrelatsioonikordaja seose tugevust. Näiteks seos on parabooli kujuga, aga Pearsoni korrelatsioonikordaja ütleb, et seos näitajate vahel puudub, samas, kui kasutame mõnda teist korrelatsioonikordajat, näeme, et tegelikult seos nende kahe näitaja vahel eksisteerib
ja kahepoolse hüpoteesi korral Praks 5 Korrelatsioonanalüüs, funktsioon CORREL ja protseduur Correlation; korrelatsioonikordaja statistiline olulisus. Kas tudengite pikkus ja jalanumber on seotud? Pikkuse ja jalanumbri vaheline lineaarne korrelatsioonikordaja Korrelatsioonanalüüs. Tunnustevahelise seose tugevuse ja suuna iseloomustamiseks kasutatakse korrelatsioonikordajat - r (lineaarne korrelatsioonikordaja). Korrelatsioonikordaja väärtused saavad olla vahemikus -1 r 1 ning vastavalt sellele otsustatakse seose tugevuse ja suuna üle. · Seose suund: 1. samasuunaline - r väärtus on positiivne (r>0) st ühe tunnuse suuremate väärtuste korral on ka teise tunnuse väärtused suuremad. Näiteks: Mida rohkem lehmad sõid, seda rohkem nad piima andsid. 2
ning ühtlasi ka prognoosida selle sõltuva tunnuse väärtusi. 29. Nimeta regressioonvõrrandi tüübid (ka valemid). Analüüsi lugemisokus. 30. Mida iseloomustab korrelatsioonikordaja? Korrelatsioonikordajaid kasutatakse seose uurimiseks kahe arvulise või pikema skaalaga järjestustunnuse vahel. Meetodi plussiks on, et see võimaldab kirjeldada nii seose suunda kui ka seose tugevust. Kõige sagedamini kasutatakse lineaarset ehk Pearsoni korrelatsioonikordajat ja Spearmani astakkorrelatsioonikordajat. 31. Mida iseloomustab determinatsioonikordaja? Determinatsioonikordaja R2 iseloomustab mudeli kirjeldusvõimet. See näitab, kui suure osa sõltuva tunnuse koguhajuvusest moodustab regressioonhajuvu 32. Mida iseloomustab jääkstandardhälve? Jääkstandardhälve e. prognoosiviga iseloomustab funktsioontunnuse erinevust regressioonijoonest. 33. Milleks kasutatakse dispersioonanalüüsi? Analüüsi lugemisoskus. 34. Mis on funktsioontunnus? 35
väärtus vähenes, võrreldes eelmise aastaga. Vali üks või enam vastust. 2000 2001 2002 2003 2004 Ahelindeks on 1,2, järelikult suurus X kasvas 20% 2005 Ahelindeks on 1,1, järelikult suurus X kasvas 10% 2006 2007 2008 Ahelindeks on suuruse X kahe järjestikuse väärtuse suhe. Kui suuruse X väärtus väheneb, siis, ahelindeks < 1 (lugeja on väiksem kui nimetaja) Vale Selle esituse hinded: 0/1. Question 6 Hinded: 1 Erind võib Pearsoni korrelatsioonikordajat Vali üks vastus. a. ainult suurendada b. ainult vähendada c. nii suurendada kui ka vähendada Õige Selle esituse hinded: 1/1. Question 7 Hinded: 1 Joonisel on toodud suuruse X ahelindeksi dünaamika. Märgi ära, millistel kuudel jäi suuruse X väärtus samaks, võrreldes eelmise kuuga. Vali üks või enam vastust. jaanuar veebruar märts aprill mai Ahelindeks on 1,1. Järelikult suurus X kasvas 10% juuni juuli
Vali üks või enam vastust. 2000 2001 2002 2003 2004 Ahelindeks on 1,2, järelikult suurus X kasvas 20% 2005 Ahelindeks on 1,1, järelikult suurus X kasvas 10% 2006 2007 2008 Ahelindeks on suuruse X kahe järjestikuse väärtuse suhe. Kui suuruse X väärtus väheneb, siis, ahelindeks < 1 (lugeja on väiksem kui nimetaja) Vale Selle esituse hinded: 0/1. Question 6 Hinded: 1 Erind võib Pearsoni korrelatsioonikordajat Vali üks vastus. a. ainult suurendada b. ainult vähendada c. nii suurendada kui ka vähendada Õige Selle esituse hinded: 1/1. Question 7 Hinded: 1 Joonisel on toodud suuruse X ahelindeksi dünaamika. Märgi ära, millistel kuudel jäi suuruse X väärtus samaks, võrreldes eelmise kuuga. Vali üks või enam vastust. jaanuar veebruar märts aprill mai Ahelindeks on 1,1. Järelikult suurus X kasvas 10% juuni
... peab .... asemel olema kovariatsioon. 9. Toodud tabeli põhjal on konstrueeritud kolm diagrammi. Milline neist on õige hajumisdiagramm? b. 10. Statistilise ehk korrelatiivse seose korral Suuruse X mingile väärtusele võib vastata mitu suuruse Y väärtust. 11. Joonisel on toodud kolm erinevat hajumisdiagrammi. Millisel diagrammil on tunnuste vaheline seos kõige tugevam? Kõigil kolmel diagrammil 12. Milline on õige valem, mis seob korrelatsioonikordajat ja kovariatsiooni? r=covxy/xy 13. Millised väited kehtivad hajumisdiagrammil esitatud seose korral? Õige vastus on: Spearmani korrelatsioonikordja =1, Pearsoni korrelatsioonikordaja absoluutväärtus < 1, Seos on positiivne. 14. Kui tunnuse X suurematele väärtustele vastavad tunnuse Y väiksemad väärtused, siis nende suuruste vahel esineb negatiive korrelatsioon. 15. Pearsoni korrelatsioonikordaja on sama, mis lineaarne korrelatsioonikordaja. 16
alusel mingi teise muutujaga. o Kuidas ennustada ühte muutujat teise muutuja kaudu? Kasutatakse siis, kui vaja vaadelda mitut tunnust korraga ja arvestada järeldustes nende omavahelisi seoseid. Mitmene regressioon mitu muutujat Kovariandid kaasnevad või selgitavad muutujad, mis varieeruvad koos huvialuse muutujaga Probleemid Lõigatud (kärbitud) haare - et arvutada tähenduslikku korrelatsioonikordajat, peavad kõigi muutujate väärtuses olema üsna suured erinevused, numbrites peab esinema teatud variatiivsus
funktsionaalse seose sarnasusastet. Korrelatiivne seos on seda rangem, mida enam see läheneb funktsionaalsele seosele, s.t. seos on seda rangem, mida vähem on kõrvutatavate suuruste arvväärtusi diagrammiväljal kujutavad punktid hajutatud ehk mida lähemal paiknevad need seose kuju ja suunda iseloomustavale teoreetilisele joonele. Seose ranguse hindamiseks kasutatakse korrelatsioonikordajat või korrelatsiooniindeksit. Korrelatsioonikoefitsiendi väärtused on -1 ja 1 vahel Kui r = -1, siis on tegemist kahaneva funktsionaalse seosega kahe suuruse vahel. Kui r =1, siis kasvava funktsionaalse seosega suuruste vahel. Ülejäänud r väärtuste korral sõltub üks tunnustest teisest korrelatiivselt, juhul kui r pole null. Kui r =0, siis eksisteerib kolm võimalust
seda tugevamaks, mida suurem on r absoluutväärtus. Korrelatsioonikordaja märk aga näitab seose suunda. Korrelatsiooni tugevuse kohta võib öelda, et korrelatsioon on tugev, kui r 0,8; korrelatsioon on märgatav, kui 0,6 r 0,8 ; korrelatsioon on nõrk, kui 0,3 r 0,6 ; korrelatsioon on väga nõrk, kui r 0,3 . Korrelatsioonikordajat r võib arvutada ka järgmiste valemite järgi xy x y r x y kus xy - x ja y väärtuste korrutiste keskväärtus r ( x x )( y y ) (x x) (y y) 2 2 47. Kõverjooneline korrelatsioon Aalti ei sobi nähtuste uurimiseks sirge, vaid võib vaja minna ka kõverjooni.
Korrelatiivse seose ranguse (tugevuse ehk tiheduse) all mõistetakse korrelatiivse ja funktsionaalse seose sarnasusastet. Korrelatiivne seos on seda rangem, mida enam see läheneb funktsionaalsele seosele, s.t. seos on seda rangem, mida vähem on kõrvutatavate suuruste arvväärtusi diagrammiväljal kujutavad punktid hajutatud ehk mida lähemal paiknevad need seose kuju ja suunda iseloomustavale teoreetilisele joonele. Seose ranguse hindamiseks kasutatakse korrelatsioonikordajat või korrelatsiooniindeksit. Korrelatsioonikoefitsiendi väärtused on -1 ja 1 vahel Kui r = -1, siis on tegemist kahaneva funktsionaalse seosega kahe suuruse vahel. Kui r =1, siis kasvava funktsionaalse seosega suuruste vahel. Ülejäänud r väärtuste korral sõltub üks tunnustest teisest korrelatiivselt, juhul kui r pole null. Kui r =0, siis eksisteerib kolm võimalust a) üks tunnus sõltub teisest funktsionaalselt, kuid mitte korrelatiivselt (vaatluspunktid
● Regressioonmudeliga kirjeldatud hajuvus ehk seletatud hajuvus ESS =TSS-RSS 25. Determinatsioonikordaja, selle arvutus ja tõlgendamine. Determinatsioonikordaja näitab, kui suur osa koguhajumisest on mudeli poolt ära seletatud Kui mudeli parameetrid on statistiliselt olulised, tuleb hinnata ka mudeli kirjeldusvõimet. Kvantitatiivseks kirjeldamiseks kasutatakse determinatsioonikordajat R2. Kui võrrelda determinatsioonikordajat ja korrelatsioonikordajat, siis determinatsioonikordaja sisu on paremini mõistetav, aga ei näita seose suunda. 26. Mudeli korrektne esitamine. Regressioonanalüüsi põhitulemuste esitamisel esitatakse ● parameetrite hinnangud; ● parameetrite standardvead; ● determinatsioonikordaja R2 ; ● valimi maht n (lugeja jaoks vajalik, kui soovib t-testi läbi viia) VARIANT 2: Mõnikord esitatakse parameetrite all sulgudes standardvigade asemel vastavad t-statistiku väärtused
MSBG - loomadevaheline (rühmadevaheline) keskmine ruutsumma, mis sisaldab dispersioonikomponendid 2 2 G + ; EP 2 MS0 - rühmadesisene ruutsumma ( ET) Et tunnuse korduvust objektiivselt hinnata, tuleb dispersioonikompleksi võtta ainult ühesugustes keskkonnatingimustes asuvate, ühevanuste ja sama sugupoolega loomade andmed. Kui korduvust tahetakse arvutada ainult kahe perioodi andmete alusel, kasutatakse mõnikord ka korrelatsioonikordajat nende kahe perioodi vahel korduvuse tähenduses. Kuid sageli on perioodide arv igal isendil erinev ja siis on õigem kasutada dispersioonanalüüsi meetodit. Korduvust vähendavad muutuvad keskkonnatingimused ja mõõtmisevead. Nii nagu päritavuski, kehtib korduvus ainult selles populatsioonis, kus see on arvutatud. 27
.. 173 1416 % 4,7% 8,2% 10,9% ... 12,2% 100,0% Tabel 21. Value Nominal by Interval Eta sugu Dependent ,186 Leibkonna sissetulek kokku (kuus) Dependent ,143 8.2. Vasta küsimustele: Milline korrelatsioonikordaja annab numbriliste tunnuste korral (kui erandlikud väärtused puuduvad) kõige tugevama seose? Milline kordaja annab järjestustunnuste korral kõige tugevama seose? Mida tahendab negatiivne kordaja? Too näide tunnustest, mille korral ei saa arvutadaPearsoni ega Spearmani korrelatsioonikordajat. ANDMEANALÜÜS: statistiline andmestik ja kirjeldav statistika. 2010/11 K.Osula -23- 8.3. Enam kui kahe tunnuse vahelise seose uurimine Lisaks kahe tunnuse uurimisele on võimalik leida korrelatsioonimaatriksit ka kolme ja enama tunnuse jaoks. Sellisel juhul tuuakse tabelist valja kõige tugevamad seosed (ei uurita kõikide tunnuste seoseid omavahel). 9. Reliaablus Uurimuseks koostatud küsimustik sai hea tagasiside.Lisaks toetab seda ka asjaolu, et enamuste
Kahe esimesega tegeleb korrelatsioonanalüüs, viimasega regressioonanalüüs (vaatame edaspidi). Korrelatiivse seose tugevuse all mõistetakse korrelatiivse ja funktsionaalse seose sarnasusastet. Korrelatiivne seos on seda tugevam, mida enam see läheneb funktsionaalsele seosele, s.t seos on seda tugevam, mida lähemal paiknevad suuruste arvväärtusi diagrammil kujutavad punktid seose kuju ja suunda iseloomustavale teoreetilisele joonele. Seose tugevuse hindamiseks kasutatakse korrelatsioonikordajat. 71 Matemaatika ja statistika 2008/2009 Korrelatsioonikordaja (r) väärtus muutub vahemikus -1 r 1. Seos on seda tugevam, mida lähem on kordaja absoluutväärtus ühele ja seda nõrgem, mida lähem on see nullile. Kui r = 1 või kui r = -1, siis on tegemist funktsionaalse seosega. Kui r = 0, siis seost täheldada ei saa. Korrelatsioonikordaja saab leida seosega: