ERINEVAD SEOSEKORDAJAD 3 1. PEARSONI KORRELATSIOONIKORDAJA enimkasutatav korrelatsioonikordaja. n (x i x )( y i y ) r i 1 n n (x i 1 i x ) 2 ( yi y ) 2 i 1 2. SPEARMANNI JA KENDALLI KORRELATSIOONIKORDAJAD Järjestustunnuse puhul. Arvulise tunnuse puhul. Normaaljaotuse eeldus puudub. n 6 d i2 rS 1 i 1 n( n 2 1) d i si ti Spearmanni korrelatsioonikordaja d – astakute vahe
väärtuse suhe. Korrelatsioonikordaja väärtus on vahemikus: -1 r 1 = |1| siis on tegemist funktsionaalse seosega > |0,7| - siis on tegemist tugeva seosega < |0,3| siis seos praktiliselt puudub =0 siis nähtuste vahel seost ei ole Paariskorrelatsioonikordaja ehk Pearsoni korrelatsioonikordaja (arvtunnused, lineaarne seos) Järjestustunnuste korral kasutatavad seosekordajad on: Spearmanni korrelatsioonikordaja, Fechneri korrelatsioonikordaja, Kordaja , Somersi d, Kendalli korrelatsioonikordaja ja Kendalli Kendalli korrelatsioonikordajad: Kui tunnustel ei ole korduvaid väärtusi, saame välja arvutada Kendalli korrelatsioonikordaja. Kui esineb võrdseid tunnuseid, kasutatakse Kendalli . d = R 2 = r 2 Determinatsioonikordaja näitab, millise osa üldvariatsioonist on kirjeldatud argumenttunnuse muutumisega. Seose kuju uurimist nimetatakse regressioonanalüüsiks. Seose kuju uurimisel kasutatakse vähimruutude meetodit
.., p = .02. Alternatiivselt: Wilcoxoni Signed Ranks Test näitas, et otse vaatava pilguga piltide atraktiivsuse astakud olid statistiliselt oluliselt kõrgemad kui kõrvale vaatava pilguga piltide astakud, Z = ..., p = .02. Korrelatsioon Korrelatsiooni kasutatakse selleks, et uurida muutujate vahelisi seoseid ning nende seoste tugevust. Parameetriline seosekordaja on Pearsoni r, mitteparameetrilisteks seosekordajateks on Spearmani roo ning Kendalli tau. Mitteparameetriliste analüüside korral kasutatakse tihtipeale Spearmani roo statistikut, ent Kendalli tau-d peetakse paremaks näitajaks väiksematel valimitel. Pearsoni korrelatsioonikordaja eeldused: - muutujad peaksid olema mõõdetud intervall või suhteskaalal; - lineaarne seos muutujate vahel (hea viis testimiseks -> Scatterplot -> visuaalselt hinnata seose olemust); - ei tohiks olla märkimisväärseid erindeid (saab samuti hinnata joonise abil);
aga samas ei pruugi kahe näitaja vahel olla põhjuslikku seost. Vajalik intervallskaala. Erind näiteks üks punkt on teistest eraldi, see võib tugevalt vähendada või suurendada korrelatsiooni. Seetõttu vajalik vaadata ka hajuvusdiagrammi. Erindit tuleb analüüsida vajadusel välja jätta. Lineaarse korrelatsioonikordaja puuduste tõttu kasutatakse ka teisi seosekordajaid Spearmanni, Kendalli. Siis kui arvad, et nähtuste vahel peaks tulema tugev seos, aga r tuleb väga väike siiski. Korrelatsioon puudub: r=0; korrel on nullist erinev r =/ 0 (võrdusmärg läbiva kriipsuga) 17. Korrelatsioonikordaja (p) 2 juhusliku suuruse X ja Y vahelise lineaarse, seose tugevust ja suunda võimaldab mõõta lineaarne paariskorrelatsioonikordaja. Võib olla positiive/negatiivne. Saab olla vahemikus 1/+1
soojust juurde. Kodutöö. Esimesena teha trendianalüüs. Vaadata muutusi tsirkulatsioonis. Slope muutujaks (y) on jaanuariväärtused ja teine argument on aastad. Tõus korrutada 60-ga (aastate arvuga). Valemit saab paremale lohistada. Temperatuuri kohta samuti leida slope funktsiooniga. Standardhälve ja variatsioonikoefitsient, miinimum, maksimum, muutus, p väärtus, korrelatsioon (sademetega). P- väärtus T-testiga. Tools - data analyses, regressioon. Y summa, x aasta mann-kendalli test. Esimeses reas on indeks, teises temperatuur või sajuhulk. Tools macro, valida programm (run) ja arvutab tulemused. Mk üle 2 siis on oluline trend. P väärtus. Trend kaob ära, kui arvestada kaasmuutuja mõju sisse. Ühes on trend olemas, mis on ka teise trendi põhjustanud. Seega AO muutus on põhjustanud muutuse temperatuuris. CPC kodulehelt: indeksite kaartidel on punase ja sinise vahel valge ala. Indeks näitab tsirkulatsiooni tugevust valgel alal
Nende andmete puhul tahame teada sõnade valentsi mõju meenutamisele. Panemegi faktori nimeks ,,valents". Tasemete arvuks (Number of Levels) pange kolm, üks tase iga katsetingimuse kohta. Tasemete sisu saate määrata järgmisest menüüst. 7. PRAKTIKUM = KT 8. PRAKTIKUM Korrelatsiooni kasutatakse selleks, et uurida muutujate vahelisi seoseid ning nende seoste tugevust. Parameetriline seosekordaja on Pearsoni r, mitteparameetrilisteks seosekordajateks on Spearmani roo ning Kendalli tau. Mitteparameetriliste analüüside korral kasutatakse tihtipeale Spearmani roo statistikut, ent Kendalli tau-d peetakse paremaks näitajaks väiksematel valimitel. Korrelatsioonikordaja on sisuliselt ka efekti suuruse ning mudeli seletusvõime näitaja. Võttes korrelatsiooni ruutu, saame R2 statistiku ehk, eesti keeles, determinatsioonikordaja. Kui me seda kordajat sajaga korrutame, saame protsendid
Kui alla 0,05, siis alternatiivhüpotees on olemas on statistiline olulisus. Spearmani näide, saadud andmetega kasutan valemit. Siit saaks, et rs=1-60/60=0 SEOST POLE. x y s(i) t(i) di(si-ti) Di(ruut) 2 150 1 3 -2 4 6 120 4 2 2 4 5 1000 3 4 -1 1 3 100 2 1 1 1 Kendalli näide(tülikam kui Spearman) X 1 <4 >3 >2 Paaride võrdlus, loeme üle vastassuunalised ja samasuunalised paarid. y 3 >2 <4 >1 8 vastassuunalist, 4 samasuunalist. Järelikult tuleb jällegi 1-1=0, SEOST POLE INDEKSITEOORIA Indeksid on üldistavad näitarvud, mille abil iseloomustatakse tunnuste väärtuse muutumist ajas. Statistikas kujutab indeks endast kahe arvu suhet, mis on leitud spetsiaalse metoodika järgi ja mis
Teenindussüsteemi tegevust iseloomustavad peamised näitajad: teenindussüsteemi koormatus, süsteemi tühiseisaku tõenäosus järjekorra tekkimise tõenäosus ja selle pikkuse keskväärtus tellimuse teenindussüsteemis ja järjekorras oleku keskmine aeg ajaühikus rahuldamata jäänud tellimuste arvu keskväärtus. 11 Teenindussüsteem (Kendalli tähistusviis) X|Y|S -> X & Y sisendvoog & teenindusaja jaotus, S kanalite arv. Poissoni või eksponentsiaalse jaotusega M|M|S S- teeninduskanalite arv 12