Joonisel 1 on graafik, mille X-teljel on käigu pikkus Li ja Y-teljel on i=1 n kõrguskasvude erinevuste summad di . Joonisele on lisatud ka regressioonisirge i=1 (Add Trendline) koos determinatsioonikordaja ruuduga (R2). Ülesanne 3: Kontrolli Tabelis 2 toodud joonemõõtmise seeria normaaljaotust graafiliselt histogrammi abil. Leia seeria hulgast erindid. Kas mõõtmisseeria on peale erindite eemaldamist täpsem. Mille põhjal otsustate? Histogrammi lasime Excelil esmalt teha nö vabalt- me ei andnud vahemikke (Bin Range) programmile ette. Tulemus on toodud joonisel 2. 3 Histogram(sagedustabel) 9 8 7 6 5 Sagedus 4 3 2 1 0 152.091 152
Transform- compute variable target variable?? Programmi SPSS kasutamine View – Value Labels: näidata koodide asemel nimetusi Utilites – Variables: muutujate/tunnuste sisu ülevaade Muutuja/tunnuse määrangute muutmine: topeltklõps selle nimel tabeli ülal. Nii saab näiteks muutujale uut nime anda või väärtuste nimetusi muuta. Output-aknast saab tabeleid ja graafikuid Word’i tõsta need valides ja siis Copy ning Word’is Paste. Sagedustabeli koostamine- vanuse puhul, kui väärtusi kiiga palju, siis ei kasutata sagedustabelit Seal esitatakse tunnuse väärtused (valid), nende esinemissagedus (frequence) ning protsendid (percent). Sagedustabeli järjestamiseks sagduste järgi: uus tabel: analyze/ferquences . tunnus perekonnaseis varialbel väljale ning klõpsame nupule format. Descending counts linnuke. Kui tunnusel on aga palju erinevaid väärtuseid, näiteks sissetulekud on kõikidel
Sagedustabelid Pidev arvtunnus Diskreetne arvtunnus Mittearvuline tunnus Pidev arvtunnus Pideva arvtunnuse klassifitseerimiseks (rühmitamiseks) ja sagedustabeli moodustamiseks on MS Exceli statistikaprotseduuride (Tools -> Data Analysis) hulgas protseduur Histogram. Selle rakendamiseks on esmalt vaja moodustada rühmitamiseeskiri rühmade ülemiste piiride bloki näol. Näiteks, kui me soovime jagada tunnust 'pikkus' klassidesse: 165 ja alla selle, 166-180, 181-195 ja üle 195 cm, siis peame Excelis sisestama arvudebloki 165, 180, 195:
21-40 5 5/25=0,2 41-60 2 2/25=0,08 61-80 4 4/25=0,16 81-100 6 6/25=0,24 =0,10 3 4.1 Joonis 1. Histogramm 0.35 0.3 0.25 0.2 Vahemikku sattumise tõenäosus 0.15 0.1 0.05 0
Üldkogumi keskväärtuse usaldusintervall (suur valim) - eng. Confidence interval (CI) for Gender FB.Friends Female 314 Male 1228 Male 1189 Female 0 Male 709 Male 1072 Female 483 Female 600 Male 659 Male 1647 Male 696 Female 154 Female 512 Male 1225 Male 757 Female 1000 Male 171 Male 900 Female 599 Male 200 Male 797 Male 786 Female 337 Male 700 Male 285 keskväärtus Male 691 standartviga Female 0 mediaan Female 860 mood Male 708
Hüpoteeside koltrollimine 1. Oletus, väide 2. Sobiv hüpoteeside paar (millised tunnused on vaja võrrelda) 3. Olulise tõenäosus (p) 4. Järeldus (p>0,05 H0, p<0,05 H1) 5. Lõppvastus (sama, mis oli küsitud hüpoteesis) T-test sobivad valemid 1. T-test H0: keskmised võrdsed H1: keskmised erinevad 2. F-test sõltumatud valemid H0: dispersioonid võrdsed H1: dispersioonid erinevad P>a H0, P<0,05 H1 Võrdsete disp mittevõrdsete disp t-test t-test 3. Olulisuse tõenäosus 4. Lõppvastus (p<0,05 H0) Vormistus nii nagu iseseisvates töös Ülesanne Eesmärk Tunnusetüüp 1.T-test (f-test) Keskmiste erinevus kahes Pidev arvtunnus- keskmised grupis tunnus, millel on vähe
kontrollima järgmisi eeltingimusi: 1. Kas tunnuse väärtused väikeses valimis alluvad normaaljaotusele kui see tingimus ei ole täidetud, ei tohi t-testi teha. 2. Kas tunnuse dispersioonid valimites on võrdsed või mitte see ei mõjuta t-testi lubatust, vaid kontrollimiseks kasutatav metoodika muutub. Nende tingimuste kontroll teoreetiliselt on mahukas, seepärast vaatame seda vaid praktikas MS Exceli abi, kus esimest tingimust kontrollime visuaalselt tunnuse histogrammi abil ning teist vastava testi abil (vartest). 4.3.4. Hüpoteesid kahes sõltuvas üldkogumis keskväärtuste võrdlemiseks Sõltuvate valimitega (üldkogumitega) on tegemist kui uurime samu isikuid kaks korda ehk teeme kordusmõõtmise, uurides mingi muutuse (ravim, koolitus, reklaamikampaania) mõju. Oluline
Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust keskmisest) Need on dispersioon ja standardhälve. ASENDIKARAKTERISTIKUTE ARVUTAMINE 1.1. Tabuleerimata(rühmitamata) diskreetsed andmed Keskmine- näiteks KOKKU TOOTEID/NENDES ESINENUD VIGADE ARV. Näitetabelis= 2190/1500=1,46 viga on keskmiselt. X= / Mediaan- kasutatakse kumulatiivset sagedust. Me=(n+1)/2. Mediaan näitetabelis on 750,5, sellele vastav vigade arv on 1. Samamoodi arvutatakse teisi kvartiile. Mood- kõige sagedasem suurus. Näitetabelis on kõige rohkem(440 korda) 0 viga. Mood on 0.
Kõik kommentaarid