Andmeanalüüs MS Exceli abil Andmeanalüüs MS Exceli abil Järgnev õpetus püüab võimalikult 'puust ja punaselt' ette näidata elementaarse andmeanalüüsi teostamise võimalused MS Excelis. Samas ei ole see materjal mõeldud matemaatilise statistika konspektiks, vastavad teadmised/materjalid eeldatakse kasutajal enesel olemas olevat. Seetõttu pole ka eriti tegeletud konkreetsete näidetega ega tulemuste tõlgendamisega. See konspekt ei ole Andres Kiviste 1998 aastal ilmunud vihiku "Matemaatilise statistika algteadmisi ja rakenduslikke näiteid MS Exceli keskkonnas" ümbertrükk. MS
168
173 Z (empiir.) "<" või ">" Z (kriit.)
168 -2.93 < -1.64
170
162 olulisuse tõenäosus p =NORM.S.DIST 0.00171
169
169
169 Võrdleme olulisuse tõenäosust olulisuse nivooga
162
160 p "<" või ">" a
160 0.00171 < 0.05
171
168 olulisuse testimine - Logical test
170
160 Significance =IF(p
·Keskmised, standardhälbed ja standardvead ümardada ühe kohani peale koma ·Data analysis - Descriptive statistics annab kõik keskmised, min, max .. jne ·Alumine ja ülemine usalduspiir - = keskmine -+ usalduspiir ·T-test näited: kas autot omavate ja mitteomavate tudengite keskmised kehamassid on erinevad? Kas hinge kinni pidamise võime on meestel ja naistel erinev? Kas spordiga tegelevate ja mitte tegelevate tudengite keskmised kehamassid on erinevad? ·T- test läbi viimine: lisa vt PRAKS 4 ·Kõige pealt kopeeri vajalikud grupid eraldi ja kõrvuti, seejärel sorteeri, et sarnased oleks järjest. Seejärel pane paika hüpoteesid: H0: ...... on sarnased; H1: .....on erinevad. Seejärel teha F-testi hüpoteesipaar, kui on tegemist sõltumatute gruppidega.H0: ...varieeruvus on sarnane; H1: varieeruvus on erinev. Kui F-testi tulemus on suurem kui 0,05=H0 ja tuleb teha võrdsete dispersioonide t-test T-test(aray1;array2;2;2). Kui
keskkooli hinne, eriala, kood, matemaatika riigieksamieksami tulemus, matemaatika testi tulemus. Analüüs on koostatud 2000, 2002, 2003 ja 2008 aasta andmete põhjal. Esmalt võtsime vaatluse alla keskkooli matemaatika hinde ning riigieksami tulemuse, kus eesmärgiks oli uurida, kas riigieksami tulemus on seotud keskkooli hindega. Seejärel uurisime matemaatika riigieksami tulemuse sõltumist aastast. Siis vaatasime tunnuseid sugu ja test, kus soovisime teada, kas matemaatika testi tulemus sõltub soost. Järgmiseks uurisime aasta ja testi sõltuvust, täpsemalt soovisime teada, kas matemaatika testi tulemus sõltub aastast. Tunnuste, riigieksami tulemused ja sugu, uurimise eesmärgiks oli välja selgitada, kas riigieksami tulemused sõltuvad soost. Soovisime teada ka, kas riigieksami tulemustel on seos valitud erialaga ja ülikoolis sooritatud matemaatika testiga
– Parameetrite usalduspiirid tulevad valed. – Mudeli ja parameetrite olulisuse testimine (F-test ja t-testid) võivad anda valesid tulemusi. • Järelikult võime teha valesid järeldusi mudelisse kuuluvate või mittekuuluvate tunnuste suhtes. ● Hinnangud ei ole efektiivsed ● Parameetrite usalduspiirid tunduvad valed 48. White’i testi idee, nullhüpotees ja sisukas hüpotees. White’i heteroskedastiivsuse test Näiteks kahe regressoriga regressioonmudel Testimiseks 1. Viiakse läbi mudeli (1) hindamine ja leitakse jääkliikmed 2. IDEE: kui jääkliikmete dispersioon ei ole konstantne, siis see sõltub regressoritest x. Kontrollimiseks hinnatakse regressioonmudelit, kus sõltuvaks tunnuseks jääkliikmete dispersioon Nullhüpotees: mudelis (2) on vaid konstant, H 0 : Teststatistik kus R2 u on mudeli (2) determinatsioonikordaja
Vealiikmete dispersioon ESINEB parameetrite hinnangute STANDARDVIGADE arvutusvalemites. – Parameetrite hinnangud ei ole enam efektiivsed. – Parameetrite usalduspiirid tulevad valed. – Mudeli ja parameetrite olulisuse testimine (F-test ja t- testid) võivad anda valesid tulemusi. Järelikult võime teha valesid järeldusi mudelisse kuuluvate või mittekuuluvate tunnuste suhtes. 48) White’i testi idee, nullhüpotees ja sisukas hüpotees (loeng 3) White’i test homoskedastiivsus Sõltuv tunnus= mudeli jääkliikmete ruudu ui2 Kui jääkliikmete dispersioon ei ole konstantne, siis see sõltub regressoritest x. Hinnatakse regressioonmudelit, kus sõltuvaks tunnuseks jääkliikmete dispersioon H0 uues mudelis on vaid konstant H1 heteroskedastiivsus ---> kui teststatistik TR2 väärtus > kriitiline (p < a) on tegemist heteroskedatiivsusega 49) Mida teha, kui heteroskedastiivsus esineb? Logaritmida tunnuseid
Hinnangud, hüpoteesid, regressioon Proovitükk nr. 6 Kolmas kodutöö õppeaines Metsandusliku andmetöötluse alused Lähteandmeteks on Teie proovitüki 1. rinde enamuspuuliigi keskmine diameeter (rühmitamata andmed). Kopeerige see tulp sellele samale töölehele. Punkthinnangud, vahemikhinnangud, valimi maht Eeldame, et teie proovitükil mõõdetud andmete põhjal tahame teha järeldusi samalaadse üldkogumi kohta Selleks arvuta järgmised statistikud oma proovitüki kohta 1) Leida 1. rinde enamuspuuliigi diameetri kohta (rühmitamata andmetest) järgmised suurused: keskväärtuse hinnang (aritmeetiline keskmine), 4.921 dispersioon, 7.352 standardhälve, 2.712 standardhälbe viga 0.183 valimi maht,
KIRJELDAVAD STATISTIKUD INTERVALLITUD REAS Kirjeldav statistika on numbriliste andmete organiseerimine ja summeerimine, see on vajalik andmeanallüüsi esimesel etapil. Valimit kirjeldatakse, kuid üldistusi ei laiendata üldkogumile. Kirjeldav statistika annab järgmist informatsiooni: uuritava tunnuse väärtuste vahemik tunnuse kõige tüüpilisemad väärtused tunnuse varieeruvus Lisaks aitab kirjeldav statistika sõnastada hüpoteese ning tõlgendada uurimistulemusi. Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust keskmisest) Need on d
Kõik kommentaarid