Vajad kellegagi rääkida?
Küsi julgelt abi LasteAbi
Logi sisse

Matemaatika andmestiku analüüs (0)

1 Hindamata
Punktid
Eesti Maaülikool
Metsandus- ja maaehitusinstituut
Geomaatika osakond
Matemaatika andmestiku analüüs
Aruanne õppeaines matemaatiline statistika
Koostajad:
Juhendaja : Eve Aruvee
Tartu
Sisukord
Sissejuhatus 3
Tunnuste esmaanalüüs 4
Seoste analüüs 8
Mudeli koostamine 13
Kokkuvõte 20
Lisad 21

Sissejuhatus


Oma aruandes uurisime Eesti Maaülikooli erinevate erialade üliõpilaste andmeid. Antud aruande andmestik koosneb sellistest andmetest nagu üliõpilaste sugu, matemaatika keskkooli hinne, eriala, kood, matemaatika riigieksamieksami tulemus, matemaatika testi tulemus. Analüüs on koostatud 2000, 2002, 2003 ja 2008 aasta andmete põhjal.
Esmalt võtsime vaatluse alla keskkooli matemaatika hinde ning riigieksami tulemuse, kus eesmärgiks oli uurida, kas riigieksami tulemus on seotud keskkooli hindega. Seejärel uurisime matemaatika riigieksami tulemuse sõltumist aastast. Siis vaatasime tunnuseid sugu ja test, kus soovisime teada, kas matemaatika testi tulemus sõltub soost. Järgmiseks uurisime aasta ja testi sõltuvust, täpsemalt soovisime teada, kas matemaatika testi tulemus sõltub aastast. Tunnuste, riigieksami tulemused ja sugu, uurimise eesmärgiks oli välja selgitada, kas riigieksami tulemused sõltuvad soost. Soovisime teada ka, kas riigieksami tulemustel on seos valitud erialaga ja ülikoolis sooritatud matemaatika testiga. Mudeli koostamise eesmärgiks oli vaadata, kuidas kirjeldavad aasta, riigieksami tulemus, ja eriala tunnust matemaatika test.

Tunnuste esmaanalüüs


Andmestik koosneb paljudest erinevatest tunnustest. Siinkohal toome välja andmestikus kasutatavate tunnuste tüübid:
Aasta – diskreetne
Test – diskreetne
Sugu – binaarne
Hinne – järjestus
Eksam /kool – järjestus
Eriala – nominaalne

Matemaatika riigieksami tulemus


Andmestikus on esitatud matemaatika eksami tulemused aastatel 2000, 2002, 2003 ja 2008. Tunnuse eksam/kool vaatluse väärtused muutuvad vahemikus 3-96 punkti. Kõige madalam punktisumma oli 3 ja kõige kõrgem 96. Loendusel on arvestatud 288 tulemust. Nende aastate keskmine punktisumma oli 50 (vt. Tabel 15). Ka sagedusjaotuse põhjal võib öelda, et paljud tulemused on vahemikus 45-55 (vt.Joonis 1 ).
Joonis 1. Sagedusjaotus tunnusele riigieksami tulemus.
Standarthälve on 24,79, mis iseloomustab rea elementide paiknevust keskväärtuse suhtes, selle põhjal võib öelda, et hälbimus on väike. Kõige enam punkte saadi 2003. aastal, 96 punkti saanud üliõpilane õpib veemajanduse erialal (vt. Tabel 1). Üldse 6 paremat tulemust on saadud 2003. aastal ja 5 neist on kinnisvara üliõpilased. Vähim punktisumma "3" on saadud 2002. aastal.
Tabel 1. Minimaalsed ja maksimaalsed punktid aastate kaupa.
Aasta
Min. punktid
Eriala
Max. punktid
Eriala
2000
10
eh
89
ve
2002
3
kv, mk, ve
89
eh
2003
18
ve
96
ve
2008
21
eh
79
eh
Ülikooli õppima tulnud üliõpilaste matemaatika eksami punktisummad on väga varieeruvad, 179 tulemust 288-st jääb vahemikku 45-80. Selle põhjal võib öelda, et ülikooli astunute matemaatika teadmised on keskmisest paremad. Tunnuse eksam jaotus ei lähene normaaljaotusele (vt. Tabel 13).

Matemaatika keskkooli hinne


Tunnuse hinne vaatlused on tehtud aastatel 2000, 2002, 2003 ja 2008 ning väärtused on vahemikus ühest viieni . Loenduses on arvesse võetud 171 õpilase tulemust. Eelnevalt nimetatud aastate matemaatika keskmine hinne on 3,5 (vt. Tabel 15). Kõige enam esineb hinnet "4" (39,18%) ja "3" (36,26%), mille esinemise sagedused on ligilähedased. Hinnet "5" on saanud ainult 12,28% andmestikus toodud õpilastest. Kõige vähem on saadud hinnet "1" (2,34%) (vt. ).
Joonis 2. Sagedusjaotus tunnusele keskkooli hinne.
Jaotust võib pidada sümmeetriliseks, sest mood ja mediaan on ligilähedalt sarnased (vt. Tabel 15). Kõige madalam matemaatika hinne on saadud 2002. aastal ning ainult eh üliõpilaste seas pole seda saadud. Hinnet "5" pole saanud ainult 2003. aastal ülikooli tulnud õpilased. Kõige enam viielisi on 2002. aastal sisse astunud üliõpilaste seas. Matemaatika hinde põhjal võib sisse astunud üliõpilaste teadmisi pidada heaks, sest nelja-viielisi oli 88 171-st õpilasest. Tunnuse hinne jaotus ei lähene normaaljaotusele (vt. Tabel 14).

Aasta


Tabelis on esitatud andmed 2000, 2002, 2003 ja 2008 aasta kohta. Kokku tehti vaatlusi 305. Kõige rohkem vaatlusi (100) pärineb 2003ndast aastast, kõige vähem aastast 2000 (32), 2002. aastal tehti 92 vaatlust ning aastal 2008 tehti vaatlusi 82 (vt. Joonis 3).
Joonis 3. Sagedusjaotus tunnusele aasta.
2000. aasta vaatlused kajastavad ehituse ja veemajanduse eriala üliõpilaste tulemusi. Aastatel 2002 ja 2003 tehtud vaatlused kajastavad kinnisvara, maakorralduse , ehituse ja veemajanduse üliõpilaste tulemusi. 2008. aastal tehtud vaatlused kajastavad kinnisvara, ehituse ja veemajanduse üliõpilaste andmeid (vt. Tabel 2).
Tabel 2. Vaatluste arv aastatel 2000, 2002, 2003, 2008 erialade kaupa.
aasta
kv
mk
ve
eh
kokku
2000
23
9
32
2002
22
11
17
41
91
2003
21
21
25
33
100
2008
18
32
32
82
kokku
61
32
97
115
305
Tunnus ei lähene normaaljaotusele (vt.Tabel 16 ).

Matemaatika test


Tunnus testi punktide väärtused muutusid vahemiku 1 kuni 15. Keskmine näitab, et testi eest on saadud keskmiselt 8,29 punkti. Mood on 6, mis tähendab, et kõige rohkem oli teste , kus saadi kuus punkti (vt.Joonis 4 ).
Joonis 4. Sagedusjaotus tunnusele test.
Kuuese punktisummaga teste oli 12,14 %. Mediaaniks on 8 ja kuna testi eest saadud punktidest oli 15 kõige suurem, siis ei ole ei punktid 1-7 kui punktid 9-15 ülekaalus. Standardhälve on 3,1, mis iseloomustab elementide paiknevust keskväärtuse suhtes (vt. Tabel 15). Tunnuse test jaotus ei lähene normaaljaotusele, aga palju puudu ei ole (vt. Tabel 17).

Seoste analüüs


1) Esmalt uurime, kas matemaatika riigieksami tulemus sõltub matemaatika keskkooli hindest. Püstitame hüpoteesid:
H0: Matemaatika riigieksami tulemus ei sõltu keskkooli hindest
H1: Matemaatika riigieksami tulemus sõltub keskkooli hindest
Selleks, et jõuda järeldusteni, leidsime kõigepealt eksamitulemuste aritmeetilise keskmise ja koostasime IF funktsiooni, kus märkisime ära, et kui tulemus on alla keskmise, on see madal ja kui üle keskmise, siis kõrge. Koostasime PivotTable, mida kopeerides saime empiirilise jaotuse, kust jätsime välja tühjad lahtrid. Teoreetilise jaotuse saamiseks kopeerisime empiirilise jaotuse tabeli ning kustutasime sealt kõik väärtused, arvutasime asemele teoreetilised väärtused. Saades kaks blokki ( empiiriline jaotus ja teoreetiline jaotus), leidsime CHITEST-iga (vt. Tabel 18) p väärtuse, saime, et p .
3) Uurime, kas matemaatika riigieksami tulemus sõltub aastast. Püstitame hüpoteesid:
H0: Matemaatika riigieksami tulemus ei sõltu aastast
H1: Matemaatika riigieksami tulemus sõltub aastast
Järelduseni jõudmiseks, leidsime kõigepealt eksamitulemuste aritmeetilise keskmise ja koostasime IF funktsiooni, kus märkisime ära, et kui tulemus on alla keskmise, on see madal ja kui üle keskmise, siis kõrge. Koostasime PivotTable, mida kopeerides saime empiirilise jaotuse, kust jätsime välja tühjad lahtrid. Teoreetilise jaotuse saamiseks kopeerisime empiirilise jaotuse tabeli ning kustutasime sealt kõik väärtused, arvutasime asemele teoreetilised väärtused. Saades kaks blokki (empiiriline jaotus ja teoreetiline jaotus), kasutasime funktsiooni CHITEST, saime, et p 0,880688524 ja tunnusel hinne on 0,103210735. Seega eemaldame kõigepealt tunnuse sugu mudelist ning teeme järgmise regressioonianalüüsi (vt. Tabel 32) ning siis eemaldame ka tunnuse hinne mudelist ning teeme veel korra regresioonanalüüsi (vt. Tabel 33). Sellest selgub , et testi kirjeldatuse aste on 27%. Mudeli olulisus on p=3,94E-19, seega mudel on oluline. Kasutades mudeli liikmete koefitsente, koostame valemi prognoosi jaoks:
Test = -0,23 × aasta + 0,06 × eksam/kool – 0,51 × kood + 470,40
Regressioonanalüüsist näeme, et standardiseeritud jääkide summa läheneb nullile . Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis välja visata . Vaatlusi on 288. Nüüd jääkide analüüsi juurde. Jääkide analüüsis on kaks olulist punkti, millest lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on -2,35861E-12, seega esimene tingimus on täidetud. Graafik (vt. Joonis 5) näitab, et jääkide jaotus on normaaljaotuse lähedane ja teinegi tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 6):
Tabel 6. Prognoos.
Prognoos
aasta
2002
2003
2000
2008
eksam/kool
34
63
54
50
kood
3
3
3
3
test
7,791813
9,332244
9,476427
7,381256
2) Valime välja regressiooniobjektid, mis on: matemaatika riigieksam ja matemaatika hinne. Uuritav tunnus on matemaatika riigieksami tulemus, argumenttunnus on keskkooli hinne.
Mudeli analüüs
Alustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli olulisus on p= 2,83E-13, seega mudel on oluline (vt. Tabel 34). P- value tunnusel test on 2,83E-13. Kasutades mudeli liikmete 14oefitsiente, koostame valemi prognoosi jaoks:
Eksam = 1,66*ln(hinne)+1,5±0,84
Kirjeldatuse aste on 27%. Standardiseeritud jääkide summa läheneb nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis välja visata. Vaatlusi on 161. Nüüd jääkide analüüsi juurde. Jääkide analüüsis on kaks olulist punkti, millest lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on -1,3E-13, seega esimene tingimus on täidetud. Graafik (vt. Joonis 6) näitab, et jääkide jaotus ei ole lähedane normaaljaotusele ja teine tingimus ei ole täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 7):
Tabel 7. Prognoos.
 
prognoos
hinne
ln (eksam)
 Exp (eksam)
 viga
1
1,50053
4,48406382
±0,84
2
2,654583
14,2190546
±0,84
3
3,329661
27,928866
±0,84
4
3,808636
45,0889016
±0,84
5
4,180158
65,3762001
±0,84
3) Valime välja regressiooniobjektid, mis on: aasta ja matemaatika hinne. Uuritav tunnus on matemaatika hinne, argumenttunnus on aasta.
Mudeli analüüs
Alustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli olulisus on p= 0,0003, seega mudel on oluline (vt. Tabel 35). P-value tunnusel test on 0,0003. Kasutades mudeli liikmete koefitsente, koostame valemi prognoosi jaoks:
Hinne= 51,41*ln(aasta)-389,708±0,30
Kirjeldatuse aste on 7%. Standardiseeritud jääkide summa läheneb nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis välja visata. Vaatlusi on 171. Nüüd jääkide analüüsi juurde. Jääkide analüüsis on kaks olulist punkti, millest lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on -1,2E-10, seega esimene tingimus on täidetud. Graafik (vt. Joonis 7) näitab, et jääkide jaotus on enam-vähem lähedane normaaljaotusele ja teine tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 8):
Tabel 8. Prognoos.
prognoos
aasta
ln(hinne)
 exp
2000
1,089196564
2,971885393
2002
1,140585407
3,128599333
2008
1,294444473
3,648968312
4) Regressiooniobjektideks valisime aasta ja testitulemuse. Uuritavaks tunnuseks on testitulemus, argumenttunnuseks aasta.
Mudeli analüüs
Alustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli olulisus on p= 0,005, seega mudel on oluline (vt. Tabel 36). Kasutades mudeli liikmete koefitsente, koostame valemi prognoosi jaoks:
Test = -0.184 aasta +377.099 ± 3.070
Kirjeldatuse aste on 3%. Standardiseeritud jääkide summa läheneb nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis välja visata. Vaatlusi on 171. Nüüd jääkide analüüsi juurde. Jääkide analüüsis on kaks olulist punkti, millest lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on -1,47E-12, seega esimene tingimus on täidetud. Graafik (vt. Joonis 8) näitab, et see läheneb normaaljaotusele, seepärast on teinegi tingimus täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 9):
Tabel 9. Prognoos.
aasta
test min
test max
2000
5.91
12.05
2003
5.36
11.50
2005
4.99
11.13
2008
4.44
10.58
5) Regressiooniobjektideks valisime keskkooli hinde ja eriala (koodi). Uuritav tunnus on eriala (kood), argumenttunnuseks hinne.
Mudeli analüüs
Alustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli olulisus on p=0,013, seega mudel on oluline (vt. Tabel 37). P-value tunnusel test on 0,013. Kasutades mudeli liikmete koefitsente, koostame valemi prognoosi jaoks:
Kood = 0.204hinne +2.250 ± 1.088
Kirjeldatuse aste on 4%. Standardiseeritud jääkide summa läheneb nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis välja visata. Vaatlusi on 177. Nüüd jääkide analüüsi juurde. Jääkide analüüsis on kaks olulist punkti, millest lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on 7.017E-14. seega esimene tingimus on täidetud. Graafik (vt. Joonis 9) näitab, et jääkide jaotus on enam-vähem lähedane normaaljaotusele ja teinegi tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 10):
Tabel 10. Prognoos.
hinne
kood
1
2.455078
2
2.660015
4
3.069888
6
3.479762
6) Valime välja regressiooniobjektid, mis on: testi tulemus ja eksami hinne. Uuritav tunnus on eksami hinne, argumenttunnus on testi tulemus.
Mudeli analüüs
Alustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli olulisus on p= 2,8E-15, seega mudel on oluline (vt. Tabel 38). P-value tunnusel test on 2,84E-15. Kasutades mudeli liikmete koefitsente, koostame valemi prognoosi jaoks:
eksam/kool = 3,59224 × test + 19,61372
Kirjeldatuse aste on 20%. Standardiseeritud jääkide summa läheneb nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis välja visata. Vaatlusi on 288. Nüüd jääkide analüüsi juurde. Jääkide analüüsis on kaks olulist punkti, millest lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on 2,9976E-14. seega esimene tingimus on täidetud. Graafik (vt. Joonis 10) näitab, et jääkide jaotus on enam-vähem lähedane normaaljaotusele ja teinegi tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 11):
Tabel 11. Prognoos
test
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
eksam
23,2
26,8
30,4
34
37,6
41,2
44,8
48,4
51,9
55,5
59,1
62,7
66,3
69,9
73,5
7) Valime välja regressiooniobjektid, mis on: matemaatika test ja hinne. Uuritav tunnus on matemaatika test. Argumenttunnus on hinne.
Mudeli analüüs
Alustame mudeli ja selle liikmete olulisuse hindamisest. Mudel on oluline (vt. Tabel 39), Significance F = 0,00125184. P-value tunnusel hinne on 0,001. Tabelist selgub, et testi kirjeldatuse aste on 6%. Kasutades mudeli liikmete koefitsente, koostame valemi prognoosi jaoks:
test = 0,020112 × hinne + 7,137337
Regresioonanalüüsist näeme, et standardiseeritud jääkide summa läheneb nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis välja visata. Vaatlusi on 171. Nüüd jääkide analüüsi juurde. Jääkide analüüsis on kaks olulist punkti, millest lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on 1,31839E-14, seega esimene tingimus on täidetud. Graafik (vt. Joonis 11) näitab, et jääkide jaotus on normaaljaotuse lähedane ja teinegi tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 12):
Tabel 12. Prognoos.
Prognoos
hinne
hinne( kuubis )
test
1
1
7,16
2
8
7,30
3
27
7,68
4
64
8,42
5
125
9,65

Kokkuvõte


Aruandes uuriti Eesti Maaülikooli erinevate erialade üliõpilaste andmeid. Antud aruande andmestik koosnes sellistest andmetest nagu üliõpilaste sugu, matemaatika keskkooli hinne, eriala, kood, matemaatika riigieksamieksami tulemus, matemaatika testi tulemus. Analüüs on koostatud 2000, 2002, 2003 ja 2008 aasta andmete põhjal.
Matemaatika andmestiku analüüsi koostamiseks kasutati erinevaid analüüsimise meetodeid . Tunnuste esmaanalüüsis hinnati igat tunnust eraldi. Leiti tunnuste maksimaalne ja minimaalne väärtus, keskmine, mood, mediaan, standardhälve. Otsustati ka kas tunnus läheneb normaaljaotusele.
Seoste analüüsist saadi teada, et matemaatika eksami tulemus sõltub keskkooli hindest ja aastast ning ei sõltu eksami kirjutaja soost. Samuti saadi teada ka, et eksamitulemus ja valitud eriala ülikoolis on omavahel sõltumatud.
Uuriti ka matemaatika testi tulemuste sõltuvust ning saadi teada, et testi tulemus ei sõltu testi tegija soost, kuid sõltub aastast ning eksamitulemusest. Samas leiti ka, et 2002. ja 2003. aasta testi tulemuste keskmine oli võrdne. Uuriti ka, kas kinnisvara ja veemajanduse eriala üliõpilaste testi tulemus on võrdne ning saadi, et nende erialade üliõpilaste testi tulemused ei ole võrdsed.
Mudeli koostamiseks tehti esmalt korrelatsioonimaatriksi ning seejärel ka regressioonanalüüsi, kust eemaldati vajalikud tunnused, leiti mudel, mis kõige paremini sobis. Mudelis prognoosisiti näiteks matemaatika testi tulemust aasta, eksamitulemuse ja koodi kaudu.
Test = -0,23 × aasta + 0,06 × eksam/kool – 0,51 × kood + 470,40
Saadud mudel oli loogiline, kuna prognoosides saadud tulemused on võimalikud.

Lisad


Tabel 13. Normaaljaotusele lähenemise kontroll tunnusele eksami tulemus.
H0:
Tunnuse eksam/kool jaotus läheneb normaaljaotusele.
p>0,05
H1:
Tunnuse eksam/kool jaotus ei lähene normaaljaotusele.
klassipiirid
Tegelik sagedus
Normaal -jaotuse jaotusfn punktid
Tõenäosus
Oodatav sagedus
5
39
0,03450
0,0345
9,936
10
1
0,05297
0,01847
5,319974839
15
0
0,07854
0,02557
7,363059613
20
2
0,11252
0,03398
9,785778787
25
8
0,15588
0,04336
12,48880485
30
11
0,20903
0,05314
15,3050528
35
12
0,27156
0,06254
18,01097823
40
10
0,34223
0,07067
20,35299503
45
22
0,41892
0,07669
22,08553569
50
30
0,49883
0,07991
23,01315457
55
21
0,57878
0,07995
23,02676809
60
18
0,65560
0,07682
22,12475324
65
28
0,72648
0,07088
20,4132658
70
22
0,78928
0,06280
18,08569206
75
20
0,84271
0,05343
15,38672991
80
17
0,88635
0,04365
12,5703117
85
11
0,92059
0,03424
9,861301377
90
11
0,94639
0,02579
7,4286659
95
4
0,96505
0,01866
5,373729024
100
1
0,97801
0,01296
3,732750498
summa:
288
0,97800
281,665302
p=
8,0916E-18
Järelikult H1 - tunnuse hinne jaotus ei lähene normaaljaotusele
Tabel 14. Normaaljaotusele lähenemise kontroll tunnusele hinne.
H0:
Tunnuse hinne jaotus läheneb normaaljaotusele.
p>0,05
H1:
Tunnuse hinne jaotus ei lähene normaaljaotusele.
Hinne
Tegelik sagedus
Normaal-jaotuse jaotusfn punktid
Tõenäosus
Oodatav sagedus
1
4
0,00328
0,00328
0,56088
2
17
0,05182
0,04855
8,301573
3
62
0,29595
0,24412
41,74516
4
67
0,71063
0,41469
70,91145
5
21
0,95018
0,23954
40,96176
Summad
171
0,95018
162,4808
p=
3,6579E-10
Järelikult H1 - tunnuse hinne jaotus ei lähene normaaljaotusele
Tabel 15. Kirjeldavad statistikud.
aasta 
sugu
test
eksam/kool
hinne
kood
Mean
2003,731
1,4
8,291803
50,0729167
3,491228
2,872131
Standard Error
0,156329
0,028098
0,177857
1,46060454
0,070072
0,064523
Median
2003
1
8
53
4
3
Mode
2003
1
6
4
4
4
Standard Deviation
2,730164
0,490703
3,106143
24,787281
0,916312
1,126845
Sample Variance
7,453796
0,240789
9,648123
614,409299
0,839628
1,26978
Kurtosis
-0,95987
-1,84381
-0,71639
-0,59609723
0,015361
-1,04477
Skewness
0,68429
0,410269
0,014344
-0,48900657
-0,34518
-0,59308
Range
8
1
14
93
4
3
Minimum
2000
1
1
3
1
1
Maximum
2008
2
15
96
5
4
Sum
611138
427
2529
14421
597
876
Count
305
305
305
288
171
305
Confidence Level(95,0%)
0,307623
0,05529
0,349987
2,87485541
0,138324
0,126968
Tabel 16. Normaaljaotusele lähenemise kontroll tunnusele aasta.
H0 - tunnuse jaotus läheneb normaaljaotusele
H1 - tunnus jaotus ei lähene normaaljaotusele
aasta
tegelik sagedus
normaal-jaotuse jaotus-funkts punktid
tõenäosus
oodatav sagedus
2000
32
0.085869
0.085869
26.19014
2002
91
0.263014
0.177144
80.21918
2003
100
0.394425
0.131412
120.2997
2008
82
0.941043
0.546618
287.0181
305
0.941043
513.7271
p=
7.21243E-33
H1! - tunnuse jaotus ei lähene normaaljaotusele
Tabel 17. Normaaljaotusele lähenemise kontroll tunnusele test.
H0:
Tunnuse test jaotus läheneb normaaljaotusele.
H1:
Tunnuse test jaotus ei lähene normaaljaotusele.
Test:
Test:
Tegelik sagedus
Normaaljaotuse jaotusfunktsioon
tõenäosus
oodadatv sagedus
1
2
0,009448851
0,009448851
2,881899555
2
5
0,02140289
0,011954039
3,645982028
3
9
0,044222555
0,022819664
6,959997589
4
23
0,083529657
0,039307103
11,98866628
5
20
0,144624164
0,061094507
18,63382473
6
37
0,230309085
0,085684921
26,13390091
7
36
0,338746482
0,108437396
33,07340592
8
29
0,462576847
0,123830365
37,76826131
9
29
0,590176398
0,127599551
38,91786316
10
32
0,708820236
0,118643838
36,18637045
11
28
0,80836421
0,099543974
30,3609121
12
30
0,883727146
0,075362936
22,9856956
13
13
0,935211182
0,051484036
15,70263089
14
6
0,96694759
0,031736408
9,67960451
15
6
0,984600304
0,017652714
5,384077644
 
 
Summad:
305
0,984600304
300,3030927
p=
0,028523453
ehk
p >0,05
ehk
H1
Tunnus test jaotus ei lähene normaaljaotusele
Tabel 18. Tunnuste hinne ja riigieksami tulemus CHITEST.
Empiiriline jaotus
Reasildid
kõrge
madal
Üldkokkuvõte
2
5
12
17
3
10
52
62
4
39
28
67
5
18
3
21
Üldkokkuvõte
72
95
167
Teoreetiline jaotus
Reasildid
kõrge
madal
Üldkokkuvõte
2
7,329341317
9,67065868
17
3
26,73053892
35,2694611
62
4
28,88622754
38,1137725
67
5
9,053892216
11,9461078
21
Üldkokkuvõte
72
95
167
p=
5,18973E-09
Tabel 19. Tunnuste hinne ja riigieksami tulemus keskmiste võrdlemine.
H0
dispersioonid on võrdsed
H1
dispersioonid ei ole võrdsed
p=
0,982066082
seega H0
dispersioonid on võrdsed
H0
Keskmisest kõrgema matemaatika eksami tulemusega üliõpilaste keskmine matemaatika
hinne on võrdne keskmisest madalama tulemusega üliõpilaste keskmise matemaatika hindega?
H1
Keskmisest kõrgema matemaatika eksami tulemusega üliõpilaste keskmine matemaatika
hinne ei ole võrdne keskmisest madalama tulemusega üliõpilaste keskmise matemaatika hindega?
t-Test: Two-Sample Assuming Equal Variances
 
Kui eksam keskmisest kõrgem, siis hinne
Kui eksam keskmisest madalam, siis hinne
Mean
3,972222222
3,141414141
Variance
0,675273865
0,673675531
Observations
72
99
Pooled Variance
0,674347021
Hypothesized Mean Difference
0
df
169
t Stat
6,531979015
P(T
Vasakule Paremale
Matemaatika andmestiku analüüs #1 Matemaatika andmestiku analüüs #2 Matemaatika andmestiku analüüs #3 Matemaatika andmestiku analüüs #4 Matemaatika andmestiku analüüs #5 Matemaatika andmestiku analüüs #6 Matemaatika andmestiku analüüs #7 Matemaatika andmestiku analüüs #8 Matemaatika andmestiku analüüs #9 Matemaatika andmestiku analüüs #10 Matemaatika andmestiku analüüs #11 Matemaatika andmestiku analüüs #12 Matemaatika andmestiku analüüs #13 Matemaatika andmestiku analüüs #14 Matemaatika andmestiku analüüs #15 Matemaatika andmestiku analüüs #16 Matemaatika andmestiku analüüs #17 Matemaatika andmestiku analüüs #18 Matemaatika andmestiku analüüs #19 Matemaatika andmestiku analüüs #20 Matemaatika andmestiku analüüs #21 Matemaatika andmestiku analüüs #22 Matemaatika andmestiku analüüs #23 Matemaatika andmestiku analüüs #24 Matemaatika andmestiku analüüs #25 Matemaatika andmestiku analüüs #26 Matemaatika andmestiku analüüs #27 Matemaatika andmestiku analüüs #28 Matemaatika andmestiku analüüs #29 Matemaatika andmestiku analüüs #30 Matemaatika andmestiku analüüs #31 Matemaatika andmestiku analüüs #32 Matemaatika andmestiku analüüs #33 Matemaatika andmestiku analüüs #34 Matemaatika andmestiku analüüs #35 Matemaatika andmestiku analüüs #36 Matemaatika andmestiku analüüs #37 Matemaatika andmestiku analüüs #38 Matemaatika andmestiku analüüs #39 Matemaatika andmestiku analüüs #40
Punktid 100 punkti Autor soovib selle materjali allalaadimise eest saada 100 punkti.
Leheküljed ~ 40 lehte Lehekülgede arv dokumendis
Aeg2012-09-11 Kuupäev, millal dokument üles laeti
Allalaadimisi 50 laadimist Kokku alla laetud
Kommentaarid 0 arvamust Teiste kasutajate poolt lisatud kommentaarid
Autor maarja656 Õppematerjali autor
Geomaatika erialale Statistika rühmatöö

Sarnased õppematerjalid

Andmeanalüüs MS Exceli abil
43
pdf

Andmeanalüüs MS Exceli abil

informatsiooni, koosnedes tavaliselt ühest või mitmest tabelist ja/või joonisest. Pivot Table Neljas andmeanalüüsil kasutatav MS Exceli vahend on Pivot Table (nn. pöördtabel või risttabel), mille konstrueerimiseks tuleb liikuda menüüst Data käsule Pivot Table Report.... Esimese sammuna tuleb valida, millisel kujul on uuritav andmestik (vaikimisi ühel lehel paiknev Exceli andmetabel, ülejäänud valikud võimaldavad konstrueerida risttabeli ka mitte-Exceli andmete või mitme andmetabeli baasil). Edasi vaatame juhtu, kus andmestikuks on ühel lehel paiknev Exceli andmetabel. Teise sammuna tuleb määrata uuritav andmeblokk (kas klaviatuurilt või hiirega andmetabelist

Informaatika
Biomeetria test
4
docx

Biomeetria test

väärtuseid (ehk siis 2 väärtust) 2. Hii-runt-test Kontrollida seose olemasolu Mittearvulised või sagedustabeli põhjal diskreetsed arvtunnused 3. Korrelatsioon Võrrelda tunnuste paare; 2 pidevat arvutunnus Kontrollida seose olemasolu 4.Regresioon analüüs Prognoosida ühte tunnust teise 2 pidevat arvutunnus järgi. Regresioonivõrrandi olulisus 5.Dispersioon Keskmiste erinevus mitmes Pidev arvtunnus- keskmised, analüüs grupis (üle 2) Tunnus, millel on vahe väärtused (üle 2) Praks 3- Kirjeldav statistika

Biomeetria
Statistika kontrolltöö
22
xls

Statistika kontrolltöö

Ülesanne1 Mis tüüpi tunnus on lehmade arv. Leia tunnuse lehmade arv jaoks: 1) Leia statistikud ja kirjelda nende abil tunnuse jaotust. 2) Kas tunnus on normaaljaotusega? 3) Tee histogramm 4) Leia üldkogumi keskväärtuse 95% usaldusintervall Valimi põhjal Lehmade arv Lehmade arv on diskreetne tunnus. 667 Lehmade arv 722 1339 Mean 842,4194 Keskväärtust ja mediaani võib lugeda ligilähedaseks, mi 1636 Standard Error 40,80659 Järsakus on väike. 1048 Median 832,5 1886 Mode 1074 klassipiirid 748 Standard Deviation 321,3114 400 401 Sample Variance 103241 600 1113 Kurtosis 0,795697 800 84

Statistika
Ökonomeetriline projekt - Brutopalga sõltuvus haridustasemest-meeste osakaalust ning linlaste osakaalust maakondade lõikes
36
docx

Ökonomeetriline projekt - Brutopalga sõltuvus haridustasemest, meeste osakaalust ning linlaste osakaalust maakondade lõikes

TALLINNA TEHNIKAÜLIKOOL Majandusteaduskond Rahandus ja majandusteooria instituut Matemaatika, statistika ja ökonomeetria õppetool Laura Kallasvee, Liisi Saksakulm BRUTOPALKADE SEOS HARIDUSE, SOO JA ELUKOHAGA EESTI MAAKONDADE LÕIKES AASTATEL 2005-2008 Ökonoomeetriline projekt Juhendaja: dotsent Ako Sauga Tallinn 2014 SISUKORD SISSEJUHATUS.................................................................................................................

Majandus
Hinnangud-hüpoteesid-regressioon
34
xls

Hinnangud, hüpoteesid, regressioon

Hinnangud, hüpoteesid, regressioon Proovitükk nr. 6 Kolmas kodutöö õppeaines Metsandusliku andmetöötluse alused Lähteandmeteks on Teie proovitüki 1. rinde enamuspuuliigi keskmine diameeter (rühmitamata andmed). Kopeerige see tulp sellele samale töölehele. Punkthinnangud, vahemikhinnangud, valimi maht Eeldame, et teie proovitükil mõõdetud andmete põhjal tahame teha järeldusi samalaadse üldkogumi kohta Selleks arvuta järgmised statistikud oma proovitüki kohta 1) Leida 1. rinde enamuspuuliigi diameetri kohta (rühmitamata andmetest) järgmised suurused: keskväärtuse hinnang (aritmeetiline keskmine), 4.921 dispersioon, 7.352 standardhälve, 2.712 standardhälbe viga 0.183 valimi maht,

Andmetöötlus alused
Biomeetria eksamiks valmistumine
3
doc

Biomeetria eksamiks valmistumine

Tee abitabel joonise tegemise jaoks. Pane kirja keskmised (massid) ja standardhälbed. Standardhälve saad SQRT variance. Tee tulpdiagramm keskmiste alusel. Lisa tulpadele veajooned:Chart layout ­ error bars- more error bar options ­ specify value ja pane lünkadesse standardhälbed, värvi tulbad heledamaks ja piirjooned tumedamaks. P järgi saad teada, kas seos on statistiliselt oluline või mitte. JÄRELDUS: Peaümbermõõdust ei olene õpilaste matemaatika hinne. Korrelatsioonanalüüs vt ka PRAKS 5 Leia korrelatsioonikordaja, funktsiooniga Correl ilma pealkirjadeta. Kirjelda seost: Seose suund: 1.samasuunaline - r väärtus on positiivne (r>0) st ühe tunnuse suuremate väärtuste korral on ka teise tunnuse väärtused suuremad. Näiteks: Mida rohkem lehmad sõid, seda rohkem nad piima andsid. 2.vastassuunaline - r väärtus on negatiivne (r<0) st ühe tunnuse suuremate väärtuste

tehnomaterjalid
Statistika kolmas kontrolltöö
46
xlsx

Statistika kolmas kontrolltöö

Ülikoolist väljalangenute arv Kasvutempo Bakalaureuseõpe Magistriõpe BakalaureuseõpMagistriõpe 1993 2952 105 -226 81 1994 2726 186 -589 184 1995 2137 370 -105 100 1996 2032 470 197 65 1997 2229 535 157 -23 1998 2386 512 187 76 1999 2573 588 457 43 2000 3030 631 284 29 2001 3314 660 -267 102 2002 3047 762 945 237 2003 3992 999 -224

Statistika
Nimetu
13
docx

Nimetu

EESTI MAAÜLIKOOL Metsandus- ja maaehitusinstituut Metsakorralduse osakond Mikk Sülla Proovitükk nr 613. Hinnangud, hüpoteesid, regressioon Kodune töö nr. 5 õppeaines Metsandusliku andmetöötluse alused II Juhendaja Külliki Kiviste Tartu 2012 Sisukord Sisukord Sissejuhatus Käesoleva töö eesmärgiks on analüüsida, kas proovitükil mõõdetud diameetri jaotus on lähendatav mõne klassikalise teoreetilise jaotusega. Töös on kasutatud Aakre metskonna proovitükki nr. 613 andmeid, mis on saadud EMÜ Metsanduse ja maakorralduse serveris võrgukaustast public:/Metsandusliku andmetöötluse alused 2011/2011]. Samuti on kasutatud K.Kiviste kodulehte [http://www.eau.ee/~kkiviste] kust oli võimalik saada väga täpseid juhiseid, lühendeid ja valeme

Andmetöötlus alused




Meedia

Kommentaarid (0)

Kommentaarid sellele materjalile puuduvad. Ole esimene ja kommenteeri



Sellel veebilehel kasutatakse küpsiseid. Kasutamist jätkates nõustute küpsiste ja veebilehe üldtingimustega Nõustun