Eesti Maaülikool
Metsandus- ja maaehitusinstituut
Geomaatika
osakond Matemaatika andmestiku analüüs
Aruanne õppeaines matemaatiline statistika
Koostajad:
Juhendaja : Eve
Aruvee Tartu
SisukordSissejuhatus 3
Tunnuste esmaanalüüs 4
Seoste analüüs 8
Mudeli koostamine 13
Kokkuvõte 20
Lisad 21
Sissejuhatus
Oma aruandes uurisime Eesti Maaülikooli erinevate erialade
üliõpilaste andmeid. Antud aruande
andmestik koosneb
sellistest andmetest nagu üliõpilaste sugu, matemaatika keskkooli hinne,
eriala, kood, matemaatika riigieksamieksami tulemus, matemaatika
testi tulemus. Analüüs on koostatud 2000, 2002, 2003 ja 2008 aasta
andmete põhjal.
Esmalt võtsime vaatluse alla keskkooli matemaatika hinde ning
riigieksami tulemuse, kus eesmärgiks oli uurida, kas riigieksami
tulemus on seotud keskkooli hindega. Seejärel uurisime matemaatika
riigieksami tulemuse sõltumist aastast. Siis vaatasime tunnuseid
sugu ja test, kus soovisime teada, kas matemaatika testi tulemus
sõltub soost. Järgmiseks uurisime aasta ja testi sõltuvust,
täpsemalt soovisime teada, kas matemaatika testi tulemus sõltub
aastast. Tunnuste, riigieksami tulemused ja sugu, uurimise
eesmärgiks oli välja selgitada, kas riigieksami tulemused sõltuvad
soost. Soovisime teada ka, kas riigieksami tulemustel on seos valitud
erialaga ja ülikoolis
sooritatud matemaatika testiga. Mudeli
koostamise eesmärgiks oli vaadata, kuidas
kirjeldavad aasta,
riigieksami tulemus, ja eriala tunnust matemaatika test.
Tunnuste esmaanalüüs
Andmestik koosneb paljudest erinevatest tunnustest. Siinkohal toome
välja andmestikus kasutatavate tunnuste tüübid:
Aasta –
diskreetne Test – diskreetne
Sugu – binaarne
Hinne – järjestus
Eksam /kool – järjestus
Eriala –
nominaalne
Matemaatika riigieksami tulemus
Andmestikus on esitatud matemaatika eksami tulemused aastatel 2000,
2002, 2003 ja 2008. Tunnuse eksam/kool vaatluse väärtused muutuvad
vahemikus 3-96 punkti. Kõige madalam
punktisumma oli 3 ja kõige
kõrgem 96. Loendusel on arvestatud 288 tulemust. Nende aastate
keskmine punktisumma oli 50 (vt. Tabel 15). Ka sagedusjaotuse põhjal
võib öelda, et paljud tulemused on vahemikus 45-55 (vt.Joonis 1
).
Joonis 1.
Sagedusjaotus tunnusele riigieksami tulemus.
Standarthälve on 24,79, mis iseloomustab rea elementide paiknevust
keskväärtuse suhtes, selle põhjal võib öelda, et hälbimus
on väike.
Kõige enam punkte saadi 2003. aastal, 96 punkti saanud üliõpilane
õpib veemajanduse erialal (vt. Tabel 1). Üldse 6 paremat tulemust
on saadud 2003. aastal ja 5 neist on kinnisvara üliõpilased. Vähim
punktisumma "3" on saadud 2002. aastal.
Tabel 1. Minimaalsed
ja maksimaalsed punktid aastate kaupa.
Aasta
Min. punktid
Eriala
Max. punktid
Eriala
2000
10
eh
89
ve
2002
3
kv, mk, ve
89
eh
2003
18
ve
96
ve
2008
21
eh
79
eh
Ülikooli õppima tulnud üliõpilaste matemaatika eksami
punktisummad on väga varieeruvad, 179 tulemust 288-st jääb
vahemikku 45-80. Selle põhjal võib öelda, et ülikooli astunute
matemaatika teadmised on keskmisest paremad. Tunnuse eksam jaotus ei
lähene normaaljaotusele (vt. Tabel 13).
Matemaatika keskkooli hinne
Tunnuse hinne vaatlused on tehtud aastatel 2000, 2002, 2003 ja 2008
ning väärtused on vahemikus ühest
viieni . Loenduses on arvesse
võetud 171 õpilase tulemust. Eelnevalt nimetatud aastate
matemaatika keskmine hinne on 3,5 (vt. Tabel 15). Kõige enam esineb
hinnet "4" (39,18%) ja "3" (36,26%), mille
esinemise sagedused on ligilähedased. Hinnet "5" on saanud
ainult 12,28% andmestikus toodud õpilastest. Kõige vähem on
saadud hinnet "1"
(2,34%)
(vt. ).
Joonis
2. Sagedusjaotus tunnusele
keskkooli hinne.
Jaotust võib pidada sümmeetriliseks, sest mood ja mediaan on
ligilähedalt sarnased (vt. Tabel 15). Kõige madalam matemaatika
hinne on saadud 2002. aastal ning ainult eh üliõpilaste seas pole
seda saadud. Hinnet "5" pole saanud ainult 2003. aastal
ülikooli tulnud õpilased. Kõige enam viielisi on 2002. aastal
sisse
astunud üliõpilaste seas. Matemaatika hinde põhjal võib
sisse astunud üliõpilaste teadmisi pidada heaks, sest
nelja-viielisi oli 88 171-st õpilasest. Tunnuse hinne jaotus
ei lähene normaaljaotusele (vt. Tabel 14).
Aasta
Tabelis on esitatud andmed 2000, 2002, 2003 ja 2008 aasta kohta.
Kokku tehti
vaatlusi 305. Kõige rohkem vaatlusi (100) pärineb
2003ndast aastast, kõige vähem aastast 2000 (32), 2002. aastal
tehti 92 vaatlust ning aastal 2008 tehti vaatlusi 82 (vt. Joonis 3).
Joonis 3.
Sagedusjaotus tunnusele aasta.
2000. aasta vaatlused kajastavad ehituse ja veemajanduse eriala
üliõpilaste tulemusi. Aastatel 2002 ja 2003 tehtud vaatlused
kajastavad kinnisvara,
maakorralduse , ehituse ja veemajanduse
üliõpilaste tulemusi. 2008. aastal tehtud vaatlused kajastavad
kinnisvara, ehituse ja veemajanduse üliõpilaste andmeid (vt. Tabel 2).
Tabel 2.
Vaatluste arv aastatel 2000, 2002, 2003, 2008 erialade kaupa.
aasta
kv
mk
ve
eh
kokku
2000
23
9
32
2002
22
11
17
41
91
2003
21
21
25
33
100
2008
18
32
32
82
kokku
61
32
97
115
305
Tunnus ei lähene normaaljaotusele (vt.Tabel 16
).
Matemaatika test
Tunnus testi punktide väärtused muutusid vahemiku 1 kuni 15.
Keskmine näitab, et testi eest on saadud keskmiselt 8,29 punkti.
Mood on 6, mis tähendab, et kõige rohkem oli
teste , kus saadi kuus
punkti (vt.Joonis 4 ).
Joonis 4. Sagedusjaotus
tunnusele test.
Kuuese punktisummaga teste oli 12,14 %. Mediaaniks on 8 ja kuna testi
eest saadud punktidest oli 15 kõige suurem, siis ei ole ei punktid
1-7 kui punktid 9-15 ülekaalus. Standardhälve on 3,1, mis
iseloomustab elementide paiknevust keskväärtuse suhtes (vt. Tabel 15).
Tunnuse test jaotus ei lähene normaaljaotusele, aga palju puudu ei
ole (vt. Tabel 17).
Seoste analüüs
1) Esmalt uurime, kas matemaatika riigieksami tulemus sõltub
matemaatika keskkooli hindest. Püstitame hüpoteesid:
H0: Matemaatika riigieksami tulemus ei sõltu keskkooli
hindest
H1: Matemaatika riigieksami tulemus sõltub keskkooli
hindest
Selleks,
et jõuda järeldusteni,
leidsime kõigepealt eksamitulemuste aritmeetilise keskmise ja
koostasime IF funktsiooni, kus märkisime ära, et kui tulemus on
alla keskmise, on see madal ja kui üle keskmise, siis kõrge.
Koostasime PivotTable, mida kopeerides
saime empiirilise jaotuse,
kust jätsime välja tühjad lahtrid.
Teoreetilise jaotuse saamiseks
kopeerisime empiirilise jaotuse tabeli ning kustutasime sealt kõik
väärtused, arvutasime asemele
teoreetilised väärtused.
Saades kaks blokki (
empiiriline jaotus ja teoreetiline jaotus), leidsime
CHITEST-iga (vt. Tabel 18) p väärtuse, saime, et p .
3) Uurime, kas matemaatika riigieksami tulemus sõltub aastast. Püstitame hüpoteesid:
H0: Matemaatika riigieksami tulemus ei sõltu aastast
H1: Matemaatika riigieksami tulemus sõltub aastast
Järelduseni
jõudmiseks,
leidsime kõigepealt eksamitulemuste aritmeetilise keskmise ja
koostasime IF funktsiooni, kus märkisime ära, et kui tulemus on
alla keskmise, on see madal ja kui üle keskmise, siis kõrge.
Koostasime PivotTable, mida kopeerides saime empiirilise jaotuse,
kust jätsime välja tühjad lahtrid. Teoreetilise jaotuse saamiseks
kopeerisime empiirilise jaotuse tabeli ning kustutasime sealt kõik
väärtused, arvutasime asemele teoreetilised väärtused. Saades
kaks blokki (empiiriline jaotus ja teoreetiline jaotus),
kasutasime funktsiooni CHITEST, saime, et p 0,880688524 ja tunnusel hinne on 0,103210735. Seega eemaldame kõigepealt tunnuse sugu mudelist ning teeme järgmise
regressioonianalüüsi (vt. Tabel 32) ning siis eemaldame ka tunnuse
hinne mudelist ning teeme veel korra regresioonanalüüsi (vt. Tabel 33).
Sellest
selgub , et testi
kirjeldatuse aste on 27%. Mudeli olulisus on
p=3,94E-19, seega mudel on oluline. Kasutades mudeli liikmete
koefitsente, koostame valemi prognoosi jaoks:
Test = -0,23 × aasta + 0,06
× eksam/kool – 0,51 ×
kood + 470,40
Regressioonanalüüsist näeme,
et
standardiseeritud jääkide summa läheneb
nullile .
Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille
väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis
välja
visata . Vaatlusi on 288. Nüüd jääkide analüüsi juurde.
Jääkide analüüsis on kaks olulist punkti, millest lähtuda:
jääkide summa peab lähenema nullile ja jääkide jaotus peab
lähenema normaaljaotusele. Standardiseeritud jääkide summa on
-2,35861E-12, seega esimene tingimus on täidetud.
Graafik (vt. Joonis 5)
näitab, et jääkide jaotus on normaaljaotuse lähedane ja teinegi
tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 6):
Tabel 6.
Prognoos.
Prognoos
aasta
2002
2003
2000
2008
eksam/kool
34
63
54
50
kood
3
3
3
3
test
7,791813
9,332244
9,476427
7,381256
2) Valime välja regressiooniobjektid, mis on: matemaatika riigieksam
ja matemaatika hinne. Uuritav tunnus on matemaatika riigieksami
tulemus, argumenttunnus on keskkooli hinne.
Mudeli analüüsAlustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli
olulisus on p=
2,83E-13, seega mudel on oluline (vt. Tabel 34).
P- value tunnusel test on 2,83E-13. Kasutades mudeli liikmete
14oefitsiente,
koostame valemi prognoosi jaoks:
Eksam = 1,66*ln(hinne)+1,5±0,84
Kirjeldatuse aste on 27%. Standardiseeritud jääkide summa läheneb
nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget,
mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud
tarvis välja visata. Vaatlusi on 161. Nüüd jääkide analüüsi
juurde. Jääkide analüüsis on kaks olulist punkti, millest
lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus
peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on
-1,3E-13, seega esimene tingimus on täidetud. Graafik (vt. Joonis 6)
näitab, et jääkide jaotus ei ole lähedane normaaljaotusele ja
teine tingimus ei ole täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 7):
Tabel 7.
Prognoos.
prognoos
hinne
ln (eksam)
Exp (eksam)
viga
1
1,50053
4,48406382
±0,84
2
2,654583
14,2190546
±0,84
3
3,329661
27,928866
±0,84
4
3,808636
45,0889016
±0,84
5
4,180158
65,3762001
±0,84
3) Valime välja regressiooniobjektid, mis on: aasta ja matemaatika
hinne. Uuritav tunnus on matemaatika hinne, argumenttunnus on aasta.
Mudeli analüüsAlustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli
olulisus on p=
0,0003, seega mudel on oluline (vt. Tabel 35).
P-value tunnusel test on 0,0003. Kasutades mudeli liikmete
koefitsente, koostame valemi prognoosi jaoks:
Hinne= 51,41*ln(aasta)-389,708±0,30
Kirjeldatuse aste on 7%. Standardiseeritud jääkide summa läheneb
nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget,
mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud
tarvis välja visata. Vaatlusi on 171. Nüüd jääkide analüüsi
juurde. Jääkide analüüsis on kaks olulist punkti, millest
lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus
peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on
-1,2E-10, seega esimene tingimus on täidetud. Graafik (vt. Joonis 7)
näitab, et jääkide jaotus on enam-vähem lähedane
normaaljaotusele ja teine tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 8):
Tabel 8. Prognoos.
prognoosaasta
ln(hinne) exp2000
1,089196564
2,971885393
2002
1,140585407
3,128599333
2008
1,294444473
3,648968312
4) Regressiooniobjektideks
valisime aasta ja testitulemuse.
Uuritavaks tunnuseks on testitulemus, argumenttunnuseks aasta.
Mudeli analüüsAlustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli
olulisus on p=
0,005, seega mudel on oluline (vt. Tabel 36). Kasutades
mudeli liikmete koefitsente, koostame valemi prognoosi jaoks:
Test = -0.184 aasta +377.099 ± 3.070
Kirjeldatuse aste on 3%. Standardiseeritud jääkide summa läheneb
nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget,
mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud
tarvis välja visata. Vaatlusi on 171. Nüüd jääkide analüüsi
juurde. Jääkide analüüsis on kaks olulist punkti, millest
lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus
peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on
-1,47E-12, seega esimene tingimus on täidetud. Graafik (vt. Joonis 8)
näitab, et see läheneb normaaljaotusele, seepärast on teinegi
tingimus täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 9):
Tabel 9. Prognoos.
aasta
test min
test max
2000
5.91
12.05
2003
5.36
11.50
2005
4.99
11.13
2008
4.44
10.58
5) Regressiooniobjektideks valisime keskkooli hinde ja eriala
(koodi). Uuritav tunnus on eriala (kood), argumenttunnuseks hinne.
Mudeli analüüsAlustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli
olulisus on
p=0,013, seega mudel on oluline (vt. Tabel 37).
P-value tunnusel test on 0,013. Kasutades mudeli liikmete
koefitsente, koostame valemi prognoosi jaoks:
Kood = 0.204hinne +2.250 ± 1.088
Kirjeldatuse aste on 4%.
Standardiseeritud jääkide summa läheneb nullile.
Standardiseeritud jääkide hulgas polnud ühtegi liiget, mille
väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud tarvis
välja visata. Vaatlusi on 177. Nüüd jääkide analüüsi
juurde. Jääkide analüüsis on kaks olulist punkti, millest
lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus
peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on
7.017E-14. seega esimene tingimus on täidetud. Graafik (vt. Joonis 9)
näitab, et jääkide jaotus on enam-vähem lähedane
normaaljaotusele ja teinegi tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 10):
Tabel 10. Prognoos.
hinne
kood
1
2.455078
2
2.660015
4
3.069888
6
3.479762
6) Valime välja regressiooniobjektid, mis on: testi tulemus ja
eksami hinne. Uuritav tunnus on eksami hinne, argumenttunnus on testi
tulemus.
Mudeli analüüsAlustame mudeli ja selle liikmete olulisuse hindamisest. Mudeli
olulisus on p=
2,8E-15, seega mudel on oluline (vt. Tabel 38).
P-value tunnusel test on 2,84E-15. Kasutades mudeli liikmete
koefitsente, koostame valemi prognoosi jaoks:
eksam/kool = 3,59224 × test + 19,61372
Kirjeldatuse aste on 20%. Standardiseeritud jääkide summa läheneb
nullile. Standardiseeritud jääkide hulgas polnud ühtegi liiget,
mille väärtus oleks üle 3 olnud ning ühtegi vaatlust polnud
tarvis välja visata. Vaatlusi on 288. Nüüd jääkide analüüsi
juurde. Jääkide analüüsis on kaks olulist punkti, millest
lähtuda: jääkide summa peab lähenema nullile ja jääkide jaotus
peab lähenema normaaljaotusele. Standardiseeritud jääkide summa on
2,9976E-14. seega esimene tingimus on täidetud. Graafik (vt. Joonis 10)
näitab, et jääkide jaotus on enam-vähem lähedane
normaaljaotusele ja teinegi tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 11):
Tabel 11. Prognoos
test
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
eksam
23,2
26,8
30,4
34
37,6
41,2
44,8
48,4
51,9
55,5
59,1
62,7
66,3
69,9
73,5
7) Valime välja regressiooniobjektid, mis on: matemaatika test ja
hinne. Uuritav tunnus on matemaatika test. Argumenttunnus on hinne.
Mudeli analüüsAlustame mudeli ja selle liikmete olulisuse hindamisest. Mudel on
oluline (vt. Tabel 39),
Significance F = 0,00125184. P-value
tunnusel hinne on 0,001. Tabelist selgub, et testi kirjeldatuse
aste on 6%. Kasutades mudeli liikmete koefitsente, koostame valemi
prognoosi jaoks:
test = 0,020112 × hinne +
7,137337
Regresioonanalüüsist näeme, et standardiseeritud jääkide summa
läheneb nullile. Standardiseeritud jääkide hulgas polnud ühtegi
liiget, mille väärtus oleks üle 3 olnud ning ühtegi vaatlust
polnud tarvis välja visata. Vaatlusi on 171. Nüüd jääkide
analüüsi juurde. Jääkide analüüsis on kaks olulist punkti,
millest lähtuda: jääkide summa peab lähenema nullile ja jääkide
jaotus peab lähenema normaaljaotusele. Standardiseeritud jääkide
summa on 1,31839E-14, seega esimene tingimus on täidetud. Graafik
(vt. Joonis 11) näitab, et jääkide jaotus on normaaljaotuse
lähedane ja teinegi tingimus on täidetud.
Kasutades saadud mudelit leiame prognoosi (vt. Tabel 12):
Tabel 12. Prognoos.
Prognoos
hinne
hinne(
kuubis )
test
1
1
7,16
2
8
7,30
3
27
7,68
4
64
8,42
5
125
9,65
Kokkuvõte
Aruandes uuriti Eesti Maaülikooli
erinevate erialade üliõpilaste andmeid. Antud aruande andmestik
koosnes sellistest andmetest nagu üliõpilaste sugu, matemaatika
keskkooli hinne, eriala, kood, matemaatika riigieksamieksami tulemus,
matemaatika testi tulemus. Analüüs on koostatud 2000, 2002, 2003 ja
2008 aasta andmete põhjal.
Matemaatika andmestiku analüüsi
koostamiseks kasutati erinevaid analüüsimise
meetodeid . Tunnuste
esmaanalüüsis hinnati igat tunnust eraldi. Leiti tunnuste
maksimaalne ja minimaalne väärtus, keskmine, mood, mediaan,
standardhälve. Otsustati ka kas tunnus läheneb normaaljaotusele.
Seoste analüüsist saadi teada, et matemaatika eksami tulemus sõltub
keskkooli hindest ja aastast ning ei sõltu eksami kirjutaja soost.
Samuti saadi teada ka, et eksamitulemus ja valitud eriala ülikoolis
on omavahel sõltumatud.
Uuriti ka matemaatika testi tulemuste sõltuvust ning saadi teada, et
testi tulemus ei sõltu testi tegija soost, kuid sõltub aastast ning
eksamitulemusest. Samas leiti ka, et 2002. ja 2003. aasta testi
tulemuste keskmine oli võrdne. Uuriti ka, kas kinnisvara ja
veemajanduse eriala üliõpilaste testi tulemus on võrdne ning
saadi, et nende erialade üliõpilaste testi tulemused ei ole
võrdsed.
Mudeli koostamiseks tehti esmalt
korrelatsioonimaatriksi
ning seejärel ka regressioonanalüüsi,
kust eemaldati vajalikud tunnused, leiti mudel, mis kõige
paremini
sobis.
Mudelis prognoosisiti
näiteks matemaatika testi tulemust aasta, eksamitulemuse ja koodi
kaudu.
Test = -0,23 × aasta + 0,06
× eksam/kool – 0,51 ×
kood + 470,40
Saadud mudel oli loogiline, kuna prognoosides saadud tulemused on
võimalikud.
Lisad
Tabel 13.
Normaaljaotusele lähenemise kontroll tunnusele eksami tulemus.
H0:
Tunnuse eksam/kool jaotus läheneb normaaljaotusele.
p>0,05
H1:
Tunnuse eksam/kool jaotus ei lähene normaaljaotusele.
klassipiiridTegelik sagedus Normaal -jaotuse jaotusfn punktidTõenäosusOodatav sagedus5
39
0,03450
0,0345
9,936
10
1
0,05297
0,01847
5,319974839
15
0
0,07854
0,02557
7,363059613
20
2
0,11252
0,03398
9,785778787
25
8
0,15588
0,04336
12,48880485
30
11
0,20903
0,05314
15,3050528
35
12
0,27156
0,06254
18,01097823
40
10
0,34223
0,07067
20,35299503
45
22
0,41892
0,07669
22,08553569
50
30
0,49883
0,07991
23,01315457
55
21
0,57878
0,07995
23,02676809
60
18
0,65560
0,07682
22,12475324
65
28
0,72648
0,07088
20,4132658
70
22
0,78928
0,06280
18,08569206
75
20
0,84271
0,05343
15,38672991
80
17
0,88635
0,04365
12,5703117
85
11
0,92059
0,03424
9,861301377
90
11
0,94639
0,02579
7,4286659
95
4
0,96505
0,01866
5,373729024
100
1
0,97801
0,01296
3,732750498
summa:2880,97800281,665302p=
8,0916E-18
Järelikult H1 - tunnuse hinne jaotus ei lähene normaaljaotusele
Tabel 14.
Normaaljaotusele lähenemise kontroll tunnusele hinne.
H0:
Tunnuse hinne jaotus läheneb normaaljaotusele.
p>0,05
H1:
Tunnuse hinne jaotus ei lähene normaaljaotusele.
HinneTegelik sagedusNormaal-jaotuse jaotusfn punktidTõenäosusOodatav sagedus1
4
0,00328
0,00328
0,56088
2
17
0,05182
0,04855
8,301573
3
62
0,29595
0,24412
41,74516
4
67
0,71063
0,41469
70,91145
5
21
0,95018
0,23954
40,96176
Summad 1710,95018162,4808p=
3,6579E-10
Järelikult H1 - tunnuse hinne jaotus ei lähene normaaljaotusele
Tabel 15. Kirjeldavad
statistikud.
aasta sugutesteksam/koolhinnekoodMean 2003,731
1,4
8,291803
50,0729167
3,491228
2,872131
Standard
Error 0,156329
0,028098
0,177857
1,46060454
0,070072
0,064523
Median
2003
1
8
53
4
3
Mode
2003
1
6
4
4
4
Standard Deviation
2,730164
0,490703
3,106143
24,787281
0,916312
1,126845
Sample Variance
7,453796
0,240789
9,648123
614,409299
0,839628
1,26978
Kurtosis
-0,95987
-1,84381
-0,71639
-0,59609723
0,015361
-1,04477
Skewness 0,68429
0,410269
0,014344
-0,48900657
-0,34518
-0,59308
Range
8
1
14
93
4
3
Minimum
2000
1
1
3
1
1
Maximum 2008
2
15
96
5
4
Sum
611138
427
2529
14421
597
876
Count 305
305
305
288
171
305
Confidence Level(95,0%)
0,307623
0,05529
0,349987
2,87485541
0,138324
0,126968
Tabel 16.
Normaaljaotusele lähenemise kontroll tunnusele aasta.
H0 - tunnuse jaotus läheneb normaaljaotusele
H1 - tunnus jaotus ei lähene normaaljaotusele
aastategelik sagedusnormaal-jaotuse jaotus-funkts punktid
tõenäosus
oodatav sagedus
2000
32
0.085869
0.085869
26.19014
2002
91
0.263014
0.177144
80.21918
2003
100
0.394425
0.131412
120.2997
2008
82
0.941043
0.546618
287.0181
305
0.941043
513.7271
p=
7.21243E-33
H1! - tunnuse jaotus ei lähene normaaljaotusele
Tabel 17.
Normaaljaotusele lähenemise kontroll tunnusele test.
H0:
Tunnuse test jaotus läheneb normaaljaotusele.
H1:
Tunnuse test jaotus ei lähene normaaljaotusele.
Test:Test:Tegelik sagedusNormaaljaotuse jaotusfunktsioon tõenäosusoodadatv sagedus1
2
0,009448851
0,009448851
2,881899555
2
5
0,02140289
0,011954039
3,645982028
3
9
0,044222555
0,022819664
6,959997589
4
23
0,083529657
0,039307103
11,98866628
5
20
0,144624164
0,061094507
18,63382473
6
37
0,230309085
0,085684921
26,13390091
7
36
0,338746482
0,108437396
33,07340592
8
29
0,462576847
0,123830365
37,76826131
9
29
0,590176398
0,127599551
38,91786316
10
32
0,708820236
0,118643838
36,18637045
11
28
0,80836421
0,099543974
30,3609121
12
30
0,883727146
0,075362936
22,9856956
13
13
0,935211182
0,051484036
15,70263089
14
6
0,96694759
0,031736408
9,67960451
15
6
0,984600304
0,017652714
5,384077644
Summad:
305
0,984600304
300,3030927
p=
0,028523453
ehk
p >0,05
ehk
H1
Tunnus test jaotus ei lähene normaaljaotusele
Tabel 18.
Tunnuste hinne ja riigieksami tulemus CHITEST.
Empiiriline jaotus
Reasildid
kõrge
madal
Üldkokkuvõte
2
5
12
17
3
10
52
62
4
39
28
67
5
18
3
21
Üldkokkuvõte
72
95
167
Teoreetiline jaotus
Reasildid
kõrge
madal
Üldkokkuvõte
2
7,329341317
9,67065868
17
3
26,73053892
35,2694611
62
4
28,88622754
38,1137725
67
5
9,053892216
11,9461078
21
Üldkokkuvõte
72
95
167
p=
5,18973E-09
Tabel 19.
Tunnuste hinne ja riigieksami tulemus keskmiste võrdlemine.
H0
dispersioonid on võrdsed
H1
dispersioonid ei ole võrdsed
p=
0,982066082
seega H0
dispersioonid on võrdsed
H0
Keskmisest kõrgema matemaatika eksami tulemusega üliõpilaste keskmine matemaatika
hinne on võrdne keskmisest madalama tulemusega üliõpilaste keskmise matemaatika hindega?
H1
Keskmisest kõrgema matemaatika eksami tulemusega üliõpilaste keskmine matemaatika
hinne ei ole võrdne keskmisest madalama tulemusega üliõpilaste keskmise matemaatika hindega?
t-Test: Two-Sample Assuming Equal Variances
Kui eksam keskmisest kõrgem, siis hinneKui eksam keskmisest madalam, siis hinneMean
3,972222222
3,141414141
Variance
0,675273865
0,673675531
Observations
72
99
Pooled Variance
0,674347021
Hypothesized Mean
Difference 0
df
169
t Stat
6,531979015
P(T
Kõik kommentaarid