TALLINNA TEHNIKAÜLIKOOL
Majandusteaduskond
Rahvamajanduse instituut
Statistika ja ökonomeetria õppetool
Birgit Aavik
ANDMEKOGUMITE KIRJELDAMINE
Kodune töö nr 1 õppeaines statistika
Juhendaja :
lektor Jelena Hartšenko
Tallinn 2009
1.SissejuhatusOma andmekogumite jaoks olen võtnud andmed Statistika
ameti kodulehelt. Esimene andmekogu kujutab endast Meeste ja naiste
abielusid aastatel 1978- 2007. Teine andmekogu kujutab elussündisid samuti aastatel 1978-2007.
Võtsin huvi pärast just sellised andmed, kuigi ega nad üksteisest
täiesti ei sõltu, on siiski huvitav võrrelda abielusid ja
elussünde (lapsesaamisi). Eelnimetatud andmete põhjal leidsin
keskmised, , jaotuse kuju iseloomustavad näitarvud, sagedusklassid
ning variatsioonnäitarvud. Lisasin ka diagrammi ning sagedustabelid.
Andmekogumite kirjeldamine lõppeb tulemuste tõlgendamisega,
andmekogumite
hajuvuse ja jaotuvuse kuju võrdlemisega
2.
Andmekogumite analüüsAnalüüsin elussünde ning
abielusid, nagu ennist juba öeldud- otseselt küll omavahel seotud
ei ole, kuid olenevalt perekonnast ning traditsioonidest(enne abielu,
siis laps), võib siit nii mõndagi järeldada.
Keskmised
on kogumit ühe arvuga iseloomustavad üldistavad näitarvud, mis
edastavad informatsiooni kogumisse kuuluva tunnuse väärtuste taseme
kohta. Võib näha Tabel 1 toodud andmete põhjal, et näiteks antud
arvude aritmeetiliseks keskmiseks nimetatakse arvu, mis saadakse
antud arvude summa jagamisel liidetavate arvuga. Selle analüüsi
puhul on elussündide korral see
18213,76667
ning abielude 9255,866667.
Seega elussündide korral on see kõrgem. ( 2 last keskmiselt abielu
kohta ). Mood ehk
dominant puudub, sest mood on rea kõige sagedamini
esinev või kõige suurema tõenäosusega esinev liige, kuid minu
poolt valitud andmekogumites see puudub. Üldiselt jäävad keskmised
16 000 ja 18 000 vahele, kuid kui vaadata aastat 2007, siis on
sündimus vaid 15 775, seega vähem, kui keskmine. Sama ka abielude
kohta. Üldiselt jäid keskmised
8000 ja 9000 vahele, siis 2007 oli
abielusid vaid 7022 ning veel kurvem on aasta 1998 – 5430 abielu.
Variatsiooninäitarvudeks
nimetatakse tunnuse väärtuste varieeruvust iseloomustavaid rea
üldistavaid karakteristikuid. Tabel 2 võib näha lineaarhälvet,
dipersiooni ja assümeetriakoefitsienti. Lineaarhälve on keskmine
erinevus keskmisest. Selle analüüsi puhul on see elussündide puhul
4620 ning abielude korral 3078. Erinevus on väga suur. Dispersioon
ehk keskmine ruuthälve on elussündidel 23645458 ning abielude puhul
10280215, jällegi on erinevused väga suured. Mõlema puhul on
asümmeetria vasakkaldeline ja positiivne- sündide puhul 0,13 ja
abielu korral 0,06. Ekstsess on mõlemal negatiivne- see tähendab,
et on
lauge jaotuskõver. Andmeid on mõlemal andmekogumil 30.
Elussündide puhul on miinimum 12167, mis oli aastal 1998 ning
abielude puhul 5430, mis oli samuti 1998. aastal.
Joonis 1. Elussünnid ja
abielud aastatel 1978-2007
Allikas: Lisa 1.
Keskmised
Elussünnid
Abielud Aritmeetiline keskmine
18213,76667
9255,866667
Harmooniline keskmine
16935,6145
8142,168537
Geomeetriline keskmine
17561,67653
8684,311985
Kronoloogiline keskmine
Puudub (pole moment)
Puudub (pole moment)
Mood
Puudub
Puudub
Mediaan
16906,5
8311,5
Kvartiil_1
13308,75
13308,75
Kvartiil_2
16906,5
16906,5
Kvartiil_3
23080,25
12749
Protsentiil
12241,82
5445,95
Tabel 1. KeskmisedAllikas: Lisa 1.
Variatsiooninäitarvud
Elussünnid
Abielud
Keskmine lineaarhälve
4620,217778
3078,057778
Dispersioon
23645458,51
10280215,12
Variatsioonikordaja
26,70%
34,64%
Standardhälve
4862,659613
3206,277455
Assümeetriakoefitsient
0,13154141
0,067634675
Ekstress
-1,83759359
-1,92421098
Tabel 2. Variatsioonnäitarvud
Allikas: Lisa 1.
Sünd
Abielud
Miinimum
12167
5430
Maksimum
25086
13434
Kokku andmeid
30
30
Klasside arv
5,75633044
5,75633044
Klassi laius
2244,311742
1390 ,469168
Tabel 3. Elussünnid ja
abielud
Allikas: Lisa 1.
Intervallid Ülemine piir
Sagedus
11000-
13000 13000
4
13000-15000
15000
9
15000-17000
17000
2
19000-21000
21000
2
21000-23000
23000
5
23000-25000
25000
6
25000-27000
27000
2
Tabel 4. Elussündide
sagedustabel Allikas: Lisa 1.
Intervallid
Ülemine piir
Sagedus
4500-6000
6000
8
6000-
7500 7500
6
7500-9000
9000
2
9000-10500
10500
1
10500-12000
12000
1
12000-13500
13500
12
Tabel 5. Abielude sagedustabel
Allikas: Lisa 1.
Joonis 2. Elussünnid
Allikas: Lisa 1.
Joonis 3. Abielud
Allikas: Lisa 1.
Aasta
Elussünnid
1978
21842
1979
21879
1980
22204
1981
22937
1982
23128
1983
24155
1984
24234
1985
23630
1986
24106
1987
25086
1988
25060
1989
24318
1990
22304
1991
19413
1992
18038
1993
15253
1994
14176
1995
13509
1996
13242
1997
12577
1998
12167
1999
12425
2000
13067
2001
12632
2002
13001
2003
13036
2004
13992
2005
14350
2006
14877
2007
15775
Aasta
Abielud
1978
12492
1979
12784
1980
12964
1981
12825
1982
12263
1983
12917
1984
12530
1985
12861
1986
13000
1987
13434
1988
12973
1989
12644
1990
11774
1991
10292
1992
8878
1993
7745
1994
7378
1995
7006
1996
5517
1997
5589
1998
5430
1999
5590
2000
5485
2001
5647
2002
5853
2003
5699
2004
6009
2005
6121
2006
6954
2007
7022
Lisa 1.
9
Kõik kommentaarid