TALLINNA TEHNIKAÜLIKOOL
Majandusteaduskond Rahandus ja
majandusteooria instituut
Matemaatika , statistika ja
ökonomeetria õppetool Laura Kallasvee, Liisi Saksakulm
BRUTOPALKADE SEOS HARIDUSE, SOO JA ELUKOHAGAEESTI MAAKONDADE LÕIKES AASTATEL 2005-2008Ökonoomeetriline projekt
Juhendaja : dotsent Ako
Sauga Tallinn 2014
SISUKORD
SISSEJUHATUS.........................................................................................................................4
1. REGRESSIOONANALÜÜS..................................................................................................7
1.1.
Ökonomeetriline mudel....................................................................................................7
1.2. Töös kasutatavad andmed................................................................................................8
1.3.
Esialgse regressioonimudeli hindamine...........................................................................9
1.4 Klassikalise regressioonmudeli
eelduste testimine .........................................................10
1.4. Lõplik mudel..................................................................................................................12
KOKKUVÕTE..........................................................................................................................14
VIIDATUD ALLIKAD.............................................................................................................16
LISAD.......................................................................................................................................17
Lisa 1. Sõltuva ja sõltumatu tunnuse vaheliste seoste
graafikud ..........................................17
Lisa 2. Sõltuva ja sõltumatu tunnuse vaheliste seoste graafikud logaritmitud muutujate
korral.....................................................................................................................................19
Lisa 3.
Analüüsis kasutatud andmed.....................................................................................20
Lisa 3
järg ..............................................................................................................................21
Lisa 4. Kirjeldav statistika....................................................................................................23
Lisa 5. Esialgse mudeli korrelatsioonikordajate
maatriks ....................................................24
Lisa 6. Korrelatsioonikordajate
statistilised olulisused (p-väärtused)..................................25
Lisa 7. Esialgne hinnatud mudel...........................................................................................26
Lisa 8. Teine hinnatud mudel (ilma meeste osakaaluta).......................................................27
Lisa 9. Kolmas hinnatud mudel (ilma meeste osakaaluta ja
linlaste osakaaluta).................28
Lisa 10. Heteroskedastiivsuse test........................................................................................29
Lisa 11. Multikollineaarsuse test...........................................................................................30
Lisa 12. Jääkliikmete normaaljaotuse testid.........................................................................31
Lisa 13. Jääkliikmete normaaljaotuse
graafik .......................................................................32
Lisa 14.
ANOVA tabel...........................................................................................................33
Lisa 15. Mudeli jääkliikmete
kirjeldavad statistikud............................................................34
Lisa 16. Lõpliku mudeli regressioonikoefitsientide koovariatsiooni maatriks.....................35
Lisa 17. Mudeli stabiilsuse test (
Chow test).........................................................................36
SISSEJUHATUSInimese sissetulek kujuneb mitmete tegurite mõjul, nagu näiteks töö iseloom
(raskuaste,
töökoormus , töötundide arv), ettevõtte ärimudel ning pidevalt muutuv
majanduskeskkond. Need on peamised tegurid, mille põhjal inimene,
otsides töökohta,
kujundab teatavad eeldused palga suurusele. Üldisemas plaanis mõjutavad elanike palgataset
mitmed demograafilised tegurid. Käesolevas töös on vaatluse alla võetud osa võimalikest
teguritest, mis rahvastiku palgataset mõjutada võivad ning mis on ka statistikaameti
kodulehelt kättesaadavad.
Ühe
tegurina mõjutab palgataset kindlasti
haridus , eeldades, et kõrgem
haridus garanteerib ka kõrgema palga. Tegelikus elus võib muidugi olla, et madalama
haridustasemega inimesed töötavad kõrgetel positsioonidel ning kõrgharidusega inimesed
lihttöölistena – seda kas siis juhuse läbi või struktuurse tööpuuduse tõttu. Käesolevas töös
lähtume siiski toodud eeldusest, et parem haridus viitab kõrgemale palgatasemele.
Haridustaseme iseloomustamiseks on ühe sõltumatu muutujana käesolevas töös vaatluse alla
võetud kõrgharidusega inimeste osakaal kogu tööealisest rahvastikust.
Palkade erinevus esineb kindlasti ka piirkondade vahel.
Palgatase on kõrgem
suuremates linnades ning madalam väikesemates linnades ning maakohtades. Linnalises
asulas on
infrastruktuur paremini arenenud, paljud ettevõtted on koondunud üksteise
lähedusse, mis teeb ressursside liikumise kiiremaks. Samuti on tõhus kaubanduse areng, sest
inimestele on enamikud
kaubad kohe kättesaadavad. Võrreldes maapiirkondadega on
linnalises asulas olevad ettevõtted ning tööstused tehnoloogiliselt rohkem arenenud ning oma
olemuselt suhteliselt
spetsiifilised . Maapiirkondades olevad ettevõtted jäävad enamasti oma
arengult alla linnades ja nende lähiümbruses olevatele ettevõtetele. Samuti on maapiirkonnas
asustus ning töökohtade arv kümneid kordi väiksem kui linnas. Seetõttu on loogiline oletada,
et kui töökoht asub linnalises asulas, on eeldus enamasti ka suuremale keskmisele
brutopalgale. Vastava teguri mudelisse lülitamiseks on töö autorid lähendmuutujana
kasutanud linnalises asulas
elavate inimeste
osakaalu kogu maakonna elanikest.
Erinevad uuringud on näidanud, et meeste palgatase on märgatavalt kõrgem kui
naistel. Seega võib oletada, et piirkonnad, kus on kõrgem meeste osakaal, on ka kõrgem
palgatase. Seega on töö autorid testitavasse mudelisse lülitanud ühe muutujana ka meeste
osatähtsuse kogu tööhõivest.
Koostatava ökonomeetrilise projekti eesmärgiks on uurida haridustaseme (kõrgharitute
osakaal), töökoha asukoha (linnalises asulas elavate inimeste osakaal) ja meeste osakaalu
seost brutopalgaga Eesti 15 maakonna põhjal perioodil 2005-2008. Vastav periood on valitud
lähtuvalt andmete kättesaadavusest statistikaameti kodulehel ning pidades silmas ka seda, et
töös kasutatav valimi maht oleks regressioonanalüüsi läbiviimiseks piisav.
Lähtuvalt projekti eesmärgist otsitakse vastuseid järgmistele küsimustele:
Kas kõrgharidusega inimeste osakaal tööga hõivatutes ja
brutopalk on omavahel
seotud (ning milline see seos on)?
Kas linnalises asulas elavate inimeste osakaal hõivatutes ja brutopalk on omavahel
seotud (ning milline see seos on)?
Kas meeste osakaal tööga hõivatutes ja brutopalk on omavahel seotud (ning
milline see seos on)?
Modelleeritava uurimisprobleemi majandusteoreetiliseks aluseks on palga
sõltuvus inimkapitalist. Lisaks üritatakse selgitada, kas tööga hõivatute elukoht ning suurem meeste
osakaal hõivatutes on seotud brutopalgaga. Püstitatud uurimusküsimustele
vastuste saamiseks
püstitasid autorid järgmised uurimishüpoteeside paarid:
I hüpoteeside paar: H0: Kõrgharidusega inimeste osakaal tööga hõivatutes ja brutopalk ei ole
omavahel seotud
H1: Kõrgharidusega inimeste osakaal tööga hõivatutes ja brutopalk on omavahel
seotud
II hüpoteeside paar: H0: Linnalises asulas elavate inimeste osakaal hõivatutes ja brutopalk ei ole
omavahel seotud
H1: Linnalises asulas elavate inimeste osakaal hõivatutes ja brutopalk on
omavahel seotud
III hüpoteeside paar: H0: Meeste osakaal tööga hõivatutes ja brutopalk ei ole omavahel seotud
H1: Meeste osakaal tööga hõivatutes ja brutopalk on omavahel seotud
IV hüpoteeside paar: H0: Periood ei avalda mõju brutopalgale
H1: Periood avaldab brutopalgale mõju
Lähtudes regressioonimudelist eeldame, et kõrgharidusega inimeste osakaal tööjõus
suurendab keskmist brutopalka ehk nende kahe näitaja vaheline seos on positiivne. Samuti
eeldame, et suurem linnalises asulas olevate hõivatute osatähtsus suurendab keskmist
brutopalka. Kuna meeste palk on üldjuhul suurem kui naistel, siis eeldame ka, et seos meeste
osakaalu ja
brutopalga vahel on positiivne. Lähtuvalt sellest, et suures plaanis hinnad pidevalt
kallinevad ja raha väärtus väheneb, tuleb järeldada, et ka inimeste
palgad aasta-aastalt
tõusevad. Seega peaks ka aasta avaldama mõju palga suurusele – mida kaugperiood
praegusest, seda madalam palk.
1. REGRESSIOONANALÜÜS1.1. Ökonomeetriline mudelRegressioonimudeli kuju
valikul tuleb esiteks uurida milline
graafiline seos keskmise
brutopalga ning kõrghariduse osakaalu vahel leidub.
Lisas 1 toodud andmeid kujutavate
jooniste põhjal võib järeldada, et seos keskmise brutopalgaga on vaid kõrgharidusega inimeste
osakaalul. Linlaste osakaalu ja brutopalga ning meeste osakaalu ja brutopalga vahelist
lineaarset seost joonised ei näita. Kuna seosed ei avaldu ka logaritmitud tunnuste korral (lisa
2), siis vastavaid jooniseid ei ole siinkohal rohkem välja toodud ega vastavaid mudeleid
testitud ning autorid jäävad lineaarse mudeli juurde. Samuti toetab lineaarse mudeli valikut
see, et andmed kõrghariduse, linnalises asulas elavate inimeste ja meeste kohta on antud
osakaaludena. Seega eeldame, et sobiv mudeli kuju antud majandusprobleemi jaoks on
lineaarne nii parameetrite kui muutujate suhtes.
Püstitatud regressioonimudel: Yi = β0 + β1X1i + β2X2i + β3X3i + β4D1i + β5D2i + β6D3i + ui ,kus
Yi –keskmine brutopalk hõivatud isiku kohta i-ndas
maakonnas perioodil 2005-
2008 (eurodes);
X1i – kõrgharidusega (bakalaureuse,
magistri - või doktorikraadiga) inimeste
osakaal tööga hõivatutest i-ndas maakonnas perioodil 2005-2008;
X2i – linnalises asulas töötavate inimeste osakaal tööga hõivatutest i-ndas
maakonnas perioodil 2005-2008;
X3i – meeste osakaal tööga hõivatutest i-ndas maakonnas perioodil 2005-2008;
D1 –
fiktiivne muutuja 2005. aasta kohta;
D2 – fiktiivne muutuja 2006. aasta kohta;
D3 – fiktiivne muutuja 2007. aasta kohta;
β0 – mudeli vabaliige (brutopalka määrav autonoomne
komponent ), mis näitab
seda, milline on brutopalk juhul kui kõigi sõltumatute tunnuste väärused on
nullid
β1 – mudeli
parameeter , mis näitab brutopalga muutust, kui kõrgharitute osakaal
muutub ühe ühiku võrra;
β2 – mudeli parameeter, mis näitab brutopalga muutust, kui linnalises asulas
töötavate inimeste osakaal muutub ühe ühiku võrra.
β3 – mudeli parameeter, mis näitab brutopalga muutust, kui meeste osakaal
tööjõus muutub ühe ühiku võrra.
β 4 – mudeli parameeter, mis näitab 2005nda aasta fiktiivse muutuja seost
brutopalgaga
β5 – mudeli parameeter, mis näitab 2006nda aasta fiktiivse muutuja seost
brutopalgaga
β6 – mudeli parameeter, mis näitab 2007nda aasta fiktiivse muutuja seost
brutopalgaga
ui – mudeli vealiige
i = 1, 2, 3, …,
n, kus
n on valimi maht (n=60)
1.2. Töös kasutatavad andmedKäesolevas töös kasutatavad andmed on võetud Eesti Statistikaameti kodulehelt.
Autorid kasutavad töös andmeid Eesti 15 maakonna kohta aastatel 2005-2008. Seega tegemist
on paneelandmetega. Kuna
statistikaamet ei väljasta kõiki töös kasutatavaid andmeid
suhtarvudena, siis need on leitud arvutuslikult
autorite poolt, kasutades Exceli
tarkvaraprogrammi. Lisaks osakaaludele on ka brutokuutasu leitud arvutuslikult
brutotunnitasu ning keskmise ühe kuu töötundide arvu (168 tundi) korrutisena. Detailsed töös
kasutatavad andmed on toodud töö lõpus, lisas 3.
Kirjeldava statistika tabelist (vt tabel 1 ja lisa 4) on näha, et keskmise brutopalga
väärtus üle kõigi maakondade on 541,9 eurot. Seejuures on brutopalga varieeruvus 467,1
eurot (minimaalne väärtus 381.384 eurot ja maksimaalne väärtus 848.48 eurot).
Standardhälve ehk keskmine kõrvalekalle keskmisest brutopalgast on 103,68 eurot. See näitab, et Eestis on
keskmiste brutopalkade vahe maakondade lõikes suhteliselt suur.
Tabel 1. Kirjeldav statistika (brutopalk toodud eurodes, ülejäänud näitajad osakaaludena)
Kesk-Miini- Maksi - Varieeru StandardValimMediaanväärtusmummum-vus-hälveBrutopalk 60
541.915
538.981
381.384 848.484
467.1
103.68
(Y)
Kõrgharitu0.32438
60
0.168530
0.153426 0.080000
0.244
0.0607
d (X1)5
Linlased 0.90379
60
0.531456
0.489964 0.285714
0.617
0.
1741 (X2)0
Mehed (X3)0.60377
60
0.514693
0.509790 0.438272
0.165
0.0293
4
Allikas: autorite koostatud, kasutades Statistikaameti andmeid ning tarkvarapaketti
Gretl Keskmine kõrgharidusega inimeste osakaal on 16.9% ning kõrghariduse osakaalu
varieeruvus hõivatute seas maakondade lõikes on 24,4% (miinimum 8,0% ja maksimum
32,4%), standardhälve on 6,1%. Linnalises asulas elavate töötajate osakaal on maakondade
lõikes keskmiselt 53,14%. Tunnuse minimaalse ja maksimaalse väärtuse vahe on 61,7%
(miinimumiks on 28.6% ja maksimumiks 90.3%) ning keskmine
hajuvus on 17,4%.
Keskmine meeste osakaal tööjõus on 51,4%, sealjuures varieeruvus 16,5% (miinimum on
43,8% ja maksimum 60,3%). Standardhälve keskmisest on 2.9%.
1.3. Esialgse regressioonimudeli hindamineKorrelatsioonkordajate tabelist (vt lisa 5) ja vastavate olulisuse tõenäosuste tabelist (vt
lisa 6) näeme, et keskmisel brutopalgal on statistiliselt oluline seos nii kõrgharidusega kui ka
fiktiivsete muutujatega D1 ja D2, kus korrelatsioonikordajad ja vastavad olulisuse tõenäosused
on
r=0,4201 (
p=0,001),
r=-0,6028 (
p=0,000) ja
r=-0,2652 (
p=0,0406). Meeste osakaal
tööjõust ja linlaste osakaal keskmise brutopalgaga statistiliselt olulist seost ei oma. Samal ajal
on tugev korrelatsioon ka osade sõltumatute muutujate vahel, näiteks kõrghariduse ja
linnalises asulas töötajate vahel (
r = 0,5873) ja fiktiivsete muutujate D
1, D2 ja D3 vahel (kõigi
fiktiivsete muutujate vahel
r = -0,3333).
Mudeli parameetritele
hinnangud leiti leiti
vähimruutude meetodil. Lisas 6 toodud
esialgse lineaarse mudeli koefitsientide tabelist on näha, et kõrgharitute osakaau hõivatutest
X1 (
p=0,000), fiktiivse muutuja D1 (p=0,000), D2 (p=0,000) ning fiktiivse muutuja D3
(p=0,000) parameetrite hinnangud on statistiliselt olulised usaldusnivool 0,95. Saame väita, et
keskmise brutopalga kujunemine sõltub olulisel määral vaid kõrghariduse määrast ning on
mõjutatud ka ajaperioodist. Meeste osakaal hõivatutest ning linlaste osakaal on antud
mudelis statistiliselt ebaolulised.
Ebaolulised muutujad tuleb mudelist eemaldada.
Esmalt eemaldati mudelist kõige
suurema olulisuse tõenäosusega muutuja ehk linlaste osakaalu ja seejärel leiti uuesti
parameetrite hinnangud. Saadud mudeli hinnang on toodud lisas 8. Kuna ka selles mudelis on
meeste osakaal jätkuvalt ebaoluline, eemaldati mudelist ka nimetatud muutuja. Lõplik mudel,
kus kõik muutujad on statistiliselt olulised, on toodud lisas 9.
Vähimruutude meetodiga leitud parameetrite hinnangute olulisusetõenäosused
näitavad, et kõik mudelisse jäänud
parameetrid on statistilised olulised. Saadud mudeli
statistilist olulisust näitab F-
statistik ning selle olulisusetõenäosus (
p = 2,53x10-21). Kui F-
statistiku empiiriline väärtus on suurem selle tabeliväärtuseset, siis saab vastu võtta sisuka
hüpoteesi. F-statistiku empiiriline väärtus (72,86) on suurem kui F-statistiku kriitiline väärtus
(2,53969) kohal kus vabadusastmete arvud on vastavalt n1=55 ning n2=4.
Edasise analüüsi viivad autorid läbi sellesama mudeli kohta, kus sõltuvaks muutujaks
on brutopalk ning sõltumatuteks muutujateks kõrgharitute osakaal ning fiktiivsed muutujad
erinevate aastate kohta (vt lisa 9). Järgnevalt uurivad autorid, kas saadud mudeli puhul
kehtivad klassikalised regressioonimudeli eeldused.
1.4 Klassikalise regressioonmudeli eelduste testimineRegressioonimudeli hindamiseks vähimruutude meetodil peavad kehtima mudeli
klassikalised eeldused (
Brooks 2008, 129):
1) jääkliikmete tinglikud
keskväärtused on võrdsed nulliga;
2) jääkliimete dispersioon on
konstantne (esineb homoskedastiivsus) ja
heteroskedastiivsus puudub;
3) jääkliikmed ei korrelleeru omavahel, st nende kovaratsioon on null
(autokorrelatsioon puudub);
4) juhuslikud liikmed ei korrelleeru seletavate tunnustega – mudelis puudub
multikollineaarsus;
5) jääkliikmed alluvad normaaljaotusele.
Klassikalise lineaarse regressioonimudeli esimene eeldus, et juhuslike liikmete
keskväärtus on 0 on täidetud, kuna mudelis on konstant ja sellest tulenevalt on see eeldus
automaatselt täidetud ja seda eraldi testida ei ole vaja (Brooks 2008, 131). Täiendavalt
kinnitavad seda ka teise ja viienda klassikalise eelduse täidetus, mida autorid järgnevalt
tõestavad.
Heteroskedastiivsuse testimiseks viisid autorid läbi White’i testi. Testiti hüpoteesi, kas
kõik parameetrid (v.a. vabaliige) on samaselt võrdsed nulliga. Kui
nullhüpotees kehtib, siis
mudelis heteroskedastiivsus puudub. (
Paas ,
Raus 2012, 58) White’i test andis teststatistiku
olulisuse tõenäosuseks 0,2961 (vt lisa 10). Seega autorite poolt võetakse vastu nullhüpotees –
saadud mudelis heteroskedastiivsus puudub. Mudelit iseloomustab homoskedastiivsus, mis on
klassikalise lineaarse regressioonmudeli
eelduseks .
Analüüsitava mudeli puhul
autokorrelatsiooni testimine tarkvaraprogrammiga ei ole
teostatav. Kuna testitavat mudelit võib käsitleda kui ristandmete mudelit (aastaid käsitletakse
kui fiktiivseid tunnuseid), siis võib eeldada, et mudelis autokorrelatsiooni ei esine, sest
ristandmete puhul ei ole erinevad andmed omavahel seotud (Paas, Raus 2012, 76). Seega
loevad autorid ka kolmanda klassikalise mudeli eelduse täidetuks.
Kui VIF > 10 siis on mudelis tugev multikollineaarsus. Reeglina viitab juba
VIFj > 5sellele, et tuleb arvestada multikollineaarsuse ning sellega kaasnevate ohtudega
modelleerimise tulemuste tõlgendamisel. (Paas, Raus 2012, 38) Testitava mudeli korral on
maksimaalseks VIF väärtuseks 1.505 (vt lisa 11), mis tõestab multikollineaarsuse puudumist
testitavas mudelis Sellega on täidetud ka neljas klassikalise mudeli eeldus.
Klassikalise regressioonimudeli
viimaseks eelduseks on juhuslike
vigade normaaljaotus. Kui juhuslike liikmete normaaljaotuse tingimus on täidetud, siis on hinnangud
mõjusad (sisukad), mis tähendab, et valimi mahu kasvades parameetri hinnangud (mitte ainult
hinnangute keskväärtused) koonduvad parameetri
tegelikuks väärtuseks ning nad on
normaaljaotusega. (Paas, Raus 2012, 63)
Kontrollimaks jääkliikmete alluvust normaaljaotusele viisid autorid läbi erinevad
normaaljaotuse testid ( vt lisa 12). Testide tulemused näitavad, et jääkliikmed on
normaaljaotusega. Seda tõestab näiteks Doornik-Hanseni statistiku väärtus 0,0715,
olulisusetõenäosusega 0,9648 ning Jarque-Bera test, mis andis tulemuseks JB=0,2534,
p=0,8810. Kuna saadud testides
p>0,05 siis jääkliikmed alluvad normaaljaotusele.
Jääkliikmete normaaljaotusele allumist kinnitab ka lisas 13 toodud graafik. Kogu
eelpooltoodust lähtub, et antud mudeli korral on täidetud kõik regressioonimudeli
klassikalised eeldused.
Lisas 14 olev ilma meeste osakaaluta ja ilma linlaste osakaaluta mudeli ANOVA test
andis autoritele mudeli hajuvuse hinnangud. Determinatsioonikordaja R2 näitab, et saadud
mudel suudab ära kirjeldada 84% kogu brutopalga hajuvusest.
Lisas 9 toodud ilma meeste osakaaluta ja ilma linlaste osakaaluta mudeli OLS testist
on näha, et kõrghariduse osakaalu (
p=0,0000), fiktiivse muutuja D1 (
p= 0,0000), fiktiivse
muutuja D2 (
p = 0,0000) ja fiktiivse muutuja D3 (
p = 0,0000) parameetrite hinnangud on
statistiliselt olulised usaldusnivool 0,95. Saame väita, et keskmise brutopalga kujunemine
sõltub olulisel määral vaid kõrghariduse olemasolust ning aastast.
Lisas 15 on toodud jääkliikmete maksimaalsed ja minimaalsed väärtused ning
standardhälbed. Lisas 16 on toodud ka lõpliku mudeli koefitsientide koovariatsiooni maatriks.
Mudeli parameetrite stabiilsuse kontrollimiseks viisid autorid läbi Chow testi ( vt lisa
17). Chow testi F-statistik F=50,27360 olulisuse tõenäosusel 0,
2017 F=50,27360 , millest
autorid järeldavad, et mudeli parameetrid on stabiilsed.
1.4. Lõplik mudelKoostatud ökonomeetrilise projekti lõplik mudel on järgmine:
Y = 529.737 + 722.087X1 – 220.916D1 – 151.609D2 – 65.535D3 R2=0.841
(19.3)
(92.0)
(15.6) (15.7) (15.6)
n=60
Antud mudeli puhul on kontrollitud mudeli kuju õiget valikut (alapunkt 1.1.), mille
kohaselt on tegemist lineaarse mudeliga. Vähimruutude meetodil saadud hinnatud mudeli
näitajad on toodud lisas 9. Saadud mudel on statistiliselt oluline, samuti on statistiliselt
olulised, (p
Kõik kommentaarid