ÖKONOMEETRIA
ÖKONOMEETRIA
TES0040
Rühmad TAAB 31, 32,
TABB 54, 55
IABB 51, 52, 53 (
valikaine )
Ako
SaugaÕppejõu kontaktandmed
• Statistika ja
ökonomeetria dotsent Ako Sauga
• E-post ako.sauga@
taltech .ee
•
Koduleht www.sauga.pri.ee
• Ruum SOC-480
Loengukava
• Sissejuhatus (programm,
hindamismeetodid ,
õppematerjalid ).
• Ökonomeetria mõiste,
ökonomeetriline
mudel.
•
Hinnangud ja nende omadused.
• Hüpoteeside kontrollimine.
Kursuse teemad
1. Sissejuhatus.
2. Harilik lineaarne regressioonmudel.
3.
Mitmene regressioonmudel I.
4. Mitmene regressioonmudel II.
5. Mudeli omaduste parandamine.
6. Fiktiivsed tunnused.
7.
Statsionaarsed aegread I.
8. Statsionaarsed aegread II.
9. Mittestatsionaarsed aegread.
10.
Paneelandmed .
11.
Tõenäosusmudelid I.
12.
Tõenäosusmudelid II.
Täpsemalt vt laiendatud ainekava .
Õppemeetodid
Hübriidõpe 1. – 13. õppenädal
• Loengut videotena
– Teooria, mõistete, meetodite seletamine, näited.
Loenguslaidid ja
videod on saadaval õpikeskkonnas Moodle. Materjalid
avanevad
iga nädala alguses.
•
Praktikumid videotena ja kontaktõppes (soovijatele).
–
Andmeanalüüs programmis Gretl .
– Ülesannete tekstid ja
andmefailid õpikeskkonnas Moodle.
• Onlain konsultatsioonid igal neljapäeval kell 10:00.
• Iseseisev töö
– Videote vaatamine, töö õppematerjalidega, interaktiivsed demod,
iseseisev töö andmefailidega,
enesekontrolli testid, kodutöö
ökonomeetriline projekt.
Kontaktõppes praktikumid soovijatele
2.-13.
õppenädal Praktikum - konsultatsioonid on
mõeldud neile üliõpilastele, kes lisaks
ülesannete videotele soovivad
mõnd ülesannet koos õppejõuga teha.
Käsitletakse
eelnenud nädala teema ülesandeid.
Osalejate arv on piiratud.
• T 14:00-15:30 praktikum arvutiklassis SOC-409
– Õppejõud
Natalia Levenko – Maksimaalne osalejate arv 15. Soovijatel registreerida
Moodles ennast
vastavasse
rühma, see on konstantse osalejaskonnaga.
• K 16:00-17:30 praktikum-
konsultatsioon auditooriumis SOC-312
– Õppejõud Ako Sauga
– Maksimaalne osalejate arv 25.
– Igakordne
eelregistreerimine
Moodles,
osalejad
võivad
varieeruda.
Eelregistreerimine
lõpeb iga T 23:59.
– Vajalik kaasa võtta oma arvuti.
E-
õppekeskkond Moodle
• Aadres
s https://moodle.taltech.ee
• Moodlesse sisselogimise võimalused
– TalTech Uni-ID
– ID-kaart
–
mobiil -ID
• Kursusele
registreerimine – TES0040 Ökonomeetria
– Registreerimise võti
lineaarne
• Esimesed kaks nädalat on lubatud külastajad.
Hindamine
Hindamismeetod
Osakaal
lõpphindes
K
ontrolltöö (teooria test + ülesanded)
20%
K
odutöö ökonomeetriline projekt
25% Eksam (teooria test + ülesanded)
55%
Protsent punktidest
Lõpphinne
kuni 50%
puudulik (0)
51% - 60%
kasin (1)
61% -70%
rahuldav (2)
71% - 80%
hea (3)
81% - 90%
väga hea (4)
91% - 100%
suurepärane (5)
Kontrolltöö
• Toimub 8. õppenädalal R, 22. okt 16:30-18:00 üle veebi ja hõlmab
1.-
6. nädala teemad.
• Kes sel ajal kontrolltööd teha ei saa, tuleb see teha ära eelnevalt
kontaktõppes kas
– T, 19. okt kell 14:00 arvutiklassis SOC-409 (õppejõud Natalia Levenko)
või
– K, 20. okt kell 16:00 auditooriumis SOC-312 (õppejõud Ako Sauga).
Palun neil eelnevalt kirja teel ühendust võtta.
Kontrolltöö koosneb kahes osast
1)
Test teooria kohta Moodles. Testis on 10 küsimust. Aega 15 minutit.
2)
Andmeanalüüs programmis Gretl. Andmefail tuleb vastavalt lingilt alla
laadida . Lahendamiseks aega 1h 15 min. Vastused tuleb kirjutada
Moodles ülesannete testi ja samuti tuleb üles laadida lahendustega
Gretli sessioonifail.
Kodutöö: ökonomeetriline projekt
• Tegemiseks 13.-15. õppenädal.
•
Rühmatöö : rühmas 2 üliõpilast.
• Sisu
–
Formuleerida autoreid huvitav
majandusprobleem .
– Leida vajalikud andmed.
– Püstitada matemaatiline mudel (mudelid).
– Hinnata mudeli(te) parameetreid, viia läbi mudeli(te)
diagnostika
(vajalikud testid).
– Tõlgendada
modelleerimise tulemusi, hinnata püstitatud hüpoteeside
paikapidavust, seost majandusteooriaga.
• Esitada Moodles pdf
failina .
•
Tähtajad –
Autorite registreerimine (rühmade
komplekteerimine ) Moodles
hiljemalt
E, 22. nov.
– Töö esitamine E, 13.dets. Hiljem esitatud töid ei arvestata!
• Täpsem juhend ilmub Moodle-sse.
Õpikud
• Põhiõpik
– Gujarati, D.,
Basic Econometrics
• 3.
trükk , TTÜ raamatukogus 20 eks
• 4. või 5. trükk, internetist võimalik leida pdf fail
• Täiendav kirjandus
–
Paas , T. Sissejuhatus ökonomeetriasse. Tartu, 1995.
(TTÜ
rmtk momendil saadaval 18 eks, olemas ka pdf,
vt Moodles
lingid ).
–
Listra , E. Ökonomeetria. Aegread.
– Sauga, A. Statistika õpik
majanduseriala üliõpilastele.
TTÜ Kirjastus, Tallinn,
2017 . (Statistika kordamiseks)
Statistika kursusest korrata
• Mõõteskaalad, keskmised (aritmeetiline, mediaan, mood), varieerumine.
• Tõenäosus p(A),
tinglik tõenäosus p(A|B).
•
Keskväärtus E(x), dispersioon
σ2 (x), var(x).
•
Jaotusseadused :
normaaljaotus , t-jaotus, F-jaotus, χ2 – jaotus.
• Valimvaatlused,
usalduspiirid .
• Hüpoteeside kontrollimine:
nullhüpotees ,
sisukas hüpotees , kriitiline
väärtus, olulisuse tõenäosus.
•
Kovariatsioon cov(x,y) ja korrelatsioonikordaja r (x,y)
•
Regressioon .
Kordamiseks võib kasutada
õpikut Sauga, A. „Statistika õpik
majanduseriala üliõpilastele“, TTÜ Kirjastus 2017. Pdf
versioon (uuendatud 2020) TTÜ raamatukogu
digikogus.
Avatud on ka Moodle
kursus TES0020
–Statistika (Ako Sauga), kus
loengud ja praktikumid videotena.
Sisenemine külalisena.
https://moodle.taltech.ee/course/view.php?id=262Tarkvara
• Kasutame programmi Gretl
–
Vabavara .
– Võimalik kasutada kodus iseseisvaks tööks (harjutusülesannete
lahendamine, ökonomeetrilise projekti koostamine).
– Ei nõua koodi kirjutamist ega programmeerimist, saab keskenduda
modelleerimisele ja tulemuste interpreteerimisele.
– http://gretl.sourceforge.net/
– Eestikeelne juhen
d http://www.sauga.pri./gretl/
• Andmetöötluses laialt kasutusel ka muu vabavara
– Statistikapakett R: nõuab koodi kirjutamist
–
Programmeerimiskeel Python • Kommertstarkvara
– STA
stata .com/">TA http://www.stata.com/
– arvutiklassides EViews
http://www.eviews.com/Ökonomeetria mõiste ja ülesanded.
Ökonomeetriline mudelD. Gujarati, Basic Econometrics,
IntroductionÖkonomeetria mõiste
Ökonomeetria on teadus, mis
on tekkinud kolme teaduse
piirimaile.
Kujunes välja XX saj 30-ndatel
aastatel.
econometrics
= oikonomia (kr majandus) + metron (kr mõõt)
= majanduse mõõtmine
Teoreetiline ja rakenduslik
•
Teoreetiline ökonomeetria (theoretical
econometrics
) tegeleb ökonomeetriliste
meetodite arendamisega. Tuginetakse
matemaatilisele statistikale.
•
Rakenduslik ökonomeetria (
applied econometrics) kasutab teoreetilises
ökonomeetrias arendatud
meetodeid erinevate
majandus-
ja ärindusprotsesside ning nähtuste
kirjeldamiseks.
Rakendusliku ökonomeetria eesmärk
Toetada
– majandusprotsesside paremat mõistmist;
– prognooside tegemist;
– majanduslike ja poliitiliste otsuste kujundamist.
Näiteid pealkirjadest Eesti Panga toimetistes.
„Kuidas ettevõtted kohanevad
miinimumpalga tõusuga? –
Uuringutulemused Kesk- ja Ida-
Euroopast.“
Malk , L. et al. (2017).
„Euroopa Liidu riikide viivislaenude prognoosimudelid.“ Staehr, K., Uusküla,
L. (2017).
„Rahastamispiirangute mõju teadus- ja arendustegevusele üle
majandustsükli “. Männasoo, K., Meriküll, J. (2015).
„
Eurole ülemineku mõju inflatsioonile Eestis.“
Rõõm , T. ja
Urke , K. (2014).
Ökonomeetria suunad
•
Mikroökonomeetria (microeconometrics) - inimeste ja ettevõtete käitumise
analüüs. Enamasti kasutatakse kas ristandmeid või paneelandmeid.
Objektideks on isikud,
majapidamised või ettevõtted.
•
Makroökonomeetria (
macroeconometrics ) –
agregeeritud andmed
piirkondade, riikide, riigigruppide kohta. Kasutatakse nii ristandmeid, aegridu
kui ka paneelandmeid.
•
Aegridade ökonomeetria (time
series econometrics) – aegridade
modelleerimine ,
prognoosimine .
•
Finantsökonomeetria (financial econometrics) - väärtpaberite ja
valuutakursside mudelid. Kasutatakse peamiselt aegridu.
•
Ruumiökonomeetria (
spatial econometrics) -
ruumiliste aspektide
arvestamine teoreetilistes mudelites. Näiteks kõrvuti asetsevates
regioonides võivad mõned näitajad olla seotud - esineb ruumiline
autokorrelatsioon.
Ökonomeetrilise uurimistöö etapid
•
Probleem: Majandusteoreetilise või ärialase probleemi
verbaalne formuleerimine.
•
Andmed: Andmete kogumine ja ettevalmistamine.
•
Mudel: Ökonomeetrilise mudeli valik ja selle
parameetrite hindamine.
•
Analüüs: Mudeli
testimine , parameetrite usaldatavuse
kontrollimine.
•
Rakendus : Järelduste tegemine, prognoosimine,
mudeli omaduste parandamine.
Teoreetilise mudeli formuleerimine
• Mis on resultaatnähtus, mis on seda mõjutavad
faktorid (faktornähtus). Endogeensete (sõltuvate)
ja eksogeensete (sõltumatute) muutujate valik.
• Hüpoteeside püstitamine
uuritavate objektide või
nähtuste kohta.
• Teoreetiline mudel võib olla ka varem püstitatud -
ökonomeetriat kasutatakse
teoreetilise mudeli
kehtivuse kontrollimiseks.
Ökonomeetrilise mudeli valik
• Mis tüüpi on
arvandmed ?
– ristandmed (
cross -sectional);
– aegread (time series);
– paneelandmed (panel data).
•
Funktsioontunnus – pidev: regressioonmudel (lineaarne või
mittelineaarne );
– piiratud väärtustega: logit,
probit või
tobit mudel.
• Mudeli valik on tegevus, mille kohta ei saa anda
kindlaid reegleid, eeskirju.
Ökonomeetrilise mudeli komponendid
• Modelleeritavad näitajad:
endogeenselt (sisemiselt)
määratud ehk
sõltuvad muutujad (Y). Väärtused
määratakse mudeli siseselt.
• Modelleeritavat nähtust mõjutavad näitajad:
eksogeenselt
(väliselt) määratud ehk
sõltumatud, seletavad muutujad
(X
). Väärtused määratakse mudeli väliselt.
•
Statistiliste meetoditega hinnatavad mudeli
parameetrid (
).
• Juhuslik
komponent ehk vealiige (u).
( , , )
f
=
Y
X β u
arvväärtused antud
arvväärtused antud
Andmebaasi korraldamine
• Ökonomeetriline mudel
baseerub arvandmetel.
• Primaarne või
sekundaarne vaatlus – riiklik või
ametkondlik statistika;
– küsitlus;
– ettevõtte andmed.
• Andmete ettevalmistamine
– sobivasse
formaati viimine ;
– ühikute
teisendamine ;
– vajadusel
logaritmimine .
• Andmetes
esinevate vigade avastamine
– registreerimisvead;
– tahtlikud vead.
Andmete ettevalmistamine
• Andmete valik
– Majandusteoreetilises
mudelis näiteks SKP.
– Eesti Statistikaameti
andmebaasis :
• SKP
jooksevhindades või SKP aheldatud väärtus?
• sesoonselt ja tööpäevade arvuga korrigeeritud või mitte?
• Ühikute teisendamine
– Arvandmed ei tohi suurusjärkudelt väga palju erineda
• Algselt: palk 12 000 eurot, SKP 20 000 000 000 eurot (aastas)
• Teisendatud: palk 12 tuh eurot, SKP 20 mld eurot
• Andmebaasi lähevad arvud 12 ja 20
• Logaritmimine
• Kui tunnuse väärtused varieeruvad suures ulatuses ja nende
jaotus on ebasümmeetriline.
• Mudelite lineariseerimisel,
elastsuskordajate leidmisel.
• Kasutatakse naturaallogaritmi ln NB! Paljudes inglisekeelsetes
õpikutes, publikatsioonides tähistab naturaallogaritmi log
Hinnangud ja nende omadused
Gujarati, Basic Econometrics, 5 ed,
Appendix A.7
Valimvaatlused I
•
Üldkogum ja
valim – Uuritav objekt on üldkogum
–
Andmebaas on üldjuhul valim
• Järeldusi
soovime teha üldkogumi kohta.
• Selleks kasutame valimit.
• Valimi parameetrite põhjal leitakse üldkogumi parameetrite
hinnangud (estimates).
üldkogum
valim
üldkogum
moodustatakse
tulemused
üldistatakse
Demo : juhuvalimi keskmine
Valimvaatlused II
• Valimi põhjal leiame mudeli parameetrite hinnangud.
• Olgu tegelik mudel
• Valimvaatlusest saadud andmete põhjal hindame mudeli
parameetreid, st leiame nende hinnangud:
β
0 hinnang
β
1 hinnang
• Teine valim annab teistsugused hinnangud.
• Valim on
juhuvalim => hinnang on juhuslik suurus.
0
ˆ
1
ˆ
0
1
y
x
=
+
Hinnangud
• Matemaatilise statistika üheks põhieesmärgiks on valimi
andmeid kasutades hinnata mingit
üldkogumi parameetrit
θ või parameetrite hulka
θ=( θ
1, θ2, …).
• Suvaline valimi andmete põhjal arvutatud funktsioon on statistik .
• Erinevad
valimid annavad
statistikutele
erinevad
v
äärtused: statistik on juhuslik suurus.
•
Punkthinnang (point estimate) on statistik, mis annab
parameetrile
ühese väärtuse.
– Näit valimi aritmeetiline keskmine on punkthinnang kogumi
keskv
äärtusele.
•
Intervallhinnang (interval estimate) on lõik, mis sisaldab
parameetri
tegelikku v
äärtust mingi etteantud
tõenäosusega. Ka
usaldusvahemik (
confidence interval).
Demo: keskväärtuse usalduspiirid
Hinnangfunktsioon
Hinnangfunktsioon (estimator) on reegel
üldkogumi parameetri(te) hinnangu(te) leidmiseks.
• Ühe ja sama parameetri hindamiseks võib kasutada
erinevaid hinnangfunktsioone.
• Mõned sobivad paremini, mõned halvemini.
Parameeter
θ =?
Üldkogum
Valim
Hinnang - funktsioon
Parameetri
hinnang
ˆ
Kogumi keskväärtuse
hindamismeetodid
Üldkogumi keskväärtuse hindamiseks võib
kasutada näiteks
– valimi keskmist;
– valimi
mediaani ;
– valimi minimaalse ja maksimaalse elemendi
aritmeetilist keskmist.
Milline on neist parim?
Mille alusel valida?
Demo: kogumi keskväärtuse
hinnangfunktsioonid
Mudeli parameetrite hindamismeetodid
Tuntumad regressioonmudeli parameetrite
hindamismeetodid ökonomeetrias:
– harilik
vähimruutude meetod (Ordinal
Least Squares,
OLS);
– suurima
tõepära meetod (
Maximum Likelihood, ML);
– kaalutud vähimruutude meetod (Weighted Least
Squares, WLS);
– kaheastmeline vähimruutude meetod (Two-Stage
Least Squares, 2SLS);
– üldistatud vähimruutude meetod (Generalized Least
Squares GLS).
Hinnangu nihe
•
Hinnangu nihe (
bias ) võrdub parameetri hinnangu
keskv
äärtuse
ning parameetri tegeliku v
äärtuse
vahega:
ˆ
ˆ
( )
B
E
=
−
• Parameetri hinnang on
nihketa (unbiased), kui hinnangu
keskväärtus võrdub parameetri tegeliku väärtusega:
ˆ
E
=
• Kahest hinnangfunktsioonist on parem see, mis on nihketa.
• Nihketa hinnangfunktsioone võib olla mitmeid
• nt sümmeetrilise jaotuse korral on üldkogumi mediaani nihketa
hinnanguteks valimi aritmeetiline keskmine ja valimi mediaan.
ˆ
ˆ
[ ]
E
Demo: hinnangu nihe
Kogumi dispersiooni
σ2 hinnang
See hinnang on nihkega.
See on nihketa hinnang.
Demo: dispersiooni hinnangud
2
2
1
(
)
i
S
x
x
n
=
−
Hinnangfunktsioon 1
2
2
1
(
1
)
i
s
x
n
x
−
−
=
Hinnangfunktsioon 2
2
2
1
(
)
i
x
x
N
=
−
N kogumi maht
Tõestust vt Sauga, A. „Statistika õpik majanduseriala üliõpilastele“, lisa A.7
Teeme 1000 valimit mahuga n. Kasutame kaht erinevat hinnangfunktsiooni.
Kogumi mediaani hinnangud
Hinnanguks valimi mediaan
Hinnanguks valimi aritmeetiline keskmine
Demo: hinnangu efektiivsus
Mõlemad hinnangfunktsioonid on nihketa.
Valimite mediaanid hajuvad rohkem.
Sümmeetrilise jaotusega kogum. Teeme 1000 valimit.
Hinnangu efektiivsus
• Parameetri
nihketa hinnang
on efektiivsem kui
nihketa hinnang
, kui hinnangu
dispersioon on
väiksem kui hinnangu
dispersioon :
1
2
ˆ
ˆ
var
var
• Efektiivne hinnang on nihketa vähima dispersiooniga
hinnang kõigi nihketa hinnangute seas.
• Hinnangute dispersioone tasub võrrelda vaid nihketa
hinnangute korral, kuna hinnangu
väike dispersioon ei
ole
eesmärk
omaette .
1
ˆ
2
ˆ
1
ˆ
2
ˆ
Hinnangu nihe ja efektiivsus
Väike
hajuvus ,
efektiivne
Suur hajuvus,
vähem efektiivne
Nihketa
Nihkega
Hinnangu mõjusus
• Olgu valimi maht n ning selle põhjal saadud hinnang
• Hinnang on mõjus (
consistent ), kui ta koondub
tõenäosuse järgi parameetri
tegelikuks väärtuseks:
(
)
→
−
=
ˆ
lim P
1
n
n
iga
ε >0 korral
• Kui hinnang on mõjus, siis valimi mahu kasvades tõenäosus, et hinnangu ja parameetri tegeliku väärtuse erinevus oleks
väiksem kui mistahes positiivne arv, läheneb ühele.
• Hinnangu
mõjusus on asümptootiline omadus
• Asümptootika: valimi maht n → ∞
• Tähistatakse ka
terminist
probability limit ˆ
( )
n
=
plim ˆ
n
ˆ
n
Demo: hinnangu mõjusus
Hinnangu asümptootiline jaotus
• Asümptootiline jaotus näitab,
millisele klassikalisele
jaotusele läheneb hinnangu valimjaotus valimi mahu
kasvamisel.
• Hinnang on asümptootiliselt normaaljaotusega, kui
hinnangu valimjaotus läheneb valimi mahu kasvamisel
normaaljaotusele.
– Näiteks valimite keskmiste jaotus läheneb valimite mahu n
kasvamisel normaaljaotusele keskväärtusega
ja dispersiooniga
2/n, kus ja 2 on vastavalt kogumi keskväärtus ja dispersioon.
• Asümptootilist jaotust kasutatakse parameetrite
usalduspiiride leidmisel, testimisel. Sellest leitakse
kriitilised väärtused, olulisuse tõenäosus.
Demo: valimite keskmiste valimjaotus
Hinnangu asümptootiline efektiivsus
Mõjusat
hinnangut nimetatakse
asümptootiliselt
efektiivseks (asymptotically efficient), kui selle
asümptootilise jaotuse dispersioon on väiksem suvalise
mõjusa asümptootiliselt normaaljaotusega hinnangu
dispersioonist.
Näiteks mõningad suurima tõepära meetodil leitud
hinnangud.
Hinnangute omadused, kokkuvõte
•
Nihe (bias). Iseloomustab süstemaatilist viga.
•
Efektiivsus (
efficiency ). Iseloomustab
hinnangute hajuvust.
•
Mõjusus (consistency). Iseloomustab
koondumist suurte valimite korral.
• Asümptootiline jaotus.
• Asümptootiline efektiivsus.
Suurte
valimite
korral (large-
sample
properties)
Hüpoteeside statistiline kontrollimine
Meeldetuletus statistika kursusest
Vt A. Sauga, Statistika majandusõppe
üliõpilastele, ptk 7.1-7.9
Regressioonmudeli juhuslikkus
y = -0,0689x + 1,7186
y
x
Valim, n=10
y = 1,775
y
x
Kogum
y = -0,034x + 1,4631
y
x
Valim 2, n=10
Valimi põhjal hinnatud mudel
näitab, et x ja y vahel on
negatiivne seos
Tegelikult y ei sõltu
suurusest x
Hüpoteeside kontrollimise vajadus I
1.
Püütakse tõestada, et Y on seotud
suurustega X
1, X2, …
2.
Kui seos on, siis kas positiivne või negatiivne.
3.
Parameetrite arvväärtused on tihti vähem
olulised.
Järelikult on meil vaja tõestada, et valimi põhjal
hinnatud mudeli parameetrid on oluliselt
erinevad nullist.
Ökonomeetrilise mudeli abil
Hüpoteeside kontrollimise vajadus II
Hindame mudelit
0
1 1
2 2
y
x
x
u
=
+
+
+
st leiame parameetrite
β
0, β1, β2 hinnangud,
kasutades vähimruutude meetodit OLS .
Kas leitud hinnangud on nihketa?
Ainult siis, kui on täidetud vähimruutude meetodi
kasutamise eeldused.
Nende
eelduste kehtimist tuleb kontrollida!
Selleks on mitmesugused testid.
Hüpoteeside kontrollimise vajadus III
Mudel 1:
y =
β
0 + β1x1
Mudel 2:
y =
β
0 + β1x1 + β2x2
Tihti tuleb võrrelda erinevaid mudeleid
Kas mudelid on oluliselt
erinevad, st kas tunnuse
x
2 sissetoomine on
põhjendatud?
Mudel 1:
y =
β
0 + β1x1
Mudel 2:
y =
β
0 + β1x1 + β2x1
2
Kas mudelid on oluliselt
erinevad, st kas
sõltuvus on lineaarne või
mittelineaarne?
Nullhüpotees ja sisukas hüpotees
• Nullhüpotees: miski võrdub millegagi (erinevus on null)
– kogumi keskväärtus μ = μ
0
– kogumi A keskväärtus = kogumi B keskväärtus
– mudeli parameeter β = 0
• Sisukas (
alternatiivne ) hüpotees: võrdus ei kehti.
• Otsustamiseks kasutatakse juhuvalimit.
• Juhuvalimi keskväärtus on
juhuslik suurus, st erineb
arvust
μ.
• Kuidas otsustada, kas
– kogumi keskväärtus μ = μ
0
kehtib nullhüpotees;
– kogumi keskväärtus μ ≠ μ
0
kehtib sisukas hüpotees?
• Ehk: kui palju võib juhuvalimi keskväärtus erineda
nullhüpoteesiga püstitatud väärtusest, et võime öelda:
nullhüpotees ei kehti?
• Vaja kriteeriumi!
Demo: otsustamise
kriteerium testimisel
Statistiline kriteerium ja teststatistik
• Otsustamiseks vajaliku statistilise kriteeriumi
leidmiseks kasutatakse teststatistikut.
• Valimi andmete põhjal arvutatakse teststatistiku
empiiriline
väärtus
– sõltuvalt sellest, mida kontrollitakse, on konkreetsed
arvutusvalemid erinevad
– z-test, t-test, F-test, χ2 -test, ….
•
Empiirilist väärtust võrreldakse vastava
kriitilise
väärtusega ja võetakse vastu otsus.
Näide: kuulid urnis
• Kastis on 100 kuuli, mustad ja valged
• Nullhüpotees:
mustade ja valgete
kuulide arv
on võrdne
• Sisukas hüpotees: mustade ja valgete kuulide arv
ei ole võrdne
• Võetakse välja 10 juhuslikku kuuli. Erinevad võimalused:
valgeid
musti Tõenäosus, kui kehtib
nullhüpotees, st
urnis 50 valget ja 50 musta
5
5
0,26
4
6
0,21
3
7
0,11
2
8
0,038
1
9
0,0072
0
10
0,00059
Neid tõenäosusi
oskame arvutada
Kriteerium, millest
alates on nullhüpotees
ebatõenäoline
Teststatistiku jaotuskõver
• Teststatistikud on nii konstrueeritud, et nad
alluvad
tuntud teoreetilistele jaotusseadustele (normaaljaotus, t-
jaotus, F-jaotus,
χ2 jaotus, …)
• Osatakse arvutada juhuvalimi põhjal leitud teststatistiku
erinevate väärtuste esinemise tõenäosusi,
kui kehtib
nullhüpotees.
• St osatakse arvutada nullhüpoteesile vastavat
teststatistiku jaotustiheduse kõverat.
teststatistik z
a
ja
otu
stihe
du
s
Tõenäosus, et
z
Kriitilised väärtused
• Nullhüpotees lükatakse tagasi, kui valimile vastava
teststatistiku empiirilise väärtuse esinemise tõenäosus
on väiksem kui olulisuse nivoo
α
• Sagedasemad olulisuse
nivood : 0,1;
0,05; 0,01
• Olulisuse nivoole vastav teststatistiku väärtus on kriitiline
väärtus.
z
1,96
-1,96
Lükkan H
0 tagasi
Aktsepteerin H
0
0
Lükkan H
0 tagasi
Näiteks kriitilised väärtused
kahepoolse z-testi korral on
-1,96 ja 1,96.
Kriitilistest väärtustest
kaugemal on kriitiline piirkond
(viirutatud), kus kehtib
sisukas hüpotees.
Demo: teststatistiku empiirilise väärtuse võrdlemine kriitilisega
Olulisuse nivoo ja kahte liiki vead
Võtan H
0 vastu
Lükkan H
0 tagasi
H
0 kehtib
Otsus õige
I liiki viga
H
0 ei kehti
II liiki viga
Otsus õige
• I liiki vea tõenäosuse ülempiir on olulisuse nivoo α.
• See määratakse ära enne hüpoteesi kontrollimist.
• Võetakse enamasti kas 5% või 1% (mõnikord ka 10%)
• Olulisuse nivoo
alandamine (α väärtuse
vähendamine)
• vähendab I liiki vea tõenäosust;
• suurendab II liiki vea tõenäosust.
Demo: I ja II liiki viga hüpoteeside testimisel
Olulisuse nivoo ja olulisuse tõenäosus
• Statistika- ja ökonomeetriapaketid võimaldavad
hüpoteeside kontrollimisel leida lisaks teststatistiku
empiirilisele väärtusele ka sellele vastavat tõenäosust.
• See on olulisuse tõenäosus p.
– Näitab tõenäosust, kui hästi valim sobib nullhüpoteesiga.
• Nullhüpotees lükatakse tagasi, kui
olulisuse tõenäosus p tõenäosuse
võrdlemine olulisuse
nivooga.
Tuntumad testimisel kasutatavad jaotused
Jaotus
Kus kasutatakse
Normaaljaotus
(z-test)
Keskväärtuse testimine, korrelatsiooni olulisuse
testimine,
vähimruutude meetodil leitud mudeli parameetrite
testimine.
t-jaotus
(t-test)
F-jaotus
(F-test)
Dispersioonide võrdlemine, mudeli statistilise
olulisuse testimine.
χ2 (hii-ruut) jaotus
(
χ2 –test)
Seosed kvalitatiivsete tunnuste vahel (
risttabelid ),
mudelite testimine.
Kokkuvõte hüpoteeside kontrollimisest
• Püstitatakse hüpoteesipaar: nullhüpotees ja sisukas
hüpotees.
• Valitakse sobiv teststatistik.
• Valimi põhjal leitakse selle empiiriline väärtus.
• Võetakse ette olulisuse nivoo (tavaliselt 0,05).
• Võrreldakse
– kas empiirilist ja kriitilist väärtust
või
– olulisuse tõenäosust p ja olulisuse nivood α.
• Otsustatakse,
kumb hüpotees tuleb vastu võtta
– Kui empiiriline väärtus on kriitilisest suurem (ehk p
Kõik kommentaarid