Vajad kellegagi rääkida?
Küsi julgelt abi LasteAbi
Logi sisse

Eksamitöö nr 4 / Kodutöö: Andmestiku analüüs (0)

1 Hindamata
Punktid
õnn - Tuleb kõvasti tööd teha, mitte oodata, et õnn (taevast) sülle kukub

Lõik failist


1. Andmestiku kirjeldus
Analüüsile on võetud Statistikaameti poolt esitatud andmed. Andmestik on koostatud kahe tabeli alusel. Esimene on : PO047 Abiellud ja lahkumised ( analoogne RV262: ABIELUD ). Teine on PO032 : Sünnid, surmad ja loomulik kasv aasta sugu ja indikaatori alusel. Andmed olid valitud nii, et tabelist PO047 võetud aastad on 1985 - 2014 ning PO032 1986 - 2015. See lubab oletada, et abiellude arv määrab järgmisel aastal sündinute laste arvu.
(xi) aasta (yi) aasta Abiellude arv (xi) Sündide arv (yi)
1985 1986 12861 24106 310027266 1986 1987 13000 25086 169000000 629307396 326118000 82710536.5511111 23202.8898274695 3546103.92188801 1987 1988 13434 25060 180472356 628003600 336656040 82238296.8177778 23784.9645641743 1625715.36261117 1988 1989 12973 24318 168298729 591365124 315477414 69331157.3511111 23166.6778046791 1325542.79743862 1989 1990 12644 22304 159870736 497468416 282011776 39848077.0844444 22725.427601048 177601.222925031 1990 1991 11774 19413 138627076 376864569 228568662 11706890.3511111 21558.5957555797 4603581.1463615 1991 1992 10292 18038 105925264 325369444 185647096 4188298.68444444 19570.9580601958 2349960.41431914 1992 1993 8878 15253 78818884 232654009 135416134 545333.017777779 17674.5210148025 5863764.02513001 1993 1994 7745 14176 59985025 200958976 109793120 3295919.21777778 16154.9572436352 3916271.77213604 1994 1995 7378 13509 54434884 182493081 99669402 6162640.75111111 15662.7419708916 4638604.47718018 1995 1996 7006 13242 49084036 175350564 92773452 7559566.95111111 15163.8207680017 3693395.06432283 1996 1997 5517 12577 30437289 158180929 69387309 11658582.6177778 13166.7947704129 347857.871206431 1997 1998 5589 12167 31236921 148035889 68001363 14626545.2844444 13263.3601645206 1202005.61034773 1998 1999 5430 12425 29484900 154380625 67467750 12719684.4844445 13050.1115858661 390764.494784021 1999 2000 5590 13067 31248100 170746489 73044530 8552505.28444445 13264.7013505499 39085.8240092609 2000 2001 5485 12632 30085225 159567424 69286520 11286016.2844444 13123.8768174762 241942.803570473 2001 2002 5647 13001 31888609 169026001 73416647 8942890.88444445 13341.1489542185 115701.311055957 2002 2003 5853 13036 34257609 169937296 76299708 8734783.21777778 13617.433276249 338064.654729588 2003 2004 5699 13992 32478601 195776064 79740408 3997866.95111111 13410.8906277408 337688.102527517 2004 2005 6009 14350 36108081 205922500 86229150 2694412.81777778 13826.6582968157 273886.538291869 2005 2006 6121 14877 37466641 221325129 91062117 1242035.95111111 13976.8711320944 810231.978837102 2006 2007 6954 15775 48358116 248850625 109699350 46857.817777778 15094.0790944795 463653.279574852 2007 2008 7022 16028 49308484 256896784 112548616 1334.6844444444 15185.2797444701 710177.429080329 2008 2009 6127 15763 37540129 248472169 96579901 52197.017777778 13984.91824827 3161574.71583524 2009 2010 5362 15825 28751044 250430625 84853650 27711.1511111113 12958.9109358755 8214466.52349423 2010 2011 5066 14679 25664356 215473041 74363814 1722568.75111111 12561.9198712104 4482028.2717158 2011 2012 5499 14056 30239001 197571136 77293944 3746031.21777778 13142.653421886 834201.971752567 2012 2013 5888 13531 34668544 183087961 79670528 6053896.21777778 13664.3747872735 17788.8338802612 2013 2014 5630 13551 31696900 183629601 76292130 5955877.55111111 13318.3487917209 54126.5847137385 2014 2015 6220 13907 38688400 193404649 86501540 4345001.28444445 14109.6485489925 41066.4344087523
Summa 228693 479744 1979529261 8151649352 3973897337 479839167.466667
55003940.02
Keskmine 7623.1 15991.4666666667
Valimimaht 30
2. Lineaarne korrelatsioonikordaja:












2.1 Leiame lineaarse korrelatsioonikordaja (r) materjalides toodud valemi põhjal: valemis kasutatavad summad on leitud ülal tabelis






























0.9409410446









2.2 Kontrollime tulemust Exceli funktsiooni abil:
0.9409410446
2.3 Järeldus: Korrelatsioonikordaja absoluutväärtus on lähedane ühele, sellega abiellude ja sündinute laste
vaheline sõltuvus on lähedane lineaarsele. |r| ≥ 0,8 ehk korrelatsioon on tugev.
Korrelatsioonikordaja märk näitab, et lineaarne seos uuritavate abiellude ja sündinute laste vahel on kasvav.


3. Kontrollime korrelatsiooni olemasolu olulisusnivooga 5%
H0: rxy = 0 üldkogumis abiellude arvu ning järgmisel aastal sündinute laste arvu vahel pole lineaarset seost
H1: rxy ≠ 0 üldkogumis abiellude arvu ning järgmisel aastal sündinute laste arvu vahel on lineaarne seos


3.1 Leiame kriitilise punkti kahepoolsele sümmeetrilisele kriitilisele piirkonnale


3.1.1 Kriitilise punkti leidmine tabeli alusel:
3.1.2 Kontrollime tulemust Exceli funktsiooni abil:

2.0484071418 alpha = 0.05


k = 28
3.2 Arvutame välja leitud korrelatsioonikordaja põhjal teststatistiku empiirilise väärtuse vastavalt
valemile:


14.7059260057




3.3 Järeldus:
Kuna
14.7059260057 > 2.0484071418
siis on alus nullhüpoteesi tagasi lükata, ehk oleme tõestanud sisuka hüpoteesi H1.
Ehk 5% eksimisriskiga võime väita, et inimeste abiellude ja sündinud laste vahel on lineaarne seos.
Võime lugeda tõestatuks, et ka üldkogumis erineb korrelatsioonikordaja nullist.
4. Määran sõltuv muutuja (tagajärg) ja sõltumatu muutuja (põhjus)
Sõltumatuks muutujaks valin X tunnuse, ehk siis abiellude arv → põhjus.
Sõltuvaks muutujaks on Y tunnus, nii et sündinute laste arv → tagajärg.
Peamiseks põhjuseks on nende sündmuste kronoloogiline järjekord .
Andmed olid valitud nii, et Y tunnuse aasta on X tunnuse aasta + 1 (järgmine).
5. Regressioonisirge y = bx + a parameetrid
5.1 Parameetrite arvutamine valemi abil:


5767.4714469089
1.3411860293
5.2 Kontrollime tulemust Exceli funktsiooni abil:
a = 5767.4714469089
b = 1.3411860293
5.3 Leitud parameetrite abil koostame regressioonisirge võrrand:
y = 1.341186 x + 5767.4714
6. Determinatsioonikordaja r2
6.1.1 Mõõdetud väärtuste yi koguvariatsioon


479839167.47


6.1.2 Selgitamata päritoluga variatsioon :




55003940.02


6.1.3 Determinatsioonikordaja:


0.8853700495
6.2 Kontrollime tulemust Exceli funktsiooni abil:


0.8853700495


6.3 Järeldus:
Lineaarne regressioonimudel kirjeldab mõõdetud suurusi hästi 0,8 ≤ ≤ 0,9:
88,5% sõltuva muutuja (sündinud laste) kogumuudust on kirjeldatud regressioonivõrrandiga.


7. X ja Y tunnuste graafik


8. Leiame parameetrite a ja b 90%-lised usalduspiirid
8.1 Prognoosijäägi standardhälbe hinnang:




1401 .5799760708


8.2 Parameetrite a ja b standardhälvete hinnangud :




740.8273032964




0.0912003793


8.3 Studenti jaotuse kvantiil :

1.7011309343 alpha = 0.1
k = 28
8.4 Vabaliikme a 90%-lised usalduspiirid:

4507.2272043226
7027.7156894952
8.5 Lineaarliikme kordaja b 90%-lised usalduspiirid:

1.1860422429
1.4963298157
9. Prognoosime muutuja Y väärtust, kui
Xp = 10000
9.1 Prognoosi punkthinnang:

19179.3317396478
10000 abielludele vastab 19180 sündinud last.
9.2 Prognoosi punkthinnangu standardhälve:




1441.1448074575


9.3 Prognoosi vastav 90%-line usalduspiirkond :

1.70 alpha = 0.1
k = 28

16727
21631
9.4 Järeldus:
90%lise tõenäosusega järgib 10000 abiellude 16727 kuni 21631 sündi.
10. Protseduur Regression
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.9409410446
R Square 0.8853700495
Adjusted R Square 0.8812761227
Standard Error 1401.5799760708
Observations 30
ANOVA

df SS MS F Significance F
Regression 1 424835227.445635 424835227.445635 216.2642596863 1.06964428385382E-014
Residual 28 55003940.0210319 1964426.42932257
Total 29 479839167.466667

Coefficients Standard Error t Stat P-value Lower 90.0% Upper 90.0%
Intercept 5767.4714469089 740.8273032964 7.7851766819 1.76203652133655E-008 4507.2272043226 7027.7156894952
X Variable 1 1.3411860293 0.0912003793 14.7059260057 1.06964428385384E-014 1.1860422429 1.4963298157
11. Kasutatud materjalide loetelu
1 Kodutöö E4 juhend
statistika_kodutoo_juhend_2017_kaug.pdf
2
korrelatsioonikordajad.xls
3
punkthinnangud .xlsx
4
regressioonanalyys2.xls
5 Kriitiliste punktide jaotus tabel
http://kontromat.ru/?page_id=4200
6 AnalysisToolPak 2016
https://www.youtube.com/watch?v=mIoS7IRo36c
7 Statistikaamet
PO032: BIRTHS, DEATHS AND NATURAL INCREASE BY SEX AND COUNTY  
8 Statistikaamet
PO047: MARRIAGES AND DIVORCES 
Vasakule Paremale
Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #1 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #2 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #3 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #4 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #5 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #6 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #7 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #8 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #9 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #10 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #11 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #12 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #13 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #14 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #15 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #16 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #17 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #18 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #19 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #20 Eksamitöö nr 4- Kodutöö-Andmestiku analüüs #21
Punktid 100 punkti Autor soovib selle materjali allalaadimise eest saada 100 punkti.
Leheküljed ~ 21 lehte Lehekülgede arv dokumendis
Aeg2017-07-26 Kuupäev, millal dokument üles laeti
Allalaadimisi 26 laadimist Kokku alla laetud
Kommentaarid 0 arvamust Teiste kasutajate poolt lisatud kommentaarid
Autor regression Õppematerjali autor
Tehtud ning maksimaalselt hinnatud eksamitöö nr 4 - kodune töö
--------------------------------------------------------------------------------------
Iseseisva töö aluseks on reaalne andmestik, mida töö teostaja peab oskama täpselt kirjeldada (mida
kajastab, mis ajast, kust pärit jne). Juhul kui vaadeldavad tunnused sõltuvad ajast (kaubaartikli hind,
sündimus, suremus, palk, liiklusõnnetuste arv) peavad olema kaasatud andmed viimase hetkel
kättesaadava ajaperioodi kohta.
Andmestik peab sisaldama 20-30 objekti andmeid, nende hulgas peab olema 2 arvtunnust.
Andmestiku võib otsida huvipakkuva ala kohta Internetist (või raamatukogust) või ka näiteks Eesti
Statistikaameti väljaannetest (Internetist, samuti raamatukogust). Andmestikuks pole lubatud valida
loengus või praktikumis vaadeldud andmetabeleid ja õpikutes näiteülesannetena kasutatud materjale.

Kasutatud allikad

Sarnased õppematerjalid

thumbnail
70
docx

Ökonomeetria kontrolltöö kordamisküsimused 2020

Ökonomeetria KT kordamisküsimused 1. Ökonomeetrilise mudeli komponendid. ● Modelleeritavad näitajad: endogeenselt (sisemiselt) määratud ehk sõltuvad muutujad (Y). Väärtused määratakse mudeli siseselt ● Modelleeritavat nähtust mõjutavad näitajad: eksogeenselt (väliselt) määratud ehk sõltumatud, seletavad muutujad (X). Väärtused määratakse mudeli väliselt. ● Statistiliste meetoditega hinnatavad mudeli parameetrid (b). ● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasuta

Ökonomeetria
thumbnail
38
docx

Ökonomeetria kordamisküsimused

regressioonimudle kui tervik stat usaldusväärne c. mudeli parameetrite statistilise olulisuse kontrollimine; usalduspiiride leidmine; t-statistiku abil hinnatakse parameetri (regressioonikordaja usaldusväärsust). t- kriitilise leidmiseks kasutada funktsiooni TINV. Usaldusvahemiku alumine ja ülemine piir (Lower 95% ja Upper 95%) määravad vahemiku, millesse jääb 95% tõenäosusega regressioonikordaja. d. eespool toodud näitajate leidmine ja seoste analüüs Exceli regressioonanalüüsi tabeli põhjal. Vaata moodles regressiooni selgitused. 9. Mitmene regressioon. Klassikalise regressioonanalüüsi põhieeldused. Gauss-Markovi teoreemi olemus. Parim hinnang. Nihutamata hinnang. Efektiivne hinnang. MITMENE REGRESSIOON Mitmese regressioonimudeli korral uuritakse seost endogeense (sõltuva ) muutuja Y ning eksogeensete (sõltumatute) muutujate vahel · Eeldatakse, et sõltuvat muutujat Y mõjutavad mitu sõltumatut muutujat X1, X2,

Ökonomeetria
thumbnail
85
pdf

Konspekt

................................................. 72 11.3 Determinatsioonikordaja ...................................................................................................... 74 11.4 Mitmene korrelatsioon ......................................................................................................... 74 11.5 Regressioonanalüüs............................................................................................................... 75 12 Aegridade analüüs .............................................................................................................. 81 12.1 Aegrea mõiste ....................................................................................................................... 81 12.2 Aegridade keskmised tasemed.............................................................................................. 81 12.3 Aegridade kompleksanalüüs ........................................................

Matemaatika ja statistika
thumbnail
12
pdf

Ökonomeetria testid vastused

1. Regressioonmudelis y=B0+B1x+u x - eksogeenne muutuja, y - endogeenne muutuja, u - juhuslik liige 2. Milline hinnangute omadus mida iseloomustab? efektiivus - hinnangute hajuvust, nihe - süstemaatilist viga, mõjusus - hinnangute koondumist suurte valimite korral 3. Asümptootiline omadus kehtib juhul, kui valimi maht läheneb lõpmatusele 4. Sinised punktid - hinnangfunktsiooni A abil saadud hinnanguid ja sinine kriipsjoon on nende keskväärtus. Rohelised - funktsiooni B abil. Hinnang A on nihketa, Hinnang B on nihketa, Hinnang B on efektiivsem kui hinnang A 5. Valimi põhjal saab leida mudeli parameetrite hinnangud 6. Ülikooli juhtkond soovis teada saada, kui palju tunde nädalas kulutavad üliõpilased keskmiselt isesisvale tööle. Selleks küsitleti juhuslikult väljavalitud 50 üliõpilast. Nende keskmine iseseisva töö tundide arv nädalas oli 15,3. Tulemus 15,3 tundi nädalas on kõigi üliõpilaste keskmise nädalatundide arvu punk

Ökonomeetria
thumbnail
21
doc

Andmeanalüüs sots.teadustes

1. ANDMEANALÜÜSI PÕHIMÕISTED (Valik)uuringu läbiviimisel on kindlad etapid, iga etapp kasutab ja vajab umbes kolmandiku uuringu ressurssidest: 1. Planeerimise alla kuuluvad järgmised mõisted ja etapid - probleemülesanne, statistiline ülesanne, üldkogum, loend, valim, tunnused, mõõtmismeetod ja -vahend; 2. Andmete kogumise all mõtleme andmete kogumist, kodeerimist jms, sisestamist, korrigeerimist; 3. Andmetöötlus on andmete statistiline töötlus, analüüs (interpretatsioon), uuringu väärtustamine, publitseerimine (esitamine). 1.1 Üldkogum ja valim Vastavalt uurija eesmärgile määratletakse üldine uurimisobjekt ehk üldkogum. Üldkogumiks on kõik objektid (näiteks isikud, ettevõtted, riigid, taimed, linnud jne), kelle kohta uurija soovib järeldusi teha. Üldkogum määratletakse nii ruumis kui ajas, vastavalt uurimisülesandele. Üldjuhul

Uurimustöö metoodika
thumbnail
26
doc

Standardhälve, SEOSED JA DISPERSIOONANALÜÜS

Standardhälve 1. leitav dispersiooni ruuduga (ruutjuurega) 2. paikneb alati vahemikus 0 ... lõpmatus (kui on alternatiivne tunnus, siis saab olla kuni 0,5 ­ see on triki küsimus, kui panid õige, siis on ÕIGE) 3. ei saa olla lineaarhälbest suurem (väiksem) 4. varieeruvas reas = 0 (st puhul rida just varieerub) 5. ei ükski Regressioonianalüüsi kõige üldisem eesmärk: 1. kirjldada korrlatiivset seost metemaatika funktsioonina Pidev juhuslik suurus... 1. võib omada ükskõik milliseid väärtusi tema võimalikke väärtusi hõlmavas arvuvahemikus. 2. juhuslikku suurust nim pidevaks juhuslikuks suurusesks, kui tema võimalike väärtuste hulk on loenduv. Lineaarne regressioonimudelil: 1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi eesmärk on: 1.

Statistika
thumbnail
78
pdf

Majandusmatemaatika

b) C (q) ' 75 q & 5000 ; c) y (x ) ' 0,1 x % 4200 . 2.7 Ventilaator pannakse kokku mootorist, tiivikust ja korpusest. Mootorite jaoks tehtavad kulutused n ventilaatori valmistamisel on f(n) = 300n + 4000 ja tiiviku ning korpuse jaoks tehtavad kulutused n ventilaatori valmistamisel on g(n) = 200n + 3000. Leida: a) funktsioon C(n), mis kirjeldaks summaarseid kulusid n ventilaatori valmistamisel; b) summaarsed kulud 150 ventilaatori valmistamiseks. 2.8 Kaubavarude tellimisprotsessi analüüs on näidanud, et tellimuse koordineerimiseks ja vormistamiseks kulub ligikaudu 15 tundi tööaega sõltumata tellimuse suurusest. Tellimuste vormistamisega tegeleva töötaja töötasuks kulub 110 kr töötunni kohta. Kulude analüüs näitas, et 50 tellimuse kohta kulus 14500 kr paberi, postikulude ja telefonikõnede peale. Ühe partii kättetoimetamistasu on 700 kr. Leida a) ühe partii hankekulud;

Raamatupidamise alused
thumbnail
466
doc

Andmeanalüüsi konspekt

Kõike võib aga ka käsitsi sisestada. Antud juhul valitakse kõik venelased (rahvus = 2). Tingimuste lahtrisse tuleb sisestada muutujate väärtuste koodid! Tähelepanu! Et analüüs sassi ei läheks, tuleb pidevalt jälgida, kas filter on peal või mitte. SPSS-i tabeli akna all paremal nurgas on vastav indikaator (“Filter On”). Uute muutujate moodustamine Transform – Recode – Into Different Variables Vasakpoolsest kastist saab noolenupuga keskmisesse tuua muutuja, mida soovime uueks muutujaks ümber kodeerida. Output Variable’i alla Name lahtrisse tuleb sisestada uue muutuja nimi. Selle viimiseks keskmisesse kasti tuleb

Andmeanalüüs i




Meedia

Kommentaarid (0)

Kommentaarid sellele materjalile puuduvad. Ole esimene ja kommenteeri



Sellel veebilehel kasutatakse küpsiseid. Kasutamist jätkates nõustute küpsiste ja veebilehe üldtingimustega Nõustun