STATISTIKA MÕISTED, VALEMID AEGRIDADE ANALÜÜS • Aegrida – nähtuste ajalist muutumist iseloomustavate arvandmete rida. • Aegrea elemendid – nähtust iseloomustava tunnuse arvväärtused ning neile vastavad teatud ajamomendid või –perioodid Aegread liigitatakse moment- ja perioodridadeks • Momentrida – aegrida, mille iga element on seotud teatud ajamomendiga. See kindel ajamoment võib olla mingi kindel kuupäev, näiteks aasta lõpp või algus, näiteks rahvaarv 1. jaanuari seisuga või bilanss mingi kuupäeva seisuga. Momentrea oluliseks iseärasuseks on asjaolu,
Sisukord 1. Aegrea karakteristikud .............................................................................................. 2. Korrelogramm. Statsionaarsuse määramine............................................................... 3. Statsionaarsuse ja mittestatsionaarsuse mõjutamine statistikale................................ 4. Statsionaarsuse ja mittestatsionaarsuse aegreadede statistika saamiseks näited........ Aegrea karakteristikud Kui meil on juba antud vaid üks realisatsiooni protsess - aegrida, siis ei ole meil võimalik täpselt aru saada stohhastilise protsessi karakteristikuid. Kuid me saame vaadelda aegrea keskmist väärtust, standardviga ning k-järku autokorrelatsioonikordajad statsionaarse juhuslikku protsessi keskväärtusse, dispersiooni ja autokorrelatsiooni funktsiooni hinnangutena. Kui aegread sisaldavad arengutendentsi, trendi, siis need karakteristikud on kindlasti
8. Box-jenkinsi meetod; Sellisel juhul koosneb mudeli konstrueerimine neljast põhietapist: 1) mudeli (või mudelite) identifitseerimine; Identifitseerimisetapil valitakse ARIMA mudelite hulgast mudeli konkreetne tüüp, mis peaks aegrida kirjeldama piisavalt hästi. Siin otsustatakse, kui mitu korda tuleb esialgset aegrida diferentsida (võibolla ka sesoonselt) ning mitmendat järku autoregresiivset ja libiseva keskmise operaatorit kasutada. Valikul tuginetakse aegrea autokorrelatsiooni-funktsioonide omadustele. 2) mudeli parameetrite hindamine; Mudelite parameetrite hindamiseks on kasutatavad kolm meetodit. Esiteks võib neid hinnata, kasutades harilikku vähimruutude meetodit ja vaadeldes aegrea igat liiget lineaarse regressioonfunktsioonina talle teatud arvu perioodide võrra eelnevatest liikmetest. Sellisel juhul kaotame me muidugi osa aegreas sisalduvast informatsioonist.
4. on pööratav ka kujule X = 18,5 + 0,48 Y 5. ei ükski Tasandusjoon Y = 18,5 – 0,48 X 1. näitab kasvavat lineaarset tendentsi 2. parameeter b ei tohi olla negatiivne 3. vabaliige 18,5 kirjeldab joone tõusu 4. igal ajaperioodil väärtused vähenevad 0,48 korda 5. ei ükski Eksponentkeskmine 1. kasutatakse keskmise kasvutempo leidmisel 2. ei arvesta rea kõiki väärtusi 3. on alati aritmeetilisest suurem 4. kasutatakse aegrea tasandamisel 5. ei ükski Keskmine esindusviga 1. on vale keskmise valiku tulemus 2. on väljavõtukeskmiste lineaarhälve 3. vahe ühe valimi keskmise ja üldkogumi keskmise vahel 4. on ruutjuur valimite keskmiste dispersioonist 5. ei ükski Keskmise taseme arvutamise juures 1. ruutkeskmine annab võrreldes aritm. keskmisega 1,253 korda väiksema tulemuse 2. kronoloogiline keskmine sobib kasutamiseks ainult aegridade korral 3
tabelist kriitiline kvantiil *järelduste tegemine: kuistatistik jääb kahe kriitlise kvantiili vahele, siis võetakse nullhüpotees vastu ja valimid võib lugeda homogeenseks. Aegrida on aja järgi järjestatud valim. Aegridade põhjal mudeli hindamist, sellest järelduste tegemist jms nim aegridade analüüsiks. Aegread tekivad selliste protsesside tulemusena, milles sisalduvad juhuslikud komponendid ja häiringud on ajas kulgevad protsessid. Analüüsi tüüpilisemad osad on: *aegrea juhuslikkuse kontroll *aegrea silumine *trendi- ja võnkekomponentide identifitseerimine/hindamine *prognoosimudeli koostamine Valge müra ehk täiesti juhuslik protsess, st jada elemendid on statistiliselt sõltumatud ühtmoodi jaotunud juhuslikud suurused. Mitteparameetrilised testid. Mediaankriteeriumi kasutamisel on testimissammud järgmised(olulisuse nivoo 0.05): *leitakse aegrea mediaan variatsioonireast *esialgse aegrea põhjal moodustatakse märgirida, mille elementideks on +, kui x on
geom.keskmine on alati aritmeetilisest keskmisest väiksem Keskmise väärtuse arvutamise juures: kasutatakse kordsete suuruste puhul geomeetrilist keskmist Mediaan: normaaljaotuse puhul on moodiga võrdne Kvartiilkeskmist kasutatakse kui on tegemist: ei ükski antud valikutest Kuupkeskmist kasut kui on tegemist: ei ükski Kronoloogilist keskmist kasutatakse, kui on tegemist: momentreaga ja ajavahemikud on võrdsed momentreaga aegrea kesmise taseme arvutamiseks. Eksponentkeskmist kasutatakse, kui on tegemist aegreaga ja selle tasandamise juures Eksponentkeskmise leidmisel: valitakse tasandusparameeter vastavalt analüüsija soovile erinevaid ajaperioode tähtsustada Aritmeetilise keskmine +-1 standardhälvet hõlmab normaaljaotuse kõvera alusest pindalast.. 68,27% Aritmeetiline keskmine t=3 standardhälvet hõlmab normaaljaotuse kõverat... 99,7%
3. ühepoolse testi korral on usaldatavus alati 95% 4. hinnang antakse valimi põhjal 5. hinnang antakse üldkogumi põhjal Hüpoteeside kontrollimisel: 1. H0 on alati tõene 2. Zemp näiab standardhälvete arvu ja µ ja µ0 vahel 3. Zemp saab olla pos ainult suure valimi korral 4. Ho tagasilükkamiseks peab Femp plema negatiivne 5. ei ükski Aegridade tasandamisel: 1. valitakse momentrea korral kronoloogiline keskmine 2. pika aegrea korral ei kasutata vähimruutude meetodit 3. valitakse tasandusjooneks võimaluse korral alati parabool 4. kasutatakse geomeetrilist keskmist 5. ei ükski ? Aritmeetiline keskmine +-1 standarthälvet hõlmab normaaljaotuse kõvera alusest pindalast 1. 95,45% 2. 99,93% 3. 90% 4. 68,27% Aritmeetiline keskmine t=3 standarthälvet hõlmab normaaljaotuse kõverat... 1. 90% 2. 99,7% 3. 100%
kvantiil järelduste tegemine: kui statistik jääb kahe kriitlise kvantiili vahele, siis võetakse nullhüpotees vastu ja valimid võib lugeda homogeenseks. Aegrida on aja järgi järjestatud valim. Aegridade põhjal mudeli hindamist, sellest järelduste tegemist jms nim aegridade analüüsiks. Aegread tekivad selliste protsesside tulemusena, milles sisalduvad juhuslikud komponendid ja häiringud on ajas kulgevad protsessid. Analüüsi tüüpilisemad osad on: aegrea juhuslikkuse kontroll aegrea silumine trendi- ja võnkekomponentide identifitseerimine/hindamine prognoosimudeli koostamine Valge müra ehk täiesti juhuslik protsess, st jada elemendid on statistiliselt sõltumatud ühtmoodi jaotunud juhuslikud suurused Mitteparameetrilised testid. Mediaankriteeriumi kasutamisel on testimissammud järgmised(olulisuse nivoo 0.05): leitakse aegrea mediaan variatsioonireast
Momentrea liikmete summa on seevastu mõttesisutu. · Eristamine on vajalik keskmiste arvutamisel. Kronoloogilist keskmist saab arvutada momentrea puhul vaid siis kui momendid on fikseeritud võrdsete ajavahemike järel. Kui aga ei ole võrdseid ahavahemikke, siis aritmeetiline keskmine. · Aegridadest ei saa ühtegi üksikut vahepunkti ehk erindit eraldada (välja võtta). · Aegrida koosneb 4 komponendist: tendents, harmooniline komponent, sesoonne komponent, juhuslik komponent. · Aegrea mudelid: aditiivne mudel, multiplikatiivne mudel (trend, sesoonne komponent, tsükliline komponent, irregulaarne komponent). · Aegridade kompleksanalüüsi korral jaotatakse (lammutatakse) aegrida komponentideks. Kaheks komponendiks: seaduspäraselt ehk süsteemselt ja juhuslikult muutuvaks osaks Seaduspärased muutused: trend, sesoonne, tsüklilised muutused. Juhuslik komponent puudub seaduspärasus. Esineb ebavõrdsete ajavahemike järel. Esineb juhuslike sokkidena
Rühmade keskväärtused: Rühmade dispersioonid: Üldkeskmine: Üldine rühmasisene dispersioon: Rühmadevaheline dispersioon: F-statistik: F-statistiku kriitiline väärtus (tabelist): Et hüpotees vastu võetaks peab seega hüpotees võetakse vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks. 9. Käsitledes valimit A aegreana pikkusega , koostada selle aegrea graafik. Kontrollida olulisuse nivoo juures selle aegrea juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. 3 9 4 8 2 1 8 4 4 9 2 9 3 1 3 6 8 9 4 8 9 2 4 7 4 4 0 4 0 4 3 4 5 4 6 6 9 5 8 9 2 8 8 7
F-statistik: 2 s A 54,688 F= 2 = =0 , 014 s 0 3960,7 F-statistiku kriitiline väärtus (tabelist): F kr=F 1−α ( k−1, N−k )=F 0,95 ( 4,20 )=2 , 87 Hüpoteesi vastuvõtmiseks peab F < Fkr: 0,014 < 2,87 Seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks. 9. Käsitleda valimit A aegreana pikkusega N=25, koostada selle aegrea graafik. Kontrollida olulisusenivoo 0,05 juures selle aegrea juhuslikku mediaanikriteeriumit ja käänupunktide kriteeriumi järgi. Andmed- N A Märgirida Käänupunktid 1 19 - 2 89 + k 3 32 - k 4 51 = 5 69 + k 6 30 - k
4 igal ajaperioodil väärtused vähenevad 0,48 korda (mitte korda, vaid ühiku võrra) 5 ei ükski (ÕIGE) Kronoloogilist keskmist kasutatakse momentridade puhul ja võrdse pikkusega vahemikega Eksponentkeskmine 1 kasutatakse keskmise kasvutempo leidmisel (geomeetrilisena, mitu korda keskmiselt) 2 ei arvesta rea kõiki väärtusi (arvestab kindla kaaluga) 3 on alati aritmeetilisest suurem (seaduspärasus puudub) 4 kasutatakse aegrea tasandamisel (ÕIGE) 5 ei ükski Keskmine esindusviga 1 on vale keskmise valiku tulemus (me ei pea alguses valima, millist keskmist kasutame) 2 on väljavõtukeskmiste lineaarhälve (standardhälve) 3 vahe ühe valimi keskmise ja üldkogumi keskmise vahel (see on lihtsalt esindusviga, mitte ühe, vaid kõigi) 4 on ruutjuur valimite keskmiste dispersioonist (ÕIGE) 5 ei ükski Keskmise esindusvea tekkepõhjus? eksponentkeskmist kasutatakse
1. PRGOGNOSTIKA MEETODID a) Faktijärgsed meetodid x Statistilised meetodid o Prognoositav näitaja aegrea alusel: ekstrapolatsioon; paindlikud funktsioonid; autoregressiivsed mudelid; eksponenttasandamine; splain meetod; harmooniliste kaalude võte; Box-Jenkinsi mudelid. o Mitmeteguriline prognoos: regressioonmudel; faktoranalüüsi mudelid; Markovi ahelmudel. x Analoogiameetodid: ajaloolise analoogia meetod, matemaatilise analoogia meetod x Ennetava informatsiooni meetodid: patentmeetod, publikatsioonide meetod b) Eksperthinnangute meetodid: individuaalsed ja kollektiivsed
Eksed e anomaaliad ekslikud katse-v vaatlustulemused, mis tav on eristatavatd õigetest tulemustest, tekib vea-tõrke tõttu katse tegemisel või tulemuse fikseerimisel. Äratundmine: a) statistiline (formaalne) b) mittestatistiline (sisuline) Mann-Whitney test mitteparameetriline meetod, valimi homogeensushüpoteesi kontrolliks. Aegrida ajas kulgevad prots, sisalduvad juh komp ja häiringud Valge müra täiesti juhuslik protsess Aegrea silumine aegrea teisendatud variant, kus juhuslikkuse mõju on vähendatud sel teel, et aegrea element asendatakse tema lähendväärtusega, mille hindamisel võetakse arvesse naaberelemente ning neid keskmistatakse. Libisev keskmine lähendväärtus rea elemendile x leitakse kui lähiselementide keskväärtus. Karp-vurrud diagramm kvantiilid kujutatakse horisontaaljoonega, otsp. Ühendatakse vertikaaljoonega, moodustub karp
- ajaloolise - patcntmeetod analoogia rneetod - pllblikatsioonide - maternaatilisc mectod analoogia mectod Prognoosita v'l1iiitaja M itmelegllriline aegrea aluscl prognoosimine · ekstrapolatsiooll - regressioonmudelid · paindlikud fUllklsioonid - faktoranaliiiisi mudelid · autoregressiivsecll11l1delid - Markovi ahelmudelid · eksponen Has" ndll 111 i ne · hannoonilistc b,t1l1dc vote · splail1-meetod · Box-Jenkins 1I1udclid 1. Prognoosieelne orienteerimine - prognoosimise eesmargi ja lilesannete ning prognoosi liigi maaratlemine
Rühmadevaheline dispersion: (k - 1) i =1 4
s 2 100,9
F = A2 = = 0,1073
F-statistik: s0 940, 6
F-statistiku kriitilise väärtuse leian tabelist: Fkr = F1-(k-1;N-k)=2,87
Selleks, et nullhüpoteesi vastu võtta, peab F
Kokku 224 3994,6 713,52 Üldine rühmasisene dispersioon: Üldkeskmine: Rühmadevaheline dispersioon: F-statistik: F-statistiku kriitiline väärtus (tabelist): Hüpoteesi vastuvõtmiseks peab F < Fkr , antud juhul on 0,22 < 2,87, seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks 9. Käsitledes valimit A aegreana pikkusega N = 25, koostada selle aegrea graafik. Kontrollida olulisuse nivoo = 0.05 juures selle aegrea juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. Lähterida Järjestatud rida Märgirida Käänupunkt 69 1 + 10 1 - k 76 7 + 79 10 +
STATISTILINE ANALÜÜS Kodune töö õppeaines Statistika TES0020 Juhendaja: Dotsent Ako Sauga Tallinn 2010 2 SISUKORD SISSEJUHATUS Käesolevas töös viib autor läbi statistilise analüüsi Eesti kahe suurima linna Tallinna ja Tartu elanikkonna põhjal. Uuritakse nende jaotumist erinevatesse vanusegruppidese aastal 2010, viiakse mõlema põhjal läbi aegrea analüüs, kasutatakse mitmeid kirjeldava statistika meetodeid ning võrreldakse neid omavahel. Antud uuringu eesmärgiks on anda ülevaade Tartu ja Tallinna elanikkonna hetkeseisust, muutustest viimase 20 aasta jooksul ning statistilise prognoosi abil ka lähitulevikust. Kasutatud andmed pärinevad Eesti Statistikaameti kodulehelt. 1. TARTU JA TALLINNA RAHVASTIKU VANUSELINE VÕRDLUS AASTAL 2010 Tartu elanike arv 2010. aastal oli 103 284, mis moodustab 7,71% kogu Eesti rahvastikust
s2A 204,508 F= 2 = =0,265 s 0 772,36 F- statistiku kriitiline väärtus on: F kr=F 1−α ( k−1, N−k )=F 0,95 ( 4 ; 20 )=2,87 Kuna F< F kr ehk 0,265< 2,87 , siis võtan hüpoteesi vastu ja loen keskväärtused hüpoteesi põhjal homogeenseteks. Kusjuures F- statistiku väärtus väga väike võrreldes kriitilise väärtusega, seega homogeenus on tugev. 9. Käsitleda valimit A aegreana pikkusega N=25, koostada selle aegrea graafik. Kontrollida olulisuse nivoo α = 0,05 juures selle aegrea juhuslikkust mediaanikriteeriumi ja käänupunktide kriteeriumi järgi. Aegrea 12 10 8 6 4 2 0 0 5 10 15 20 25 Lähteri Märgiri Käänupunk Järjestat da da tid ud rida 84 - 1 44 - k 1 79 + 7
ajavahemikuga(päev, kuu, aasta..); pideva perioodrea korral summa tähendab sama tunnuse väärtust mingi pikema perioodi jooksul. 58.Aegridade keskmised tasemed – Perioodread: võrdse perioodiga read – tavaline aritmeetiline keskmine; ebavõrdse perioodiga read – kaalutud aritmeetiline keskmine, kaaludeks perioodide pikkused. Momentread: kronoloogiline keskmine. Kui ahelindeksid – geomeetriline keskmine. 59.Aegrea väärtuste muutumist iseloomustavad näitarvud – Absoluutne juurdekasv eelmise elemendi väärtusega võrreldes ehk aheljuurdekasv leitakse valemiga da=yt-y(t-1) [t ja t-1 on allindeksid) ja absoluutne juurdekasv mingi baasiks võetava väärtuse suhtes leitakse valemiga db=yt-y1.. Kasvutempo on nähtus iseloomustava tunnuse vaadeldava momendi ja mingi eelmise momendi väärtuse suhe. Baaskasvutempo leidmiseks valem ib=yt/y1
Fkr = F1-a (k - 1, N - k ) = F0,9 5(4,20)) = 2,87 Et me saaksime hüpoteesi vastu võtta (keskväärtuste homogeensus), siis peab arvutatud Fstatistik olema väiksem kui tabelist võetud Fstatistiku kriitiline väärtus. Nii see ka on ja seega võtame hüpoteesi vastu ja loeme keskväärtused homogeenseteks. 9. Kasitledes valimit A aegreana pikkusega N = 25, koostada selle aegrea graafik. Kontrollida olulisuse nivoo =0.05 juures selle aegrea juhuslikkust mediaankriteeriumi ja kaanupunktide kriteeriumi jargi. Järjest Lähterid Märgirid Käänupunkti atud a a d rida 37 - 9 54 - 15 94 + K 18 32 - K 19
Olulisuse nivoo on = 0,05 Üldkeskmise leidmine Üldine rühmasisene dispersioon Rühmadevaheline dispersioon =126,528 F- statistiku kriitiline väärtus on: Kuna , siis võtan hüpoteesi vastu ja loen keskväärtused hüpoteesi põhjal homogeenseteks. Kusjuures F- statistiku väärtus tuli väga väike võrreldes kriitilise väärtusega, seega homogeenus on tugev. 9. Küsimus Käsitledes valimit A aegreana pikkusega N = 25, koostada selle aegrea graafik. Kontrollida olulisuse nivoo = 0.05 juures selle aegrea juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. Lähterid Märgirid Käänupunkti Järjestatud a a d rida 16 - 1 35 - 1 38 - 7 49 + K 10 51 + 15
=¿ 151,28 F-statistik: 2 s 151,28 F= A2 = =0,128 s 0 1183,9 F- statistiku kriitiline väärtus on: F kr=F 1−α ( k−1, N−k )=F 0,95 ( 4 ; 20 )=2,87 Hüpoteesi vastuvõtmiseks peab F < Fkr , seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks. 9. Käsitledes valimit A aegreana pikkusega N = 25, koostada selle aegrea graafik. Kontrollida olulisuse nivoo α = 0.05 juures selle aegrea juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. Variatsioonir Tavarid Käänupun ida a Märgirida ktid 2 98 + 4 47 + K 7 99 + K 8 4 - K 9 18 - 13 45 + K
d. ettevõtete arv äriregistris momentrida 2. Vali, milline allpool toodud suurustest on varusuurus ja milline voosuurus. a. sissetulek voosuurus, b. summa pangakontol varusuurus, c. valitsuskulud voosuurus, d. ettevõtte töötajate arv varusuurus 3. Milline keskmine on momentrea andmetel leitud aritmeetiliste keskmiste aritmeetiline keskmine? kronoloogiline keskmine. 4. Absoluutne juurdekasv aegrea eelmise elemendiga võrreldes on sama, mis aheljuurdekasv. 5. Sea vastavusse kasvutempod (vasakul) ja juurdekasvutempod (paremal) a. 1,05 5%, b. 0,7 -30%, c. 2,5 150%, d. 1,5 50% 6. Diagrammil on toodud suuruse X absoluutne aheljuurdekasv. Millal jäi suurus X eelmise kuuga võrreldes samaks? juuli, oktoober. 7. Diagrammil on toodud suuruse X absoluutne alusjuurdekasv, baasaastaks on võetud aasta 2006.
ebavõrdse perioodiga read – kaalutud aritmeetiline keskmine, kaaludeks perioodide pikkused. Momentread – kronoloogiline keskmine. Kui ahelindeksid – geomeetriline keskmine. 22) Libiseva keskmise meetod – leitakse tunnuse iga väärtuse ja tema naaberväärtuste aritmeetiline keskmine. 4 Eksponentsiaalne tasandamine – lühemate ja stabiilsemate aegridade korral. Ei kaota aegrea algusest ja lõpust informatsiooni ära. 23) Aegrea dekompositsioon Trend – püsiv arengutendents uuritaval perioodil. Sesoonne komponent – iseloomustab perioodilist lühemaajalist komponenti (kuu, kvartal). Tsükliline komponent – pikaajalised lainetaolised võnkumised. Juhuslik – juhuslikud kõrvalekalded üldtendentsist. 5
0 0 39700 0 1 39496 0 0 39700 Teist järku parabool sobib niisuguste aegridade tasandamiseks, kus rea tasemed kasvavad (vähenevad) teatud piirini ning seejärel hakkavad aja kulgedes vähenema (kasvama). · Parameetrite a0, a1 ja a2 normaalvõrrandite süsteem: · Leiame parabooli parameetrite a0, a1 ja a2 hinnangud normaalvõrrandite süsteemist Interpoleerimine aegrea puuduvate elementide arvväärtuste leidmine Ekstrapoleerimine trendi retrospektiivne ja/või perspektiivne leidmine n ( y^ t - y)2 D=R = 2 i =1 n (y t - y)2 i =1 Statistiline prognoosimine ja terve hulk lihtsamaid prognoosimudeleid tugineb senise arengutrendi kindlaksmääramisel ja selle ekstrapoleerimisele tulevikku Aproksimeerimisviga -
Kokku 259 4951,3 688,16 Üldine rühmasisene dispersioon: Üldkeskmine: Rühmadevaheline dispersioon: F-statistik: F-statistiku kriitiline väärtus (tabelist): Hüpoteesi vastuvõtmiseks peab F < Fkr , antud juhul on 0,17 < 2,87 Seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks 9. Käsitledes valimit A aegreana pikkusega N = 25, koostada selle aegrea graafik. Kontrollida olulisuse nivoo α = 0.05 juures selle aegrea juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. Lähterida Järjestatud rida Märgirida Käänupunkt 1 1 - 2 2 - 17 2 - 81 14 +
Koguhajuvuse vabadusastmete arv on n-1. Gruppidevahelise hajuvuse vabadusastmete arv on k-1 Grupisisese hajuvuse vabadusastmete arv on n-k Analüüsi on kaasatud k gruppi, vaatluste arv on n. Kui dispersioonid erinevad, siis tuleb uurida, millistes gruppides. Selleks tehakse post hoc test(ANOVA- Bonferroni test). Tärnikesega on need, kus sig on alla 0,05- oluline erinevus. AEGRIDADRE ANALÜÜS Aegrida nähtuste ajalist muutumist iseloomustav arvandmete rida Aegrea elemendid nähtust iseloomustava tunnuse arvväärtused ning neile vastavad teatud ajamomendid või perioodid Momentrida aegrida, mille iga element on seotud teatud ajamomendiga Perioodrida aegrida, mille iga element on seotud mingi ajavahemikuga, perioodiga Analüüsitakse: absoluutne juurdekasv(aheljuurdekasv on aritmeetilise keskmisega- võrreldes eelmisega; alusjuurdekasv- võrreldes esimesega); kasvutempo(ahelkasvutempo(geom. keskmine)- uus jagatud
56 + K 63 71 + 65 83 + K 71 50 + 74 27 - K 77 46 + K 83 1 - K 89 89 + 98 Seeriate arv Ns = 12, pikima seeria pikkus = 6, käänupunkte p =15. Käänupunktide graafik Aegrea mediaankriteeriumi võib lugeda juhuslikuks, kui võrratused kehtivad võrratused: --- --- Ns= 12 --- p = 15 Kuna kõik võrratused kehtivad, võib aegrea mediaankriteeriumi järgi ja käänupunktide kriteeriumi järgi lugeda juhuslikuks. Osa B Andmed: B1 xi 1,2 2,9 1,9 4,9 4,3 yi 7,9 9,9 7,7 20,3 14,1 B2 4,7 5,5 7,4 3,1 4,9 4,4 3,7 10
17 Fkr = F1-α (k-1, N-k) = F0,95 (4;20) = 2,87 Fkr : nii see on (0,17 < 2,87). eskväärtused loetakse hüpoteesi põhjal homogeenseteks Käänupunkt Pikim seeria Lmax = 3 Seeriate arv Ns = 14 Lmax < 3,3(log N+1) ja Ns > 0,5(N+1-1,96√(N-1)) Kuna mõlemad võrratused kehtivad, siis võib aegrea mediaankr. järgi luge k Käänupunktide arv p = 15 p > (2(N-2) - 1,96√(1,6N-2,9))/3 k Võrratus kehtib ning aegrea käänupunktide järgi võib lugeda juhuslikuks k k k k k k k k k k k k k Jrk. nr Järj. rida Empiiriline Ühtlane 1 1 0.04 0.01 2 2 0.08 0.02 3 2 0.12 0.02
regressioonmudeli hindamisel saadud aruanne, tunnused on statistiliselt olulised x1 x2 x3 x4 regressioonmudelis olevate sõltumatute tunnuste omavaheline korrelatsioon, heteroskedastiivsus, multikollineaarsus Test 11 momentrida, perioodrida, voosuurus, vaosuurus momentrida, kronoloogiline keskmine alusjuurdekasv, aheljuurdekasv, alusjuurdekasvutempo, aheljuurdekasvutempo, juurdekasvutempo, kasvutempo absoluutne aheljuurdekasv absoluutne alusjuurdekasv, aegrea silutud väärtus eksponentsilumine aditiivne mudel, trendi mudel, keskmine sesoonne komponent, prognoositav väärtus silumiskonstant, prognoositav väärtus, multiplikatiivne mudel libisev keskmine sesoonne komponent multiplikatiivne mudel, sesoonne muutus, tsükliline muutus perioodiliselt ümber trendi perioodiga adaptiivne prognoosimine, operatiivne, lühiajaline, keskmise pikkusega prognoos
Ettevõtete arv u Keskmine tootlikkus u Aij on ettevõtete arv i-ndas osakogumis ja netokäibe j-ndas intervallirühmas Bij on tootlikkuse tase i-ndas osakogumis ja netokäibe j-ndas intervallirühmas Probleemiks võib olla kogumite piisav suurus ja millised tunnused võtta muutujateks. Analüütilist rühmitamist saab teha ka aegrea baasil dünaamilises muutuses. Benchmarking analüüs Pidev mõõtmine võrdluse kaudu. Kõige olulisemate parandamist vajavate valdkondade väljaselgitamine. Kaks varianti: x üks integraalne (ehk sünteetiline) näitaja x mitmemõõtmeline võrdlev analüüs o "kohtade summa" meetod (äripäeva top) o geomeetriline keskmine o kauguste meetod: igal näitajal võib olla oma kaal. I etapp. Näitajate süsteemi määratlemine
62 + k 54 K22nupunktide arv= 16 41 - k 54 81 + 62 11,3539 54 + k 69 49 - k 81 16>11.35 54 + k 85 Kuna kõik võrratused kehtivad, võib aegrea 15 - k 87 mediaankriteeriumi järgi ja käänupunktide krite lugeda juhuslikuks. 94 + 88 85 + k 89 43 - k 94 87 + 94 16 kehtivad, võib aegrea
Ns= 12 12 > 0,5 (25 +1-1,96 √(25−1) ) 12 > 8,20 ; seega teine võrratus kehtib ning mediaanikriteeriumi kohaselt saab antud aegrida juhuslikuks lugeda. Kontrollin käänupunktide kriteeriumi: Leidsin Exceli programmiga käänupunktide arvu: p = 16 1,6 N−2,9 p > (2 (N-2) – 1,96 √ ¿ ¿/3 ¿ 1,6∗25−2,9 16 > (2 (25-2) – 1,96 √ ¿ ¿/3 ¿ 16 > 11,35 ; seega käänupunktide võrratus kehtib ning aegrea saab käänupunktide kriteeriumi kohaselt juhuslikuks lugeda. OSA B 10. x ja y seose korrelatsioonitegur ja determinatsioonitegur. x ja y korreleerimatus t- statistiku ja z-statistiku abil, võttes olulisuse nivooks α = 0.05. Yi- ´y (Yi- y´ )2 (Xi- x̅ )*(Yi- y´ ) i Xi Yi Xi- x̅ (Xi- x̅ )2 XiYi
ga (valemis teatud väärtused taandusid). Rühmadevahelise dispersiooni s A2 leidmiseks liitsin kokku iga rühma keskmise ja üldkeskmise vahe ruudud ning jagasin (k-1)-ga, kus k=5. F-statistik avaldub rühmadevahelise ja rühmasisese dispersiooni suhtena. Kuna FF1-(f1, f2), kus f1=k-1, f2=N-k, siis H0 võetakse vastu, st sisendfaktori mõju väljunditele on mitteoluline. 9. Aegrea juhuslikkuse kontrollimiseks mediaanikriteeriumi järgi olulisuse nivool =0,05 leidsin aegrea variatsioonreast mediaani xmed=38, moodustasin selle põhjal märgirea ja leidsin nii moodustunud seeriate arvu Ns, pikima seeria pikkuse Lmax. Otsuse juhuslikkuse olemasolu kohta saab vastu võtta, kui L max3,3(logN+1) ja N s >0,5 (N +1-1,96 N-1) , kus N=25 ning need võrratused kehtivad, seega
n, siis võib leida t ja selle kaudu määrata tabeli abil vastava tõenäosuse. 23. Vajaliku valimi koguse arvutus kordumistega ja kordumisteta juhuväljavõtul Kodumistega väljavõtul : μ=√δ2/n Kordumisteta: μ =√p(1-p)/n 24. Aegridade mõiste ja liigitus Aegreaks nimetatakse nähtuste ajalist muutumist iseloomustavate arvandmete rida. Aegrea elemendid on nähtust iseloomustava tunuse arvväärtused ja neile vastavad ajamomendid või ajaperioodid. Aegread liigitatakse : 1) momentread- aegrida, mille iga element on seotud teatud ajamomendiga (kuupäev, mingi aasta algus,-lõpp). Momentrea oluliseks iseärasuseks on see, et nähtust iseloomustava tunuse arvväärtuste summal ei ole reaalset sisu. Nii näiteks ei ole mõtet liita rahvaarve aastate alguses.
lähenemisviis- Objekti juhtimisviise ei saa ette määrata. Sobiv meetod valitakse lähtudes 3.2.Prognoosimise meetodid Kvantitatiivsed: Faktijärgsed meetodid: *statistilised: - *hindade tase, hinnad. konkreetsest situatsioonist, mis erinevad sisu poolest ( tehnilised, majanduslikud, prognoositava näitaja aegrea alusel:ekstrapolatsioon, paindlikud funktsioonid, 5.2Kaubavarud ja ettevõtte käive Kaubandusettevõtte jaoks on kaubavarud suurimaks poliitilised, psühholoogilised jt), kestuse poolest( streteegilised, taktikalised, operatiivsed), autoregressiivsed mudelid(autoregressioon-arvestab inertsust), eksponenttasandamine, investeeringuks ja aktivaks bilansis. Kaubavarud kuuluvad käibevara hulka ja neil on
Question 5 Hinded: 1 Kui n on kõigi katsetulemuste arv ja p klassikaline tõenäosus, siis soodsate katsetulemuste arv m leitakse järgmiselt Vali üks vastus. a. m = p / n b. m = n× p c. m = n / p Õige Selle esituse hinded: 1/1. Question 6 Hinded: 1 Sisenejate loendamine kaupluse ukse juures ja tulemuste ülesmärkimine on Vali üks vastus. a. otsene vaatlus b. eksperiment c. sekundaarne vaatlus Õige Selle esituse hinded: 1/1. Question 7 Hinded: 1 Aegrea kompleksanalüüsil kasutati multiplikatiivset mudelit. Teatud ajaperioodil on trendi väärtus 23 ja keskmine sesoonne komponent 2,5. Uuritava suuruse väärtus on siis sellel ajaperioodil Vali üks vastus. a. 25,5 b. 57,5 c. 9,2 Vale Selle esituse hinded: 0/1. Question 8 Hinded: 1 Nominaalskaala korral Vali üks vastus. a. saab leida mediaani b. saab leida moodi c. saab leida geomeetrilist keskmist Vale Selle esituse hinded: 0/1. Question 9 Hinded: 1
m leitakse järgmiselt Vali üks vastus. a. m = p / n b. m = n× p c. m = n / p Õige Selle esituse hinded: 1/1. Question 6 Hinded: 1 Sisenejate loendamine kaupluse ukse juures ja tulemuste ülesmärkimine on Vali üks vastus. a. otsene vaatlus b. eksperiment c. sekundaarne vaatlus Õige Selle esituse hinded: 1/1. Question 7 Hinded: 1 Aegrea kompleksanalüüsil kasutati multiplikatiivset mudelit. Teatud ajaperioodil on trendi väärtus 23 ja keskmine sesoonne komponent 2,5. Uuritava suuruse väärtus on siis sellel ajaperioodil Vali üks vastus. a. 25,5 b. 57,5 c. 9,2 Vale Selle esituse hinded: 0/1. Question 8 Hinded: 1 Nominaalskaala korral Vali üks vastus. a. saab leida mediaani b. saab leida moodi c
standardvigade hinnangud (heteroskedasticity-consistent standard errors, robust standard errors) ehk kohandatud standardvead on suuremad, arvestavad võimalikku heteroskedastiivust. Kohandatud standardvead EI KAOTA heteroskedastiivsust · Nad võtavad heteroskedastiivsust arvesse. Nende arvutamisel kasutatakse teistsugust metoodikat kui tavaliste standardvigade korral 45. Mis on autokorrelatsioon? 3. eeldus Cov(ui , uj )=0, jääkliikmete autokorrelatsiooni puudumine. Aegrea autokorrelatsioon on perioodil t esineva aegrea väärtuse sõltuvus varasemate perioodide väärtustest. 46. Durbin-Watsoni statistiku väärtuste interpreteerimine. 47. Durbin-Watsoni statistiku testimine: nullhüpotees ja sisukas hüpotees. Positiivse autokorrelatsiooni testimine 1. Hüpoteesipaari püstitamine. Nullhüpotees H0 : positiivne autokorrelatsioon puudub. Sisukas hüpotees H1 : positiivne autokorrelatsioon eksisteerib. 2
kogumaksumus ei tule oluliselt suurem tavahoonest. Kontseptsioon arenes välja tänu mitmele uurimisprojektile, mida rahastas Saksamaa Hesseni liidumaa. Esimene passiivmaja oli nelja korteriga ridaelamu Darmstadtis Saksamaal. Selle tellisid eraisikud professorite Butti, Ridderi ja Westermeyeri arhitektuurifirmalt 1990. aastal ja juba järgmisel aastal kolisid elanikud sisse. Hoone on andnud tänaseks üle 20-aastase aegrea praktilise kasutuse andmetest. See on olnud aluseks PHPP tarkvara pidevale edasiarendamisele ja valideerimisele. 4 2. KRITEERIUMID Passiivmaja on hoone, mis vastab kõigile järgnevatele kriteeriumitele (kasulik põrandapind, inglise keeles TFA - treated floor area, mille kohta energiavajadus esitatakse, on passiivmaja meetodi puhul defineeritud mõiste.
Majandusteaduskond Rahvamajanduse instituut Statistika ja ökonomeetria õppetool Tiina Vaht Abortide arv Eestis 1970-2008 Juhendaja: prof. Ako Sauga Tallinn 2010 1. Sissejuhatus Kodutöö tegemisel kasutasin Eesti Statsitikaameti kodulehelt saadud andmeid. Valimis on abortide arv Eestis 1970. aastast kuni 2008. aastani. Valimi kirjeldamiseks kasutasin keskmisi ja variatsiooninäitarve ning aegrea analüüsi, mille käigus leiti vajalikud juurdekasvud ja kasvutempod. Samuti viisin läbi erinevad silumised ning koostasin nendele vastavad diagrammid. Käesoleva töö eesmärgiks on lähtuvalt uurimisülesandest kogutud statistilist materjali töödelda ja analüüsida (tabel 1 ja joonis 1). Töö käigus püüan kirjeldada ja analüüsida valimit ning seletada valimis toimunud muutusi ja tendentse. Tabel 1. Aasta Abortide arv 1970 40663 1971 42256 1972 42309
15 - k 94 96 + k 95 4 - k 96 87 + k 98 Seeriate ( märgirea osad, mis koosnevad järjestikustest ,,+" või ,,-" märkidest) arv: Ns = 10 Pikima seeria pikkuse järgi (Lmax = 2) => H0 2=Lmax<3.3(log25+1)7,9 Seeriate arvu järgi ( Ns = 14 ) => H0 Käänupunktide arvu järgi (p = 20) => H0 Kuna kõik võrratused kehtivad, võib aegrea mediaankriteeriumi järgi ja käänupunktide kriteeriumi järgi lugeda juhuslikuks. Osa B Andmed: paarisvalim (xj,yj) mahuga 2x5 arvu (valim B1, N = 5), pluss korduskatsete sari dispersiooni määramiseks mahuga 7 arvu (valim B2, w = 7). 10. Leida ühefaktoriline lineaarne regressioonimudel y = b0 + b1 x ja analüüsida selle täpsust (võttes vastavates testides jm arvutustes olulisuse nivooks a = 0.05): 10.1 leida mudeli parameetrite hinnangud b0 ja b1
s2A = 244,52 s A2 Leiame F-statistiku: F = 2 = 0,4031 s0 f1 = k (rühmade arv) 1 = 3 1 = 2 f2 = N k = 25 3 = 22 Fkr = F1-(f1, f2) = F0,95(2, 22) = 3,43 Kuna FN < Fkr, siis võtame nullhüpoteesi vastu. 9. Käsitledes valimit A aegreana pikkusega N = 25, kontrollida olulisuse nivoo = 0,05 juures selle juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. Kontrollin aegrea juhuslikust olulisuse nivoo = 0,05 juures. Kuna punktis 1. on juba rida ümberjärjestatud mediaani leidmiseks, siis pole siin ümberjärjestust vaja teha ning mediaaniks on 51. Teen lähterea, märgirea ja käänupunktide tabeli: 7 4 5 1 5 2 2 3 5 5 8 3 5 8 3 6 5 9 1 1 7 5 1 3 6 7 6 9 9 4 3 4 3 1 0 6 4 4 3 9 5 2 1 2 5 1 5
15 - k 94 96 + k 95 4 - k 96 87 + k 98 Seeriate ( märgirea osad, mis koosnevad järjestikustest ,,+" või ,,-" märkidest) arv: Ns = 10 Pikima seeria pikkuse järgi (Lmax = 2) => H0 2=Lmax<3.3(log25+1)7,9 Seeriate arvu järgi ( Ns = 14 ) => H0 Käänupunktide arvu järgi (p = 20) => H0 Kuna kõik võrratused kehtivad, võib aegrea mediaankriteeriumi järgi ja käänupunktide kriteeriumi järgi lugeda juhuslikuks. Osa B Andmed: paarisvalim (xj,yj) mahuga 2x5 arvu (valim B1, N = 5), pluss korduskatsete sari dispersiooni määramiseks mahuga 7 arvu (valim B2, w = 7). 10. Leida ühefaktoriline lineaarne regressioonimudel y = b0 + b1 x ja analüüsida selle täpsust (võttes vastavates testides jm arvutustes olulisuse nivooks a = 0.05): 10.1 leida mudeli parameetrite hinnangud b0 ja b1
E. koostamine ja juhtimine toimub laekumiste ja väljamaksete baasil. TEKKEPÕHINE E.- Tulud, kulud ja invest planeeritakse per, mil nad peaksid tekkima sõltumata sellest, millal nende eest raha laekus/tasuti; sis ka kulud, millega ei kaasne rah väljaminekuid. TOOTEPÕHINE EELARVEST-arvestatakse kulud-tulud iga toote jaoks. E koostatakse lähtuvalt tooteplaanist. PER EELARVEST-staatiline mudel. Jätkuv eelarvest- dünaamiline, orgaaniline mudel. KULUPÕHISE E. e AEGREA MEETOD- vanim. Alus: eelmiste a vastava artikli kulud, tuleva a makoökonoomilise arengu indikaatorid, hinnamuutused, palganõudmised. SKP DEFLAATOR- kajastub kodumaine toodang. Hinnataseme muutus. Jooksva per kaubakogust kasutatakse. Deflaator on hinnaindeks, mõõdab hindade muutmise tempot e inflatsiooni. jagada tuleb sama aasta nom ja reaalne SKP Kulupõhise eelarve põhijooned. Ressursid jagatakse iga kuluobj maksumusele. Kuluobj liigitatakse iseloomu järgi
6 > 8,20 ; seega teine võrratus ei kehti ning mediaanikriteeriumi kohaselt ei saa antud aegrida juhuslikuks lugeda. Kontrollin käänupunktide kriteeriumi: Xxxxx xxxxx xxxx Leidsin Exceli programmiga käänupunktide arvu: p = 16 p > (2 (N-2) 1,96 16 > (2 (25-2) 1,96 16 > 11,35 ; seega käänupunktide võrratus kehtib ning aegrea saab käänupunktide kriteeriumi kohaselt juhuslikuks lugeda. Xxxxx xxxxx xxxx Osa B 10. x ja y seose korrelatsioonitegur ja determinatsioonitegur. x ja y korreleerimatus t- statistiku ja z-statistiku abil, võttes olulisuse nivooks = 0.05.
75 + 96 79 + 99 Seeriate ( märgirea osad, mis koosnevad järjestikustest ,,+" või ,,-" märkidest) arv: Ns = 15 Pikima seeria pikkuse järgi (Lmax = 3) => H0 3=Lmax<3.3(log25+1)7,9 Seeriate arvu järgi ( Ns = 15 ) => H0 Käänupunktide arvu järgi (p = 15) => H0 (2(N - 2) 1,96 (1,6 N - 2,9) ) / 3 11 Kuna kõik võrratused kehtivad, võib aegrea mediaankriteeriumi järgi ja käänupunktide kriteeriumi järgi lugeda juhuslikuks. Osa B 10. Leida x ja y seose jaoks korrelatsioonitegur ja determinatsioonitegur. Kontrollida t- statistiku ja z-statistiku abil, olulisuse nivoo = 0,05. (x- (y- x- y- xkesk)^ ykesk)^ (x-xkesk)(y- i x y xkesk ykesk 2 2 ykesk)
85 + K 91 69 - K 95 82 + k 96 39 - 96 Seeriate ( märgirea osad, mis koosnevad järjestikustest ,,+" või ,,-" märkidest) arv: Ns = 14 Pikima seeria pikkuse järgi (Lmax = 3) => H0 Seeriate arvu järgi ( Ns = 14 ) => H0 Käänupunktide arvu järgi (p = 17) => H0 Kuna kõik võrratused kehtivad, võib aegrea mediaankriteeriumi järgi ja käänupunktide kriteeriumi järgi lugeda juhuslikuks. Osa B 10. Leida x ja y seose jaoks korrelatsioonitegur ja determinatsioonitegur. Kontrollida x ja y korreleerimatust t-statistiku ja z-statistiku abil, võttes olulisuse nivooks a = 0.05. (t-statistik on 3,1824 ja z-statisik on 1,9602) i xi yi x-xkesk y-ykesk (x- (y- (x-xkesk)(y-ykesk) xi*yi xkesk)2 ykesk)2
Nt kõhulahtisus vastsündinud põrsastel. 8. Sporaadilise haiguse mõiste ja haiguse sporaadilisuse põhjused. Sporaadilise esinemise korral tekivad üksikud haigusjuhud ebaregulaarselt, sageli pikema ajavahemiku järel. Haigusjuhud ei tundu olevat seotud üksteisega aga ka seldelt määratlevate riskiteguritega. Nt aktinomükoos veisekarjas. 9. Sesoonsed, tsüklilised ja sekulaarsed. trendid - mõisted ja näited. Trend näitab statistilise aegrea muutuse põhisuunda. Haigestumisel on 4 liiki ajalisi trende: Lühiajalised epideemiad Sesoonsed trended Tsüklised trended Pikaajalised trended (sekulaarsed) 10.Ajaliste trendide hindamise meetodid ja vea allikad ajalistes trendides. Ajaliste trendide määramise meetodid: Aegrea graafiku hindamine "silmamuna" testiga (Võib, aga on ka paremaid mooduseid) Liikuv keskmine Andmete eksponentsiaal-silumine Regressioonanalüüs