STATISTIKA
KESKMISED - Kogumit ühe arvuga iseloomustavad üldistavad näitarvud, mis edastavad informatsiooni kogumisse kuuluva tunnuse väärtuste taseme kohta.
- Mahukeskmised sõltuvad statistilise rea mahust. Rea maht ei ole otseselt rea liikmete arv. Ritta kuuluvate elementide väärtuste summa. Reageerivad igale muutusele, väga tundlikud. Mahukeskmised: aritmeetiline keskmine, harmooniline keskmine, geomeetriline keskmine, ruutkeskmine ja teised astmekeskmised, kronoloogiline keskmine.
- Asendi ehk struktuurikeskmised kuuluvad keskmised mis ei reageeri igale muutusele elementide väärtuste osas. Oluline on struktuur. Asendi ehk struktuurikeskmised: mood, mediaan, kvartiilid, pentiilid, sekstiilid, oktiilid (teoorias), detsiilid protsentiilid.
- Harmooniline keskmine on mitmese tähendusega. Sõltuvalt andmete iseloomust võib ta tähendada kas mingi suuruse aritmeetilise keskmise leidmist kaudselt antud andmete abil... Teiseks võib harmooniline keskmine tähendada lihtsalt samade andmete sama majandusnähtust iseloomustavat teist keskmist. Aritmeetilist keskmist kasutame me hästi sageli eelkõige tema interpreteeritavuse mugavuse pärast. Siiski on olukordi, kus ka harmoonilisel keskmisel on selge majanduslik tähendus.
- Ruutkeskmisi kasutatakse statistilise rea varieeruvuse üldistavaks iseloomustamiseks.
- Geomeetrilist keskmist kasutatakse majandusstatistikas kõige sagedamini aegridade uurimisel keskmiste kasvutempode leidmiseks, kuid teda on kasutatud ka hinnataseme muutusi kirjeldavate börsiindeksite konstrueerimiseks. Geomeetrilist keskmist leida ei ole üldjuhul võimalik, kui mõned rea liikmed on hulgas negatiivsed.
- ÜL. Midagi liigub punktist A punkti B, vahemaa 100 km. Läbib edasi ja tagasi. Minnes 60 km/h, tagasi 120 km/h. Leidke keskmine kiirus punktist A punkti B ja tagasi.
Kiirus= teepikkus /aegKeskmine kiirus= teepikkuste summa/aegade summaAeg=teepikkus/kiirusAeg1=100/60=1,6
Aeg2=100/120=0,833
Kokku kulus aega 2,5 h
Keskmine kiirus= (100+100 (teepikkuste summa))
/(1/60*100)+(1/120*100) ehk esimese etapiaeg ja teise etapi aeg = 80
km/h
Seega õige oli valida harmooniline keskmine kuna aritmeetiline
keskmine oleks olnud: 60+120/2=90 km/h
- Mood ehk dominant (domineeriv e kõige sagedasem näitaja). Intervallrea moodi hinnatakse graafiliselt. Mood sobib ka järje- ja nimeskaalas mõõdetud tunnuste iseloomustamiseks. Juhul kui rea liikmete arv on suur, tuleks rida enne moodi leidmist korrastada ning leida variantide esinemissagedused.
- Mediaan ehk keskliige (reas keskel asuv). Eeldab korrastatud rida.
Mediaani kasutatakse juhul , kui aritmeetilist keskmist leida ei ole
võimalik. Tugevalt ebasümmeetrilise rea korral on ta tüüpilisem
kui aritmeetiline keskmine.
Kui reas on paaritu arv liikmeid, siis võrdub mediaan järjestatud
rea asendilt keskmise
liikmega , mistõttu moodi
nimetatakse ka rea
keskliikmeks. Kui reas on paarisarv liikmeid, siis leitakse ta
järjestuses kahe keskmise liikme aritmeetilise keskmisena, mistõttu
mediaan ei pruugi võrduda ühegi rea liikmega.
- Kvartiil 4 võrdset osa ( xmin , q1, q2 ehk mediaan, q3 ja xmax), pentiil 5 võrdset osa, sekstiil 6 võrdset osa, detsiil 10 võrdset osa, protsentiil 100 võrdset osa.
- Momentideks nimetatakse rea liikmete väärtuste ja mingi arvu vaheliste hälvete astendamisel saadud arvude aritmeetilisi keskmisi. Arvu, millega momendi leidmisel hälbeid astendatakse, nimetatakse momendi järguks.
VARIATSIOONINÄITARVUD - Variatsiooniamplituud (R= Xmax-Xmin)näitab äärmuste vahet. Äärmusi kirjeldab, ei kirjelda seda mis on kogumi sees. Väheväärtuslik, infot pea ei olegi.
- Absoluutsed variatsiooninäitarvud: variatsiooniamplituud, keskmine lineaarhälve, dispersioon ja standardhälve, kvartiilhälve.
Absoluutsete variatsiooninäitarvude suurus sõltub variantide
absoluutväärtustest, mis muudab nad erinevate ridade võrdlemisel
raskesti kasutatavateks. Teiseks probleemiks absoluutsete
varieeruvusnäitarvude
kasutamisel on ühik. Neil on mõõdetava
suurusega sama ühik, mis muudab võimatuks erinevate ühikutega
suuruste hajuvuse võrdlemise.
- Keskmine lineaarhälve (d katusega ) ehk keskmine absoluuthälve. Hälve ehk erinevus. Kokkuvõtlikult on lineaarhälve erinevuste keskmine.
Keskmise lineaarhälbe
eeliseks on tema lihtne interpreteeritavus.
Probleemiks on absoluutväärtuse kasutamine arvutustes, mis muudab
keskmise lineaarhälbe matemaatiliste operatsioonide jaoks
ebamugavaks.
- Dispersioon σ2 ehk hajuvus ehk hälvete ruutude keskmine (keskmine ruuthälve). Dispersiooniks nimetatakse variantide väärtuste ja aritmeetilise keskmise erinevuste ruutude (ruuthälvete) aritmeetilist keskmist.
- Standardhälve σ ehk hälvete keskmine on leitud ruutkeskmise abil. Standardhälve ehk ruutkeskmine hälve on ruutjuur dispersioonist. Standardhälve on seotud tõenäosusteooria rakendustega, lineaarhälve ei ole. Standardhälve ON ALATI varieeruvas kogumis keskmisest lineaarhälbest suurem. Normaaljaotuse üks parameetritest on standardhälve σ ehk sigma . Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe.
NORMAALJAOTUS - Jaotuse püstakuse ehk ekstessi mõõtmisel tuginetakse neljandat järku normeeritud momendile ning jaotust võrreldakse normaaljaotusega (selle neljandat järku normeeritud moment on 3).
- Normaaljaotus kirjeldab tunnust, mille käitumine on normaalne. Normaaljaotus on piirjaotus, millele lähenevad paljud teised jaotused .
- Normaaljaotuse üks parameetritest on standardhälve σ ehk sigma.
- Normaaljaotuse omadused: * normaaljaotus on pidev jaotus *normaaljaotus on täielikult kirjeldatav kahe parameetriga: keskväärtusega μ ja dispersiooniga σ2 *normaaljaotusele vastav kõver on sümmeetriline keskväärtuse μ suhtes * normaaljaotuse keskväärtus, mood ja mediaan ühtivad.
- Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe!!!
- Mediaan jaotab normaaljaotuse tagurpidi U kaheks osaks. Artitmeetiline keskmine on samas kohas kus mediaan kuna äärmused on normaaljaotusel võrdsed. Mood on samuti keskel ehk seal kus mediaan ja aritmeetiline keskmine kuna kõige suurem sagedus on seal (tipp). Aritmeetiline keskmine = Mood = Mediaan.
- Normaaljaotuse puhul on tegu sümeetriaga.
NÄHTUSTEVAHELISED SEOSED - Seoste analüüsil baseerub ökonomeetria (majanduse mõõtmine).
- Seaduspärasuse jaoks peab seos esinema püsivalt ja korduvalt.
- Põhjuslik ehk kausaalne seos. Põhjusnähtus peab esile kutsuma tagajärgnähtuse. P→T Põhjuslik tagajärgseos. Põhjusnähtus on tagajärgnähtuse esilekutsumiseks ühtaegu piisav ja tarvilik. Mõju → seos üldises mõistes. Mõju on mõlemasuunaline! Põhjuslik seos on alati mingi suunaga, sama ei kehti seoste kohta üldiselt.
- Statistiline seos ehk stohhastiline korrelatiivne, mittetäielik seos. Statistilise (stohhastilise) sõltuvusega on tegemist, kui ühe tunnuse Y tõenäosusjaotus (täpsemalt tinglik jaotus) sõltub teise tunnuse X väärtustest. Selle alusel jaotuvad tunnusepaarid statistiliselt sõltuvateks ja statistiliselt sõltumatuteks.
Statistilise
sõltuvuse iseloom sõltub vaadeldud tunnustest. Eriline tähtsus on regressioonsõltuvusel. Sellisel juhul esitatakse sõltuv (juhuslik)
suurus Y
regressioonifunktsioonina
juhusliku suuruse X järgi, mille väärtused võrduvad sõltuva
suuruse Y (tingliku tõenäosusjaotuse) keskväärtustega.
Regressioonifunktsioon seab igale sõltumatu suuruse X väärtusele
vastavusse sõltuva suuruse Y keskväärtuse sellel kohal.
- Funktsionaalne seos: kui on üks hind, siis talle vastab 1 konkreetne kogus. Funktsionaalne seos on kokkuvõte. Seoseid ei vaadata eraldi. Funktsionaalne seos on esitatav funktsioonina , mis seab sõltumatute tunnuste väärtustele vastavusse üheselt määratud sõltuva tunnuse väärtused (mida mitmeste funktsioonide korral võib sõltumatu tunnuse ühele väärtusele vastata mitu).
- Seose suund saab olla + või -, kasvav või kahanev, samasuunaline või vastassuunaline. Graafiliselt kuju lineaarne või mittelineaarne.
Seose
suund annab
sõltuva tunnuse väärtuse (y) muutuse, mis on tingitud sõltumatu
tunnuse väärtuse(x) muutusest. Tegemist võib olla
kasvava
seosega,
kui sõltuv tunnus reageerib sõltumatu tunnuse väärtuse
suurenemisele väärtuse kasvuga,
konstantse
seosega,
kui sõltuva tunnuse väärtus ei muutu sõltumatu tunnuse väärtuse
muutumisel, ja
kahaneva
seosega,
kui sõltuv tunnus reageerib kahanemisega sõltumatu tunnuse väärtuse
kasvule.
- Lineaarne regressioon: y= a + bx võrrand.
- Vähimruutude meetodi abil leitakse sirge, mille puhul vaatlusel saadud punktide ja seost kirjeldava sirge vaheliste hälvete (y-telje suunas mõõdetud kauguste ehk vigade ) ruutude summa on minimaalne.
- Regressioonisõltuvus ei ole pööratav. Tema kuju oleneb sellest, kas vaadelda suurust y x-i funktsioonina või vastupidi.
- Korrelatsioon – kui lähedale on koondunud punktid üksteise suhtes.
- Erind – anomaalne punkt. Ebatüüpilise erindi võib välja jätta, nt. viimsi pole traditsiooniline vald.
- Tugevus: kui lähedal on punktid (joonisel). Suund: ; + või -; kasvav või kahanev. Kuju: kui vähegi võimalik võiks vaadelda lineaarsena (korrelatsiooni analüüsi puhul).
- Astakkorrelatsioonikordaja e Spearmanikordaja: põhiolemuselt lineaarne ikkagi aga üle minnakse järjeskaalale. Kõiki füüsilisi suurusi mõõdetakse suhteskaalal (tavaliselt).
(roo) on valimi ja üldkogumi korrelatsioon. Spearmani kordaja
osas toome selle 1 erindi punkti teistele lähemale. Kõigi vahemaaks
saab 1 ühik. Ei ole nii täpne kui lineaarne kordaja, see on
üldistav kordaja, seega kaotame täpsuses.
- Nelikkorrelatsioon (nelikkorrelatsioonikordaja) saab kasutada kui ei ole arvandmeid (kvalitatiivse tunnuse korral).
- Regressioonanalüüsi juures on paigutus väga oluline. X ja y sõltuvad. Y=a+bx (x-sõltumatu muutuja ehk eksogeenne muutuja), y sõltuv muutuja ehk endogeenne muutuja. Püütakse selgeks teha x-i mõju y-le. Regressioonanalüüsi käigus lükkame punktid kokku kirjeldava joone peale. Mõnel juhul on hälve kasuks ja teisel juhul kahjuks.
y = a+bx , a – näitab punkti kus sirge lõikab y telge;b regressioonikordaja (kõige tähtsam komponent ehk joone tõus).
B näitab kui mitme ühiku võrra muutub y kui x muutub 1 ühiku
võrra. Mida suurema nurga all regressioonisirged
lõikuvad, seda nõrgem on nähtustevaheline seos! Suurim nurk on 90
kraadi, see tähendab, et seos on nõrk.
- Funktsiooni headus on selgitusvõime. Selgitusvõime näitaja on determinatsioonikordaja R2. Determinatsioonikordaja näitab, kui suure osa sõltuva suuruse hälvete ruutude summana mõõdetud koguhajuvusest seos ära seletas.
Ruutjuurt determinatsioonikordajast nimetatakse
üldjuhul korrelatsioniindeksiks (r) ehk korrelatsioonikordajaks ehk
korrelatsioonikoefitsiendiks.
Korrelatsioonikordaja väärtused on
vahemikus -1 kuni 1.
- Korrelatsioonikordajaid on palju. Sagedamini kasutatav on kovariatsioon (koos varieerumine ehk koos erinemine). Korrelatsioonikordaja kirjeldab vaid lineaarset seost!
- Korrelatsioonikordaja saab olla vahemikus -1 kuni 1. 0 ütleb, et seost ei ole, 1 ütleb, et on funktsionaalne seos. 0 lähedal on seos nõrk, 1 seos on tugev.
- Kui r= -1, siis on tegemist kahaneva funktsionaalse seosega kahe suuruse vahel. Kui r =1, siis kasvava funktsionaalse seosega suuruste vahel. Ülejäänud r väärtuste korral sõltub üks tunnustest teisest korrelatiivselt, juhul kui r pole null. Kui r =0, siis eksisteerib kolm võimalust:
a) üks tunnus sõltub teisest funktsionaalselt,
kuid mitte korrelatiivselt (vaatluspunktid horisontaalsirgel);
b) seose suund pole määratud (vaatluspunktid
ringikujulisel alal);
c) puudub lineaarne seos, kuid tegemist on mingit
mittelineaarset seost esitavate andmetega (vaatluspunktid paiknevad
sümmeetriliselt näiteks paraboolil).
EKSAMI KÜSIMUSED SEOSTE ANALÜÜSI KOHTA: - Korrelatsioonikordaja 1,2 näitab väga tugevat positiivset seost. VALE kuna korrelatsioonikordaja on vahemikus 0-1.
- Regressioonikordaja peab olema alati positiivne. VALE kuna võib olla ka – ehk vastassuunaline.
- Vabaliige näitab seose selgitusvõimet. VALE, näitab punkti kus sirge lõikab y telge.
- Regessioonikordaja näitab y kordset muutumist x-i 1 ühikulise muutumise korral. Õige oli ei ükski variant kuna õige oleks y ühikulist muutumist x-i 1 ühikulise muutumise korral.
AEGREAD - Aegread on statistiliste ridade eriliik teisiti nimetatakse kronoloogilisteks ehk dünaamikaridadeks.
- Sisuliselt võib aegridu tõlgendada statistiliste valimitena, kus iga valimi objekti korral on muude tunnuste kõrval fikseeritud ka aega väljendav (enamasti determineeritud) suurus.
- Jagunevad omakorda moment- ja perioodridadeks. Momentrea iga liige on seotud kindla ajamomendiga, perioodrea iga liige mingi ajavahemikuga (perioodiga).
Nt. momentrida: kaubamaja töötajate arv iga
kvartali esimese
kuupäeva seisuga. Valuuta- ja aktsiakursid, börsiindeksid,
arvutisse sisseloginute arv.
Perioodrida : reastatud andmed
tehase kuutoodangute maksumuste kohta. Kaupluse läbimüük
kvartalite kaupa,
veebiserveri poole pöördumiste arv
tundide kaupa.
- Perioodrea liikmete summal on majanduslik mõte: väljendab vastava pikema perioodi jooksul kujunenud tunnuse väärtust. Momentrea liikmete summa on seevastu mõttesisutu.
- Eristamine on vajalik keskmiste arvutamisel. Kronoloogilist keskmist saab arvutada momentrea puhul vaid siis kui momendid on fikseeritud võrdsete ajavahemike järel. Kui aga ei ole võrdseid ahavahemikke, siis aritmeetiline keskmine.
- Aegridadest ei saa ühtegi üksikut vahepunkti ehk erindit eraldada (välja võtta).
- Aegrida koosneb 4 komponendist : tendents , harmooniline komponent, sesoonne komponent, juhuslik komponent.
- Aegrea mudelid: aditiivne mudel, multiplikatiivne mudel (trend, sesoonne komponent, tsükliline komponent, irregulaarne komponent).
- Aegridade kompleksanalüüsi korral jaotatakse (lammutatakse) aegrida komponentideks. Kaheks komponendiks: seaduspäraselt ehk süsteemselt ja juhuslikult muutuvaks osaks Seaduspärased muutused: trend, sesoonne, tsüklilised muutused. Juhuslik komponent – puudub seaduspärasus. Esineb ebavõrdsete ajavahemike järel. Esineb juhuslike šokkidena. Kompleksanalüüsi korral kui toimub osadeks lammutamine , siis esimesena otsitakse juhuslikku komponenti.
- Trend ehk tendents. Lihtsamateks meetoditeks trendi leidmiseks ja kirjeldamiseks on libisevad ja eksponentkeskmised (lisaks aegrea analüütiline silumine). Mugavaks vahendiks trendi esitamiseks on tunnuse trendiväärtuste kirjeldamine funktsioonina ajast. Räägitakse kas lineaarsest või mittelineaarsest trendist.
Aegridades võib täheldada kolme liiki trende:keskmise taseme trend;
dispersiooni trend;
autokorrelatsiooni trend.
Keskmise taseme trend on tavaliselt hästi
jälgitav aegrea graafikul; trendi võime kujutada mingi
matemaatilise funktsiooni graafikuna, joonena, mille ümber
varieeruvad uuritava nähtuse tegelikud väärtused. Taolisel juhul
on trendi väärtused üksikutel ajamomentidel uuritava nähtuse
matemaatilisteks ootusteks, millest tuleb ka kasutatav nimetus –
keskmise taseme trend.
Dispersiooni trend kujutab endast nähtuse
empiiriliste väärtuste ja determineeritud komponendi – keskmise
taseme trendi – vaheliste hälvete muutumise tendentsi. Ka see
trendi liik on sageli (kuid mitte alati) jälgitav aegrea graafikult.
Autokorrelatsiooni trend on aegrea üksikute
liikmete vahelise seose muutumise tendents. Aegrea graafikult selline
muutumine otseselt jälgitav pole, kuid kuid ta omab suurt tähtsust
prognoosimisel.
- Tsüklilised muutused (ehk harmoonilised muutused) on aastast pikema perioodiga trendi ümbruses toimuvad perioodilisele lähedased muutused tunnuse väärtustes.
- Hooajaline muutus ehk sesoonne - ajas perioodiliselt toimuvad muutused. Hooajaline, nt. Kevad, suvi… Avaldub lühikese võnke puhul. Aeg alla aasta.
- Lihtsaim aegridade tasandamise meetod on visuaalne tasandamine. Sel juhul esitatakse aegrida graafiliselt ning tunnuse väärtuste tendentsi hinnatakse silma järgi. Kõige sagedamini tähendab see sirge paigutamist graafikule nii, et see tundub tunnuste väärtustes esinevat kasvu- või kahanemistendentsi piisavalt hästi kirjeldavat. Kasutatakse ka tasandamist kõvera abil, siis joonistatakse graafikule sujuv kõver, mis näib toimuvat hästi kirjeldavat. Visuaalse tasandamise põhiprobleemiks on see, et ta on subjektiivne ning sõltub tugevalt sellest kes on tasandaja ja milline on tema nägemus heast kirjeldamisest ning uuritava nähtuse arengust. Analüütiline tasandusmeetod tugineb tulemuse objektiivsust tagavale arvutusmeetodile. Lihtsaim meetod on libisev keskmine, mõnevõrra keerulisem on eksponentkeskmine. Ka eksponentkeskmised ei võimalda aegrida kokkuvõtlikult esitada. Tasandamisel püütakse kasutada lihtsaid funktsioone mille parameetrid leitakse harilikult analoogiliselt regressioonanalüüsiga.
- Libisevaks keskmiseks nimetatakse aegrea kindlast arvust järjestikku liikmetest leitavaid keskmisi. Iga uue libiseva keskmise väärtuse arvutamisel jäetakse eelmise keskmise arvutamiseks kasutatud aegrea liikmete hulgast välja ajaliselt kõige varasem ning lisatakse järelejäänutele ajaliselt vahetult järgnev uus aegrea liige. Libisemissammuks võib olla paaris või paarituarv aga soovituslikult on parem kasutada viimast varianti , sest sellisel juhul paiknevad keskmised ajaliselt kohakuti esialgse rea elementidega.
Libiseva keskmise puhul tuleb silmas pidada, et
tunnuse väärtuste kasvamise korral kalduvad libisevad keskmised
tunnuse väärtusi alla
hindama ja kahanemise korral üle hindama.
Libisev keskmine tasandab ära jääkliikmete
varieerumise. - Eksponentkeskmised arvutatakse iga ajamomendi (perioodi) jaoks sellele momendile (perioodile) vastava tunnuse tegeliku väärtuse ja sellele vahetult eelnevale ajamomendile vastava eksponentkeskmise kaalutud keskmisena. Eksponentkeskmise leidmisel võetakse rea liikmed arvesse seda väiksema kaaluga, mida varasemale ajale nad vastavad võrreldes vaatlushetkega. Eksponentkeskmise leidmist alustatakse keskmistamiskaalu (tasandusparameetri) valikuga. Kui see võrduks ühega, siis oleksid kõik eksponentkeskmise väärtused võrdsed neile vastava rea liikmega ning tasandamist tegelikult ei toimugi. Kui võrduks nulliga, siis võrduksid kõik eksponentkeskmised kõige esimese eksponentkeskmise hinnatud väärtusega ning rida tasanduks horisontaalseks sirgeks .
Eksponentkeskmise kasutamisel tuleb silmas pidada,
et üldise kasvutendentsiga aegridade korral
kaldub eksponentkeskmine
tunnuse väärtusi alla hindama ja üldise kahanemistendetsiga ridade
korral neid üle hindama.
- Prognoosiks nimetatakse kindlatele andmetele ja objektiivsetele meetoditele tuginevat ennustust.
Prognoos eeldab, et leiame olemasolevale aegreale
kirjelduse.
Prognoosi pole motet anda mitteusaldava näitaja
järgi.
Eristatakse punktprognoose, mille korral saadakse
prognoositava tunnuse jaoks üks väärtus ja vahemikprognoose, mille
korral hinnatakse väärtusvahemikku, millesse tunnuse väärtus
teatud
usaldatavusega jääb.
Eristatakse interpoleerimist ja ekstrapoleerimist.
Mõlemal juhul on tegemist kahe muutujaga, millest üks on sõltuv
ja teine sõltumatu (argument),
kusjuures sõltuva tunnuse väärtused
on teada ainult osade argumenttunnuse väärtuste jaoks.
Argumenttunnuse väärtuste vahemikku, millesse jäävate väärtuste
jaoks on teada sõltuva tunnuse väärtusi, nimetame
seose
määramispiirkonnaks. - Interpoleerimiseks nimetatakse mitteteadaolevate sõltuva tunnuse väärtuste hindamist seose määramispiirkonnas. Hindamisel tuginetakse teada olevatele sõltuva tunnuse väärtustele. Aegridade interpoleerimiseks on kasutatavad nii eespool käsitletud tasandamismeetodid kui elementaaranalüüsi meetodid.
Prognoosi tegemiseks koostatakse
prognoosifunktsioon, mis annab seose
kasutatavate alussuuruste ja hinnatava näitaja vahel. Aegreana
esitatud tunnuse sõltuvus ajast võib olla funktsionaalne,
stohhastiline või sisaldada mõlemat komponenti. Tunnuse väärtused
stohhastilises aegreas on vaadeldavad aegrea aluseks oleva
juhusliku
protsessi realisatsioonina. Juhuslik on
protsess, mille käigus uuritava tunnuse väärtused genereeritakse
vastavalt mingile tõenäosuslikule seaduspärasusele. Juhuslik
protsess on
statsionaarne ,
kui tema tõenäosuslikud omadused ajas ei muutu. Vastasel korral on
tegemist
mittestatsionaarse juhusliku
protsessiga. Sageli on võimalik
jaotada aegrida komponentideks nii, et tema juhuslik komponent on
statsionaarse juhusliku protsessi realiseeringuks.
- Ekstrapoleerimiseks nimetatakse sõltuva tunnuse väärtuste hindamist väljaspool seose määramispiirkonda. Ekstrapoleerimisel tuginetakse kas vahetult teada olevatele sõltuva tunnuse väärtustele või varem kindlaks tehtud seosele tunnuste vahel. Seoses aegridadega eristatakse retrospektiivset (ajas tagasi vaatavat) ja perspektiivset (tulevikku suunatud) ekstrapoleerimist. Just viimane on aluseks statistilistele prognoosidele.
INDEKSID - Dünaamika suhtarvud , näitavad kuidas nähtus on muutunud (mitu korda on väärtused muutunud).
- Liigitus: 1) lihtindeksid (valem kahe arvu suhe); 2) liitindeksid; 3)individuaalindeksid (tähis i)- kogumi näitajate muutused, üksiku toote indeks; 4)üldindeksid, nt: THI. Tähis: Ip, Iq.
- Kvalitatiivne muutuvsuurus: näitab intensiivsust ehk on intensiivsusnäitajad. Nt. hind, tootlus (midagi millegi kohta). Hind – raha/liitri ehk koguse kohta, kiirus – km/h.
Kvantitatiivne muutuvsuurus: näitab hulka, mahtu.
Kvalitatiivne x Kvantitatiivne = resultaat (tegurisüsteem).Nt: hind (Ip)x kogus (Iq) = Maksumus (Ipq)
kogus hind = tarbitud kauba maksumus; kogus
omahind =
toodangu maksumus; aeg kiirus = tee pikkus; külvipind saagikus = saak; töötundide arv tootlus = toodete arv.
- Ühismõõtsustamine ehk ühismõõtseks saamine.
- Varasema perioodi kaubakogus Laspeyres hinnaindeks:
ILP= p1q0/p0q0Juhul kui võrrelda hilisema perioodi kaubakogumi maksumusi
hilisemates ja varasemates hindades, saab
Paasche hinnaindeksi:
IPP= p1q1/
p0q1 - Juhul kui ühismõõtsustajateks on varasema perioodi hinnad, saab Laspeyresi koguseindeksi:
ILq=p0q1/p0q0,
kus q1 – tänane kogus, q0 – baas, eilne
kogus.
Juhul kui ühismõõtsustajateks on hilisema perioodi hinnad, saab
Paasche koguseindeksi:IPq=p1q1/p1q0 VALIMID - Kui vaatlusega ei ole võimalik vaadelda kõiki uuritava kogumi liikmeid, vaid on võimalik vaadelda vaid osa neist, siis sellist vaatlust nimetatakse väljavõtuvaatluseks ja selle tulemusel saadavat kogumit nimetatakse väljavõtukogumiks ehk valimiks .
- Valimivaatlus nt. rahvaloendus . Negatiivne pool: kulukas ja aeganõudev. Suur üldkogum N, vaatlusobjekt n. Kõigepealt toimub tulemuste väljavõtt ja seejärel tulemuste ülekandmine ehk tagasikandmine. Valimivaatlus võib ja ei pruugi olla ebatäpne.
- Usaldatav väljavõtukogum peab olema üldkogu suhtes esinduslik. Esinduslikkuse tagamiseks tuleb kasutada juhuväljavõttu. Juhuväljavõtuga on tegemist kui igal uuritava kogumi liikmel on ühesugune tõenäosus sattuda väljavõtukogumisse. Kasutatakse kahte juhuväljavõtu viisi: kordumistega ja kordumisteta. Kordumisteta väljavõtu korral loetakse kord juba väljavõtukogumisse sattunud üldkogumi liige sellest eemaldatuks ja tema teistkordne valimisse sattumine on välistatud. Nt. Bingo Loto (pall ei lähe tagasi üldkogumisse). Kordumistega väljavõtu korral võib iga üldkogumi liige sattuda väljavõtukogumisse mitmeid kordi . Eristatakse suunamata ja suunatud juhuväljavõtte. Suunamata juhuväljavõtt – üldkogumi elemente võetakse täiesti juhuslikult. Suunatud juhuväljavõtt – jaotatakse üldkogum enne väljavõttu osakogumiteks, et tagada üld- ja väljavõtukogumi struktuuride paremat kokkulangevust. Nt. 1000 in, Elanikkond jaguneb pooleks 50/50. Valimis 500 meest ja 500 naist. 500 meest ja naist valitakse juhuslikult.
- Kui üldkogum on normaaljaotusega, siis on ka väljavõtukeskmiste jaotuseks normaaljaotus, kusjuures selle keskväärus võrdub üldkogumi keskväärtusega.
- Üldkogumi parameetrite hindamine. Punkthinnangu andmisel antakse parameetri väärtuseks väljavõtukogumi mingi statistiku või statistikute kombinatsiooni arvväärtus. Me teame, et iga konkreetse punkthinnangu väärtus erineb hinnatava parameetri tegelikust väärtusest. Parameetri hinnangu ja tegeliku väärtuse erinevust nimetatakse esindusveaks. Selle tekkimise põhjuseks on väljavõtuvaatluse iseloomust tingitud valimi ja üldkogumi struktuuride erinevus. Esindusvea väärtuse määramine ei ole võimalik, sest see eeldaks parameetri tegeliku väärtuse teadmist. Üldkogumi parameetri vahemikhinnang on piirkond arvteljel, millesse hinnatav parameeter jääb teatud usaldatavusega. Vahemikhinnangul on mõned olulised omadused: usaldatavuspiirkond on seda laiem, mida suurem on usaldatavus ja seda väiksema täpsusega on määratud hinnatav parameeter. Mida suurem on väljavõtukogum, seda kitsam on usaldatavuspiirkond ja seda täpsemalt on määratud hinnatav parameeter.
- Keskväärtuse hindamisel võrdub keskmine esindusviga ehk standardviga δ väljavõtukeskmiste standardhälbega.
- Valimi kaalumist kasutatakse valimi esinduslikkuse parandamiseks. Kui valim vajab kaalumist mitme erineva tausttunnuse järgi, siis objektidele kaalude omistamisel korrutatakse omavahel erinevate tausttunnuste järgi saadud kaalud.
- Valimi keskmise leidmisel kasutatakse aritmeetilist keskmist.
- Vea komponendid: valikuviga, loendiviga, kaoviga, objektide asendamise viga, mõõtmisviga, töötlusviga.
- Usaldatavus: 1 sigma = 68,27 %; 1,96 sigma ( standartne ) = 95%; 2 sigma = 95,45%; 3 sigma = 99,73 %. Usaldatavus 100% tähendab vahemikku( –lõpmatus... + lõpmatus).
HÜPOTEESIDStatistiline hüpotees – oletus on tehtud üldkogumi koguse
kohta ja tegu on arvväärtusega.
Nullhüpotees - hüpotees mis määrab üldkogumile
võimalikult lihtsa struktuuri,
sisuks üldkogumi vastavus
standardile. Saame kontrollida trendi seost.
Seose juures võimalikult lihtne struktuur ehk seos puudub (pole
seost, pole probleemi). Nt. trendi pole, faktori mõju puudub.
Alternatiivne hüpotees – vaidleb nullhüpoteesile vastu.
Kontrollstatistik on väljavõtustatistik, mille alusel
tehakse otsus nullhüpoteesi kohta. Kontrollstatistiku väärtuste
piirkonda, milles võetakse vastu alternatiivne hüpotees nimetatakse
kriitiliseks piirkonnaks . - Hüpoteeside paar tuleb sõnastada korralikult.
- NÄIDE: Testi täitmiseks on antud 10 minutit. (See tähendab, et standard on 10 minutit)
H0: μ = 10 (nullhüpotees: keskmine aeg on 10 minutit)
H1: μ ≠ 10 (tähendab, et on OLULISELT erinev)
Kui saame 15, siis VASTUS: keskmine on 10-st oluliselt erinev ehk H1
kehtib. (Kui õiget aega pole küsitud, siis vastus seda ei sisalda)
- Enne hüpoteesi kontrollimist on võimalus
Nullhüpotees: vastu võtta ei saa aga tagasi saame lükata.
Alternatiivne hüpotees: vastu saame võtta aga tagasi lükata
ei saa.
Nt: Persoon on kohtualuneH0: kohtualune ei ole süüdi
H1: kohtualune on süüdi
Otsuse
langetamiseks on vaja tõendeid (infot). Peame kokku
panema valimi. Kui süütõendeid on piisavalt on süüdi. Kui ei ole
süütõendeid piisavalt ei ole süüdi.
Kui H1 on vastu võetud (kui on
loobutud H0),
siis võetakse vastu tagasipöördumatu vastus.
H1 puhul ei saa otsust tagasi võtta (nt. süüalune on
maha
lastud aga vea puhul ei saa seda olematuks teha).
DISPERSIOONANALÜÜS - Ei analüüsi dispersiooni. Näide: kui on vaja teha kindlaks kas eksamitulemus sõltub nädalapäevast? Dispersiooni kasutatakse arvutamisel. Nt: odra mõju õllele? Analüüsi saab kasutada küsimuste lahendamisel. Annab rakendada ka kvalitatiivsete tunnuste puhul. Nt. viiepalliskaalal hinnatud rahulolu.
Analüüsimeetod põhineb dispersioonide
liitmise lausel.
Kogumi ülddispersioon = rühmade vaheline dispersioon + rühmade
sisene dispersioon.Nt. uuritav nähtus meeleoli.
Sõltub: temperatuurist, kõhu täis olemisest, rahalisest seisust,
suhetest, tervisest jne... Võetakse 1 faktor tervis. Uuritav faktor
ühel pool: tervis. Ja teised teisel pool (juhuslikud
faktorid on
teised). Vaadatakse kus on varieeruvus. Seejärel kontrollitakse
hüpoteesi.
- Rühmade sisene dispersioon – hajuvus ühe rühma piires (jääkfaktorite mõju, jääkvarieeruvus). Leiame rühma keskmise ja siis võrdleme seda keskväärtuste varieerumisega.
- Rühmade vaheline dispersioon: 2 rühma vaheline. Võrreldakse uuritava faktori mõju.
- Kogumi dispersioon: Igat komponenti vaadeldakse üldkeskmise suhtes.
- Dispersioonanalüüsi abil jaotatakse uuritava tunnuse dispersioon mõju avaldavate tegurite järgi komponentideks ning kontrollitakse selle juures püstitatud hüpoteeside paikapidavust. Keskväärtuste erinevuste põhjuste selgitamiseks võib üheaegselt kasutada mitut faktortunnust.
- Mida suurem on rühmade erinevus, seda suurem mõju on metoodika faktoril.
Selleks, et öelda kas erinevus on piisav, peame võrdlema empiirilist kriitilisega:Femp > FcritH0 lükatakse tagasiFemp crit
H0 jääb kehtima
ÜLESANDED
KESKMISED
- ÜL. Midagi liigub punktist A punkti B, vahemaa 100 km. Läbib edasi ja tagasi. Minnes 60 km/h, tagasi 120 km/h. Leidke keskmine kiirus punktist A punkti B ja tagasi.
Kiirus= teepikkus/aeg
Keskmine kiirus= teepikkuste summa/aegade summa
Aeg=teepikkus/kiirus
Aeg1=100/60=1,6
Aeg2=100/120=0,833
Kokku kulus aega 2,5 h
Keskmine kiirus= (100+100 (teepikkuste summa))
/(1/60*100)+(1/120*100) ehk esimese etapiaeg ja teise etapi aeg = 80
km/h
Seega õige oli valida harmooniline keskmine kuna aritmeetiline
keskmine oleks olnud: 60+120/2=90 km/h
VALIMID
Valem, kui ei tea üldkogumi suurust:
μ = aritmeetiline keskmine +- usaldatavus (1,96 standard) * sigma/
(ruutjuur)vaatlusobjektide arv n
Vastus kirjutada järgmiselt:
Vastus: vahemik on (kandiliste sulgude vahele kirjutada
number... number), usaldatavusega 95%.
Kõik kommentaarid