Vajad kellegagi rääkida?
Küsi julgelt abi LasteAbi
Logi sisse

STATISTIKA konspekt (0)

3 HALB
Punktid
STATISTIKA
KESKMISED
  • Kogumit ühe arvuga iseloomustavad üldistavad näitarvud, mis edastavad informatsiooni kogumisse kuuluva tunnuse väärtuste taseme kohta.
  • Mahukeskmised sõltuvad statistilise rea mahust. Rea maht ei ole otseselt rea liikmete arv. Ritta kuuluvate elementide väärtuste summa. Reageerivad igale muutusele, väga tundlikud. Mahukeskmised: aritmeetiline keskmine, harmooniline keskmine, geomeetriline keskmine, ruutkeskmine ja teised astmekeskmised, kronoloogiline keskmine.
  • Asendi ehk struktuurikeskmised kuuluvad keskmised mis ei reageeri igale muutusele elementide väärtuste osas. Oluline on struktuur. Asendi ehk struktuurikeskmised: mood, mediaan, kvartiilid, pentiilid, sekstiilid, oktiilid (teoorias), detsiilid protsentiilid.
  • Harmooniline keskmine on mitmese tähendusega. Sõltuvalt andmete iseloomust võib ta tähendada kas mingi suuruse aritmeetilise keskmise leidmist kaudselt antud andmete abil... Teiseks võib harmooniline keskmine tähendada lihtsalt samade andmete sama majandusnähtust iseloomustavat teist keskmist. Aritmeetilist keskmist kasutame me hästi sageli eelkõige tema interpreteeritavuse mugavuse pärast. Siiski on olukordi, kus ka harmoonilisel keskmisel on selge majanduslik tähendus.
  • Ruutkeskmisi kasutatakse statistilise rea varieeruvuse üldistavaks iseloomustamiseks.
  • Geomeetrilist keskmist kasutatakse majandusstatistikas kõige sagedamini aegridade uurimisel keskmiste kasvutempode leidmiseks, kuid teda on kasutatud ka hinnataseme muutusi kirjeldavate börsiindeksite konstrueerimiseks. Geomeetrilist keskmist leida ei ole üldjuhul võimalik, kui mõned rea liikmed on hulgas negatiivsed.
  • ÜL. Midagi liigub punktist A punkti B, vahemaa 100 km. Läbib edasi ja tagasi. Minnes 60 km/h, tagasi 120 km/h. Leidke keskmine kiirus punktist A punkti B ja tagasi.

Kiirus= teepikkus /aeg
Keskmine kiirus= teepikkuste summa/aegade summa
Aeg=teepikkus/kiirus
Aeg1=100/60=1,6
Aeg2=100/120=0,833
Kokku kulus aega 2,5 h
Keskmine kiirus= (100+100 (teepikkuste summa)) /(1/60*100)+(1/120*100) ehk esimese etapiaeg ja teise etapi aeg = 80 km/h
Seega õige oli valida harmooniline keskmine kuna aritmeetiline keskmine oleks olnud: 60+120/2=90 km/h
  • Mood ehk dominant (domineeriv e kõige sagedasem näitaja). Intervallrea moodi hinnatakse graafiliselt. Mood sobib ka järje- ja nimeskaalas mõõdetud tunnuste iseloomustamiseks. Juhul kui rea liikmete arv on suur, tuleks rida enne moodi leidmist korrastada ning leida variantide esinemissagedused.
  • Mediaan ehk keskliige (reas keskel asuv). Eeldab korrastatud rida.

Mediaani kasutatakse juhul , kui aritmeetilist keskmist leida ei ole võimalik. Tugevalt ebasümmeetrilise rea korral on ta tüüpilisem kui aritmeetiline keskmine.
Kui reas on paaritu arv liikmeid, siis võrdub mediaan järjestatud rea asendilt keskmise liikmega , mistõttu moodi nimetatakse ka rea keskliikmeks. Kui reas on paarisarv liikmeid, siis leitakse ta järjestuses kahe keskmise liikme aritmeetilise keskmisena, mistõttu mediaan ei pruugi võrduda ühegi rea liikmega.
  • Kvartiil 4 võrdset osa ( xmin , q1, q2 ehk mediaan, q3 ja xmax), pentiil 5 võrdset osa, sekstiil 6 võrdset osa, detsiil 10 võrdset osa, protsentiil 100 võrdset osa.
  • Momentideks nimetatakse rea liikmete väärtuste ja mingi arvu vaheliste hälvete astendamisel saadud arvude aritmeetilisi keskmisi. Arvu, millega momendi leidmisel hälbeid astendatakse, nimetatakse momendi järguks.

VARIATSIOONINÄITARVUD
  • Variatsiooniamplituud (R= Xmax-Xmin)näitab äärmuste vahet. Äärmusi kirjeldab, ei kirjelda seda mis on kogumi sees. Väheväärtuslik, infot pea ei olegi.
  • Absoluutsed variatsiooninäitarvud: variatsiooniamplituud, keskmine lineaarhälve, dispersioon ja standardhälve, kvartiilhälve.

Absoluutsete variatsiooninäitarvude suurus sõltub variantide absoluutväärtustest, mis muudab nad erinevate ridade võrdlemisel raskesti kasutatavateks. Teiseks probleemiks absoluutsete varieeruvusnäitarvude kasutamisel on ühik. Neil on mõõdetava suurusega sama ühik, mis muudab võimatuks erinevate ühikutega suuruste hajuvuse võrdlemise.
  • Keskmine lineaarhälve (d katusega ) ehk keskmine absoluuthälve. Hälve ehk erinevus. Kokkuvõtlikult on lineaarhälve erinevuste keskmine.

Keskmise lineaarhälbe eeliseks on tema lihtne interpreteeritavus. Probleemiks on absoluutväärtuse kasutamine arvutustes, mis muudab keskmise lineaarhälbe matemaatiliste operatsioonide jaoks ebamugavaks.
  • Dispersioon σ2 ehk hajuvus ehk hälvete ruutude keskmine (keskmine ruuthälve). Dispersiooniks nimetatakse variantide väärtuste ja aritmeetilise keskmise erinevuste ruutude (ruuthälvete) aritmeetilist keskmist.
  • Standardhälve σ ehk hälvete keskmine on leitud ruutkeskmise abil. Standardhälve ehk ruutkeskmine hälve on ruutjuur dispersioonist. Standardhälve on seotud tõenäosusteooria rakendustega, lineaarhälve ei ole. Standardhälve ON ALATI varieeruvas kogumis keskmisest lineaarhälbest suurem. Normaaljaotuse üks parameetritest on standardhälve σ ehk sigma . Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe.
NORMAALJAOTUS
  • Jaotuse püstakuse ehk ekstessi mõõtmisel tuginetakse neljandat järku normeeritud momendile ning jaotust võrreldakse normaaljaotusega (selle neljandat järku normeeritud moment on 3).
  • Normaaljaotus kirjeldab tunnust, mille käitumine on normaalne. Normaaljaotus on piirjaotus, millele lähenevad paljud teised jaotused .
  • Normaaljaotuse üks parameetritest on standardhälve σ ehk sigma.
  • Normaaljaotuse omadused: * normaaljaotus on pidev jaotus *normaaljaotus on täielikult kirjeldatav kahe parameetriga: keskväärtusega μ ja dispersiooniga σ2 *normaaljaotusele vastav kõver on sümmeetriline keskväärtuse μ suhtes * normaaljaotuse keskväärtus, mood ja mediaan ühtivad.
  • Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe!!!
  • Mediaan jaotab normaaljaotuse tagurpidi U kaheks osaks. Artitmeetiline keskmine on samas kohas kus mediaan kuna äärmused on normaaljaotusel võrdsed. Mood on samuti keskel ehk seal kus mediaan ja aritmeetiline keskmine kuna kõige suurem sagedus on seal (tipp). Aritmeetiline keskmine = Mood = Mediaan.
  • Normaaljaotuse puhul on tegu sümeetriaga.

NÄHTUSTEVAHELISED SEOSED
  • Seoste analüüsil baseerub ökonomeetria (majanduse mõõtmine).
  • Seaduspärasuse jaoks peab seos esinema püsivalt ja korduvalt.
  • Põhjuslik ehk kausaalne seos. Põhjusnähtus peab esile kutsuma tagajärgnähtuse. P→T Põhjuslik tagajärgseos. Põhjusnähtus on tagajärgnähtuse esilekutsumiseks ühtaegu piisav ja tarvilik. Mõju → seos üldises mõistes. Mõju on mõlemasuunaline! Põhjuslik seos on alati mingi suunaga, sama ei kehti seoste kohta üldiselt.
  • Statistiline seos ehk stohhastiline korrelatiivne, mittetäielik seos. Statistilise (stohhastilise) sõltuvusega on tegemist, kui ühe tunnuse Y tõenäosusjaotus (täpsemalt tinglik jaotus) sõltub teise tunnuse X väärtustest. Selle alusel jaotuvad tunnusepaarid statistiliselt sõltuvateks ja statistiliselt sõltumatuteks.

Statistilise sõltuvuse iseloom sõltub vaadeldud tunnustest. Eriline tähtsus on regressioonsõltuvusel. Sellisel juhul esitatakse sõltuv (juhuslik) suurus Y regressioonifunktsioonina juhusliku suuruse X järgi, mille väärtused võrduvad sõltuva suuruse Y (tingliku tõenäosusjaotuse) keskväärtustega. Regressioonifunktsioon seab igale sõltumatu suuruse X väärtusele vastavusse sõltuva suuruse Y keskväärtuse sellel kohal.
  • Funktsionaalne seos: kui on üks hind, siis talle vastab 1 konkreetne kogus. Funktsionaalne seos on kokkuvõte. Seoseid ei vaadata eraldi. Funktsionaalne seos on esitatav funktsioonina , mis seab sõltumatute tunnuste väärtustele vastavusse üheselt määratud sõltuva tunnuse väärtused (mida mitmeste funktsioonide korral võib sõltumatu tunnuse ühele väärtusele vastata mitu).
  • Seose suund saab olla + või -, kasvav või kahanev, samasuunaline või vastassuunaline. Graafiliselt kuju lineaarne või mittelineaarne.

Seose suund annab sõltuva tunnuse väärtuse (y) muutuse, mis on tingitud sõltumatu tunnuse väärtuse(x) muutusest. Tegemist võib olla kasvava seosega, kui sõltuv tunnus reageerib sõltumatu tunnuse väärtuse suurenemisele väärtuse kasvuga, konstantse seosega, kui sõltuva tunnuse väärtus ei muutu sõltumatu tunnuse väärtuse muutumisel, ja kahaneva seosega, kui sõltuv tunnus reageerib kahanemisega sõltumatu tunnuse väärtuse kasvule.
  • Lineaarne regressioon: y= a + bx võrrand.
  • Vähimruutude meetodi abil leitakse sirge, mille puhul vaatlusel saadud punktide ja seost kirjeldava sirge vaheliste hälvete (y-telje suunas mõõdetud kauguste ehk vigade ) ruutude summa on minimaalne.
  • Regressioonisõltuvus ei ole pööratav. Tema kuju oleneb sellest, kas vaadelda suurust y x-i funktsioonina või vastupidi.
  • Korrelatsioon – kui lähedale on koondunud punktid üksteise suhtes.
  • Erind anomaalne punkt. Ebatüüpilise erindi võib välja jätta, nt. viimsi pole traditsiooniline vald.
  • Tugevus: kui lähedal on punktid (joonisel). Suund: ; + või -; kasvav või kahanev. Kuju: kui vähegi võimalik võiks vaadelda lineaarsena (korrelatsiooni analüüsi puhul).
  • Astakkorrelatsioonikordaja e Spearmanikordaja: põhiolemuselt lineaarne ikkagi aga üle minnakse järjeskaalale. Kõiki füüsilisi suurusi mõõdetakse suhteskaalal (tavaliselt).

 (roo) on valimi ja üldkogumi korrelatsioon. Spearmani kordaja osas toome selle 1 erindi punkti teistele lähemale. Kõigi vahemaaks saab 1 ühik. Ei ole nii täpne kui lineaarne kordaja, see on üldistav kordaja, seega kaotame täpsuses.
  • Nelikkorrelatsioon (nelikkorrelatsioonikordaja) saab kasutada kui ei ole arvandmeid (kvalitatiivse tunnuse korral).
  • Regressioonanalüüsi juures on paigutus väga oluline. X ja y sõltuvad. Y=a+bx (x-sõltumatu muutuja ehk eksogeenne muutuja), y sõltuv muutuja ehk endogeenne muutuja. Püütakse selgeks teha x-i mõju y-le. Regressioonanalüüsi käigus lükkame punktid kokku kirjeldava joone peale. Mõnel juhul on hälve kasuks ja teisel juhul kahjuks.

y = a+bx , a – näitab punkti kus sirge lõikab y telge;b regressioonikordaja (kõige tähtsam komponent ehk joone tõus). B näitab kui mitme ühiku võrra muutub y kui x muutub 1 ühiku võrra. Mida suurema nurga all regressioonisirged lõikuvad, seda nõrgem on nähtustevaheline seos! Suurim nurk on 90 kraadi, see tähendab, et seos on nõrk.
  • Funktsiooni headus on selgitusvõime. Selgitusvõime näitaja on determinatsioonikordaja R2. Determinatsioonikordaja näitab, kui suure osa sõltuva suuruse hälvete ruutude summana mõõdetud koguhajuvusest seos ära seletas.

Ruutjuurt determinatsioonikordajast nimetatakse üldjuhul korrelatsioniindeksiks (r) ehk korrelatsioonikordajaks ehk korrelatsioonikoefitsiendiks. Korrelatsioonikordaja väärtused on vahemikus -1 kuni 1.
  • Korrelatsioonikordajaid on palju. Sagedamini kasutatav on kovariatsioon (koos varieerumine ehk koos erinemine). Korrelatsioonikordaja kirjeldab vaid lineaarset seost!
  • Korrelatsioonikordaja saab olla vahemikus -1 kuni 1. 0 ütleb, et seost ei ole, 1 ütleb, et on funktsionaalne seos. 0 lähedal on seos nõrk, 1 seos on tugev.
  • Kui r= -1, siis on tegemist kahaneva funktsionaalse seosega kahe suuruse vahel. Kui r =1, siis kasvava funktsionaalse seosega suuruste vahel. Ülejäänud r väärtuste korral sõltub üks tunnustest teisest korrelatiivselt, juhul kui r pole null. Kui r =0, siis eksisteerib kolm võimalust:

a) üks tunnus sõltub teisest funktsionaalselt, kuid mitte korrelatiivselt (vaatluspunktid horisontaalsirgel);
b) seose suund pole määratud (vaatluspunktid ringikujulisel alal);
c) puudub lineaarne seos, kuid tegemist on mingit mittelineaarset seost esitavate andmetega (vaatluspunktid paiknevad sümmeetriliselt näiteks paraboolil).
EKSAMI KÜSIMUSED SEOSTE ANALÜÜSI KOHTA:
  • Korrelatsioonikordaja 1,2 näitab väga tugevat positiivset seost. VALE kuna korrelatsioonikordaja on vahemikus 0-1.
  • Regressioonikordaja peab olema alati positiivne. VALE kuna võib olla ka – ehk vastassuunaline.
  • Vabaliige näitab seose selgitusvõimet. VALE, näitab punkti kus sirge lõikab y telge.
  • Regessioonikordaja näitab y kordset muutumist x-i 1 ühikulise muutumise korral. Õige oli ei ükski variant kuna õige oleks y ühikulist muutumist x-i 1 ühikulise muutumise korral.

AEGREAD
  • Aegread on statistiliste ridade eriliik teisiti nimetatakse kronoloogilisteks ehk dünaamikaridadeks.
  • Sisuliselt võib aegridu tõlgendada statistiliste valimitena, kus iga valimi objekti korral on muude tunnuste kõrval fikseeritud ka aega väljendav (enamasti determineeritud) suurus.
  • Jagunevad omakorda moment- ja perioodridadeks. Momentrea iga liige on seotud kindla ajamomendiga, perioodrea iga liige mingi ajavahemikuga (perioodiga).

Nt. momentrida: kaubamaja töötajate arv iga kvartali esimese kuupäeva seisuga. Valuuta- ja aktsiakursid, börsiindeksid, arvutisse sisseloginute arv. Perioodrida : reastatud andmed tehase kuutoodangute maksumuste kohta. Kaupluse läbimüük kvartalite kaupa, veebiserveri poole pöördumiste arv tundide kaupa.
  • Perioodrea liikmete summal on majanduslik mõte: väljendab vastava pikema perioodi jooksul kujunenud tunnuse väärtust. Momentrea liikmete summa on seevastu mõttesisutu.
  • Eristamine on vajalik keskmiste arvutamisel. Kronoloogilist keskmist saab arvutada momentrea puhul vaid siis kui momendid on fikseeritud võrdsete ajavahemike järel. Kui aga ei ole võrdseid ahavahemikke, siis aritmeetiline keskmine.
  • Aegridadest ei saa ühtegi üksikut vahepunkti ehk erindit eraldada (välja võtta).
  • Aegrida koosneb 4 komponendist : tendents , harmooniline komponent, sesoonne komponent, juhuslik komponent.
  • Aegrea mudelid: aditiivne mudel, multiplikatiivne mudel (trend, sesoonne komponent, tsükliline komponent, irregulaarne komponent).
  • Aegridade kompleksanalüüsi korral jaotatakse (lammutatakse) aegrida komponentideks. Kaheks komponendiks: seaduspäraselt ehk süsteemselt ja juhuslikult muutuvaks osaks Seaduspärased muutused: trend, sesoonne, tsüklilised muutused. Juhuslik komponent – puudub seaduspärasus. Esineb ebavõrdsete ajavahemike järel. Esineb juhuslike šokkidena. Kompleksanalüüsi korral kui toimub osadeks lammutamine , siis esimesena otsitakse juhuslikku komponenti.
  • Trend ehk tendents. Lihtsamateks meetoditeks trendi leidmiseks ja kirjeldamiseks on libisevad ja eksponentkeskmised (lisaks aegrea analüütiline silumine). Mugavaks vahendiks trendi esitamiseks on tunnuse trendiväärtuste kirjeldamine funktsioonina ajast. Räägitakse kas lineaarsest või mittelineaarsest trendist.

Aegridades võib täheldada kolme liiki trende:
keskmise taseme trend;
dispersiooni trend;
autokorrelatsiooni trend.
Keskmise taseme trend on tavaliselt hästi jälgitav aegrea graafikul; trendi võime kujutada mingi matemaatilise funktsiooni graafikuna, joonena, mille ümber varieeruvad uuritava nähtuse tegelikud väärtused. Taolisel juhul on trendi väärtused üksikutel ajamomentidel uuritava nähtuse matemaatilisteks ootusteks, millest tuleb ka kasutatav nimetus – keskmise taseme trend.
Dispersiooni trend kujutab endast nähtuse empiiriliste väärtuste ja determineeritud komponendi – keskmise taseme trendi – vaheliste hälvete muutumise tendentsi. Ka see trendi liik on sageli (kuid mitte alati) jälgitav aegrea graafikult.
Autokorrelatsiooni trend on aegrea üksikute liikmete vahelise seose muutumise tendents. Aegrea graafikult selline muutumine otseselt jälgitav pole, kuid kuid ta omab suurt tähtsust prognoosimisel.
  • Tsüklilised muutused (ehk harmoonilised muutused) on aastast pikema perioodiga trendi ümbruses toimuvad perioodilisele lähedased muutused tunnuse väärtustes.
  • Hooajaline muutus ehk sesoonne - ajas perioodiliselt toimuvad muutused. Hooajaline, nt. Kevad, suvi… Avaldub lühikese võnke puhul. Aeg alla aasta.
  • Lihtsaim aegridade tasandamise meetod on visuaalne tasandamine. Sel juhul esitatakse aegrida graafiliselt ning tunnuse väärtuste tendentsi hinnatakse silma järgi. Kõige sagedamini tähendab see sirge paigutamist graafikule nii, et see tundub tunnuste väärtustes esinevat kasvu- või kahanemistendentsi piisavalt hästi kirjeldavat. Kasutatakse ka tasandamist kõvera abil, siis joonistatakse graafikule sujuv kõver, mis näib toimuvat hästi kirjeldavat. Visuaalse tasandamise põhiprobleemiks on see, et ta on subjektiivne ning sõltub tugevalt sellest kes on tasandaja ja milline on tema nägemus heast kirjeldamisest ning uuritava nähtuse arengust. Analüütiline tasandusmeetod tugineb tulemuse objektiivsust tagavale arvutusmeetodile. Lihtsaim meetod on libisev keskmine, mõnevõrra keerulisem on eksponentkeskmine. Ka eksponentkeskmised ei võimalda aegrida kokkuvõtlikult esitada. Tasandamisel püütakse kasutada lihtsaid funktsioone mille parameetrid leitakse harilikult analoogiliselt regressioonanalüüsiga.
  • Libisevaks keskmiseks nimetatakse aegrea kindlast arvust järjestikku liikmetest leitavaid keskmisi. Iga uue libiseva keskmise väärtuse arvutamisel jäetakse eelmise keskmise arvutamiseks kasutatud aegrea liikmete hulgast välja ajaliselt kõige varasem ning lisatakse järelejäänutele ajaliselt vahetult järgnev uus aegrea liige. Libisemissammuks võib olla paaris või paarituarv aga soovituslikult on parem kasutada viimast varianti , sest sellisel juhul paiknevad keskmised ajaliselt kohakuti esialgse rea elementidega.

Libiseva keskmise puhul tuleb silmas pidada, et tunnuse väärtuste kasvamise korral kalduvad libisevad keskmised tunnuse väärtusi alla hindama ja kahanemise korral üle hindama.
Libisev keskmine tasandab ära jääkliikmete varieerumise.
  • Eksponentkeskmised arvutatakse iga ajamomendi (perioodi) jaoks sellele momendile (perioodile) vastava tunnuse tegeliku väärtuse ja sellele vahetult eelnevale ajamomendile vastava eksponentkeskmise kaalutud keskmisena. Eksponentkeskmise leidmisel võetakse rea liikmed arvesse seda väiksema kaaluga, mida varasemale ajale nad vastavad võrreldes vaatlushetkega. Eksponentkeskmise leidmist alustatakse keskmistamiskaalu (tasandusparameetri) valikuga. Kui see võrduks ühega, siis oleksid kõik eksponentkeskmise väärtused võrdsed neile vastava rea liikmega ning tasandamist tegelikult ei toimugi. Kui võrduks nulliga, siis võrduksid kõik eksponentkeskmised kõige esimese eksponentkeskmise hinnatud väärtusega ning rida tasanduks horisontaalseks sirgeks .

Eksponentkeskmise kasutamisel tuleb silmas pidada, et üldise kasvutendentsiga aegridade korral kaldub eksponentkeskmine tunnuse väärtusi alla hindama ja üldise kahanemistendetsiga ridade korral neid üle hindama.
  • Prognoosiks nimetatakse kindlatele andmetele ja objektiivsetele meetoditele tuginevat ennustust.

Prognoos eeldab, et leiame olemasolevale aegreale kirjelduse.
Prognoosi pole motet anda mitteusaldava näitaja järgi.
Eristatakse punktprognoose, mille korral saadakse prognoositava tunnuse jaoks üks väärtus ja vahemikprognoose, mille korral hinnatakse väärtusvahemikku, millesse tunnuse väärtus teatud usaldatavusega jääb.
Eristatakse interpoleerimist ja ekstrapoleerimist. Mõlemal juhul on tegemist kahe muutujaga, millest üks on sõltuv ja teine sõltumatu (argument), kusjuures sõltuva tunnuse väärtused on teada ainult osade argumenttunnuse väärtuste jaoks. Argumenttunnuse väärtuste vahemikku, millesse jäävate väärtuste jaoks on teada sõltuva tunnuse väärtusi, nimetame seose määramispiirkonnaks.
  • Interpoleerimiseks nimetatakse mitteteadaolevate sõltuva tunnuse väärtuste hindamist seose määramispiirkonnas. Hindamisel tuginetakse teada olevatele sõltuva tunnuse väärtustele. Aegridade interpoleerimiseks on kasutatavad nii eespool käsitletud tasandamismeetodid kui elementaaranalüüsi meetodid.

Prognoosi tegemiseks koostatakse prognoosifunktsioon, mis annab seose kasutatavate alussuuruste ja hinnatava näitaja vahel. Aegreana esitatud tunnuse sõltuvus ajast võib olla funktsionaalne, stohhastiline või sisaldada mõlemat komponenti. Tunnuse väärtused stohhastilises aegreas on vaadeldavad aegrea aluseks oleva juhusliku protsessi realisatsioonina. Juhuslik on protsess, mille käigus uuritava tunnuse väärtused genereeritakse vastavalt mingile tõenäosuslikule seaduspärasusele. Juhuslik protsess on statsionaarne , kui tema tõenäosuslikud omadused ajas ei muutu. Vastasel korral on tegemist mittestatsionaarse juhusliku protsessiga. Sageli on võimalik jaotada aegrida komponentideks nii, et tema juhuslik komponent on statsionaarse juhusliku protsessi realiseeringuks.
  • Ekstrapoleerimiseks nimetatakse sõltuva tunnuse väärtuste hindamist väljaspool seose määramispiirkonda. Ekstrapoleerimisel tuginetakse kas vahetult teada olevatele sõltuva tunnuse väärtustele või varem kindlaks tehtud seosele tunnuste vahel. Seoses aegridadega eristatakse retrospektiivset (ajas tagasi vaatavat) ja perspektiivset (tulevikku suunatud) ekstrapoleerimist. Just viimane on aluseks statistilistele prognoosidele.

INDEKSID
  • Dünaamika suhtarvud , näitavad kuidas nähtus on muutunud (mitu korda on väärtused muutunud).
  • Liigitus: 1) lihtindeksid (valem kahe arvu suhe); 2) liitindeksid; 3)individuaalindeksid (tähis i)- kogumi näitajate muutused, üksiku toote indeks; 4)üldindeksid, nt: THI. Tähis: Ip, Iq.
  • Kvalitatiivne muutuvsuurus: näitab intensiivsust ehk on intensiivsusnäitajad. Nt. hind, tootlus (midagi millegi kohta). Hind – raha/liitri ehk koguse kohta, kiirus – km/h.

Kvantitatiivne muutuvsuurus: näitab hulka, mahtu.
Kvalitatiivne x Kvantitatiivne = resultaat (tegurisüsteem).
Nt: hind (Ip)x kogus (Iq) = Maksumus (Ipq)
kogus hind = tarbitud kauba maksumus; kogus omahind = toodangu maksumus; aeg kiirus = tee pikkus; külvipind saagikus = saak; töötundide arv tootlus = toodete arv.
  • Ühismõõtsustamine ehk ühismõõtseks saamine.
  • Varasema perioodi kaubakogus Laspeyres hinnaindeks:

ILP= p1q0/p0q0
Juhul kui võrrelda hilisema perioodi kaubakogumi maksumusi hilisemates ja varasemates hindades, saab Paasche hinnaindeksi:
IPP= p1q1/ p0q1
  • Juhul kui ühismõõtsustajateks on varasema perioodi hinnad, saab Laspeyresi koguseindeksi:

ILq=p0q1/p0q0, kus q1 – tänane kogus, q0 – baas, eilne kogus.
Juhul kui ühismõõtsustajateks on hilisema perioodi hinnad, saab Paasche koguseindeksi:
IPq=p1q1/p1q0
VALIMID
  • Kui vaatlusega ei ole võimalik vaadelda kõiki uuritava kogumi liikmeid, vaid on võimalik vaadelda vaid osa neist, siis sellist vaatlust nimetatakse väljavõtuvaatluseks ja selle tulemusel saadavat kogumit nimetatakse väljavõtukogumiks ehk valimiks .
  • Valimivaatlus nt. rahvaloendus . Negatiivne pool: kulukas ja aeganõudev. Suur üldkogum N, vaatlusobjekt n. Kõigepealt toimub tulemuste väljavõtt ja seejärel tulemuste ülekandmine ehk tagasikandmine. Valimivaatlus võib ja ei pruugi olla ebatäpne.
  • Usaldatav väljavõtukogum peab olema üldkogu suhtes esinduslik. Esinduslikkuse tagamiseks tuleb kasutada juhuväljavõttu. Juhuväljavõtuga on tegemist kui igal uuritava kogumi liikmel on ühesugune tõenäosus sattuda väljavõtukogumisse. Kasutatakse kahte juhuväljavõtu viisi: kordumistega ja kordumisteta. Kordumisteta väljavõtu korral loetakse kord juba väljavõtukogumisse sattunud üldkogumi liige sellest eemaldatuks ja tema teistkordne valimisse sattumine on välistatud. Nt. Bingo Loto (pall ei lähe tagasi üldkogumisse). Kordumistega väljavõtu korral võib iga üldkogumi liige sattuda väljavõtukogumisse mitmeid kordi . Eristatakse suunamata ja suunatud juhuväljavõtte. Suunamata juhuväljavõtt – üldkogumi elemente võetakse täiesti juhuslikult. Suunatud juhuväljavõtt – jaotatakse üldkogum enne väljavõttu osakogumiteks, et tagada üld- ja väljavõtukogumi struktuuride paremat kokkulangevust. Nt. 1000 in, Elanikkond jaguneb pooleks 50/50. Valimis 500 meest ja 500 naist. 500 meest ja naist valitakse juhuslikult.
  • Kui üldkogum on normaaljaotusega, siis on ka väljavõtukeskmiste jaotuseks normaaljaotus, kusjuures selle keskväärus võrdub üldkogumi keskväärtusega.
  • Üldkogumi parameetrite hindamine. Punkthinnangu andmisel antakse parameetri väärtuseks väljavõtukogumi mingi statistiku või statistikute kombinatsiooni arvväärtus. Me teame, et iga konkreetse punkthinnangu väärtus erineb hinnatava parameetri tegelikust väärtusest. Parameetri hinnangu ja tegeliku väärtuse erinevust nimetatakse esindusveaks. Selle tekkimise põhjuseks on väljavõtuvaatluse iseloomust tingitud valimi ja üldkogumi struktuuride erinevus. Esindusvea väärtuse määramine ei ole võimalik, sest see eeldaks parameetri tegeliku väärtuse teadmist. Üldkogumi parameetri vahemikhinnang on piirkond arvteljel, millesse hinnatav parameeter jääb teatud usaldatavusega. Vahemikhinnangul on mõned olulised omadused: usaldatavuspiirkond on seda laiem, mida suurem on usaldatavus ja seda väiksema täpsusega on määratud hinnatav parameeter. Mida suurem on väljavõtukogum, seda kitsam on usaldatavuspiirkond ja seda täpsemalt on määratud hinnatav parameeter.
  • Keskväärtuse hindamisel võrdub keskmine esindusviga ehk standardviga δ väljavõtukeskmiste standardhälbega.
  • Valimi kaalumist kasutatakse valimi esinduslikkuse parandamiseks. Kui valim vajab kaalumist mitme erineva tausttunnuse järgi, siis objektidele kaalude omistamisel korrutatakse omavahel erinevate tausttunnuste järgi saadud kaalud.
  • Valimi keskmise leidmisel kasutatakse aritmeetilist keskmist.
  • Vea komponendid: valikuviga, loendiviga, kaoviga, objektide asendamise viga, mõõtmisviga, töötlusviga.
  • Usaldatavus: 1 sigma = 68,27 %; 1,96 sigma ( standartne ) = 95%; 2 sigma = 95,45%; 3 sigma = 99,73 %. Usaldatavus 100% tähendab vahemikku( –lõpmatus... + lõpmatus).

HÜPOTEESID

Statistiline hüpotees – oletus on tehtud üldkogumi koguse kohta ja tegu on arvväärtusega.
Nullhüpotees - hüpotees mis määrab üldkogumile võimalikult lihtsa struktuuri, sisuks üldkogumi vastavus standardile. Saame kontrollida trendi seost.
Seose juures võimalikult lihtne struktuur ehk seos puudub (pole seost, pole probleemi). Nt. trendi pole, faktori mõju puudub.
Alternatiivne hüpotees – vaidleb nullhüpoteesile vastu.
Kontrollstatistik on väljavõtustatistik, mille alusel tehakse otsus nullhüpoteesi kohta. Kontrollstatistiku väärtuste piirkonda, milles võetakse vastu alternatiivne hüpotees nimetatakse kriitiliseks piirkonnaks .
  • Hüpoteeside paar tuleb sõnastada korralikult.
  • NÄIDE: Testi täitmiseks on antud 10 minutit. (See tähendab, et standard on 10 minutit)

H0: μ = 10 (nullhüpotees: keskmine aeg on 10 minutit)
H1: μ ≠ 10 (tähendab, et on OLULISELT erinev)
Kui saame 15, siis VASTUS: keskmine on 10-st oluliselt erinev ehk H1 kehtib. (Kui õiget aega pole küsitud, siis vastus seda ei sisalda)
  • Enne hüpoteesi kontrollimist on võimalus

Nullhüpotees: vastu võtta ei saa aga tagasi saame lükata.
Alternatiivne hüpotees: vastu saame võtta aga tagasi lükata ei saa.
Nt: Persoon on kohtualune
H0: kohtualune ei ole süüdi
H1: kohtualune on süüdi
Otsuse langetamiseks on vaja tõendeid (infot). Peame kokku panema valimi. Kui süütõendeid on piisavalt on süüdi. Kui ei ole süütõendeid piisavalt ei ole süüdi.
Kui H1 on vastu võetud (kui on loobutud H0), siis võetakse vastu tagasipöördumatu vastus.
H1 puhul ei saa otsust tagasi võtta (nt. süüalune on maha lastud aga vea puhul ei saa seda olematuks teha).
DISPERSIOONANALÜÜS
  • Ei analüüsi dispersiooni. Näide: kui on vaja teha kindlaks kas eksamitulemus sõltub nädalapäevast? Dispersiooni kasutatakse arvutamisel. Nt: odra mõju õllele? Analüüsi saab kasutada küsimuste lahendamisel. Annab rakendada ka kvalitatiivsete tunnuste puhul. Nt. viiepalliskaalal hinnatud rahulolu.

Analüüsimeetod põhineb dispersioonide liitmise lausel.
Kogumi ülddispersioon = rühmade vaheline dispersioon + rühmade sisene dispersioon.
Nt. uuritav nähtus meeleoli.
Sõltub: temperatuurist, kõhu täis olemisest, rahalisest seisust, suhetest, tervisest jne... Võetakse 1 faktor tervis. Uuritav faktor ühel pool: tervis. Ja teised teisel pool (juhuslikud faktorid on teised). Vaadatakse kus on varieeruvus. Seejärel kontrollitakse hüpoteesi.
  • Rühmade sisene dispersioon – hajuvus ühe rühma piires (jääkfaktorite mõju, jääkvarieeruvus). Leiame rühma keskmise ja siis võrdleme seda keskväärtuste varieerumisega.
  • Rühmade vaheline dispersioon: 2 rühma vaheline. Võrreldakse uuritava faktori mõju.
  • Kogumi dispersioon: Igat komponenti vaadeldakse üldkeskmise suhtes.
  • Dispersioonanalüüsi abil jaotatakse uuritava tunnuse dispersioon mõju avaldavate tegurite järgi komponentideks ning kontrollitakse selle juures püstitatud hüpoteeside paikapidavust. Keskväärtuste erinevuste põhjuste selgitamiseks võib üheaegselt kasutada mitut faktortunnust.
  • Mida suurem on rühmade erinevus, seda suurem mõju on metoodika faktoril.

Selleks, et öelda kas erinevus on piisav, peame võrdlema empiirilist kriitilisega:
Femp > Fcrit
H0 lükatakse tagasi
Femp crit
H0 jääb kehtima
ÜLESANDED
KESKMISED
  • ÜL. Midagi liigub punktist A punkti B, vahemaa 100 km. Läbib edasi ja tagasi. Minnes 60 km/h, tagasi 120 km/h. Leidke keskmine kiirus punktist A punkti B ja tagasi.

Kiirus= teepikkus/aeg
Keskmine kiirus= teepikkuste summa/aegade summa
Aeg=teepikkus/kiirus
Aeg1=100/60=1,6
Aeg2=100/120=0,833
Kokku kulus aega 2,5 h
Keskmine kiirus= (100+100 (teepikkuste summa)) /(1/60*100)+(1/120*100) ehk esimese etapiaeg ja teise etapi aeg = 80 km/h
Seega õige oli valida harmooniline keskmine kuna aritmeetiline keskmine oleks olnud: 60+120/2=90 km/h
VALIMID
Valem, kui ei tea üldkogumi suurust:
μ = aritmeetiline keskmine +- usaldatavus (1,96 standard) * sigma/ (ruutjuur)vaatlusobjektide arv n
Vastus kirjutada järgmiselt:
Vastus: vahemik on (kandiliste sulgude vahele kirjutada number... number), usaldatavusega 95%.
Vasakule Paremale
STATISTIKA konspekt #1 STATISTIKA konspekt #2 STATISTIKA konspekt #3 STATISTIKA konspekt #4 STATISTIKA konspekt #5 STATISTIKA konspekt #6 STATISTIKA konspekt #7 STATISTIKA konspekt #8 STATISTIKA konspekt #9 STATISTIKA konspekt #10
Punktid 50 punkti Autor soovib selle materjali allalaadimise eest saada 50 punkti.
Leheküljed ~ 10 lehte Lehekülgede arv dokumendis
Aeg2014-01-27 Kuupäev, millal dokument üles laeti
Allalaadimisi 69 laadimist Kokku alla laetud
Kommentaarid 0 arvamust Teiste kasutajate poolt lisatud kommentaarid
Autor grero Õppematerjali autor

Sarnased õppematerjalid

Standardhälve-SEOSED JA DISPERSIOONANALÜÜS
26
doc

Standardhälve, SEOSED JA DISPERSIOONANALÜÜS

Standardhälve 1. leitav dispersiooni ruuduga (ruutjuurega) 2. paikneb alati vahemikus 0 ... lõpmatus (kui on alternatiivne tunnus, siis saab olla kuni 0,5 ­ see on triki küsimus, kui panid õige, siis on ÕIGE) 3. ei saa olla lineaarhälbest suurem (väiksem) 4. varieeruvas reas = 0 (st puhul rida just varieerub) 5. ei ükski Regressioonianalüüsi kõige üldisem eesmärk: 1. kirjldada korrlatiivset seost metemaatika funktsioonina Pidev juhuslik suurus... 1. võib omada ükskõik milliseid väärtusi tema võimalikke väärtusi hõlmavas arvuvahemikus. 2. juhuslikku suurust nim pidevaks juhuslikuks suurusesks, kui tema võimalike väärtuste hulk on loenduv. Lineaarne regressioonimudelil: 1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi eesmärk on: 1.

Statistika
Statistika eksamiks
86
doc

Statistika eksamiks

Eksponentkeskmist kasutatakse, kui on tegemist: 1. Keskmise taseme leidmisega väga pikkades aegridades 2. Keskmise taseme leidmisega momentreas ja ajavahemikud on võrdsed 3. Keskmise taseme leidmisega perioodreas ja perioodid ei ole võrdsed 4. Aegreaga ja väärtuste standardhälbe arvutamise juures 5. Aegreaga ja selle tasandamise juures Valimivaatluse korral 1. Usalduspiiride laius sõltub väärtuste varieerumisest 2. Suurema valimi kasutamisel usalduspiirid laienevad 3. Valitud usaldatavus ei avalda mõju moodustatava valimi suurusele 4. Keskmine esindusviga ei sõltu valimi suurusest 5. Suurem valimi kasutamine vähendab väärtuste varieerumist üldkogumis Esindusviga on oma sisult: 1. Viga mis tekib aritmeetilise keskmise ebatäpsuse tulemusena 2. Kõikide võimalike esindusvigade harmooniline keskmine 3. Väljavõtukogumi ja üldkogumi struktuurid erinevuse tulemusel tekkinud ebatäpsus 4. Ei ükski eelnevatest

Statistika
Statistika kordamisküsimused
22
docx

Statistika kordamisküsimused

1. MÕÕTMINE Mõõtmine on objektide võrdlemine - Korraga saab võrrelda ainult kaht objekti omavahel. Kui objekte palju, valitakse välja üks (etalon) ning teisi võrreldakse sellega. Otsene mõõtmine ja kaudne mõõtmine – otseste mõõtmiste kaudu Nimi- ehk nominaalskaala – objektide eristamiseks – sugu, rahvus, huvid, kaubakood, ettevõtte registrinumber Järjestusskaala – võimaldab objekte järjestada mingi tunnuse alusel – nt ettevõtted: väikesed, keskmised, suured – küsitlus: "poolt", pigem poolt kui vastu", "pigem vastu kui poolt", "vastu" – intervallid skaalajaotuste vahel pole võrdsed Intervallskaala – skaalajaotuste intervallid on võrdsed  Vahemikskaala – nullpunkti asukoht kokkuleppeline – ajaskaala, Celsiuse skaala temperatuuri mõõtmiseks – võib leida vahesid, ei tohi leida suhteid  Suhteskaala – nullpunkt fikseeritud absoluutselt – objekti pikkus, kaal, töötajate arv, käive, m

Statistika
Tõenäosusteooria ja statistika
20
docx

Tõenäosusteooria ja statistika

1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi:  Uuringu ettevalmistamine  Statistiline vaatlus või eksperiment  Vaatlusandmete kokkuvõtte ja esialgne töötlemine  Andmete analüüs, järelduste ja üldistuste sõnastamine. 3. Statistlise vaatluse vead. Eristatakse vaatlusmeetodist tulenevaid metodoloogilisi vigu ja registreerimisvigu. Metodoloogilised nt : valimivaatlusel esinevad representatiivsusvead – valim ei kirjelda üldkogumit adekvaatselt. Vaa

Tõenäosusteooria ja statistika
Statistika eksamiküsimused
5
docx

Statistika eksamiküsimused

- 11000.- -3% Peet 5500.- 9000.- +3% Suurenes 1,12 % Suurenes 4,1% Jäi samaks Vähenes 0,6 % Ei ükski eelnevatest var. Millised on riiklikule statistikale esitatavad põhinõuded? Ametialaselt sõltumatu, volitus andmete kogumiseks, ressursside piisavus, kvaliteetne pühendumine (asjakohasus täpsus, õigeaegsus, sidusus jne), statistika konfidetsiaalsus (kaista isikute ja ettevõtete üksikandmeid), erapooletus, läbimõeldud metoodika, asjakohased statimenetlused, tasuvus. EL Nõukogu määrus statistika kohta, Riigi siseselt ­ est riiklik statistika seadus, andmekaitsekord, Statiameti põhikiri.

Algebra I
Statistika eksamiküsimused
16
docx

Statistika eksamiküsimused

Statistika eksamiküsimused Eksponentkeskmist kasutatakse, kui on tegemist: ei ole mitte 1 keskmine väärtus, vaid rea tasandamine, rea silumise meetod  keskmise taseme leidmisega väga pikkades aegridades – VALE  keskmise taseme leidmisega momentreas ja ajavahemikud on võrdsed - VALE, kronoloogilist keskmist kasutaks  keskmise taseme leidmisega perioodreas ja perioodid ei ole võrdsed - VALE, tavalist aritmeetilist keskmist kasutaks  aegreaga ja väärtuste standardhälbe arvutamise juures - VALE, standardhälve leidmisel kasutatakse aritmeetilist keskmist  aegreaga ja selle tasandamise juures – ÕIGE Tugeva samasuunalise lineaarse seose y=a+bx korral  regressioonikordaja on alati vahemikus 0 kuni +1 - kindlalt vale, võib olla mis iganes (nii neg kui üle ühe), näitab x ühikulist mõju y-le  lineaarse kor.kordaja ja regr.funktsiooni parameetri a märgid langevad kokku  regr.kordaja peab olema eranditult positiivne - õige, (muidu võib olla neg) aga l

Statistika
Statistika konspekt
19
doc

Statistika konspekt

KIRJELDAVAD STATISTIKUD INTERVALLITUD REAS Kirjeldav statistika on numbriliste andmete organiseerimine ja summeerimine, see on vajalik andmeanallüüsi esimesel etapil. Valimit kirjeldatakse, kuid üldistusi ei laiendata üldkogumile. Kirjeldav statistika annab järgmist informatsiooni: ­ uuritava tunnuse väärtuste vahemik ­ tunnuse kõige tüüpilisemad väärtused ­ tunnuse varieeruvus Lisaks aitab kirjeldav statistika sõnastada hüpoteese ning tõlgendada uurimistulemusi. Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on

Majandus
Statistika eksamiks kordamiseks küsimused
28
doc

Statistika eksamiks kordamiseks küsimused

 Kvantitaiivne tunnus (arvtunnus) on tunnus , mille väärtused on arvud (nt. Pikkus, kaal, rahvaarv, keskmine hinne)  Kvalitatiivne tunnus on tunnus, mille väärtused ei ole arvud ( juustevärv, perekonnaseis, rahvus). STATISTIKA EKSAMI KORDAMISKÜSIMUS TE VASTUSED 1. Statistika aine ja meetod Statistika on iseseisev teadus. Ta uurib ühiskondlike nähtuste kvantitatiivset külge lahutamata seoses nende kvalitatiivse küljega ja ühiskonna arengu kvalitatiivset väljendumist konkreetsel ajal ja kohal. Peamiselt tegeleb statistika : 1) Statistiliste andmete hankimisega e. statistiline vaatlus 2) Ststistilise informatsiooni kompaktne ja ülevaatlik esitamine e. Kirjeldava statistika (andmete esitamine ja organiseerimine)

Ettevõtluse alused




Kommentaarid (0)

Kommentaarid sellele materjalile puuduvad. Ole esimene ja kommenteeri



Sellel veebilehel kasutatakse küpsiseid. Kasutamist jätkates nõustute küpsiste ja veebilehe üldtingimustega Nõustun