Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Statistiliste andmete töötlemine". Need materjalid aitavad sul teemat sügavamalt mõista.
karakteristikud, hajuvus, statistiliste, hajuvuse, suuremaid, variatsiooni, standardhälve, andmeanalüüs, tervikut, seisukohast, arvteljel, esinevat, xmax, xmin, üksiku, ruutude, keskväärtus, valimiteStatistilise rea karakteristikud. Tunnuseid ( nende väärtusi) iseloomustavad teatud suurused nn. karakteristikud. Karakteristikud on tunnuse jaotust ja selle omadusi iseloomustavad suurused. Karakteristikud jagunevad I keskmised e. paiknevuse karakteristikud - väljendavad antud tunnuse mingit keskmist väärtust, mille ümber tunnuse väärtused paiknevad. II hajuvuse karakteristikud - iseloomustavad tunnuse väärtuse hajuvust s.t kas väärtused erinevad üksteisest vähe või palju. Keskmised e. paiknevuse karakteristikud. Keskmised jagunevad a) asendikeskmised ( mediaan, mood) - sõltuvad elementide asendist variatsioonreas, b) mahukeskmised (keskväärtus, kaalutud aritmeetiline keskmine, harmooniline keskmine, geomeetriline keskmine, ruutkeskmine) -
üksikuid väärtusi, vaid tunnuse väärtuste vahemikud ehk klassid. Klasside arv: kui kogumi maht N ei ole väga suur, on klasside arv umbes √N . Klassipiiride leidmine (Max-Min)/klasside arv. 14. Histogramm – kui sagedus- või jaotustabelis on tunnuse väärtused esitatud vahemikena, kujutatakse neid andmeid geomeetriliselt tulpdiagrammina, mida nimetatakse histogrammiks. (tulbad üksteise kõrval, ilma vaheta) ÜL.150, 153 15. Karakteristikud – arvulised suurused, mis iseloomustavad tunnuse väärtuste jaotust kui tervikut mingist seisukohast (jaguneb: 1) – paiknemise karakteristikud ehk keskmised ja 2) – hajuvuse karakteristikud) 16. Paiknemise karateristikud – annavad informatsiooni tunnuse väärtuste paiknemise kohta arvteljel ja iseloomustavad tunnust keskmise väärtuse seisukohalt. (aritmeetiline keskmine, mediaan, mood) 17
Võrdlusdiagramm diagramm, mille abil saab võrrelda kahe või enama nähtuse mahtu. (tulp-,joon-, või lintdiagramm) Struktuurdiagramm diagramm, mille abil saab millegi koostist iseloomustada. (sektordiagramm, kastidiagramm, tulpdiagramm) Jaotushulknurk, jaotuspolügoon sirglõik diagramm, mis vastab jaotustabelile. Tulpdiagramm, histogramm kui sagedus- või jaotustabelis on tunnuse väärtused eistatud vahemikena, kujutatakse neid andmeid geomeetriliselt tulpdiagrammina. Andmete karakteristikud andmete kogumise järgnenud andmete töötlemise teel leitud arvulised suurused, mis iseloomustavad tunnuse väärtuste jaotust kui tervikut mingist seisukohast. Paiknemise karakteristikud annavad informatsiooni tunnuse väärtuste paiknemise kohta arvteljel ja iseloomustavad tunnust keskmise väärtuse seisukohalt. Aritmeetiline keskmine tunnuse kõigi väärtuste summa ja kogumi mahu (objektide arvu) jagatis.
Variatsioonireas on andmed kasvavas või kahanevas järjekorras. Sagedustabeli esimeses reas on tunnus x, teises sagedus f. Jaotustabeli esimeses reas on tunnus x, teises suhteline sagedus W. Jaotushulknurk e. jaotuspolügoon on jaotustabelile vastav sirglõikdiagramm. Statistilise vahemiku e. klassi optimaalse arvu määrab N . Jooniseks saadakse tulpidagramm e. histogramm. Karakteristikud jagunevad kohakarakteristikuteks (keskmine, mediaan, mood) ja hajuvuse karakteristikuteks (muutumispiirkond, kvartiilid, hälve, dispersioon, variatsioonikordaja). Aritmeetiline keskmine x on tunnuse kõigi väärtuste summa ja väärtuste (objektide) arvu jagatis. Mood Mo on tunnuse kõige sagedamini esinev väärtus. Moode võib olla ka rohkem kui üks. Kui kõik väärtused on võrdsed, siis mood puudub. Mediaan Me on tunnuse väärtus, millest variatsioonireas jääb vasakule ja paremale võrdne arv liikmeid.
n i=1 3.2 Mediaan Me X = x0,5 Mediaan on variatsioonrea keskmine liige. Kui liikmeid on paaritu arv, siis keskmine liige. Kui liik 3.3 Kvartiilid Kv - alumine kvartiil ehk tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioon Kv - ülemine kvartiil ehk tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonr Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendik Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendik 3.4 Mood Mo - variatsioonrea kõige suurema esinemissagedusega liige 3.5 Dispersioon
Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika uurib statistika teoreetilisi aluseid, ta uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Üldkogum on kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi(Populatsioon).Valimiks nimetatakse mõõtmiseks võetud üldkogumi osa. Juhuslik valim, valimisse kuuluvad objektid valitakse välja täiesti juhuslikult üldkogumi kõigi objektide hulgast. Planeeritud valim valimisse kuuluvad objektid määratakse katseplaani järgi. Kõikne valim, valim langeb ühte üldkogumiga
Sageduste summa n=16 Tulpdiagramm 4. Suhteline sagedus (w) Tunnuse väärtuse esinemise arvu f suhe väärtuste koguarvu n f w = 100% n Sagedus-jaotustabel Jalanumber (x) 36 37 38 39 40 41 Sagedus (f) 2 2 5 3 3 1 Suhteline sagedus (w) %-des 12,5 12,5 31,25 18,75 18,75 6,25 Sagedus-jaotushistogramm Sektordiagramm 5. Asukoha karakteristikud Mood Mo Tunnuse kõige sagedamini esinev väärtus Mo=38 Mediaan Me Tunnuse väärtus, millest väiksemaid ja suuremaid väärtusi on võrdne arv Me=38 Aritmeetiline keskmine Tunnuse keskväärtus x + + xn x= 1 n =38,375 6. Hajuvuse karakteristikud Maksimaalne väärtus Tunnuse suurim väärtus x max = 41 Minimaalne väärtus Tunnuse vähim väärtus x min = 36 Variatsioonirea ulatus
on p. Nt 0,3 kvantiil on tunnuse selline väärtus, millest väiksemaid väärtuseid on variatsioonreas 30%. Täiendkvantiiliks nimetatakse juhusliku suuruse q-täiendkvantiili suuruse sellist väärtust xq, millest võrdsete või suuremate väärtuste esinemise tõenäosus on q. 9. Mis on tihedusfunktsioon? Tihedusfunktsioon on jaotusfunktsiooni tuletis: F'(x) = f(x). 10. Normaaljaotuse skitseerimine (tihedus- ja jaotusfunktsioon). Graafikult lugemine (aritmeetiline keskmine, standardhälve, mood, mediaan). 11. Mis omadused on normaaljaotusel? 1) normaaljaotus on sümmeetriline keskväärtuse µ suhtes: tema keskväärtus, mood ja mediaan võrduvad parameetriga µ 2) normaaljaotuse tihedusfunktsioonil on kaks käänupunkti, mis asuvad mõlemal pool keskväärtust kaugusel 3) normaaljaotuse asümmeetriakordaja ja ekstsess on nullid (A=0, E=0). 12. Missugused on juhusliku suuruse hajuvuse karakteristikud (nimeta vähemalt 4). Definitsioonid.
Matemaatilise statistika kordamisküsimused õpikust 1. Selgita, millega tegeleb statistika, millega matemaatiline statistika. Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemiste meetodeid. 2. Mis on üldkogum, mis valim? Too näiteid. Üldkogum on looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Üldkogumi osa nimetatakse valimiks. Valim: - Igal üldkogumi objektil peab olema võimalus valimisse sattuda. -Valim peab olema arvukas. Kõikne valim ehk üldkogum. 3. Mis on planeeritud valim, mis juhuslik valim
46 1 46 5,09 5,09 25,91 25,91 900 57,82 180,06 Variatsioonrida on kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida. 37, 37, 38, 38, 38, 38, 39, 39, 39, 39, 40, 40, 41, 43, 43, 44, 44, 44, 44, 44, 45, 46 Mood on tunnuse kõige sagedamini esinev väärtus. Mo= 44 Mediaan on arv, millest suuremaid ja väiksemaid väärtusi on vartiatsioonreas ühepalju. Me= ( 40 + 40) : 2= 40 Keskväärtus ehk keskimne x on tunnuse kõigi väärtuste aritmeetiline keskmine. x = 900 : 22 40,91 Keskmine hälve on hälvete aritmeetiline keskmine. = 57,82 : 22 2,63 Dispersioon on variatsioonreas olevatele andmetele vastava hälvete ruutude keskväärtus. 2 =180,06 : 21 8,57 Standardhälve on variatsioonreas oleva arvu ja keskväärtuse vahe. = 8,57 2,93
Binaarne tunnus -> Omab kahte teineteist välistavat väärtust (Nt. Sugu). Andmete sisestamisel ei tohi vigaseid väärtusi asendada tõenäoliselt õigega. Tööle tuleb kindlasti lisada KODEERIMISE EESKIRI! Keskväärtus, mediaan, mood 1) Diskreetse juhusliku suuruse keskväärtus nimetatakse selle suuruse võimalike väärtuste ja vastavate tõenäosuste korrutiste summat. EX = p1x1 + p2x2 + .... + pnxn 2) Mediaan arv, millest suuremaid ja väiksemaid väärtusi on variatsioonreas ühe palju. 3) Mood tunnuse kõige sagedamini esinev väärtus. Bimodaalne kui on kaks moodi. Hajuvusmõõdud Minimaalne element tunnuse väärtuste hulgas vähim. Maksimaalne elemet tunnuse väärtuste hulgas suurim. Variatsioonrea ulatus maksimaalse ja minimaalse elemendi vahe. Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonreas 25%.
1.00/1.00 Märgi küsimus lipuga Küsimus 4 Lõpetage järgmine definitsioon: ülemiseks kvartiiliks Q3 nimetatakse tunnuse väärtust, millest ... Osaliselt õige Hindepunkte Valige üks või mitu: 0.50/1.00 a. väiksemaid ﴾või võrdseid﴿ liikmeid on variatsioonireas 25 % Märgi küsimus lipuga b. väiksemaid ﴾või võrdseid﴿ liikmeid on variatsioonireas 75 % c. suuremaid ﴾või võrdseid﴿ liikmeid on variatsioonireas 75 % d. suuremaid ﴾või võrdseid﴿ liikmeid on variatsioonireas 25 % Küsimus 5 Määra järgmiste tunnuste tüüp. Õige Hindepunkte pangakontoris käinud klientide arv arvuline 1.00/1.00 Märgi
Kui autok. Esineb, tuleb mudel ümber vaadata, tuleb muuta spetsifikatsiooni. 2. Asümptootilised hinnangud kui juhuslike vigade normaaljaotuse eeldus ei ole täidetud, siis usalduspiirid on asümptootilised. Nad on täpsed siis, kui valimi maht on lõpmatu; lõpliku valimi mahu korral usalduspiirid on ligikaudsed. 3. Determinatsioonikordaja (D=R²) väljendab regressioonimudeli poolt kirjeldatud hajuvuse suhet (ESS explained sum of squares) modelleeritava näitaja (endogeense muutuja) koguhajuvusse (TSS total sum of squares). 4. Dispersioon iseloomustab juhusliku suuruse Xi erinevust keskväärtusest, seega iseloomustab tunnuse hajuvust. Valimi dispersiooni kui üldkogumi dispersiooni hinnangu tähiseks on tavaliselt Sruut, üldkogumi dispersiooni tähiseks ruut (kasutatakse teisi tähiseid
Sõiduvahendid 10 Kaugeimad sihtpunktid 11 Õpitulemused 12 NRG õpilased ja võõrkeeled 13 Vanuse ja sõiduvahendi vaheline seos 16 Kokkuvõte 17 Statistika mõisted Statistika teadus, mis käsitleb andmete kogumist, töötlemist, analüüsimist ja kokkuvõtlikku esitamist. Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Üldkogum kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Valim mõõtmiseks võetud üldkogumi osa. Valim peab olema küllalt arvukas ja igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Valimi moodustamiseks on kolm võimalust: · Juhuslik valim (juhuslikult valitud uuritavad objektid) · Planeeritud valim
astendamisel saadud arvude aritmeetilisi keskmisi. Arvu, millega momendi leidmisel hälbeid astendatakse, nimetatakse momendi järguks. VARIATSIOONINÄITARVUD · Variatsiooniamplituud (R= Xmax-Xmin)näitab äärmuste vahet. Äärmusi kirjeldab, ei kirjelda seda mis on kogumi sees. Väheväärtuslik, infot pea ei olegi. · Absoluutsed variatsiooninäitarvud: variatsiooniamplituud, keskmine lineaarhälve, dispersioon ja standardhälve, kvartiilhälve. Absoluutsete variatsiooninäitarvude suurus sõltub variantide absoluutväärtustest, mis muudab nad erinevate ridade võrdlemisel raskesti kasutatavateks. Teiseks probleemiks absoluutsete varieeruvusnäitarvude kasutamisel on ühik. Neil on mõõdetava suurusega sama ühik, mis muudab võimatuks erinevate ühikutega suuruste hajuvuse võrdlemise. · Keskmine lineaarhälve (d katusega) ehk keskmine absoluuthälve. Hälve ehk erinevus
................................................................ 13 4. Üldkogumile tulemuste leidmine (üldistamine)................................................................... 14 4.1. Normaaljaotus....................................................................................................................14 4.2. Keskväärtuse (keskmise) usaldusvahemik.........................................................................16 4.3. Statistiliste hüpoteeside kontrollimine...............................................................................16 4.3.1. Hüpoteesid ühe üldkogumi keskväärtusele.....................................................................17 4.3.2. Hüpoteesid ühe üldkogumi binaarse tunnuse väärtuse osakaalule ................................ 18 4.3.3. Hüpoteesid kahes sõltumatus üldkogumis keskväärtuste võrdlemiseks.........................18 4.3.4
90
80
70
60
50
40
30
20
10
0
Kuni 30a 31-42a 43-54a 55-66a Üle 67a
(*ülesanne 02)
Klassid W% 40
155
Ligikaudseks rühmade arvu määramiseks kasutatakse valemit: r=1+3,32*log n. Kus r – rühmade(intervallide) arv, n – kogumi maht. Intervalliks nim. uuritava tunnuse väärtuse vahemikku, millega määratakse kindlaks missugusesse rühma rühmitatava kogumi liige tuleb arvata. Ms Excelis on rühmitamise jaoks funktsioon FREQUENCY. Kogutud andmed moodustavad statistilise rea, mida korrastatakse, rühmitatake, leitakse nendele statistilised karakteristikud, moodustatakse tabelid ja diagrammid. Kui statistilises reas korrastatakse andmed nende väärtuste kasvavas või kahanevas järjestuses, nim tulemust variatsioonireaks. Lihtsatest ridades on sama palju arve kui on vaatlusega hõlmatud kogumis liikmeid. Intervallitud variatsioonirida hõlmab 2 koostisosa – intervallide loetelu ja igasse interv. langevate rea liikmete arv. 5. Kaalutud aritmeetiline keskmine – tuleb kasutada kui iga variant stat
vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi Assümeetria - Asümmeetria on jaotuskõvera maksimumi kõrvalekaldumine sümmeetriateljest. Kui jaotuskõvera maksimum (mood) on sümmeetriateljest (mediaan) paremal pool, on tegemist on negatiivse ehk vasakkaldelise asümmeetriaga. Kui maksimum on sümmeetriateljest vasakul, on tegemist positiivse ehk paremkaldelise asümmeetriaga
1.00/1.00 Küsimus 11 Lõpetage järgmiseid väiteid variatsioonikordaja kohta. Õige Hindepunkte variatsioonikordajat tavaliselt esitatakse protsentides 1.00/1.00 variatsioonikordaja on kasulik erinevates mõõtühikutes mõõdetud tunnuste hajuvuse võrdle variatsioonikordajal on mõte vaid siis, kui tunnuse positiivsed väärtused on variatsioonikordaja on mõõtühikuta suurus
1. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides
..................................................................................... 8 15. Ülemine kvartiil.............................................................................................................. 8 16. Kvartiilide vahe.............................................................................................................. 8 17. Dispersioon.................................................................................................................... 8 18. Standardhälve................................................................................................................ 8 19. Variatsioonikordaja........................................................................................................ 8 20. Kokkuvõttev tabel.......................................................................................................... 8 Järeldus.............................................................................................................
hinnet ning nende ainete keskmist hinnet. Samuti on välja toodud ka kõik kogutud andmed tabelis. Kõikide uurimustöös esinevate mõistete definitsioonid ning nende tähistused on eraldi välja toodud. Kokkuvõte on esitatud viimase leheküljena. 1. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides
seaduspärasuste avastamine (nt ettevõtete jaotamine mingite majanduslike näitajate põhjal). 1 Struktuurne – kvalitatiivselt ühetüübiliste rühmade seesmise struktuuri uurimiseks (nt autode rühmitamine remontidevahelise aja jooksul läbisõidetud tee pikkuse järgi). 5) Kogutud andmed moodustavad statistilise rea, mida korrastatakse, rühmitatakse, leitakse nendele statistilised karakteristikud, moodustatakse tabelid ja diagrammid. Variatsioonirida – tulemus, kui statistilises reas korrastatakse andmed nende väärtuste kasvavas või kahanevas järjestuses. Aegread (kronoloogilised read) – koosnevad andmetest, mis iseloomustavad nähtuse ajalist muutumist. Jagunevad: momentrida – iga liige seotud kindla ajamomendiga. perioodrida – iga liige seotud mingi ajavahemikuga. Intervallitud variatsioonireas on kasvavalt või kahanevalt järjestatud elemendid koos nende
Tunnuse kõikide väärtuste esinemissagedust absoluutarvudes, suhtarvudes ning protsentides. b. Tunnuse erinevate väärtuste esinemissagedust absoluutarvudes, suhtarvudes ning protsentides. c. Tunnuse erinevate väärtuste esinemissagedust ainult absoluutarvudes Väär Selle esituse hinded 0/1. Question 5 Punktid: 1 Millised järgmistest karakteristikutest on asendikarakteristikud? Vali üks või enam vastust. a. Mood b. Mediaan c. Keskväärtus d. Standardhälve e. Dispersioon f. Alumine kvartiil Osaliselt õige Selle esituse hinded 0.67/1. Question 6 Punktid: 3 Järgmine tabel näitab ühe väikese riigi nafta ostukogust ja hinda kolmes erinevas kohas ühe nädala jooksul: Allikas Mehhiko Kuveit Sularahaturg (Spot Market) Kogus (barrel) 1000 200 100
6; 4; 3; 6; 2; 5; 4; 4; 12; 10; 12; 5; 3,5; 5; 13; 6; 2; 3; 8; 6; 3; 2; 1; 14; 4; 10; 4; 3; 11; 4 2) Variantsioonirida(kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida) 1; 2; 2; 2; 3; 3; 3; 3; 3,5; 4; 4; 4; 4; 4; 4; 5; 5; 5; 6; 6; 6; 6; 8; 10; 10; 11; 12; 12; 13; 14 3) Mood(tunnuse kõige sagedamini esinev väärtus) Mo = 6 (antud tunnuste väärtuste mood on 6) 4) Mediaan(arv, millest suuremaid ja väiksemaid väärtusi on variatsioonreas ühepalju) Kuna variatsioonreas on paarisarv liimeid, siis on mediaaniks kahe keskmise liikme poolsumma: Me = (4+5)/2 = 4,5 5) Minimaalne ja maksimaalne element(vähim ja suurim väärtus) Minimaalne element Min = 1 ; maksimaalne element Max = 14 6) Variatsioonrea ulatus(maksimaalse ja minimaalse elemendi vahe) Antud variatsioonrea ulatus on Max Min = 14 1 = 13
(kvantiil, kvartiil, mediaan, täiendkvantiil). 8. Mis on juhusliku suuruse p-kvantiil? Juhusliku suuruse X p-kvantiiliks (ingl. k. percentile) nimetatakse niisugust väärtust p, mille korral Mis on juhusliku suuruse q-täiendkvantiil? 9. Mis on tihedusfunktsioon? Tihedusfunktsioon juhusliku suuruse tõenäosuse tihedus, mis avaldub jaotusfunktsiooni tuletisena. 10. Normaaljaotuse skitseerimine (tihedus- ja jaotusfunktsioon). Graafikult lugemine (aritmeetiline keskmine, standardhälve, mood, mediaan). 11. Mis omadused on normaaljaotusel? Normaaljaotuse omadusi: Normaaljaotus on sümmeetriline oma keskväärtuse suhtes. Normaaljaotuse korral ühtivad keskväärtus, mood ja mediaan. Kui dispersioon suureneb, muutub graafik madalamaks ja seega ka laiemaks (hajuvus suureneb) ning lamedamaks. Gaussi kõvera alune pindala x-teljeni on 1, sest juhusliku suuruse X kõikvõimalike väärtuste tõenäosuste summa peab olema 1.
mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud
valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X).
kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle
tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima
väärtuse vahel
dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2=
standardhälve - Standardhälve on ruutjuur dispersioonist
7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
x vastavusse tõenäosuse, et Xx. Tähistame F-ga
F(x )=P(Xx ) tõenäosus, et JS kuulub paljude väärtuste korral
0 0
teatavasse piirkonda P(a
perekonnaseis) Ordinaalskaala ehk järjestusskaala (Esitab vastuse variandid sel viisil, et neid on võimalik hinnangu intensiivsuse alusel järjestada nt haridustase, rahuolu hinnangu, Likerti skaala) Arvskaala (Esitab või võimaldab esitada vastused arvudena) 4) Kirjeldav statistika eri tüüpi tunnuste kohta: Mood- kõige sagedasem väärtus või väärtusklass Mediaan-Punt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks. Kvantiilid- jagunevad alumine kvartiil- punkt, millest väiksemaid väärtusi on kogumis üks neljandik osa. Ülemine kvartiil- punkt millest suuremaid väärtusi on kogumis üks neljandik osa. Kvantiilid jagavad tunnuse väärtuste järjestatud rea teatud arvuks võrdseteks osadeks. Sagedamini kasutatavad kvantiilid on detsiilid, kvintiilid ja kvartiilid.
nende tähistused on eraldi välja toodud. Eesmärk teada saada: 1) kui palju kulub sõitmiseks päevas? 2) kas sõiduaeg on iga päev sama? 3) mis põhjustab erinevusi? 3 2. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse.
Sagedustabelist graafilise ülevaate saamiseks kasutatakse histogramme(tulpdiagramme). 4.1 4.2 3 5. Füüsika 5.1.Leian keskväärtuse. Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. Valem: x + x + ... + x n x= 1 2 n Olgu x1 vaadeldava tunnuse väärtus esimese objekti korral, x2 teise objekti korral jne ning n olgu mõõdetud objektide arv. x=4,4 5.2. Leian standardhälve. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on tunnuse väärtuste hajuvus. Valem: n ( xi - x) 2 = i =l n *Väikese valimi korral(alla 100 objekti), kasutatakse valemis n-1. =0,723974 5.3. Leian variatsioonikordaja. Variatsioonikordaja on standardhälve ja keskväärtuse suhe. Valem: V = x V=0,164539 5.4. Leian mediaani.
alljärgneva tabeli põhjal Õppeaine Maht Ain Paul Tiit tundides Matemaatik 80 5 4 5 a Füüsika 60 4 3 3 Keemia 40 3 5 4 17 Jalgrattur sõitis 48km kiirusega 16km/h, 60km keskmise kiirusega 15km/h ja 65km kiirusega 13km/h. Arvuta jalgratturi keskmine kiirus. 18 Mediaan on arv, millest suuremaid ja väiksemaid väärtusi on variatsioonireas ühepalju. Tähis Me Kui variatsioonireas on elemente paarisarv, siis mediaaniks on kahe keskmise liikme poolsumma. 19 Mediaani eelised: 1) lihtsamini leitav 2) vähem mõjutatud eranditest 20 Mediaani puudused: 1) ei kasuta kogu infot 2) tunnuse muutudes allpool või ülalpool mediaani jääb mediaan samaks. 21 Kumba eelistada, kas
Minu eesmärk on uurida, kas ja kuidas erinevad tüdrukute vastused poiste vastustest ning vaadata, kas linnainimesed on pirtsakamad kui maainimesed. STATISTIKA MÕISTED Valim mõõtmiseks võetud üldkogumi osa. Valimi maht N - uuritavate objektide koguarv. Aritmeetiline keskmine - tunnuse kõigi väärtuste summa ja objektide arvu jagatis. Keskväärtus - tunnuste väärtuste aritmeetiline keskmine. Mood - tunnuse kõige sagedamini esinev väärtus Mediaan - arv, millest on suuremaid ja väiksemaid väärtusi variatsioonireas on ühepalju. Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil, - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon andmetele vastav hälvete keskväärtus.