Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Karakteristikud". Need materjalid aitavad sul teemat sügavamalt mõista.
korrelatsioon, keskväärtus, karakteristik, kvartiil, hajuvus, karakteristikud, harm, geom, xmin, kvartiili, hajuvuse, mediaani, standardhälve, geomeetriline, ruutude, xmax, variatsioonikordaja, kvartiilid, detsiil, üksiku, muutuja, ruutkeskmine, soeng, pöördväärtus, ruutjuur, arvulise, eespool, erind, sõltuvus, juhuslikud, mahust, statistilisteüksikuid väärtusi, vaid tunnuse väärtuste vahemikud ehk klassid. Klasside arv: kui kogumi maht N ei ole väga suur, on klasside arv umbes √N . Klassipiiride leidmine (Max-Min)/klasside arv. 14. Histogramm – kui sagedus- või jaotustabelis on tunnuse väärtused esitatud vahemikena, kujutatakse neid andmeid geomeetriliselt tulpdiagrammina, mida nimetatakse histogrammiks. (tulbad üksteise kõrval, ilma vaheta) ÜL.150, 153 15. Karakteristikud – arvulised suurused, mis iseloomustavad tunnuse väärtuste jaotust kui tervikut mingist seisukohast (jaguneb: 1) – paiknemise karakteristikud ehk keskmised ja 2) – hajuvuse karakteristikud) 16. Paiknemise karateristikud – annavad informatsiooni tunnuse väärtuste paiknemise kohta arvteljel ja iseloomustavad tunnust keskmise väärtuse seisukohalt. (aritmeetiline keskmine, mediaan, mood) 17
x 1 +x 2 +. ..+x n 1 n x i = x= n i=1 3.2 Mediaan Me X = x0,5 Mediaan on variatsioonrea keskmine liige. Kui liikmeid on paaritu arv, siis keskmine liige. Kui liik 3.3 Kvartiilid Kv - alumine kvartiil ehk tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioon Kv - ülemine kvartiil ehk tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsioonr Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendik Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendik
12. klass Statistiliste andmete töötlemine Statistiliste andmete kogumisele järgneb andmete töötlemine ehk andmeanalüüs. Selle käigus leitakse karakteristikud, mis iseloomustavad tunnuse väärtuste jaotust kui tervikut ühest või teisest seisukohast. Põhilised karakteristikud jagunevad kahte rühma: 1. paiknemise karakteristikud ehk keskmised 2. hajuvuse karakteristikud Paiknemise karakteristikud Paiknemise karakteristikud annavad informatsiooni tunnuse väärtuste paiknemise kohta arvteljel ja iseloomustavad tunnust keskmise väärtuse seisukohalt. Need on aritmeetiline keskmine, mediaan, mood. 1. Aritmeetiliseks keskmiseks ( X ) nimetatakse tunnuse kõigi väärtuste summa ja väärtuste arvu jagatist. Kui tunnuse väärtused on x1, x2, x3, …, xn, siis x x 2 .... x n
Aritmeetiline keskmine x on tunnuse kõigi väärtuste summa ja väärtuste (objektide) arvu jagatis. Mood Mo on tunnuse kõige sagedamini esinev väärtus. Moode võib olla ka rohkem kui üks. Kui kõik väärtused on võrdsed, siis mood puudub. Mediaan Me on tunnuse väärtus, millest variatsioonireas jääb vasakule ja paremale võrdne arv liikmeid. Tunnuse muutumispiirkond on piirkond minimaalsest väärtusest maksimaalse väärtuseni (xmax - xmin). Alumine kvartiil Q (Kv ) on tunnuse väärtus, millest väiksemaid või võrdseid väärtusi on 25%. Ülemine kvartiil Q (Kv ) on tunnuse väärtus, millest suuremaid või võrdseid väärtusi on 25%. Mida suurem on kvartiilide vahe, seda suurem on hajuvus. Hälve on tunnuse väärtuse ja keskmise vahe ( x i -x ) . Dispersiooniks 2 nimetatakse hälvete ruutude keskmist. Variatsioonikordaja V näitab standardhälbe suhet keskmisse. Valemid: f W = 100% N n
Keskväärtust kasutatakse sageli, sest ta on aluseks teiste statistiliste näitajate määramiseks. Puudus-Arvutamise tulemusena saadud väärtus ei pruugi ise olla üks tunnuse väärtustest. Hajuvusmõõdu vajalikkus- tunnuste iseloomustamiseks ainult keskimiste abil annab liiga vähe informatsiooni. Hajuvusmõõdud:* min/max element*variatsioonrea ulatus*alumine/ülemine kvartiil*disepersioon/standarhälve*variatsioonikordaja. Variatsioonirea ulatus=Xmax-Xmin. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioonreas 25% Kv . Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsoonnreas 25% Kv . Detsiilide abil jaotatakse variatsioonrida kümneks osaks. Dispersioon on juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus ( ) . Standardhälve on ruutjuur dispersioonist. = ( ) = ( )
nimetada ka püstakuse kordajaks. Moment - Tunnuse k-ndat järku moment väärtuse a suhtes on väärtuste xi ja arvu a vaheliste hälvete k-ndat järku astmete aritmeetiline keskmine: Algmoment, kui a = 0 Kaheväärtuseline tunnus {0, 1} – selle aritmeetiline keskmine on kus n on kogumi maht, m ühtede arv ja p ühtede osakaal kogumis. Kaheväärtuselise tunnuse dispersion σ^2=p(1-p) ja standardhälve σ = sqrt(p(1-p)) Kvartiilhaare - Kvartiilhaare on kolmanda kvartiili Q 3 ja esimese kvartiili Q1 vahe: IQR=Q3-Q1. Kvartiilhaarde sisse jääb alati jääb 50% variatsioonrea väärtustest. Detsiilhaare - Detsiilhaare on 9. detsiili D9 ja 1.detsiili D1 vahe: IDR=D9-D1. Detsiilhaarde sisse jääb alati 80% variatsioonrea väärtustest. 4. INDEKSID Indeks – kahe arvu suhe, leitud spetsiaalse metoodika järgi, iseloomustab mingi majandusalase suuruse muutumist ajas Alusindeks - Alusindeks on indeks mingi kindla väärtuse, baasväärtuse suhtes teatud ajamomendil (või perioodil)
Enne katse toimumist on tundmata. Üldjuhul tähistatakse X. Diskreetne juhuslik suurus on juhuslik suurus, mille väärtuste hulk on lõplik või loenduv. Praktiliselt vaatleme ainult selliseid DJS, mille võimalikud väärtused on 0, 1, 2, ... või alamhulk eelnevast. DJS jaotusseadus on eeskiri, mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X). kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima väärtuse vahel dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2= standardhälve - Standardhälve on ruutjuur dispersioonist 7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
Tugevalt ebasümmeetrilise rea korral on ta tüüpilisem kui aritmeetiline keskmine. Kui reas on paaritu arv liikmeid, siis võrdub mediaan järjestatud rea asendilt keskmise liikmega, mistõttu moodi nimetatakse ka rea keskliikmeks. Kui reas on paarisarv liikmeid, siis leitakse ta järjestuses kahe keskmise liikme aritmeetilise keskmisena, mistõttu mediaan ei pruugi võrduda ühegi rea liikmega. · Kvartiil 4 võrdset osa (xmin, q1, q2 ehk mediaan, q3 ja xmax), pentiil 5 võrdset osa, sekstiil 6 võrdset osa, detsiil 10 võrdset osa, protsentiil 100 võrdset osa. · Momentideks nimetatakse rea liikmete väärtuste ja mingi arvu vaheliste hälvete astendamisel saadud arvude aritmeetilisi keskmisi. Arvu, millega momendi leidmisel hälbeid astendatakse, nimetatakse momendi järguks. VARIATSIOONINÄITARVUD · Variatsiooniamplituud (R= Xmax-Xmin)näitab äärmuste vahet
5. Füüsika 5.1.Leian keskväärtuse. Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. Valem: x + x + ... + x n x= 1 2 n Olgu x1 vaadeldava tunnuse väärtus esimese objekti korral, x2 teise objekti korral jne ning n olgu mõõdetud objektide arv. x=4,4 5.2. Leian standardhälve. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on tunnuse väärtuste hajuvus. Valem: n ( xi - x) 2 = i =l n *Väikese valimi korral(alla 100 objekti), kasutatakse valemis n-1. =0,723974 5.3. Leian variatsioonikordaja. Variatsioonikordaja on standardhälve ja keskväärtuse suhe. Valem: V = x V=0,164539 5.4. Leian mediaani. Mediaan on arv, millest suuremaid ja väiksemaid väärtusi on variatsioonireas ühepalju. Tähis: M e = M e =5 5.5. Leian moodi.
4. Dispersioon iseloomustab juhusliku suuruse Xi erinevust keskväärtusest, seega iseloomustab tunnuse hajuvust. Valimi dispersiooni kui üldkogumi dispersiooni hinnangu tähiseks on tavaliselt Sruut, üldkogumi dispersiooni tähiseks ruut (kasutatakse teisi tähiseid ka: var, D(X)). Seega, mida suurem on Xi väärtus võrreldes keskväärtusega, (aritmeetilise keskmisega) seda suurem on hajuvus e dispersiooni. 5. Dispersiooni meetod 6. Diskreetne arvuline tunnus omab vaid täisarvulist väärtust, n laste arv perekonnas, eesti elanike arv. 7. DurbinWatsoni test. Kasut 1. järku autokorrelatsiooni avastamiseks. Kasut.tingimused: reg.mudel sisaldab vabaliiget. Mudel ei sisalda sõltuva muutuja viitajaga liikmeid (nt Yt1, Yt2) 8. Fiktiivne muutuja (dummy) iseloomustavaid binaarseid muutujaid. Binaarne muutuja
5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet). Nominaaltunnus mittearvuline tunnus, mille väärtused pole järjestatavad. 6. Juhuslik suurus ehk juhuslik muutuja suurus või muutuja, mille väärtus enne mõõtmist või katset ei ole teada. 7. Kuidas on defineeritud jaotusfunktsioon? Jaotusfunktsiooni skitseerimine, graafikult lugemine (kvantiil, kvartiil, mediaan, täiendkvantiil). · Juhusliku suuruse X jaotusfunktsiooni väärtus argumendi x kohal on sellest väiksemate väärtuste esinemise suhteline sagedus (tõenäosus) F(x) = P(X < x). · 0 F(x) 1 ehk jaotusfunktsiooni piirväärtused on 0 ja 1. · F(x) on mittekahanev ja pidev. · P(a < X b) = F(b) F(a) 8. Mis on juhusliku suuruse p-kvantiil? Mis on juhusliku suuruse q-täiendkvantiil? p-kvantiil - Arvrea väärtus, millest väiksemate ja sama suurte väärtuste osakaal on p
Sageduste summa n=16 Tulpdiagramm 4. Suhteline sagedus (w) Tunnuse väärtuse esinemise arvu f suhe väärtuste koguarvu n f w = 100% n Sagedus-jaotustabel Jalanumber (x) 36 37 38 39 40 41 Sagedus (f) 2 2 5 3 3 1 Suhteline sagedus (w) %-des 12,5 12,5 31,25 18,75 18,75 6,25 Sagedus-jaotushistogramm Sektordiagramm 5. Asukoha karakteristikud Mood Mo Tunnuse kõige sagedamini esinev väärtus Mo=38 Mediaan Me Tunnuse väärtus, millest väiksemaid ja suuremaid väärtusi on võrdne arv Me=38 Aritmeetiline keskmine Tunnuse keskväärtus x + + xn x= 1 n =38,375 6. Hajuvuse karakteristikud Maksimaalne väärtus Tunnuse suurim väärtus x max = 41 Minimaalne väärtus Tunnuse vähim väärtus x min = 36 Variatsioonirea ulatus
n i =1 i =1 fi Andmetöötlus sotsiaalteadustes 10 Tulemuste kommenteerimisel võib arvestada, mida sarnasemad on aritmeetiline keskmine, mediaan ja mood, seda sarnasemad on suurem osa tunnuse väärtuseid ja seda rohkem võime uskuda ka aritmeetilist keskmist. Ka miinimum, alumine kvartiil, ülemine kvartiil ja maksimum aitavad hinnata andmete ühtsust ning otsustada, kas valimis on üksikuid erandlike väärtusi (erindeid). Kui valimis on uuritaval tunnusel üksikuid erindeid või kõik väärtused liiga erinevad, siis võib valim olla üldkogumile järelduste tegemiseks, üldistamiseks liiga ebaühtlane. Hindamaks konkreetselt uuritava tunnuse ebaühtlust või hajusust on kasutusele võetud vastavad hajuvuskarateristikud. 2.2.2. Hajuvuskarakteristikud
seaduspärasuste avastamine (nt ettevõtete jaotamine mingite majanduslike näitajate põhjal). 1 Struktuurne – kvalitatiivselt ühetüübiliste rühmade seesmise struktuuri uurimiseks (nt autode rühmitamine remontidevahelise aja jooksul läbisõidetud tee pikkuse järgi). 5) Kogutud andmed moodustavad statistilise rea, mida korrastatakse, rühmitatakse, leitakse nendele statistilised karakteristikud, moodustatakse tabelid ja diagrammid. Variatsioonirida – tulemus, kui statistilises reas korrastatakse andmed nende väärtuste kasvavas või kahanevas järjestuses. Aegread (kronoloogilised read) – koosnevad andmetest, mis iseloomustavad nähtuse ajalist muutumist. Jagunevad: momentrida – iga liige seotud kindla ajamomendiga. perioodrida – iga liige seotud mingi ajavahemikuga. Intervallitud variatsioonireas on kasvavalt või kahanevalt järjestatud elemendid koos nende
Normaalselt jaotuvas kogumis 1. Mediaan, mood ja aritmeetiline keskmine ei pea olema võrdsed (peavad) 2. Stadarthälve ei pea võrduma nulliga, kuid lineaarhälve peab olema null 3. Assümeetria kordaja peab olema alati positiivne (vale) 4. Ei esine väärtuste vatieerumist 5. Mõlemasuunalised kõrvalekalded keskmisest tasemest on võrdvõimalikud Normaaljaotuse korral 1. aritm, keskmine ei saa olla suurem kui geom. keskmine 2. geom. keskmine on alati aritm. keskmisega võrdne 3. ei ole aritm. Keskmise ja mediaanig võrdsed Mediaan, mood ja aritmeetiline keskmine ei pea olema võrdsed (peavad) Mo=Me ei võrdu aritmeetilise keskmisega (kõik peaks võrduma) 4. geom. Keskmine ja aritm. Keskmne on alati sama tähendusega 5. kolmandat järku standardmoment on võrdne nulliga 6. neljandat järku standardmoment on võrdne kolmega 7. kui ekstsess on neg, siis jaotuskõver on lamedam ja laiem 8
Võrdlusdiagramm diagramm, mille abil saab võrrelda kahe või enama nähtuse mahtu. (tulp-,joon-, või lintdiagramm) Struktuurdiagramm diagramm, mille abil saab millegi koostist iseloomustada. (sektordiagramm, kastidiagramm, tulpdiagramm) Jaotushulknurk, jaotuspolügoon sirglõik diagramm, mis vastab jaotustabelile. Tulpdiagramm, histogramm kui sagedus- või jaotustabelis on tunnuse väärtused eistatud vahemikena, kujutatakse neid andmeid geomeetriliselt tulpdiagrammina. Andmete karakteristikud andmete kogumise järgnenud andmete töötlemise teel leitud arvulised suurused, mis iseloomustavad tunnuse väärtuste jaotust kui tervikut mingist seisukohast. Paiknemise karakteristikud annavad informatsiooni tunnuse väärtuste paiknemise kohta arvteljel ja iseloomustavad tunnust keskmise väärtuse seisukohalt. Aritmeetiline keskmine tunnuse kõigi väärtuste summa ja kogumi mahu (objektide arvu) jagatis.
Sagedustabel näitab, mitmel korral antud tunnus saab antud väärtuse. 12. Mille poolest erinevad sagedustabel ja jaotustabel? Jaotustabel näitab tunnuse väärtuste suhtelist esinemissagedust (%). 13. Millal kasutatakse tulpdiagrammi, millal sektordiagrammi? Sektordiagrammi valime siis kui tahame näidata osakaalu tervikus (midagi on 100 %). Andmete võrdlemiseks või tendentside näitamiseks on sobiv tulpdiagramm. 14. Mis on tunnuse keskväärtus? Tunnuste väärtuste aritmeetiline keskmine. 15. Kuidas leitakse aritmeetiline keskmine a) Väikese mahuga variatsioonrea korral? b) Sagedustabeliga määratud andmete korral? c) Pideva tunnuse korral? 16. Mis on mediaan? Kuidas leitakse mediaan. a) Variatsioonreast? b) Sagedustabelist? c) Pideva tunnuse korral? Mediaan arv, millest suuremaid ja väiksemaid väärtusi on variatsioonreas ühepalju. 17. Mis on mood
Ligikaudseks rühmade arvu määramiseks kasutatakse valemit: r=1+3,32*log n. Kus r – rühmade(intervallide) arv, n – kogumi maht. Intervalliks nim. uuritava tunnuse väärtuse vahemikku, millega määratakse kindlaks missugusesse rühma rühmitatava kogumi liige tuleb arvata. Ms Excelis on rühmitamise jaoks funktsioon FREQUENCY. Kogutud andmed moodustavad statistilise rea, mida korrastatakse, rühmitatake, leitakse nendele statistilised karakteristikud, moodustatakse tabelid ja diagrammid. Kui statistilises reas korrastatakse andmed nende väärtuste kasvavas või kahanevas järjestuses, nim tulemust variatsioonireaks. Lihtsatest ridades on sama palju arve kui on vaatlusega hõlmatud kogumis liikmeid. Intervallitud variatsioonirida hõlmab 2 koostisosa – intervallide loetelu ja igasse interv. langevate rea liikmete arv. 5. Kaalutud aritmeetiline keskmine – tuleb kasutada kui iga variant stat
Mood on tunnuse kõige sagedamini esinev väärtus. Mo= 44 Mediaan on arv, millest suuremaid ja väiksemaid väärtusi on vartiatsioonreas ühepalju. Me= ( 40 + 40) : 2= 40 Keskväärtus ehk keskimne x on tunnuse kõigi väärtuste aritmeetiline keskmine. x = 900 : 22 40,91 Keskmine hälve on hälvete aritmeetiline keskmine. = 57,82 : 22 2,63 Dispersioon on variatsioonreas olevatele andmetele vastava hälvete ruutude keskväärtus. 2 =180,06 : 21 8,57 Standardhälve on variatsioonreas oleva arvu ja keskväärtuse vahe. = 8,57 2,93 Variatsioonkordaja on standardhälbe ja keskväärtuse suhe. V= 2,93 : 40,91 0,07 Variatsioonrea ulatus on maksimaalse ja minimaalse elemendi vahe. 46-37= 9 Alumine kvartiil on tunnuse väärtus, millest väiksemaid või võrdseid liikmeid on variatsioonreas 25%. (Kv ) = 38 Ülemine kvartiil on tunnuse väärtus, millest suuremaid või võrdseid liikmeid on variatsioonreas 25%.
7) Ülemine(tunnuse väärtus, millest väiksemaid liimeid on variatsioonreas ligikaudu 25 %) ja alumine kvartiil(tunnuse väärtus, millest suuremaid liimeid on variatsioonreas ligikaudu 25 %) 1; 2; 2; 2; 3; 3; 3; 3; 3,5; 4; 4; 4; 4; 4; 4; 5; 5; 5; 6; 6; 6; 6; 8; 10; 10; 11; 12; 12; 13; 14 7 liiget 14 liiget 7 liiget 9 Alumine kvartiil Kv = 3(leian variatsioonrea alumise poole mediaani, mis ongi ühtlasi alumine kvartiil) Ülemine kvartiil Kv = 8(leian sarnaselt variatsioonrea ülemise poole mediaani). Kontrollin: alumisest kvartiilist väiksemaid liimeid on 7 ehk ligikaudu 23 protsenti ülemisest kvartiilist suuremaid liikmeid on samuti 7 23 protsenti alumise ja ülemise kvartiili vahele jääb 14 liiget 46 protsenti
2. on alati moodist suurem 3. on alati geomeetrilisest keskmisest suurem 4. normaaljaotuse puhul on moodiga võrdne 5. ei ükski Standardhälve 1. leitav dispersiooni ruuduga 2. paikneb alati vahemikus 0 ... lõpmatus 3. ei saa olla lineaarhälbest suurem 4. varieeruvas reas = 0 5. ei ükski Normaaljaotuse korral 1. puudub sümmeetria 2. st. hälve = 0 3. Mo = Me ei võrdu aritmeetilise keskmisega 4. keskväärtus on alati = 0 5. ei ükski Seos Y = 18,5 + 0,48 X 1. kirjeldab X-i mõju Y-le 2. kirjeldab seose tugevust 3. kirjeldab Y-i mõju X-le 4. on pööratav ka kujule X = 18,5 + 0,48 Y 5. ei ükski Tasandusjoon Y = 18,5 – 0,48 X 1. näitab kasvavat lineaarset tendentsi 2. parameeter b ei tohi olla negatiivne 3. vabaliige 18,5 kirjeldab joone tõusu 4. igal ajaperioodil väärtused vähenevad 0,48 korda 5. ei ükski Eksponentkeskmine
Keksmised jagunevad mahukeskmised ja asendkeskmised. Mahukeskmised on rea liikmete individuaalväärtuste summa : a. ARTIMEETILINE KESKMINE b. HARMOONILINE c. GEOMEETRILINE d. RUUTKESKMINE e. KRONOLOOGILINE Asendkeskmised reageerivad ainult sellistele muutustele rea üksikliikmete väärtuses, millega kaasneb olulisis nihkeid ka rea struktuuris. MOOD MEDIAAN KVARTIIL, DESTSIIL JA TSENTRIIL 11. Mahukeskmiste majorantsus Samadest arvudest leitud eri keskmiste arvväärtused ei ole ühesugused. Sellises mittevõrdsuses avalduvat keskmiste omadust nim nende majorantsuseks. Näiteks Xharm <= Xgeom <= Xarit<=Xruut jne 12. Millal, millist mahukeksmist kasutada Lihtsat aritmeetlilist keskmist kasutatakse siis kui : I Tee kindlaks milline suurus on variant ja milline on keskmine. Variant on see suurus mille keskmist otsitakse. (teepikkus k, kiirus – variant).
12. Kogumi alamhulk, mida uuritakse ja mille põhjal tehakse järeldusi kogumi kohta, on valim 13. Väljavõttelise vaatluse korral vaadeldakse valimit. 14. Kas on õige väide "Korraga saab võrrelda ainult kaht objekti omavahel" tõsi 15. Ankeetküsitluse korral põhjustab halvasti sõnastatud küsimus süstemaatilise vea. Statistilise kogumi keskmised - Test 2 1. Määra ära, millised keskmised on asendikeskmised ja millised mahukeskmised a. 1. Kvartiil - asendikeskmine b. Mood - asendikeskmine c. geomeetriline keskmine - mahukeskmine d. mediaan - asendikeskmine e. aritmeetiline keskmine mahukeskmine 2. Kõige tüüpilisem väärtus arvukogumis on selle arvukogumi mood 3. Kui arvukogumi aritmeetiline keskmine on väiksem kui mediaan, siis (Vali üks) a. d. esinevad üksikud ekstremaalselt väikesed väärtused 4. Arvukogumis on 10 arvu ja nende aritmeetiline keskmine on 17
STATISTIKA MÕISTED Valim mõõtmiseks võetud üldkogumi osa. Valimi maht N - uuritavate objektide koguarv. Aritmeetiline keskmine - tunnuse kõigi väärtuste summa ja objektide arvu jagatis. Keskväärtus - tunnuste väärtuste aritmeetiline keskmine. Mood - tunnuse kõige sagedamini esinev väärtus Mediaan - arv, millest on suuremaid ja väiksemaid väärtusi variatsioonireas on ühepalju. Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil, - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon andmetele vastav hälvete keskväärtus. 2 Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0.
Mõisted Valim mõõtmiseks võetud üldkogumi osa. Valimi maht N - uuritavate objektide koguarv. Aritmeetiline keskmine - tunnuse kõigi väärtuste summa ja objektide arvu jagatis. Keskväärtus - tunnuste väärtuste aritmeetiline keskmine. Mood - tunnuse kõige sagedamini esinev väärtus Mediaan - arv, millest on suuremaid ja väiksemaid väärtusi variatsioonireas on ühepalju. Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon 2 andmetele vastav hälvete keskväärtus. Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0.
Hinne 28.00, maksimaalne 30.00 (93%) Tagasiside Suurepärane! Küsimus 1 Andmestik on antud jaotustabelina Õige Väärtus x i 2 1 4 0 Hindepunkte 1.00/1.00 Osakaal p i 0.1 0.3 0.2 0.4 Leida keskväärtus (vastuse lahtrisse sisestage ainult arv). Vastus: 1.3 Küsimus 2 Järgmine tabel näitab ühe väikse riigi nafta ostukogust ühe nädala jooksul ning barreli hinda kolmes erinevas kohas : Õige Allikas Mehhiko Kuveit Sularahaturg (Spot Market) Hindepunkte 1.00/1.00
..................................................5 2. Esimene punkt.........................................................................................................................6 2.1 Kirjandi tulemuste sagedustabel................................................................................6 2.2 Kirjandi sageduspolügoon.........................................................................................6 2.3 Kirjandi tulemuste mood, mediaan ja keskväärtus....................................................6 3. Teine punkt.............................................................................................................................8 3.1 Võõrkeele tulemuste tabel.........................................................................................8 3.2 Võõrkeele sageduspolügoon.....................................................................................8 3
90
80
70
60
50
40
30
20
10
0
Kuni 30a 31-42a 43-54a 55-66a Üle 67a
(*ülesanne 02)
Klassid W% 40
155
x 0,157 0, 2 8 0,19 0, 0810 0,1111 0, 2312 0,1313 10, 01 10 Me = 10 Mo = 12 Mida võib öelda leitud valimite kohta? Keskväärtused, mediaanid on võrdsed. Kas on ka erinevusi? Mood on erinev. Erinevus on ilmselt väärtuste hajuvuses. Kui vaadelda antud valimeid sellest seisukohast, kuidas paiknevad väärtused keskväärtuse suhtes, siis tundub olema nõnda, et teise valimi korral on hajuvus mõnevõrra suurem. Kuidas seda arvuliselt kinnitada? Tuuakse sisse hälbe mõiste. Hälve - tunnuse väärtuse erinevus keskväärtusest; sümbolites: xi x Täiendame tabeleid vastava reaga: xi 7 8 9 10 11 12 13 fi 1 3 5 10 5 3 1 xi x -3 -2 -1 0 1 2 3
· Binaarsed tunnused on ainult kaks teineteist välistavat väärtust. Tüüpiline binaarne tunnus on sugu. ___ 1 n = xi n i =1 Tunnuse keskväärtus tunnuste väärtuste aritmeetiline keskmine. Valem: Kodeerimine tunnuste väärtuste hulga teisendamine, milles igale tunnuse esialgsele väärtusele seatakse vastavusse üks uus väärtus kood. Variatsioonrida kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida. Sagedustabel - moodustatakse variatsioonirea põhjal. Näitab, mitmel korral antud tunnus saab antud väärtuse. Jaotustabel tabel, kus tunnuse väärtusele on seatud vastavusse nende esinemise suhteline
jaotusfunktsiooni: F * ( x) = P( X * < x) = ni / n, xi < x kus X* on diskreetne juhuslik suurus, mille jaotustabel on moodustatud variatsioonrea abil. Teoreem Valimi mahu n tõkestamatu kasvamise korral koondub empiiriline jaotusfunktsioon F*(x) tõenäosuse järgi üldkogumi jaotusfunktsiooniks F(x). Punkthinnang (I) Ülesanne: olles fikseerinud valimi, arvutanud selle põhjal välja valimi karakteristikud, hinnata, kui hästi (või halvasti) iseloomustavad valimi arvulised karakteristikud üldkogumit. Kaht liiki hinnangud: 1. Punkthinnangud; 2. Vahemikhinnangud. Punkthinnang Olgu antud juhuslik suurus X, mille jaotust iseloomustab parameeter a (väärtus on tundmata). Võtame mingi valimi, mille korral see juhuslik suurus omandab väärtused x1, x2, ... , xn ja arvutame selle jaoks parameetri väärtuse ã. Igale valimile vastab üldiselt erinev ã, seega võime kirjutada
· Variatsioonirida tunnuse väärtuste rida kasvavad või kahanevas järjekorras · Mood variatsioonirea kõige suurema esinemissagedusega liige. Tähis Mo. · Mediaan variatsioonirea keskmine liige; paarisarvulise variatsioonirea korral on mediaaniks variatsioonirea esimese poole viimase ja teise poole esimese liikme aritmeetiline keskmine. Tähis Me. _ · Aritmeetiline keskmine ehk tunnuse keskväärtus. Tähis x. · Hajuvusmõõdud näitavad kui palju erineb tunnuse väärtus keskväärtusest või mediaanist: · Tunnuse minimaalne väärtus esinev tunnuse vähim väärtus. Tähis Min · Tunnuse maksimaalne väärtus esinev tunnuse suurim väärtus. Tähis Max · Variatsioonirea ulatus tunnuse maksimaalse ja minimaalse väärtuse vahe. Tähis U · Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioonireas 25%
-Järjestatud 2) Mittearvtunnus (mittekvantitatiivne) -kodeeritud -Nominaaltunnus: Pärast kodeerimist ei ole mõtet järjestada. -Järjestustunnus: 5 v.hea; 4 hea; 3 rahuldav jne. Binaarne tunnus -> Omab kahte teineteist välistavat väärtust (Nt. Sugu). Andmete sisestamisel ei tohi vigaseid väärtusi asendada tõenäoliselt õigega. Tööle tuleb kindlasti lisada KODEERIMISE EESKIRI! Keskväärtus, mediaan, mood 1) Diskreetse juhusliku suuruse keskväärtus nimetatakse selle suuruse võimalike väärtuste ja vastavate tõenäosuste korrutiste summat. EX = p1x1 + p2x2 + .... + pnxn 2) Mediaan arv, millest suuremaid ja väiksemaid väärtusi on variatsioonreas ühe palju. 3) Mood tunnuse kõige sagedamini esinev väärtus. Bimodaalne kui on kaks moodi. Hajuvusmõõdud Minimaalne element tunnuse väärtuste hulgas vähim.