Sagedustabelist graafilise ülevaate saamiseks kasutatakse histogramme(tulpdiagramme). 4.1 4.2 3 5. Füüsika 5.1.Leian keskväärtuse. Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. Valem: x + x + ... + x n x= 1 2 n Olgu x1 vaadeldava tunnuse väärtus esimese objekti korral, x2 teise objekti korral jne ning n olgu mõõdetud objektide arv. x=4,4 5.2. Leian standardhälve. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on tunnuse väärtuste hajuvus. Valem: n ( xi - x) 2 = i =l n *Väikese valimi korral(alla 100 objekti), kasutatakse valemis n-1. =0,723974 5.3. Leian variatsioonikordaja. Variatsioonikordaja on standardhälve ja keskväärtuse suhe. Valem: V = x V=0,164539 5.4. Leian mediaani.
kõrg 26 m 3 MIN 24 2 MAX 65 40 Aritm. Keskmine 39.75 13.2 Mood 26 #NAME? Mediaan 32.875 #NAME? Dispersioon 118.6 91.9 Standardhälve 10.9 9.6 Variatsiooni kordaja 27.4% 72.6% Ennustus 4 2 Leia keskmise vanuse piiresindusvigatõenäosusega 95% ja 99% Viga 95% 4.77 Viga 99% 6.27 Laste arv Töötasu Intervallita rida 3 667.88 ctrl+shift+enter!!!
Variant A Ülesanne 1 - 6p Nõustate isikut, kes soovib jääda pensionile 65. eluaastal. Ülesanne 2 – 4 p Statistikaameti andmetele tuginedes teate, et 65-aastaste keskmine Saate moodustada portfelli, mis koosneb kahest varast. Nende oodatav eluiga on 15 aastat. Lihtsuse mõttes eeldame, et varade tootlustel on järgmised omadused pensionifondi investeeringute oodatav tootlus nii pensioniks Aktsia Oodatav tootlus Standardhälve Korellatsioon kogumisel kui pensionil olemise ajal on 6% aastas ning sisse- ja A 10% 20% väljamakseid saab teha kuiselt ning see ei mõjuta tootlust. Kui 0,5 B 15% 40% soovitavaks pensioniks oleks €1000 kuus, siis
Ülesanne 1 Alljärgnevalt on toodud Jüri ja Mari kontrolltööde punktid ühel aastal. Uuri punktide varieerumist mõlema õpilase korral. Leia punktide aritmeetiline keskmine ( vastus ümarda kümnendikeni ), standardhälve( kümnendikeni) ja vari Mari Punktid ( x ) Sagedus ( f ) f*x Standardhälve ülemine osa 33 1 33 114,49 35 1 35 75,69 39 1 39 22,09 40 1 40 13,69 42 3 126 8,67 45 2 90 3,38 46 1 46 5,29
Eksponentkeskmist kasutatakse, kui on tegemist: ei ole mitte 1 keskmine väärtus, vaid rea tasandamine, rea silumise meetod keskmise taseme leidmisega väga pikkades aegridades – VALE keskmise taseme leidmisega momentreas ja ajavahemikud on võrdsed - VALE, kronoloogilist keskmist kasutaks keskmise taseme leidmisega perioodreas ja perioodid ei ole võrdsed - VALE, tavalist aritmeetilist keskmist kasutaks aegreaga ja väärtuste standardhälbe arvutamise juures - VALE, standardhälve leidmisel kasutatakse aritmeetilist keskmist aegreaga ja selle tasandamise juures – ÕIGE Tugeva samasuunalise lineaarse seose y=a+bx korral regressioonikordaja on alati vahemikus 0 kuni +1 - kindlalt vale, võib olla mis iganes (nii neg kui üle ühe), näitab x ühikulist mõju y-le lineaarse kor.kordaja ja regr.funktsiooni parameetri a märgid langevad kokku regr.kordaja peab olema eranditult positiivne - õige, (muidu võib olla neg) aga loe küsimust, samasuunaline.
Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil, - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon andmetele vastav hälvete keskväärtus. 2 Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse. Korrelatsiooniväli - Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Variatsioonirida - kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida.
The correct answer is: Mediaan võib olla ka selline väärtus, mida reaalsete vastuste hulgas ei esine, Keskväärtus võib olla ka selline väärtus, mida reaalsete vastuste hulgas ei esine, Mood on alati reaalne väärtus uuritud valimi väärtuste hulgast Question 2 Ettevõtte töötajate keskmine sissetulek on 820 €, mediaan 600 € ning standardhälve 200 €. Incorrect Milline järgnevatest väidetest on õige? Mark -5.0 out of 5.0 Select one: Üksikud väga suured sissetulekud suurendavad aritmeetilist keskmist, kuid ei mõjuta oluliselt mediaani. Arvutustes on viga, sest Eesti keskmine brutopalk on juba ammu üle 1000 euro
Alljärgnevalt on toodud Läänemaa põhikoolide mitmevõistlustel toimunud kõrgushüppe tulemused 2010 kui ka 2011 aastal. Võrdle poiste tulemusi mõlemal aastal. Korrasta andmed tabelisse. 1. Leia poiste keskmine tulemus mõlemal aastal (vastus ümarda sajandikeni). 2. Leia standardhälve (sajandikeni) ja variatsioonikordaja (vastus täisarvuna) 3. Leia mood. 4. Joonestage saadud tulemuste abil tulpdiagramm. 5. Leia variatsiooniulatus 2010 poisid Kõrgus (x) Sagedus (f) f*x Standardhälve ülemine osa 2010 1,00 1 1,00 0,13 1,05 1 1,05 0,10 1,15 1 1,15 0,04
Variatsioonirea ulatus=Xmax-Xmin. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) väärtusi on variatsioonreas 25% Kv . Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) väärtusi on variatsoonnreas 25% Kv . Detsiilide abil jaotatakse variatsioonrida kümneks osaks. Dispersioon on juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus ( ) . Standardhälve on ruutjuur dispersioonist. = ( ) = ( ) n k n 2 2 2 xi -x f i xi - x xi - x varieerub.2 = i=
valemit S 0= √ V T WV T m−n , kus V on mõõtmistulemuste parandite maatriksi V transponeeritud maatriks, m mõõtmiste arv ning n on otsitavate tundmatute arv. Praegusel juhul on mõõtmisi 4 ja tundmatuid 3. Tehes vastavad arvutused, siis saame tasandusjärgse kaaluühiku standardhälbeks S0=0.000058. Tasandusjärgse kaaluühiku standardhälve annab infot mõõtmistulemuste täpsuse kohta. Mida ebatäpsemad on olnud mõõtmistulemsued, seda suurem on tasandusjärgne standardhälve. Kontrollimaks kaaluühiku dispersiooni vastavust a priori väärtusele 1, kasuame selleks χ2-testi olulisuse nivool α=0,05. Testi sooritamiseks püstitame hüpoteesid: H0: Tasandusjärgsete kaaluühikute standardhälve on 1; HA: Tasandusjärgsete kaaluühikute standardhälve ei ole 1. 2
...............................................................................6 1.2 Histogramm..................................................................................................................6 1.3 Karakteristikud............................................................................................................. 7 1.3.1 Keskväärtus...........................................................................................................7 1.3.2 Standardhälve........................................................................................................ 7 1.3.3 Variatsioonikordaja...............................................................................................7 1.3.4 Mediaan ja mood...................................................................................................7 1.Kehakaal...........................................................................................................................
3. Sagedustabel ja graafik poiste ja tüdrukute andmete kohta eraldi TÜDRUKUD Raamatute arv (x) 0 1 2 3 5 20 30 50 Sagedus (f) 2 1 2 1 1 1 1 1 POISID Raamatute arv (x) 0 1 2 3 4 5 7 8 Sagedus (f) 1 2 1 1 2 1 1 1 4. Mood Mo (tüdrukud) = 0 ja 2 Mo (poisid) = 1 5. Mediaan Me (tüdrukud) = (5+3):2 = 4 Me (poisid) = (4+3):2 = 3,5 6. Standardhälve (tüdrukud) D = (|X1-X|f1+|X2-X|f2+...+|Xk-X|fk):n ( x1 - x) 2 f 1 + ( x 2 - x) 2 f 2 + .. + ( x n - x) 2 f n = = 2 N Valimis on järgmised väärtused: 0 0 1 2 2 3 5 20 30 50 Nende kaheksa väärtuse aritmeetiline keskmine on 11,3: 113:10 = 11,3 Et arvutada standardhälvet, tuleb esmalt arvutada iga väärtuse hälve kõigi väärtuste aritmeetilisest keskmisest ja võtta saadud tulemused ruutu:
Mood, kui tunnusel on vähe erinevaid väärtuseid Mediaan Mitte ühtegi nimetatutest, kui on tegemist nominaaltunnusega, millel on palju erinevaid väärtuseid Aritmeetiline keskmine Küsimus 8 Pole veel vastatud Võimalik punktisumma 5'st Märgista küsimus Küsimuse tekst Millised järgnevatest arvnäitajatest iseloomustavad keskmist tendentsi? Vali üks või enam: Kaalutud aritmeetiline keskmine Variatsioonikoefitsient Mediaan Mood Dispersioon Standardhälve Küsimus 9 Pole veel vastatud Võimalik punktisumma 5'st Märgista küsimus Küsimuse tekst Variatsioonikoefitsient näitab, mitu protsenti moodustab ... Vali üks: standardhälve mediaanist standardhälve aritmeetilisest keskmisest aritmeetiline keskmine standardhälbest Küsimus 10 Pole veel vastatud Võimalik punktisumma 5'st Märgista küsimus Küsimuse tekst
võiks olla antud sündmus. Seega eeldav kasuminorm `r kujutab endast tõenäosusega kaalutud investeeringu keskmist tasuvust: Kus, ri võimalik tasuvus Pi i-nda kasumi saamise tõenäosus n- võimalike tulemuste arv Riski mõõtmine: Risk tähendab investeeringult tulu saamise tõenäosuse muutmist, kaasa arvatud võimalus kaotada investeeritud vahendid. Mitmesuguste investeeringute riski määra näitajaks on standardhälve (roo) võimaliku tulu saamise tõenäosuse jaotumise statistiline mõõt. Mida väiksem on standardhälve, seda väiksem on tõenäosuse hajusus ja järelikult väiksem investeeringu riskimäär. Matemaatiliselt on standardhälve võrdne: Arvutamine toimub: 1. Arvutatakse eeldatav kasuminorm (r (kesk)) 2. Leitakse vahe eeldatava kasuminormi ja iga võimaliku tasuvuse vahel, saades seega rida hälbeid (ri r(kesk)) 3
Tähtede arvu esinemise suhtelised sagedused jaotuspolügonina: 40.00% 35.00% 30.00% 25.00% 20.00% Poisid Tüdrukud 15.00% 10.00% 5.00% 0.00% 4 tähte 5 tähte 6 tähte 7 tähte 8 tähte 9 tähte 10 tähte 12 tähte 6. Dispersioon, standardhälve ja variatsioonikordajad 6.1 Leian poiste ja tüdrukute eesnimede tähtede disperisiooni ( σ2), kasutades tabelis olevaid andmeid ning järgmist valemit: 2 2 +¿… +(x n− ¯x )2 f n (x 1−¯x ) f 1 +( x2− ¯x ) f 2 σ2 = N ¿ N – kõikide nimede arv kokku (vastavalt kas poiste või tüdrukute) Poiste dispersioon (σ2): 20,23+1,47 +0,81+10,58+21,78 σ2 = 23
Iseseisev töö nr 3. Mõõtmistulemuste kaalude, kaalutud keskmise väärtuse ja kaalutud keskmise standardhälbe leidmine. Ülesanne 1: On toodud ühe nurga neljakordse mõõtmise tulemused. Leia selle nurga kõige tõenäolisem väärtus, selle standardhälve ning kaal. Nurga kõige tõenäolisema väärtuse saame kui leiame selle nurga kaalutud keskmise väärtuse. Kuna algandmetes on meile ette antud nurgamõõtmiste standardhälbed S, siis need ruutu tõstes saame neile vastavad dispersioonid S 2. Nurgamõõtmiste kaalud leiame 1 w= nende dispersioonide pöördväärtustena S 2i .
Uuritav proov 52,4 29/28 52,3 47/44 - -/- Joon. 2. Fenooli kalibratsioonigraafik Joon. 3. Parakresooli kalibratsioonigraafik Joon. 4. 2,3-dimetüülfenool. kalibratsioonigraafik Kontsentratsioonide arvutus: Fenool - y = 0,1917x - 0,2254 y1= 0,1917x28 - 0,2254=5,14 (mg/l) y2= 0,1917x29 - 0,2254=5,33 (mg/l) yk=(5,14+5,33)/2=5,24 (mg/l) Standardhälve Suhteline standardhälve Proovi kontsentratsioon 52,4 mg/l (10 kordne lahjendus) Parakresool - y = 0,1217x - 0,3076 y1=0,1217x47 - 0,3076=5,41 (mg/l) y2= 0,1217x44 - 0,3076=5,04 (mg/l) yk=(5,41+5,04)/2=5,23 (mg/l) Standardhälve Suhteline standardhälve Proovi kontsentratsioon 52,3 mg/l (10 kordne lahjendus) Kokkuvõte Uuritavas proovis oli 52,4 mg/l fenooli ja 52,3 mg/l parakresooli. Katsete standardhälve oli vastavalt 0,095 ja 0,185. Kontsentratsiooni määrasime kõrgsurvevedelikkromatograafia abil,
Graafik: 3000 2000 1000 0 0 10 20 30 40 50 60 Arvutused: Ajavahemiku täpne väärtus: 0 = 2009 0 ± 0,1 vahemikus on 21 tulemust, seega tõenäosus, et mõõtja mõõdab ajaintervalle selles vahemikus on = 42%. 0 ± 0,05 vahemikus on 10 tulemust, seega tõenäosus, et mõõtja mõõdab ajaintervalle selles vahemikus on = 20%. - Mõõteseerja keskmine väärtus on = 2169,38. Mõõtetulemuste standardhälve on = 176,55. Mõõtja ühe mõõtmise piirviga on = ±282,49. - Keskmine mõõteviga ehk mõõtja mõõtevea hinnang on = 180,06. Mõõtevea standardhälve on = 156,00. Mõõtevea keskväärtuse hajumise normaaljaotuse standardhälve on = 22,06. - Mõõtevea mõõtemääramatus tõenäosuse 0,95 korral on = 44,12. -
...................................................................6 ............................................................................................................................................6 1.4 Karakteristikud............................................................................................................. 7 1.4.1 Keskväärtus...........................................................................................................7 1.4.2 Standardhälve........................................................................................................ 7 1.4.3 Variatsioonikordaja...............................................................................................7 1.4.4 Mediaan ja mood...................................................................................................7 1.Keskmine hinne...................................................................................................................8
kohandatuds keskväärtus- 5% on välja jäätud dispersioon on protsent - standardhälve ruudus standardhälve- hälbe keskmine range- ulatus, maksimum miinus miinimum kvartiirid - 50% keskel tühidiagram tunnusetüübid: binaarne - 2 vastust nimi - katekooriad (kelle poolt hääletasid?) interval - halb-12345- hea järjestus - 1-hea, 2-suht hea, 3-keskmine, 4-suht halb, 5- halb 0-100; 101-200 s-303 pühapäeviti 10.00-15.00 arvutiklass spss programm http://www.tlu.ee/~kairio/6201/ise%206201.pdf
võrdseteks osadeks. Sagedamini kasutatavad kvantiilid on detsiilid, kvintiilid ja kvartiilid. Keskmine- õenäoliselt kõige sagedamini kasutatav näitaja statistilisel andmete analüüsis on aritmeetiline keskmine ehk keskväärtus. Selle saamiseks liidetakse kokku kõigi vastajate antud tunnuste väärtused ja jagatakse saadud summa vastajate arvuga. Tulemuseks on näitaja, mida võib käsitleda kui tüüpilist või läbilõikelist vastust vaatlusalusele küsimusele. Standardhälve- iseloomustab vastuste hajuvust keskmise ümber. Standardhälbe saab, kui leida kõigi vastajate vastuste erinevus üldisest keskmisest ning arvutada nende erinevuste keskmine. Seega näitab standardhälve tüüpilist erinevust üldisest keskmisest. Kui standardhälve on suur, siis võib arvata, et vastajate vastused on enamasti üldisest keskmisest kaugel. Kui standardhälve on väike, siis on vastajate vastused antud üldise keskmise lähedale
Pane lehe nimeks tüdrukud. Järje 2. Kopeeri alljärgnev tabel oma tüdrukute lehele ning täida tabeli tühjad lahtrid. Tütarlapsed Pikkus Jala nr Aritmeetiline keskmine Mood Mida näitab mood? Mediaan Mida näitab mediaan? Minimaalne väärtus Maksimaalne väärtus Standardhälve Mida näitab standardhälve? 3. Koosta tüdrukute lehele eelmise tabeli alla pikkuse ja jala numbri vaheline korrelatsiooniväli ( Lisa juurde regressioonisirge ning arvuta korrelatsioonikordaja. Kas me saame väita, et mida pikem tüdruk, seda suurem jalanumber? 4. Koosta tulpdiagramm iga tüdruku jalanumbri kohta. (Koosta see tüdrukute lehele) Lisa diagrammile jalanumbrite aritmeetilist keskmist iseloomustav sirge.
.................................................................................... 8 15. Ülemine kvartiil.............................................................................................................. 8 16. Kvartiilide vahe.............................................................................................................. 8 17. Dispersioon.................................................................................................................... 8 18. Standardhälve................................................................................................................ 8 19. Variatsioonikordaja........................................................................................................ 8 20. Kokkuvõttev tabel.......................................................................................................... 8 Järeldus............................................................................................................
12. Dispersioon on juhusliku suuruse varieeruvuse mõõt. See näitab, kui palju uuritav suurus varieerub. Keskmine ruuthälve on üks varieeruvuse karakteristik Näiteks kui katseseerias on kõigi katsete tulemus sama, siis katsete dispersioon on null. Mida suurem dispersioon on, seda rohkem erinevad katsete tulemused üksteisest 13. Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. Kõik väärtused kokkuliidetud ja jagatud väärtuste arvuga. 14. Standardhälve iseloomustab vastuste hajuvust keskmise ümber. Standardhälbe saab, kui leida kõigi vastajate vastuste erinevus üldisest keskmisest ning arvutada nende erinevuste keskmine. Seega näitab standardhälve tüüpilist erinevust üldisest keskmisest. Kui standardhälve on suur, siis võib arvata, et väärtused on enamasti üldisest keskmisest kaugel. Kui standardhälve on väike, siis on väärtused antud üldise keskmise lähedale. 15
28 6. Kanna tabelisse hälve X 1 - X (erinevus keskväärtusest) 2 3,8 = -1,8 3 3,8 = -0,8 4 3,8 = 0,2 5 3,8 = 1,2 7. Kanna tabelisse hälvete ruutude rida (X- X )2 1,8 2 = 3,24 0,8 2 = 0,64 0,2 2 = 0,04 1,2 2 = 1,44 8. Kanna tabelisse ( X - X ) 2 f rida 3,24 3 = 9,72 2 0,64 7 = 4,48 =26,12 0,04 10 = 0,4 1,44 8 = 11,52 9. Arvuta standardhälve Standardhälve on ruutjuur hälvete ruutude summa ja variatsioonirea elementide arvu jagatisest: ( X 1 - X ) f 1 + ( X 2 - X ) f 2 + ...( X n - X ) f n = N 26,12 = = 0,9328 =0,97 28 Standardhälve iseloomustab hajuvust. Enamus tulemusi asub vahemikus ( X ; X + ) 10. Mitme õpilase kontrolltööde hinded asuvad selles vahemikus? Mitu % on see töö teinud õpilaste arvust? [3,8 0,97; 3,8 + 0,97] = [2,83; 4,77] ehk hajuvus vahemik
S= 0 ã- ã+ a p(a) juhusliku suuruse a tihedusfunktsioon. Usalduspiirkonna (ã , ã + ) leidmiseks tuleb: 1. Arvutada valimi põhjal punkthinnang ã; 2. Ette anda usaldusnivoo (näiteks 95%; 99%); 3. Leida seosest P(|ã a| < ) = suurus , mis määrabki usalduspiirkonna. Normaaljaotuse keskväärtuse usalduspiirkond suure valimi korral Eeldame, et valimi maht on küllalt suur (n > 30) või standardhälve on eelnevalt teada (näiteks mõõteriista täpsus on teada). Olgu X ~ N(m, ). Leiame keskväärtuse punkthinnangu aritmeetilise keskmise abil: 1n x = xi n i =1 Normaaljaotusega juhusliku suuruse X antud vahemikku sattumise tõenäosuse võime leida Laplace'i funktsiooni abil: P (| X - m |< ) = P (m - < X < m + ) = ( / ) - (- / ) = 2 ( / ) Kui X on normaaljaotusega, siis on ka X normaaljaotusega:
Korrelatsioonikordaja absoluutväärtused!! paiknevad alati vahemikus 0 kuni 1 regressioonifunktsiooni on võimalik leida aegridade andmetel Kvalitatiivse (väärtus, mida ei saa arvuna avaldada) tunnuse puhul: on võimalik metodoloogiliste vigade tekkimine Esindusviga on oma sisult vahe ühe juhuslikult moodustatud valimi keskmise taseme ja üldkogumi keskväärtuste vahel (õige) Väljavõtukogumi ja üldkogumi struktuurid erinevuse tulemusel tekkinud ebatäpsus Standardhälve paikneb alati vahemikus 0 ... lõpmatus (kui on alternatiivne tunnus, siis saab olla kuni 0,5 see on triki küsimus, kui panid õige, siis on õige Aegridade tasandamisel valitakse trendijoon võimalikult suure determinatsioonikordaja põhjal (õige) valitakse trendijooneks võimalikult lihtne geomeetriline joon trendijoone valikul peaks kasutama võimalikult lihtsat geomeetrilist joont (õige) Valimvaatluse korral
30 Xi-X -9,5 -41,1 -21,1 -11,1 -1,1 8,9 34 (Xi-X)2 90,25 1690,31 445,79 123,51 1,24 78,97 36 Pi*(Xi-X) 0 6,15 12,3 16,4 22,6 12,3 38 Pi% 0,00% 6,00% 14,00% 18,00% 25,00% 14,00% 38 39 Mood 54 Standardhälve 17,79711 40 Mediaan 55,5 40 keskmine 55,61364 41 43 44 Eesti keel 2008 45 47 12 48 50 54 10 54 54 8 55 56 6 56 56 58 4 58
μg/mL (ruumala 1mL)g/mL Teobromiin Kofeiin 3 170,6 163 3 vt märkus 1 vt märkus 1 Keskmine väärtus 170,6 163 Standardhälve 0 0 2 10 544,1 530,8 10 530,8 528,7 Keskmine väärtus 537,5 529,8
Hajuvusmõõdud Minimaalne element tunnuse väärtuste hulgas vähim. Maksimaalne elemet tunnuse väärtuste hulgas suurim. Variatsioonrea ulatus maksimaalse ja minimaalse elemendi vahe. Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonreas 25%. Ülemine kvartiil tunnuse väärtus, milles suuremaid (või võrdseid) liikmeid on variatsioonras 25%. Dispersioon ja standardhälve Variatsioonrida: x1; x2; x3....xn Variatsioonreas oleva arvu ja keskväärtuse vahet nimetatakse selle arvu hälbeks. Dispersioon - juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus varieerub. Näiteks kui katseseerias on kõigi katsete tulemus sama, siis katsete dispersioon on null. Mida suurem aga dispersioon on, seda enam erinevad katsete tulemused üksteisest. Standardhälve ruutjuur dispersioonist.
Ennutused, projektsioonid: kellele ja mille põhjal Ruumis (geograafiliselt): kas on võrreldavad (seadusandlus, normid, keel) Gruppide vahel: gruppide suurused Eri probleemide võrdlus Võrdlusülesanded andmeanalüüsis Üks v mittu tunnust? Jaotuse võrdlus v mingi parameetri võrdlus Kuidas jaotusi võrrelda? Millega võrrelda? Mille alusel võrrelda? Milliseid jaotusparameetreid võrrelda? Nt: -mood, mediaan, kvantiilid -keskmine, standardhälve, dispersioon - kujuparameetrid (ekstsess ja järsakuskordaja) Tunnuse jaotus Jäotus üldarvudena v protsentidena Segadustabel, risttabel Jaotus joonisel Võrdlus normaaljaotusega Parameetrite võrdlus Mood- kõige sagedasem väärtus v väärtusklass Mediaan- punkt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks
Teisendus toimub ctrl+shift+enter klahvikombinatsiooniga. Kovariatsioonimaatriksist saame samal viisil uuesti kaalumaatriksi. Tabel 3. Kovariatsioonimaatriks 12.25 0 0 0 0 34.81 0 0 0 0 22.09 0 0 0 0 5.29 Ülesanne 2. Reeperite A ja B vahel on rajatud neli nivelleerimiskäiku. Arvutada kõige tõenäolisem kõrguskasv, kaaluühiku standardhälve, kaalutud keskmise standardhälve ja kaalutud mõõtmiste standardhälbed. 2 Reeperite A ja B vahelise niveleerimiskäigu kõige tõenäolisem kõrguskasv on kaalutud keskmine kõrguskasv. Kaalutud keskmise leidmiseks tuleb esmalt leida kaalude ja kõrguskasvude korrutiste summa (∑wz). Kaalutud keskmine väärtus leitakse valemist ∑ wz M= , kus ∑w on kaalude summa. Kaalutud keskmise kõrguskasvu ∑w
Lineaarne regressioonimudelil: 1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi eesmärk on: 1. dispersioonide leidmine 2. uuritava nähtuste tegurite mõju olulisuse hindamine Valimi andmete põhjal saadi järgmised tulemused: aritm.keskmine=80 ja standardhälve 20. Üldkogumi maht 1200. Kui suur peaks olema valim, et teha kindlaks üle 110 väärtusega elementide osakaalu üldkogumis täpsusega +/-4 ühikut, usaldatavusega 95%. 1. 1700 (üldkogum 1200) 2. 1280 (üldkogum 1200) 3. Ei saa arvutada, sest dispersioon ei ole teada (standarthälbe väärtus on olemas, tõstam ruutu saan dispersiooni, 2. Tahan teha kindlaks elementide osakaalu, ehk et kui dispersiooni ei tea, saan arvutada võttes maksimaalse dispersiooni)
............................ 7 19. Millal kasutata kahepoolset ja millal ühepoolset hüpoteesi?......................................8 20. Regressioon - Andmete filtreerimine.......................................................................... 8 21. Graafik kõrguse ja diameetri vahelise sõltuvuse hindemiseks....................................8 22. Data analytics Regression. Kõrguse sõltuvus diameetrist........................................9 22. 1 Jääkstandardhälve ja kõrguse standardhälve............................................................9 23. Determinatsioonikordaja............................................................................................. 9 2 Sissejuhatus Kodutöö on proovitükk nr. 815 kohta. Andmed pärinevad failidest ,,prt815.xls" mis pärineb Eesti Maaülikooli kohalikust võrgust, ja Külliki Kiviste kodulehelt1 allalaetud failist kodu5.xls 1
on p. Nt 0,3 kvantiil on tunnuse selline väärtus, millest väiksemaid väärtuseid on variatsioonreas 30%. Täiendkvantiiliks nimetatakse juhusliku suuruse q-täiendkvantiili suuruse sellist väärtust xq, millest võrdsete või suuremate väärtuste esinemise tõenäosus on q. 9. Mis on tihedusfunktsioon? Tihedusfunktsioon on jaotusfunktsiooni tuletis: F'(x) = f(x). 10. Normaaljaotuse skitseerimine (tihedus- ja jaotusfunktsioon). Graafikult lugemine (aritmeetiline keskmine, standardhälve, mood, mediaan). 11. Mis omadused on normaaljaotusel? 1) normaaljaotus on sümmeetriline keskväärtuse µ suhtes: tema keskväärtus, mood ja mediaan võrduvad parameetriga µ 2) normaaljaotuse tihedusfunktsioonil on kaks käänupunkti, mis asuvad mõlemal pool keskväärtust kaugusel 3) normaaljaotuse asümmeetriakordaja ja ekstsess on nullid (A=0, E=0). 12. Missugused on juhusliku suuruse hajuvuse karakteristikud (nimeta vähemalt 4). Definitsioonid.
arv arv f i xi 1 6 6 2 18 36 3 25 75 4 20 80 5 12 60 6 9 54 KOKKU 90 311 Kaalutud aritmeetiline keskmine 3,46 NÄIDE Standardhälve Uuri millistest etappidest koosneb standardhälbe leidmine. Kasutades allpool toodud nooltega nuppu, muuda numbreid ja vaata, kuidas muutub standardhälve. Jälgi ka illustreerivat diagrammi. Püüa sõnastada, millal on standardhälve suurem, millal väiksem. arvud vahed vahede ruudud 30 10 100 N
.............................................................5 1.5 Statistika...........................................................................................................................5 1.5.1 Juhuslik ja süstemaatiline kõrvalekalle..................................................................6 1.5.2 Normaaljaotus...........................................................................................................6 1.5.3 Aritmeetiline keskmine ja standardhälve...............................................................7 3. MEETOD................................................................................................................................8 3.1 Katseisik ja pill................................................................................................................8 3.2 Ülesanne viiuldajale ja lindistuse läbiviimine...............................................................8 3
keskväärtust. Keskväärtust kasutatakse küllalt sageli, sest ta on aluseks teiste statistiliste näitajate määramisele. 19. Miks läheb lisaks keskmistele vaja ka hajuvusmõõte? Milliseid hajuvusmõõte tead? Hajuvusmõõdud iseloomustavad tunnuse väärtuste hajuvust (ehk kas väärtused erinevad üksteisest palju või mitte). Enimkasutatavad: min ja max element, variatsioonrea ulatus, alumine ja ülemine kvartiil, dispersioon ja standardhälve, variatsioonikordaja. 20. Kuidas leitakse variatsioonrea ulatus? Maksimaalse ja minimaalse elemendi vahe. 21. Mis on alumine kvartiil ja ülemine kvartiil? Mis on detsiilid? Alumine kvartiil tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonreas 25%. Ülemine kvartiil tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonras 25%. Detsiilide abil jaotatakse variatsioonrida 10-ks osaks. 22
Esindusviga on oma sisult: 1. Viga mis tekib aritmeetilise keskmise ebatäpsuse tulemusena 2. Kõikide võimalike esindusvigade harmooniline keskmine 3. Väljavõtukogumi ja üldkogumi struktuurid erinevuse tulemusel tekkinud ebatäpsus 4. Ei ükski eelnevatest variantidest Mediaan 1. on korrastamata rea keskmine element 2. on alati moodist suurem 3. on alati geomeetrilisest keskmisest suurem 4. normaaljaotuse puhul on moodiga võrdne 5. ei ükski Standardhälve 1. leitav dispersiooni ruuduga 2. paikneb alati vahemikus 0 ... lõpmatus 3. ei saa olla lineaarhälbest suurem 4. varieeruvas reas = 0 5. ei ükski Normaaljaotuse korral 1. puudub sümmeetria 2. st. hälve = 0 3. Mo = Me ei võrdu aritmeetilise keskmisega 4. keskväärtus on alati = 0 5. ei ükski Seos Y = 18,5 + 0,48 X 1. kirjeldab X-i mõju Y-le 2. kirjeldab seose tugevust 3. kirjeldab Y-i mõju X-le 4
kaalutud aritmeetiline keskmine, mediaan keskmise hinnaga, keskmine hind, arvukogumis, geomeetriline keskmine, harmooniline, aritmeetline mood, mediaan, harmooniline, aritmeetiline aritmeetiline, geomeetriline, harmooniline, mediaan Test 3 asümmeetriakordaja, püstakus, järku keskmoment, algmoment, tingmoment 1. 50 2. 65 3. 65 4. 90 5. 40 6. 70 kvartiilihaare, variatsiooniamplituud 3. 30 4. 10 5. 55,6 intervallskaala, standardhälve, püstakus kordaja, ekstsess järjestusskaala, mood, kvartiilhaare, standardhälbe valem, standardhälve tsebõsovi võrratus, variatsioonikoefitsient indeksid, kvantitatiivne, kvalitatiivne, alusindeks, lihtindeks, individuaalindeks ühismõõdustamine agregeerimine, ahelindeks alusindeks alusindeks ahelindeks ahelindeks teguriindeks, hindade muutumisest põhjustatud käibe muutus indeksanalüüs muutuva struktuuri indeks, püsiva struktuuri indeks
väärtused (üle 2) Praks 3- Kirjeldav statistika. Arvkarakteristikute leidmine funktsioonide ja protseduuri Descriptive Statistics abil. Usalduspiirid (protseduur Descriptive Statistics) Vaatluste arv- f- Statistical- Count Keskmine väärtus - =AVERAGE(Alguskoordinaat:Lõppkoordinaat) Mediaan - =MEDIAN(Alguskoordinaat:Lõppkoordinaat) Standardhälve - = STDEV.S (Alguskoordinaat:Lõppkoordinaat) Minimaalne väärtus - =MIN(Alguskoordinaat:Lõppkoordinaat) Maksimaalne väärtus - =MAX(Alguskoordinaat:Lõppkoordinaat) Standardviga =Sthälve/SQRT(vaatluste arv) Lisage andmetabelisse kehamassi veeru järele tühi veerg, kirjutage esimesse lahtrisse tunnuse nimeks 'KMI' (kehamassiindeks) ja arvutage selle väärtused kõigile tudengitele valemiga KMI = Kehamass, kg / (Pikkus, m)2.
Kui igas mõõtmiskohas on tekkinud hälve välja arvutatud, siis arvutan keskmise hälbe igale mõõtmiskohale. B= n- kordade arv, mitu korda mõõdeti Bi Igas mõõtmiskohas tekkinud hälve B- Igas mõõtmiskohas tekkinud hälbe keskmine Keskmi ne hälve B11 B12 B13 B14 B15 12.10 12.092 35 12.0968 12.1221 12.0988 0.000113 7.396 3.41056 0.0003786 1.47456 21 E-07 E-05 92 E-05 Keskmine hälve on 12.1 Standardhälve s s= s= 0.01046652 BMIN=12.035 BMAX=12.17 4 · Leian B keskväärtuseintervallhälve tõenäosusastmel P=0.95 ehk =0.05 Studenti tabelist kriitiline t (=0,05; n=50; kahepoolne) = 2,01 B-(t* B+(t* 12.0996818 Bmin 4 12.1055981 Bmax 6 · Teha mõõtme B histogramm ja sellele vastav teoreetilise normaaljaotuse tihedusfunktsiooni graafik f(x). Intervallide arvuks valida 8 kuni 10.
Defineeri mõisted: Statistika Matemaatiline statistika Üldkogum. Näide. Üldkogu uurimisel on kaks võimalust: Valim. Kuidas on seotud üldkogu ja valim? Millised on nõuded valimile? Valimi moodustamise viisid. Statistiline rida. Variatsioonirida. Sagedustabel. Diagramm. Mood. Mediaan. Aritmeetiline keskmine. Variatsiooni ulatus. Hälve. Dispersioon. Standardhälve. Korrelatsiooniväli. Normaaljaotus. Statistika mõisted Andmete esitamine 1.Statistika - teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. 2.Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. 3.Statistikas on oluline uurimise objekt - üldkogum. 4.Üldkogum on kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi.
standardiseeritud hälve (Std.Res) on suurem kui 0,019, kuid kõik leitud standardiseeritud hälbed on sellest kriteeriumist väiksemad. Mõõtmistulemustele ning punktide kõrgustele leitud standardhälbed on väikesed, mis annab alust eeldada, et mõõtmistulemused on täpsed ning usaldusväärsed. 2 Siiski proovime joonepikkuste ümberskaleerimist ( S 0 ∑ ). S0 on tasandusjärgse kaaluühiku standardhälve ning ∑ on kovariatsioonimaatriks (Tabel 1), mille diagonaalil on sektsioonide pikkused L. Tasandusjärgse kaaluühiku standardhälve S0 = 0,0057, mis on võetud esialgsest tasandusaruandest. Ümberskaleeritud joonepikkused on toodud tabelis 2. Tabel 1. Kovariatsioonimaatriks ∑. 13.6 0 0 0 0 0 0 0 0 0 0 9.7 0 0 0 0 0 0 0 0
2 4. Populatsioon ja valim, standardviga Populatsioon on kõigi objektide, isendite, esemete, nähtuste või seisundite kogum, mille kohta soovitakse järeldusi teha Populatsiooni neid objekte, mida on vaadeldud või uurimiseks välja valitud, kutsutakse valimiks Valimit, kus uuritava tunnuse jaotus on samasugune kui populatsioonis, nimetatakse esindavaks valimiks Standardhälve- ruutjuur dispersioonist (dispersioon pt.2) standardviga = uuritava tunnuse standardhälve / ruutjuur valimi suurusest Populatsioon Valim keskväärtus (EX, ) keskmine (x) pop. dispersioon (DX,2) valimi dispersioon (s2) pop. mediaani valimi mediaan 3 5
x X 1 2 2 2 f 1 x 2 X f 2 .... x n X f n N 6. Standardhälve iseloomustab tunnuse hajuvust (δ). Mida suurem on standardhälve, seda suurem on hajuvus. 2 7. Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe (v). Esitatakse tavaliselt protsentides. v=
KOLLOKVIUM 3 20. mai 2012. a. 14:25 1.Kirjeldava statistika põhimõisted: aritmeetiline keskmine, mediaan, kvartiilid, mood, dispersioon, standardhälve, haare, kovariatsioon, korrelatsioonikordaja. Definitsioonid ja arvutamine. Aritmeetiline keskmine: AVERAGE Mediaan: MEDIAN Kui N is paaritu, siis on mediaan järjestatud statistilise rea ehk variatsioonrea keskmine liige. Kui N on paaris, siis on mediaan variatsioonrea kahe keskmise liikme poolsumma. Kvartiilid: QUARTILE 25-protsentiili nimetatakse esimeseks kvartiiliks. Mediaan on 50-protsentiil ehk teine kvartiil.
Selle poisi pikkust, kellest vasemale jääb 75% kogureast selle poisi pikkust, kellest paremale jääb 25% kogu reast. 3. Mitu % andmetest jääb ülemise, alumise kvartiili vahele? 50% 4. Tudengite eksamitulemused olid järgmised: Mehed: 1 2 3 4 5 Naised: 11 22 33 44 55 Väited õiged: Meeste, naiste eksamihinnete mediaanid on võrdsed. Meeste, naiste keskmised eksamitulemused olid võrdsed. Naiste tulemuste standardhälve on väiksem, kuna naisi on rohkem. 5. Millised väited on korrektsed? Keskväärtus võib olla ka selline väärtus, mida reaalsete vastuste hulgas ei esine. Mood on alati reaalne väärtus uuritud valimi väärtuste hulgast. Mediaan võib olla ka selline väärtus, mida reaalsete vastuste hulgas ei esine. 6. Tudengite eksamihinded on 1 2 2 3 3 5 Õiged: Eksamihinnete mediaan 2,5 Eksamihinnete jaotusel on 2 moodi: 2 ja 3. 7
Valem (6) Vp = ((m1 m) / p ) Vp - parafiini ruumala m3 m1 - proovikeha mass koos parafiiniga õhus kg m -kuiva proovikeha mass õhus kg p - parafiini tihedus kg/m3 Valem (7) V = V1 Vp V - keha ruumala m3 V1- keha ruumala koos parafiiniga m3 Vp - parafiini ruumala m3 Valem (8) p = (1 0/) * 100 p - materjali poorsus % 0 - materjali tihedus kg/m3 - materjali absoluutne tihedus kg/m3 Valem (9) Standardhälve Tabel 1.1 Korrapäraste kujudega kehade mõõtmed Jrk nr. Materjali nimetus Mõõtmed (mm) Keskmised mõõtmed (m) 99,5 98,7 100,1 0,099 0,098 0,099 1 Dolomiit 99,1 98,8 99,8 98,3 98,9 99,0 h = 50,6 d = 20,0 Terassilinder
keskmine on keskväärtuse parim hinnang. Püüame hinnata tajuvust, selleks moodustatakse hälbed aritm. keskmise suhtes. + + ... + ) Juhusliku sündmuse mood (M0 X) on kõige suurem tõenäosuse väärtus. = max Juhusliku sündmuse mediaan variatsioonirea keskmine element paarituarvulise valimi korral või paariarvulise valimi korral kahe keskmise elemendi poolsumma. 4. Dispersioon ja standardhälve ( DX ja ( X ) ). Dispersiooni ja standardhälbe punkthinnangud ( s 2 ja s ). Dispersioon (DX) juhusliku suuruse ja tema keskväärtuse vahe ruudu keskväärtus DX=E(X-EX)². Praktikas kasutatava binoomjaotuse dispersioon on arvutatav lihtsama valemiga D(x)=npq Standardhälve on ruutjuur dispersioonist - (X)= ruutjuur DX. Dispersiooni punkthinnang on valiku uuringu korral. Dispersiooni hindamiseks kasutatud kõikse uuringu