Rakendusstatistika arvestusharjutus AGT-1 (Andmete kood: 38 42 36) OSA A 1. Leida keskväärtuse, dispersiooni, standarthälbe, mediaani ja haarde hinnangud Keskväärtus N 1 ´x = N ∑ xi i=1 ´x =53,24 Dispersioon N 1 s x 2= ∑ N−1 i=1 ( x i−´x )2 s x 2 =705,69 Standardhäve s x =√ s x 2 s x =26,56
13,848 χ ( 2 ( 1+ p ) 2 ; n−1) Dispersiooni 90%-line usalduspiirkond on (536,52 ; 1410,84) 2 P(536,52< σ^ <1410,84) 3. Kontrollida järgmisi hüpoteese: (Eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0,1) 3.1 H 0 : μ=50 alternatiiviga H 1 : μ ≠ 50 t statistik = |√N ´ s || 25 28,53 | ( x −μ0 ) = √ ( 44,84−50 ) =|−0,9043|≈|−0,90| Studenti funtktsioon: t(0,1;24) = 1,7109 Hüpotees vastab tõele, kuna |t|>t 1−∝ /2 (f ) ja |−0,90| < 1,7109 H0 hüpotees vastu võetud. 2 2 3.2 H 0 : σ =800 alternatiiviga H 0 : σ ≠ 800 s2 (
oletatavatest suundadest. Andmeid on võimalik koondada ja teha arusaadavamaks kõrvalistele isikutele. Kõige parema ülevaate annavad jaotusgraafik ning histogramm, millelt on võimalik välja lugeda suur osa esmaseid tulemusi. Saadud tulemusi on võimalik kasutada ka hüpoteeside kontrollimiseks. Plastide tootmisel läheb statistikat lisaks saadud materjalide omaduste uurimiseks vaja ka keemilise ühendite koostamisel. Kokkuvõtteks võib öelda, et ilma statistikata ei jääks küll töö otseselt tegemata, kuid see võib aidata võita tohutult aega ning lihtustada tulemusi ka kõrvaltvaatajale ilma, et viimane peaks teemat süvitsi uurima. Raie Eesti metsades 2011. aasta metsamaa pindala oli ligikaudu 142 221 miljonit hektarit, milles oli puitu umbkaudu 131 459 miljoni kuupmeetrit. Iga aasta võrreldakse juurde kasvava metsa pindala raiutud osaga ja selle abil on välja arvutatud, et optimaalne raiemaht aastas on 12,6 miljonit tihumeetrit. Sellise
Rakendusstatistika arvestusharjutus AGT-1 Osa A 1. Arvkarakteristikud Keskväärtus N µ = xi pi µ = 44,8 i =1 (Kasutades Exceli funktsiooni AVERAGE) Dispersioon N 2 = ( xi - µ ) 2 p i 2 = 814,4 i =1 (Kasutades Exceli funktsiooni VAR.P lisaks kontrollisin Excelis vahetulemusi kasutades) Standardhälve = 2 = 814,4 = 28,54 Mediaan Me = 41 Variatsioonirea keskmine arv (juhul kui on tegemist paarituarvutlise valimiga) või kahe
RAKENDUSSTATISTIKA ARVUTUSGRAAFILINE TÖÖ Osa A Valim A mahuga N=25 variatsioonirida: 1 2 17 81 97 75 22 21 94 62 81 73 74 52 79 45 14 70 2 71 48 79 77 39 19 1. Leida keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde hinnangud. Keskväärtus: = 51,8 Dispersioon: s x² = 968,58 Standardhälve: s x = 31,12 Mediaan: Mediaan on variatsioonirea keskmine element paarituarvulise valimi korral või kahe keskmise elemendi poolsumma paarisarvulise valimi korral. Me = 62 Haare: R = 91 – 1 = 96 2. Leida keskväärtuse ja dispersiooni usaldusvahemikud (eeldades üldkogumi normaaljaotust ning võttes olulisuse nivooks α = 0.10). Keskväärtuse usaldusvahemik:
11.4 Kontrollida mudeli adekvaatsust F < Fkr, seega võtame null-hüpoteesi vastu (mudel on adekvaatne) 11.5 Leida mudeli poolt prognoositava väljundi usaldusvahemikud punktides x=1, x=3, x=5 Usaldusvahemikute leidmiseks peame leidma prognoositava y dispersiooni ja t-statistikut. Neid leiame kasutades järgmisi valemeid: Punktis x = 1 Punktis x = 3 Punktis x = 5 11.6 Regressioonisirge graafik koos katsepunktide ja p.11.5 leitud usaldusvahemikega. 12. Kokkuvõte. Antud töö A osas anti hinnangud valimi keskväärtuse, dispersiooni, standardhälbe, mediaani ja haarde osas. Arvutati välja dispersiooni ja keskväärtuse usaldusvahemikud. Punktis 3 kontrollitakse hüpoteese. Valimile leiti vastav empiiriline histogramm ja leiti graafikud olulisematele näitajatele. Kontrolliti Kolmogorovi-Smironovi testi abil hüpoteesi ning hiljem rühmade keskväärtuste homogeensushüpoteesi. Punktis 9 vaadeldi aegridade analüüsi. Osas B
i xi 1. 1 1 2 2 3 17 4 81 5 97 6 75 7 22 8 21 2. 9 94 10 62 11 81 12 73 13 74 14 52 15 79 16 45 17 14 18 70 19 2 20 71 21 48 22 79 23 77 24 39 25 19 3.1. 3.2. N 25 i (xi - x)2 Keskväärtus 51.8 1 2580.64 Dispersioon 968.58 2 2480.04 Standardhälve 31.12 3 1211.04 Mediaan 62 4 852.64 Haare 96 5 2043.04 6 538.24 7 888.04 α 0.1 8 948.64 t1-α/2
P((3 - 1,58) < µ y ( x) < (3 + 1,58)) = 1 - 0, 05 P(1, 42 < µ y ( x) < 4,58) = 0,95 2) x=5 1 (5 - 3, 08) 2 s ( y^ | x ) = 2, 08 + = 1,12 5 9,19 y^ | x = 2, 4469 1,12 = 2, 73 P((7, 06 - 2, 73) < µ y ( x) < (7,06 + 2, 73)) = 1 - 0, 05 P(4,33 < µ y ( x) < 9, 79) = 0,95 11.6 Regressioonimudeli graafik koos katsepunktidega KOKKUVÕTE Rakendusstatistika arvestusharjutuses AGT-1 leidsin erinevaid valimit iseloomustavaid parameetreid, kontrollisin hüpoteese ja esitasin mitmeid graafikuid. Osa A Ülesandes 1 on toodud põhilised valimit A iseloomutavad arvkarakteristikud: keskväärtus 46,2, dispersioon 867,9, standardhälve 29,46. Samuti on välja toodud mediaan 46 (valimi keskelement) ja haare 99 (valimi suurima ja vähima elemendi vahe). Ülesandes 2 on leitud keskväärtuse ja dispersiooni usaldusvahemikud, ehk piirkonnad, kus
Kõik kommentaarid