variatsioonireas 25%. Tähis Kv · Hälve variatsioonireas oleva tunnuse väärtuse ja keskväärtuse vahe. Kogu variatsioonirea hälvete summa on 0. · Dispersioon hälvete ruutude aritmeetiline keskmine. Tähis ² · Standardhälve ruutjuur dispersioonist. Tähis · Variatsioonikordaja standardhälbe ja keskväärtuse suhe. Esitatakse tavaliselt protsentides. Tähis V. · Hajuvusvahemik selle abil saab teada keskväärtuse standardvea. 5 3. Koondtabel sõiduaegade kohta Üldkogumiks on bussi sõiduajad, samuti kuuluvad need valimisse. Kuupäev Sõiduks kulunud aeg (minutites) 12.09.2011 hommik 10 12.09.2011 õhtu 11 13.09.2011 hommik 10 13.09.2011 õhtu 12 14.09.2011 hommik 13 14.09.2011 õhtu 11 15.09.2011 hommik 10 15.09.2011 õhtu 11 16.09.2011 hommik 13 16.09.2011 õhtu 12 19.09.2011 hommik 10 19.09.2011 õhtu 12 20.09
N 7. Katsetäpsus Katsetäpsus iseloomustab suhtelist standardviga protsentides. Katsetäpsus arvutatakse valemiga: SX Sx V P x = 100 * x = 100 * N *x = x N Kus Vx Variatsioonikordaja 8. Vaatluste arvu leidmine, kui on teada standardviga N leidmiseks on vaja peale standardvea ka valimi standardhälvet. Siis on võimalik arvutada valemiga: 2 S N = x (valem 2) SX 5 9. Vaatluste arvu leidmine kui on teada katsetäpsus Kui on teada katsetäpsus siis on vaja ka varitasioonikordajat, siis on võimalik leida vaatluste arvu valemiga: 2 V
18) tudengid[1:4,] -nelja esimese tudengi kõigi tunnuste väärtused 19) tudengid[1:3, -4] - neljas tunnus on eemaldatud 20) table(perekonnaseis) - sagedustabel 21) prop.table(perekonnaseis) - näitab osakaalusid (100-ga korrutades protsente) 22) barplot(table(perekonnaseis) - tulpdiagramm, pie - sektor 23) plot(ecdf(kaal) - jaotusfunktsioon 24) boxplot(kaal) - karp-vurrud diagramm ehk mingi mega veider asi 25) sd(valim2$pikkus)/sqrt(50) - standardvea arvutamine 26) t.test(valim2$pikkus) - usaldusintervall, p-väärtus ja valimi keskmine 27) binom.test(73, 73+407) - täpne usaldusintervall, kus 1.arv on edukate katsete arv, 2. aga tehtud katsete koguarv 6 28) binom.test(6, 10, 1/3) - hüpoteeside testimine, kus 6 on õnnestunud katsete arv, 10
(küllalt suure) tõenäosusega. Seda tähistatakse 1-. Selle väärtuseks võetakse tavaliselt metsanduslikes uurimustes 0,95. 6)Vastavalt usaldusnivoo etteeantud väärtustele arvutatakse usalduspiirid s.o. kaks arvu mille vahel asub üldkogumi parameeter tõenäosusega 1-. 7) Standartveaks nimetatakse aritmeetlise keskmise kui keskväärtuse hinnangu standarthälvet. 8) Katsetäpsuseks nimetatakse suhtelist standartviga protsentides. 9) Standardvea arvutamise valem (Equation Editoriga) sx sx = N 10) Katsetäpsuse arvutamise valem sx sx V = 100 = x Px = 100 x N x N 11) N leidmise valem, kui on ette antud standardviga 12) N leidmise valem, kui on ette antud katsetäpsus Hüpoteeside kontroll 13) Edasi võrdlesin enda proovitükil mõõdetud andmeid proovitükiga 64. Selleks arvutasin proovitükil 64 kahes suunas mõõdetud diameetri keskmise
23,5 24,15 4) Leida, mitme puu diameetrid peaksime mõõtma, 23,2 et saada keskväärtuse hinnang täpsusega 1%. Variatsioonikordaja 33,4 N= 26,85 18,25 18,4 5) Mis on usaldusnivoo? 26,1 6) Mis on usalduspiirid? 27,05 7) Mida iseloomustab standardviga 26,6 8) Mida iseloomustab katsetäpsus (suhteline standardviga) 25,6 9) Standardvea arvutamise valem (Equation Editoriga) 21,1 10) Katsetäpsuse arvutamise valem (Equation Editoriga) 22,55 11) N leidmise valem, kui on ette antud standardviga (Equation Editoriga) 27,9 12) N leidmise valem, kui on ette antud katsetäpsus (Equation Editoriga) 27,15 24,75 Ülesanne jätkub järgmistel töölehtedel 19,35 36 25,75 22,4 22,25 30,95 29,25 36,7 26 27,95 18,25 20,9 22,1 23,35 25,95 22,95 20,9 19,65 19,65
· Statistik valimit iseloomustab arvkarakteristik, mis arvutatakse tunnuse väärtuste põhjal. 3. Valimi jaotuseks nim valimi jagunemist erinevate tunnuse väärtuste vahel (nt veregrupi tabel). 4. Normaaljaotus pideva tunnuse jaotu, mille korral histogrammi kuju on sümmeetriline ja nn kellukesekujuline. · Normaaljaotuse kirjeldab ära 2 parameetrit: keskmine (asukoht) ja standardhälve (järsakus). · · 95% valimist jääb ligikaudu 2 standardvea kaugusele keskmisest. · Ligikaudu 2/3 valimist jääb vahemikku keskmine +-SD · Normaaljaotus on nii oluline, sest: o Valimi keskväärtus on informatiivne eelkõige ligikaudse normaaljaotusega valimite korral (valimist ülevaade keskväärtuse ja standardhälbe põhjal; sobilik on keskväärtusel põhinevad analüüsimeetodid). o Enamik klassikalisi statistilisi analüüsi meetodeid pidevate tunnuste jaoks on kasutatavad
5) Mis on usaldusnivoo? Usaldusnivoo on tõenäosus, mis on etteantud, sinna kuulub üldkogumi parameeter. 6) Mis on usalduspiirid? Usalduspiirid on usaldusnivoo kaudu arvutatud parameetrid. Kaks arvu, mille vahel on 7) Mida iseloomustab standardviga Standardveaks nimetatakse aritmeetilise keskmise kui keskväärtuse hinna 8) Mida iseloomustab katsetäpsus (suhteline standardviga) Katsetäpsus on suhteline standardviga protsentides 9) Standardvea arvutamise valem (Equation Editoriga) 10) Katsetäpsuse arvutamise valem (Equation Editoriga) 11) N leidmise valem, kui on ette antud standardviga (Equation Editoriga) 12) N leidmise valem, kui on ette antud katsetäpsus (Equation Editoriga) Sx S¯x V x 2 Sx ( ) 9
Deterministlik komponent on see oluline osa, mille mudel peab välja tooma. Deterministlik komponent = tinglik keskväärtus E[Y|X]. Regressioonanalüüsi käigus leitakse regressioonmudeli deterministlik component y= αx+ β + ε. Lineaarse mudeli hindamine = parima sirge leidmine Vähimruutude meetod – Objektiivne kriteerium: Empiiriliste punktide ja sirge vastavate punktide vaheliste kauguste ruutude summa on minimaalne. Vähimruutude meetod tähendab mudeli standardvea minimeerimist Regressioonanalüüs ei ole pööratav. Determinatsioonikordaja iseloomustab mudeli kirjeldusvõimet. Standardviga iseloomustab funktsioontunnuse väärtuste yi kõrvalekallet regressioonmudeliga määratud väärtustest ŷi. Mudel kirjeldab suuruste vahelist seost: mis suunas üks suurus teist mõjutab; kui palju mõjutab; kas mõju on lineaarne või mittelineaarne. Mudel võimaldab prognoosimist. Mudel võimaldab välja tuua erindeid.
Tolerants (TOL) kui suur osa sõltumatu muutuja varieeruvusest jääb ülejäänud sõltumatute muutujate poolt kirjeldamata Varieeruvusindeks (VIF) ehk dispersiooni mõju faktor näitab sõltumatu muutuja mõju regressiooniparameetri hajuvusele ja on tolerantsi pöördväärtus 11. Multikollineaarsuse mõju regressioonanalüüsi tulemustele (labortöö). Multikollineaarsuse tagajärjed: kui reg kordajate varieeruvus on väga suur, siis regressioonikordaja parameetri standardvea (S a1) arvutusvalemist järeldub, et juhul kui sõltumatute muutujate X1i ja X2i vahelise sõltuvuse korrelatsioonikordaja r 1,2 läheneb 1-le siis murru nimetaja väheneb ning S a1 suureneb. Varieeruvuse suurenemisel t-statistik muutub mitteusaldusväärseks/t-statistiku avaldises parameetri hinnang jagatakse standardevaga t=a/S ai. Multikollineaarsus suurendab regressioonikordajate varieeruvust.. Mittetäieliku multikollineaarsuse
5) Mis on usaldusnivoo? Usaldusnivoo näitab tulemuse sattumist mingisse kindlasse vahemikku, milleks enam 6) Mis on usalduspiirid? Usalduspiirid iseloomustavad 7) Mida iseloomustab standardviga See selleks, aga ta iseloomustab siis meie teadmiste täpsust uuritava 8) Mida iseloomustab katsetäpsus (suhteline standardviga) Iseloomustab hinnangute täpsust. m=S_x/(n) 9) Standardvea arvutamise valem (Equation Editoriga) P_x=100 S_x/(x n) 10) Katsetäpsuse arvutamise valem (Equation Editoriga) n=(S_x/m)^2 11) N leidmise valem, kui on ette antud standardviga (Equation Editoriga) n=((S_x P_x)/
jääma. Seda nimetatakse usaldusintervalliks (konfidence interval) ja selle suurus oleneb usalduse astmest, mida uurija (tellija) soovib valimitulemustes näha. Enamasti kasutatakse usaldatavuse 95 ja 99 protsendilisi tõenäosusi. Lähtudes joonisest 15, saame usaldusintervalli määramiseks järgmised valemid (4): x ± 1,96 (sx) = usaldusintervall 95%; x ± 2,57 (sx) = usaldusintervall 99%; Standardvea kasutamine valimi suuruse määramiseks Valimi suuruse (n) määramisel lähtutakse keskmise standardvea arvutamise valemist (3), kus eemaldatakse korrektsioonifaktor, N-n ning valem saab N Järgmise kuju: s2= s2 (4), millest ne = s2 (5). N s2
viimase kuu jooksul H1: regressioonivõrrand on statistiliselt oluline viimase kuu jooksul Regressioonivõrrand on H1: statistiliselt oluline , sest p=8,82306E-13 (p<=0,05), seega viimase aasta jooksul õige on, et H1: pikkus = a + b * Jalanumber Sõnastage üks lause regressioonivõrrandist saadavate prognooside täpsuse kohta kas mitmese korrelatsioonikordaja (R), determinatsioonikordaja (R2) või mudeli standardvea baasil. Prognoosites pikkus ja jalanumbri järgi on vaja arvestada +/- 5,4 cm vea. 251 42 44 46 48 Jalanumber 172,23 MS F Significance F 2470,022 85,3386 8,82306398E-013 28,94378 t Stat P-value Lower 95% Upper 95% Lower 95,0%
§ Jaotuse keskväärtus=170cm, standardhälve=5cm § Leili, kelle pikkus on 170 cm, asub jaotuse keskel (temast lühemaid 50%) Leili (170 cm) keskmine + 0·st.hälvet e z-väärtus = 0 § Mari, kelle pikkus on 180 cm, temast lühemaid 97,5% Mari (180 cm) keskmine + 2·st.hälvet e z-väärtus = 2 § Virve(160cm) keskmine -2·st.hälve z-väärtus = -2 § Tiiu (185cm) Üldistav statistika Väärtuste standardiseerimine Üldistav statistika Statistiline järeldamine § Standardvea põhjal saab üld- kogumi vastava arvnäitaja väärtusele hinnangu anda vastavalt alltoodud reeglitele: § 68%tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 1 st.viga § 95% tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 2 st.viga § 99%tõenäosusega asub üldkogumi parameeter vahemikus: valimi arvnäitaja väärtus ± 2,5 st.viga