EESTI
MAAÜLIKOOL
Metsandus-
ja maaehitusinstituut
Metsakorralduse
osakond
Mikk SüllaProovitükk
nr 613.
Hinnangud , hüpoteesid,
regressioon Kodune
töö nr. 5 õppeaines Metsandusliku andmetöötluse alused II
Juhendaja Külliki
Kiviste Tartu 2012
Sisukord
Sisukord
Y
Sisukord 1
Sissejuhatus 3
Punkthinnangud, vahemikhinnangud, valimi maht 4
Hüpoteeside kontroll 5
Tabel1.
Diameetrite keskväärtused 6
Tabel 2. Täpsusklupi ja tavaklupi mõõtmistulemused 6
Tabel 3.
Tervete ja kahjustunud taimede sõltuvuvs feromoonpüünisest. 6
Tabel 4.
Teoreetilised sagedused katsele 7
Regressioon 8
Tabel 5. I rinde mändide
diameeter kõrgus ja võra algus 8
Joonis 1. Kõrguse sõltuvus diameetrist. 8
Tabel 6. Regressioonanalüüs kõrguse sõltuvuse leidmiseks diameetrist 9
Tabel7.
Mitmene regressioonanalüüs võra alguse sõltuvuse leidmiseks diameetrist ja kõrgusest 9
Kasutatud kirjandus 11
Sisukord
YSisuko
Sissejuhatus 3
Punkthinnangud, vahemikhinnangud, valimi maht 4
Hüpoteeside kontroll 5
Tabel1. Diameetrite keskväärtused 6
Tabel 2. Täpsusklupi ja tavaklupi mõõtmistulemused 6
Tabel 3. Tervete ja kahjustunud taimede sõltuvuvs
feromoonpüünisest. 6
Tabel 4. Teoreetilised sagedused katsele 7
Regressioon 8
Tabel 5. I rinde mändide diameeter kõrgus ja võra algus 8
Joonis 1. Kõrguse sõltuvus diameetrist. 8
Tabel 6. Regressioonanalüüs kõrguse sõltuvuse leidmiseks
diameetrist 9
Tabel7. Mitmene regressioonanalüüs võra alguse sõltuvuse
leidmiseks diameetrist ja kõrgusest 9
Kasutatud kirjandus 11
Sisukord 1
Sissejuhatus 3
Punkthinnangud, vahemikhinnangud, valimi maht 4
Hüpoteeside kontroll 5
Tabel1. Diameetrite keskväärtused 6
Tabel 2. Täpsusklupi ja tavaklupi mõõtmistulemused 6
Tabel 3. Tervete ja kahjustunud taimede sõltuvuvs feromoonpüünisest. 6
Tabel 4. Teoreetilised sagedused katsele 7
Regressioon 8
Tabel 5. I rinde mändide diameeter kõrgus ja võra algus 8
Joonis 1. Kõrguse sõltuvus diameetrist. 8
Tabel 6. Regressioonanalüüs kõrguse sõltuvuse leidmiseks diameetrist 9
Tabel7. Mitmene regressioonanalüüs võra alguse sõltuvuse leidmiseks diameetrist ja kõrgusest 9
Kasutatud kirjandus 11
Sissejuhatus
Käesoleva
töö eesmärgiks on analüüsida, kas proovitükil mõõdetud
diameetri jaotus on lähendatav mõne klassikalise teoreetilise
jaotusega. Töös on kasutatud
Aakre metskonna proovitükki nr. 613
andmeid, mis on saadud EMÜ Metsanduse ja
maakorralduse serveris
võrgukaustast public:/Metsandusliku
andmetöötluse alused 2011/2011]. Samuti on kasutatud K.Kiviste
kodulehte [
http://www.eau.ee/~kkiviste ] kust oli võimalik saada väga
täpseid juhiseid, lühendeid ja valemeid ülesande sooritamiseks. .
Töö eesmärk on tundma õppida hinnangute, hüpoteeside ja
regressiooni koostamist MS
Exceli keskkonnas ning neid uurida
proovitüki nr. 613 andmete põhjal.
Lisamaterjalina kasutasin ka A.Kiviste poolt välja antud raamatut
„Matemaatiline statistika MS Exeli keskkonnas“
Punkthinnangud, vahemikhinnangud, valimi maht
Eeldades, et proovitükil mõõdetud andmete põhjal tahame teha järeldusi samalaadse
üldkogumi kohta.
Selleks tuli arvuta järgmised statistikud oma proovitüki kohta
1) Leida 1. rinde männi diameetri kohta (rühmitamata andmetest) järgmised suurused:
aritmeetiline keskmine,
6,39
cm
dispersioon,
14,27
standardhälve,
3,78
cm
valimi maht,
80
standardviga,
0,42
cm
variatsioonikordaja,
59,14
katsetäpsus e suhteline standardviga.
6,61
variatsioonikordaja viga
4,68
2) Leida diameetri
usalduspiirid :
üldkogumi keskväärtuse 95%lised usalduspiirid,
5,55
7,23
cm
üldkogumi keskväärtuse 90%lised usalduspiirid,
5,68
7,09
cm
üldkogumi dispersiooni 95%lised usalduspiirid,
10,69
20,02
üldkogumi dispersiooni 90%lised usalduspiirid,
11,19
18,94
üldkogumi standardhälbe 95%lised usalduspiirid,
3,27
4,47
cm
üldkogumi standardhälbe 90%lised usalduspiirid.
3,34
4,35
cm
3) Eeldades diameetrite samasugust hajuvust ka ülejäänud üldkogumis tuli leida, mitme
puu diameetrid peaksime mõõtma, et saada keskväärtuse hinnang veaga 0,3 cm
159
diameetrit
4) Tuli leida, mitme puu diameetrid peaksime mõõtma,
et saada keskväärtuse hinnang täpsusega 1%.
Variatsioonikordaja
59,14
N=
3498
diameetrit
5)
Usaldusnivoo
on uurija poolt ette antud tõenäosus kuhu üldkogumi
parameeter kuulub teatud (küllalt suure) tõenäosusega. Seda tähistatakse
1-.
Selle väärtuseks võetakse tavaliselt metsanduslikes uurimustes
0,95.
6)Vastavalt
usaldusnivoo etteeantud väärtustele arvutatakse
usalduspiirid
s.o. kaks arvu mille
vahel asub üldkogumi parameeter tõenäosusega 1-.
7
)
Standartveaks
nimetatakse aritmeetlise keskmise kui keskväärtuse hinnangu
standarthälvet.
8)
Katsetäpsuseks
nimetatakse suhtelist standartviga protsentides.
9) Standardvea arvutamise valem (Equation Editoriga)
10) Katsetäpsuse arvutamise valem
Px = 100
11) N leidmise valem, kui on ette antud standardviga
12)
N leidmise valem, kui on ette antud katsetäpsus
Hüpoteeside kontroll
13)
Edasi võrdlesin enda proovitükil mõõdetud andmeid proovitükiga
64. Selleks arvutasin proovitükil 64 kahes suunas mõõdetud
diameetri keskmise. Seejärel
filtreerisin proovitükilt 64 välja
1. rinde sama
puuliigi ( MA) diameetrid ning leidin vaatluste arvu.
Proovitüki
nr. 64 vaatluste arv tuli
N=6414Edasi
leidsin mõlema proovitüki diameetri
dispersioonid vastaval 1.
rinde puuliigile. Ning vastavalt nendele andmetele leidsin kas
nendele proovitükkidele vastavate üldkogumite diameetri
dispersioonid on oluliselt erinevad (
= 0,05)?
Disp. Oma
14,27
Disp. 64
18,72
P-väärtus
0,284
Jah või ei
Ei ole olulist erinevust
15)
Nende proovitükkide diameetrite keskväärtused (tabel1) ei ole
oluliselt erinevad (a = 0,05). Lähtuvalt eelmise ül. vastusest
tuleks T-test valida 'assuming equal variances' .
Tabel1. Diameetrite keskväärtused
Kesk. Oma
6,387 cm
Kesk. 64
22,19 cm
Equal or unequal
equal
P-väärtus
1E-50
Jah või ei
Ei ole oluliselt erinevad keskväärtused
16)
Sooviti uurida tavalise täpsusklupi ja elektronklupi
mõõtmistulemuste erinevust (tabel2).
Selleks mõõdeti
samadel puudel diameeter tavalise täpsusklupiga ning
elektronklupiga. Kas võib väita, et keskmine mõõtmistulemus nende
kluppide puhul on oluliselt erinev (t-Test,
Paired Two Sample for
Means )
Tabel 2. Täpsusklupi ja tavaklupi
mõõtmistulemused
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
Tavaline
17,9
21,1
20,7
19,5
19,7
20,1
20,6
18,9
19,4
19,7
20,3
Elektron 17,8
21,2
20,7
19,4
19,6
20,1
20,4
18,9
19,2
19,6
20,1
Kesk. tava
19,81
Kesk.elek.
19,73
P-väärtus
0,02
Jah või ei
Jah, on oluline
17)
Ühel katselapil istutati 110 kuusetaime, teisel 130. Esimesele
katselapile paigaldati feromoonpüünis. Järgmisel aastal loendati
terved ja kahjustatud taimed mõlemal katselapil. Saadi järgmised
tulemused mis on kajastatud tabelis 3.
Tabelis
nr4 on esitatud katse teoreetilised sagedused. Ning
kasutades funktsiooni CHITEST saame P-väärtuseks
0,374.
Katsest järeldub et feromoonpüünis ei aidanud oluliselt kaasa
taimede kasvamaminekule.
Tabel 3. Tervete ja kahjustunud
taimede sõltuvuvs feromoonpüünisest.
Feromoonpüünis
Kontroll
Kokku
Terved
69
73
142
Kahjustatud
22
25
47
Hukkunud
19
32
51
Kokku
110
130
240
Tabel 4. Teoreetilised sagedused
katsele
Feromoonpüünis
Kontroll
Kokku
Terved
65,1
76,9
142
Kahjus -tatud
21,5
25,5
47
Hukkunud
23,4
27,6
51
Kokku
110
130
240
18)
H0 -nullhüpotees
väljendab uurijat mittehuvitavat juhtu. Nullhüpoteesi pole võimalik
tõestada ning kui uurija tahab mingisugust erinevust tõestada siis
tuleb tal
uurimist jätkata
H1-
sisukas hüpotees, mida uurija soovis tõestada. Hüpoteeside kontrollimisel
püütakse tõestada sisukas hüpotees nullhüpoteesi kummutamise
teel.
19)
1. liiki viga tekib siis, kui võetakse vastu sisukas hüpotees aga
tegelikult on tegemist nullhüpoteesiga.Tegemist on raske veaga, mis
tekib siis kui uurija tahab tõestada erinevust või seost mida
tegelikult ei ole.
20)
Tavaliselt antakse metsanduslikes uurimustöödes 1. liiki vea
tõenäosuseks =0,05.
21)
Usaldusnivoo on uurija poolt ette antud tõenäosus kuhu üldkogumi
parameeter kuulub teatud (küllalt suure) tõenäosusega. Seda
tähistatakse 1-.
Selle väärtuseks võetakse tavaliselt metsanduslikes uurimustes
0,95.
22)Vastavalt
usaldusnivoo etteeantud väärtustele arvutatakse usalduspiirid s.o.
kaks arvu mille vahel asub üldkogumi parameeter tõenäosusega 1-.
22)Vähimat
olulisuse nivood mille korral saab konkreetse valimi põhjal sisukat
hüpoteesi tõestada, nimetatakse olulisuse tõenäosuseks e.
P-väärtuseks. Olulisuse tõenäosus on väikseim risk mille korral
saame sisukat hüpoteesi tõestada.
23)Kahepoolset
väidet
- kasutatakse siis, kui protsessi kohta ei ole mingit
eelinformatsiooni. Meil ei ole mingit teoreetilist alust arvata, et
ühe valimi üldkogumi hüpoteesis võrreldav tunnus on suurem kui
teise oma. Hüpoteesi sõnastus: on
erinevad.
Ühepoolset
väidet
– mingitel sisulistel kaalutlustel
soovime kontrollida vaid seda,
kas ühe üldkogumi mingi näitaja on suurem kui teise üldkogumi
sama näitaja. Hüpoteesi sõnastus: on
suurem.
Regressioon
24)
Eeldade , et proovitükil on arvutatud kahes suunas mõõdetud
diameetrite keskmine filtreerisin oma proovitükil 1. rinde
peapuuliigi andmetest välja need, kus on mõõdetud ka kõrgus (h>0)
ja võra algus (hv>0). Filtreeritud andmetest kopeerisin välja
diameetri, kõrguse ja võra alguse andmed mis on esitatud tabelis
5. Samas tabelis on
esitatud ka vaatluste arv.
Tabel 5. I rinde mändide
diameeter kõrgus ja võra algus
d
h
hv
5,95
6,2
2,2
7,2
7,2
2,6
10,7
8,7
3,3
10,1
7,5
3,6
4,4
4,8
2,6
9,8
8,6
3,7
4,9
6,4
3,4
9,35
7,7
3,3
5,25
5,8
2,7
13,7
8,9
3,1
9,55
7,2
2,8
10,8
8,5
3,8
9,4
9
4,2
11,2
8
3,8
9
7,7
3,9
8,1
7,3
4
Kokku
16
25)
Joonisel 1 on
graafik kõrguse (y) ja diameetri (x) vahelise
sõltuvuse hindamiseks. Graafikult on välja toodud ka regressioonisirge võrrand ja determinatsioonikordaja (R2).
Joonis 1. Kõrguse sõltuvus
diameetrist.
26)
Kasutades MS exceli protseduuri '
Regression '
tegin regressioonanalüüsi kõrguse sõltuvuse leidmiseks diameetrist.
Regressioonanalüüsi tulemused on esitatud tabelis 6. Enese
kontrolliks
kirjutasin välja ka regressioonivõrrandi, mis pidid
olema sama, mis graafikul.
h=0,4093*d+3,9025
Tabel 6. Regressioonanalüüs
kõrguse sõltuvuse leidmiseks diameetrist
Regression Statistics Multiple R
0,881340398
R
Square 0,776760897
Adjusted R Square
0,760815246
Standard
Error 0,585169098
Observations
16
ANOVA dfSSMSFSignificance F Regression
1
16,68045478
16,68045
48,71302735
6,45445E-06
Residual
14
4,793920222
0,342423
Total 15
21,474375
Coefficients Standard Errort StatP- value Lower 95% Upper 95%Intercept
3,902516762
0,531490252
7,342593
3,66132E-06
2,762583548
5,04245
X Variable 1
0,409323758
0,05864681
6,979472
6,45445E-06
0,283538861
0,5351087
27)
Kuna P value on väiksem kui 0,05 siis regressioonvõrrand on
usaldatav.
28)
Saadud võrrandi jääkstandardhälve on
0,59m.
Kõrguse standardhälve on
1,20m. Jääkstandardhälve e.
prognoosiviga iseloomustab funktsioontunnuse
erinevust regressioonijoonest.
29)
Determinatsioonikordaja on
0,77676.
R2-
determinatsioonikordaja iseloomustab, kui suur osa iseloomustab seose
tugevust.
30)Käivitasin
uuesti funktsiooni
Regression ning tegin mitmese regressioonanalüüsi võra alguse sõltuvuse
leidmiseks diameetrist ja kõrgusest. Analüüsi tulemused on tabelis
7. Sealt kirjutasin välja ka
regressioonivõrrandi.
hv=-11,03-0,475*d+1,437*h
Tabel7. Mitmene regressioonanalüüs
võra alguse sõltuvuse leidmiseks diameetrist ja kõrgusest
Regression Statistics Multiple R
0,671418
R Square
0,450802
Adjusted R Square
0,366310
Standard Error
0,471284
Observations
16,000000
ANOVA
dfSSMSFSignificance FRegression
2,0
2,370092
1,185046
5,3354438
0,020335
Residual
13,0
2,887408
0,222108
Total
15,0
5,257500
CoefficientsStandard Errort StatP-valueLower 95%Upper 95%Lower 95,0%Upper 95,0%Intercept
0,424929
0,942781
0,450719
0,65962
-1,61183
2,46168
-1,61183
2,46168
X Variable 1
-0,093382
0,099968
-0,93413
0,36727
-0,30935
0,12258
-0,30935
0,12258
X Variable 2
0,495554
0,215247
2,302256
0,03850
0,03054
0,96057
0,03054
0,96057
31)
Mitmene
korrelatsioonikordaja on
0,6714. Mitmene korrelatsioonikordaja iseloomustab seose tugevust. Mida
lähemal 1'le, seda tugevam seos, mida lähem 0'le, seda nõrgem
seos.
32)
Vabaliige on usaldatavalt nullist
erinev, d kordaja on usaldatav, h kordaja on ei ole usaldatav.
33)
Saadud võrrandi järgi arvutasin , kui suur on selle puu võra
algus, mille diameeter on 15 cm ja kõrgus 16 m. Selle puu võra
algus võib olla
hv=
6,953. Kuigi selle
proovitüki järgi ei tohiks tegelikult ennustada.
Kasutatud kirjandus
A.Kiviste
„Matemaatiline statistika MS
exel ´i keskkonnas“ Tartu 2007
E.Tiit
„Matemaatilise statistika tabelid I“. Tartu 1997
[
http://www.eau.ee/~kkiviste/ ] (16.03.12)
Kõik kommentaarid