Lifetime Lost Due to Smoking
Allikas: https://www.spreadsheetweb.com/time-lost-due-to-smoking-calculator/
time X - suitsetatud aastate arv
# sig - keskmine suitsetatud sigarettide arv päevas
lost Y - prognoositud kaotatud eluaastate arv
Hajuvusdiagramm
time X
# sig
lost Y
1
1
0.01
1
5
0.04
2
8
0.12
5
10
0.38
5
20
0.76
7
4
0.21
8
5
0.31
10
18
1.38
13
25
2.48
12
7
0.64
15
19
2.18
18
9
1.24
20
20
3.06
22
8
1.34
25
11
2.1
28
4
0.86
31
26
6.16
T-test lineaarse korrelatsioonikordaja olulisuse kontrollimiseks usaldusnivool 95%
33
48
12.1
34
11
2.86
35
15
4.01
38
14
4.06
41
17
5.32
korrelatsioon on statistiliselt oluline
45
12
4.13
50
20
7.64
52
21
8.34
58
24
10.63
60
40
18.33
63
12
5.78
65
26
12.91
Kriitilise väärtuse leidmine antud olulisuse nivool
Korrelatsioon- ja regressioonanalüüs - eng. Correlation and Regression
Nullhüpotees H
0: korrelatsioon ei ole statistiliselt oluline
Sisukas hüpotees H
1:
0
10
20
30
40
50
60
70
0
2
4
6
8
10
12
14
16
18
20
f(x) = 0.185502355354747 x − 0.981564731645981
R² = 0.670908809953496
Hajuvusdiagramm
Suitsetatud aastate arv
K
a
o
ta
tu
d
e
lu
a
a
st
a
te
a
rv
Parameetri empiirilise väärtuse võrdlemine kriitilisega
Olulisuse tõenäosuse võrdlemine olulisuse nivooga
olulisuse tõenäosus p =T.DIST.2T
Significance =IF(p
DATA ANALYSIS -> REGRESSION
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.81909
R Square
0.670909
Adjusted R Squa 0.65872
Standard Error 2.676996
Observations
29
ANOVA
df
SS
Regression
1
394.463
Residual
27 193.4902
Total
28 587.9533
Coefficients
Standard Error
Intercept
-0.981565 0.848113
time X
### 0.025003
RESIDUAL OUTPUT
ObservationPredicted lost Y
Residuals
1 -0.796062 0.806062
2 -0.796062 0.836062
3 -0.61056
0.73056
4 -0.054053 0.434053
5 -0.054053 0.814053
6 0.316952 -0.106952
7 0.502454 -0.192454
8 0.873459 0.506541
9 1.429966 1.050034
10 1.244464 -0.604464
11 1.800971 0.379029
12 2.357478 -1.117478
13 2.728482 0.331518
14 3.099487 -1.759487
15 3.655994 -1.555994
16 4.212501 -3.352501
17 4.769008 1.390992
18 5.140013 6.959987
19 5.325515 -2.465515
20 5.511018 -1.501018
21 6.067525 -2.007525
22 6.624032 -1.304032
23 7.366041 -3.236041
24 8.293553 -0.653553
25 8.664558 -0.324558
26 9.777572 0.852428
27 10.14858 8.181423
28 10.70508 -4.925084
29 11.07609 1.833912
Hajuvusdiagramm Insert -> Charts -> Scatter
T-test lineaarse korrelatsioonikordaja olulisuse kontrollimiseks usaldusnivool 95%
Hüpoteesi püstitamine
korrelatsioon on statistiliselt oluline
Empiirilised arvkarakteristikud
valimi suurus n =COUNT
29
Lineaarne (Pearsoni) korrelatsioonikordaja r
0.82
Empiiriline t-statistik 7.419173
Kriitilise väärtuse leidmine antud olulisuse nivool
vabadusastmete arv df=n-2
27
usaldusnivoo 1-alfa
0.95
olulisuse nivoo alfa
0.05
t-statistiku kriitiline väärtus t_kr =T.INV.2T
2.05
korrelatsioon ei ole statistiliselt oluline
0
10
20
30
40
50
60
70
0
2
4
6
8
10
12
14
16
18
20
f(x) = 0.185502355354747 x − 0.981564731645981
R² = 0.670908809953496
Hajuvusdiagramm
Suitsetatud aastate arv
K
a
o
ta
tu
d
e
lu
a
a
st
a
te
a
rv
𝑡=(𝑟√((𝑛−2)))/
√(1−𝑟^2 )
Parameetri empiirilise väärtuse võrdlemine kriitilisega
t (empiir.) "<" või ">"
t (kriit.)
T-testi empiiriline parameeter ei lange kriitilisse piirkonda -> võtame vastu nullhüpoteesi
7.42
>
2.05
T-testi empiiriline parameeter langeb kriitilisse piirkonda -> võtame vastu sisuka hüpoteesi
Olulisuse tõenäosuse võrdlemine olulisuse nivooga
olulisuse tõenäosus p =T.DIST.2T
5.555E-08
p
"<" või ">"
a
Olulisuse tõenäosus p on suurem kui olulisuse nivoo alpha -> võtame vastu nullhüpoteesi
5.555E-08
<
0.05
Olulisuse tõenäosus p on väiksem kui olulisuse nivoo alpha -> võtame vastu sisuska hüpoteesi
olulisuse testimine - Logical test
Significance =IF(pT-testi empiiriline parameeter langeb kriitilisse piirkonda ja olulisuse tõenäosus p on väiksem kui olulisuse nivoo alpha
Järelikult kehtib sisukas hüpotees ehk korrelatiivne seos on oluline
DATA -> DATA ANALYSIS -> REGRESSION
MS
F
Significance F
394.463 55.04413
5.56669536373E-08
7.166305
t Stat
P-value
Lower 95%
Upper 95%
Lower 95,0%
Upper 95,0%
-1.157352 0.257265
-2.72174801870612 0.758619 -2.721748 0.758619
7.419173 5.567E-08 0.134200223612278 0.236804
0.1342 0.236804
<0,05
kehtib H1
a= tõus
b= vabaliige
a=tõusunurga tang
Y=ax+b+(eksilon)
E=eksilon( viga)
^
0
10
20
30
40
50
60
70
0
2
4
6
8
10
12
14
16
18
20
f(x) = 0.185502355354747 x − 0.981564731645981
R² = 0.670908809953496
Hajuvusdiagramm
Suitsetatud aastate arv
K
a
o
ta
tu
d
e
lu
a
a
st
a
te
a
rv
T-testi empiiriline parameeter ei lange kriitilisse piirkonda -> võtame vastu nullhüpoteesi
T-testi empiiriline parameeter langeb kriitilisse piirkonda -> võtame vastu sisuka hüpoteesi
Olulisuse tõenäosus p on suurem kui olulisuse nivoo alpha -> võtame vastu nullhüpoteesi
Olulisuse tõenäosus p on väiksem kui olulisuse nivoo alpha -> võtame vastu sisuska hüpoteesi
T-testi empiiriline parameeter langeb kriitilisse piirkonda ja olulisuse tõenäosus p on väiksem kui olulisuse nivoo alpha
Järelikult kehtib sisukas hüpotees ehk korrelatiivne seos on oluline
Correlation - Scatter Diagrams
Insert -> Chart -> Scatter
x
y
2
2
4
4
7
10
5
8
8
12
6
9
9
16
12
21
3
6
10
15
=CORREL
Correlation coeff
0.98
x
y
2
3
4
6
7
12
5
6
8
15
6
8
9
13
12
8
3
3
10
7
Correlation coeff
0.59
x
y
2
3
4
6
7
12
5
15
8
15
6
21
9
15
12
8
3
3
10
7
Correlation coeff
0.30
0
2
4
6
8
10
12
14
0
5
10
15
20
25
r=0,98
X
Y
0
2
4
6
8
10
12
14
0
2
4
6
8
10
12
14
16
r=0,59
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
R=0,30
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
R=0,30
X
Y
x
y
2
21
4
13
7
7
5
8
8
10
6
9
9
6
12
1
3
14
10
4
Correlation coeff
-0.91
x
y
2
18
4
10
7
7
5
14
8
15
6
6
9
7
12
3
3
5
10
4
Correlation coeff
-0.56
x
y
2
3
4
6
7
5
5
21
8
12
6
14
9
2
12
16
3
12
10
5
Correlation coeff
0.07
0
2
4
6
8
10
12
14
0
5
10
15
20
25
r=0,98
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
r=-0,91
X
Y
0
2
4
6
8
10
12
14
0
2
4
6
8
10
12
14
16
r=0,59
X
Y
0
2
4
6
8
10
12
14
0
2
4
6
8
10
12
14
16
18
20
r=-0,56
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
R=0,30
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
R=0,07
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
R=0,30
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
R=0,07
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
r=-0,91
X
Y
0
2
4
6
8
10
12
14
0
2
4
6
8
10
12
14
16
18
20
r=-0,56
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
R=0,07
X
Y
0
2
4
6
8
10
12
14
0
5
10
15
20
25
R=0,07
X
Y
Killed - People killed in road accidents (per 100 000 persons) in 2018
Trust - Average rating of trust in the police (range 1-10) in 2018
Allikas: https://ec.europa.eu/eurostat
Country
Killed
Trust
Belgium
5.3
6.1
Bulgaria
8.7
3.6
Czechia
6.2
4.9
Denmark
3.0
7.9
Germany
4.0
6.4
Estonia
5.1
6.0
Ireland
2.9
6.9
Greece
6.5
5.0
Spain
3.9
5.4
France
4.8
5.6
Croatia
7.7
3.3
Italy
5.5
5.8
Cyprus
5.6
4.7
Latvia
7.7
5.4
Lithuania
6.2
6.0
Luxembourg
5.9
6.1
Hungary
6.5
5.7
Malta
3.7
6.3
Netherlands
3.5
6.6
Austria
4.6
7.2
Poland
7.5
5.2
Portugal
6.8
5.4
Romania
9.6
6.4
Slovenia
4.4
5.5
Slovakia
4.8
4.4
Finland
4.3
8.2
Sweden
3.2
7.1
United Kingdom
2.8
6.4
Iceland
5.1
7.7
Norway
2.0
7.5
Switzerland
2.7
7.4
Turkey
8.2
6.5
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
11.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
hajavusdiagramm
surnude arv 10 elanikude kohta
tr
u
st
Lineaarne (Pearsoni) korrelatsioonkordaja r=
-0.580047
Otsus: Tunnuste Killed ja Trust vahel on keskmine kahanev lineaarne korrelatiivne seos
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
10.0
11.0
0.0
1.0
2.0
3.0
4.0
5.0
6.0
7.0
8.0
9.0
hajavusdiagramm
surnude arv 10 elanikude kohta
tr
u
st
Otsus: Tunnuste Killed ja Trust vahel on keskmine kahanev lineaarne korrelatiivne seos
Erinevate betoonisegude mõõtmistulemused
Y - survetugevus, Pa (paskal)
Segu #
X
Y
1
5.3
30.1
2
4.5
31
3
4.8
31.2
4
3.2
31.6
5
3.5
31.9
6
3.3
32.8
7
3.1
33
8
3
33.8
9
3.4
34.9
10
2.5
35.6
11
2.4
35.7
12
2.2
36.1
13
1.3
37.3
14
1.8
37.7
15
1.2
39
X - absoluutne läbilaskvus, 10-12 m2
Mõned stat. näitajad Eesti maakondades 2021 a.
Allikas: www.stat.ee
Vabad ametikohad - vabade ametikohtade määr, kogu Eesti on 1
Internet - internetiühendusega leibkondade osatähtsus, %
Mob internet - mobiilse internetiühendusega leibkondade osatähtsus, %
Kuritegude arv - kuritegude arv 1000 elaniku kohta maakonnas
Elanike arv
Internet, %
Harju maakond
614,567
1694
2.6
95.0
Hiiu maakond
8,497
1194
0.4
88.3
Ida-Viru maakond
132,741
1202
1.1
88.1
Jõgeva maakond
27,858
1241
0.4
92.2
Järva maakond
29,697
1340
1.1
88.6
Lääne maakond
20,229
1308
1.9
96.7
Lääne-Viru maakond
58,709
1256
1.0
86.7
Põlva maakond
23,991
1207
0.2
83.8
Pärnu maakond
85,710
1280
1.5
89.2
Rapla maakond
33,529
1277
1.1
93.7
Saare maakond
31,292
1247
0.8
93.8
Tartu maakond
157,760
1550
0.9
89.7
Valga maakond
27,651
1205
0.4
86.8
Viljandi maakond
45,413
1285
1.8
88.0
Võru maakond
34,180
1192
1.6
86.5
Brutopalk,
eur
Vabad
ametikohtad
77.4
5.1
21.01
75.6
5.7
9.18
68.1
11.0
27.50
75.3
6.5
15.22
78.0
5.1
14.45
86.9
5.0
17.05
74.2
6.0
15.94
70.1
6.6
10.55
66.7
7.1
17.85
81.2
5.0
18.19
76.7
5.7
10.26
78.7
5.1
17.45
71.6
7.0
19.57
70.1
4.9
11.12
67.6
4.1
17.55
Mob internet,
%
Töötuse
määr, %
Kuritegude
arv (1000
in)
Korrelatsioonimaatriks: DATA -> DATA ANALYSIS -> CORRELATION
Brutopalk, eur
Vabad ametikohtad
Brutopalk, eur
1
Vabad ametikohtad
0.58
1
Internet, %
0.45
0.47
Mob internet,%
0.39
0.15
Töötuse määr, %
-0.32
-0.30
Kuritegude arv (1000 in)
0.24
0.35
Korrelatsioonimaatriks: DATA -> DATA ANALYSIS -> CORRELATION
Internet, %
Mob internet,%
Töötuse määr, %
1
0.74
1
-0.26
-0.45
1
0.14
-0.11
0.53
Kuritegude arv (1000 in)
1
Mitme muutujaga lineaarne regressioonimudel:
Sugu - lapse sugu
Laps - lapse pikkus (toll)
1 toll = 2,54 cm
DATA -> DATA ANALYSIS -> REGRESSION
Ema - ema pikkus (toll)
Isa - isa pikkus (toll)
Sugu
Laps
Ema
Isa
M
62.5
66
70
M
64.6
58
69
M
69.1
66
64
M
73.9
68
71
M
67.1
64
68
M
64.4
62
66
M
71.1
66
74
M
71.0
63
73
M
67.4
64
62
M
69.3
65
69
M
64.9
64
67
M
68.1
64
68
M
66.5
62
72
M
67.5
69
66
M
66.5
62
72
N
58.6
63
64
N
64.7
67
65
N
65.3
64
67
N
61.0
60
72
N
65.4
65
72
N
67.4
67
72
N
60.9
59
67
N
63.1
60
71
N
60.0
58
66
N
71.1
72
75
N
62.2
63
69
N
67.2
67
70
N
63.4
62
69
N
68.4
69
62
N
62.2
63
66
Mitmene regressioon - eng. Multiple regression
Mitme muutujaga lineaarne regressioonimudel:
DATA -> DATA ANALYSIS -> REGRESSION
Y = a
1X1 + a2X2 + … + anXn + b + e
Mitme muutujaga lineaarne regressioonimudel:
Energiakulu - energiakulu jalutamisel (kcal 10 min kohta)
Sugu
Vanus, a Kaal, kg
M
41
89
51
M
41
84
49
M
29
73
41
M
41
67
41
M
41
69
42
M
20
69
45
M
20
90
55
M
34
83
52
N
41
69
46
M
22
84
44
M
28
62
36
M
39
95
54
M
38
75
41
M
37
70
40
M
48
92
53
M
36
85
48
M
26
89
50
N
45
79
48
N
22
72
39
N
31
64
40
N
28
65
39
M
26
86
46
M
14
48
37
M
13
56
40
M
13
56
40
N
18
56
38
N
21
56
34
N
20
62
36
M
24
69
48
N
20
66
37
M
18
110
65
N
20
61
33
M
15
68
46
N
17
64
46
N
14
66
43
M
57
65
40
M
32
78
50
M
64
95
55
M
79
68
46
N
53
80
48
M
62
76
52
N
34
65
44
Mitmene regressioon - eng. Multiple regression
Energia
kulu
M
47
80
41
M
26
69
48
M
40
89
60
M
73
58
36
M
38
63
39
M
22
69
39
N
15
60
34
M
26
80
50
Mitme muutujaga lineaarne regressioonimudel:
DATA -> DATA ANALYSIS -> REGRESSION
Y = a
1X1 + a2X2 + … + anXn + b + e
nXn + b + e
Nikotiini, tõrva ja vingugaasi sisaldus erinevates sigarettides (mg sigareti kohta)
Firma
Tõrv
Nikotiin
CO
DATA -> DATA ANALYSIS -> REGRESSION
1
16
1.2
15
2
16
1.2
15
3
16
1
17
4
9
0.8
6
5
1
0.1
1
6
8
0.8
8
7
10
0.8
10
8
16
1
17
9
14
1
13
10
13
1
13
11
13
1.1
13
12
15
1.2
15
13
16
1.2
15
14
9
0.7
11
15
11
0.9
15
16
2
0.2
3
17
18
1.4
18
18
15
1.2
15
19
13
1.1
12
20
15
1
16
21
17
1.3
16
22
9
0.8
10
23
12
1
10
24
14
1
17
25
5
0.5
7
26
6
0.6
7
27
8
0.7
11
28
18
1.4
15
29
16
1.1
18
30
17
1.4
16
Nikotiini, tõrva ja vingugaasi sisaldus erinevates sigarettides (mg sigareti kohta)
DATA -> DATA ANALYSIS -> REGRESSION
VEIN
SELGUS AROOM KONSISTENTS MAITSE BUKETT KVALITEET
1
1
3.3
2.8
3.1
4.1
9.8
2
1
4.4
4.9
3.5
3.9
12.6
3
1
3.9
5.3
4.8
4.7
11.9
4
1
3.9
2.6
3.1
3.6
11.1
5
1
5.6
5.1
5.5
5.1
13.3
6
1
4.6
4.7
5
4.1
12.8
7
1
4.8
4.8
4.8
3.3
12.8
8
1
5.3
4.5
4.3
5.2
12
9
1
4.3
4.3
3.9
2.9
13.6
10
1
4.3
3.9
4.7
3.9
13.9
11
1
5.1
4.3
4.5
3.6
14.4
12
0.5
3.3
5.4
4.3
3.6
12.3
13
0.8
5.9
5.7
7
4.1
16.1
14
0.7
7.7
6.6
6.7
3.7
16.1
15
1
7.1
4.4
5.8
4.1
15.5
16
0.9
5.5
5.6
5.6
4.4
15.5
17
1
6.3
5.4
4.8
4.6
13.8
18
1
5
5.5
5.5
4.1
13.8
19
1
4.6
4.1
4.3
3.1
11.3
20
0.9
3.4
5
3.4
3.4
7.9
21
0.9
6.4
5.4
6.6
4.8
15.1
22
1
5.5
5.3
5.3
3.8
13.5
23
0.7
4.7
4.1
5
3.7
10.8
24
0.7
4.1
4
4.1
4
9.5
25
1
6
5.4
5.7
4.7
12.7
26
1
4.3
4.6
4.7
4.9
11.6
27
1
3.9
4
5.1
5.1
11.7
28
1
5.1
4.9
5
5.1
11.9
29
1
3.9
4.4
5
4.4
10.8
30
1
4.5
3.7
2.9
3.9
8.5
31
1
5.2
4.3
5
6
10.7
32
0.8
4.2
3.8
3
4.7
9.1
33
1
3.3
3.5
4.3
4.5
12.1
34
1
6.8
5
6
5.2
14.9
35
0.8
5
5.7
5.5
4.8
13.5
36
0.8
3.5
4.7
4.2
3.3
12.2
37
0.8
4.3
5.5
3.5
5.8
10.3
38
0.8
5.2
4.8
5.7
3.5
13.2
Tabelis on toodud Pinot Noir viinamarjasortidest tehtud veinide degusteerimise tulemused.
Allikas: Wing-On Kwan, Bruce R. Kowalski, Rodney K., Pattern recognition analysis of elemental data. Wines of Vitis vinifera cv Pinot Noir from France and the United States, Journal of Agricultural and Food Chemistry, Vol. 27, 1979
DATA -> DATA ANALYSIS -> REGRESSION
viinamarjasortidest tehtud veinide degusteerimise tulemused.
Pattern recognition analysis of elemental data. Wines of Vitis vinifera cv Pinot Noir from France and the United States, Journal of Agricultural and Food Chemistry, Vol. 27, 1979
Pattern recognition analysis of elemental data. Wines of Vitis vinifera cv Pinot Noir from France and the United States, Journal of Agricultural and Food Chemistry, Vol. 27, 1979
, Journal of Agricultural and Food Chemistry, Vol. 27, 1979
Kulud nädalas (GBP) alkoholile ja tubakale
astak =RANK.AVG
Piirkond
d=s-t
North
6.47
4.03
11
9
2
Yorkshire
6.13
3.76
9
7
2
Northeast
6.19
3.77
10
8
2
East Midlands
4.89
3.34
4
4
0
West Midlands
5.63
3.47
6
5
1
East Anglia
4.52
2.92
2
2
0
Southeast
5.89
3.2
7
3
4
Southwest
4.79
2.71
3
1
2
Wales
5.27
3.53
5
6
-1
Scotland
6.08
4.51
8
10
-2
Northern Ireland
4.02
4.56
1
11
-10
Kokku
Spearmani astak-korrelatsioonikordaja - eng. Spearman's rank correlation coefficient
Kulud
alkoholile
Kulud
tubakale
Kulud
alkoholile
astak s
Kulud
tubakale
astak t
Nullhüpotees H
0:
Sisukas hüpotees H
1:
Hajuvusdiagramm Insert -> Charts -> Scatter
d^2
4
4
4
0
1
0
16
4
1
4
100
138
kogumi suurus n
11
Eranditega Eranditeta
Pearsoni korrelatsioonikordaja r =CORREL
0.30
0.77
Spearmani astak-korrelatsioonikordaja rho
1.00
-0.29
ro
-0.56
Otsus: Tunnuste kulud alkoholile ja kulud tubakale vahel nõrk kasvav lineaarne korrelatiivne seos (r=0,22)
Tunnuste kulud alkoholile ja kulud tubakale vahel nõrk kasvav monotoonne korrelatiivne seos (rho=0,37)
T-test Spearmani korrelatsioonikordaja olulisuse kontrollimiseks usaldusnivool 95%
T-test lineaarse korrelatsioonikordaja olulisuse kontrollimiseks usaldusnivool 95%
Hüpoteesi püstitamine
korrelatsioon on statistiliselt oluline
Empiirilised arvkarakteristikud
valimi suurus n =COUNT
11
Spearman's rank correlation coefficient
Nullhüpotees H
0: korrelatsioon ei ole statistiliselt oluline
Sisukas hüpotees H
1:
3.5
4
4.5
5
5.5
6
6.5
7
2.5
3
3.5
4
4.5
5
hajuvusdiagramm
kulud alkoholile, GBP
k
u
lu
d
t
u
b
a
k
a
le
,
G
B
P
Lineaarne (Pearsoni) korrelatsioonikordaja r
1.00
Empiiriline t-statistik
#DIV/0!
Kriitilise väärtuse leidmine antud olulisuse nivool
vabadusastmete arv df=n-2
9
usaldusnivoo 1-alfa
0.95
olulisuse nivoo alfa
0.05
t-statistiku kriitiline väärtus t_kr =T.INV.2T
2.26
Parameetri empiirilise väärtuse võrdlemine kriitilisega
t (empiir.)
"<" või ">"
t (kriit.)
1.21
<
2.26
Olulisuse tõenäosuse võrdlemine olulisuse nivooga
olulisuse tõenäosus p =T.DIST.2T
0.26
p
"<" või ">"
a
0.26
<
0.05
olulisuse testimine - Logical test
Significance =IF(pT-testi empiiriline parameeter EI LANGE kriitilisse piirkonda ja olulisuse tõenäosus p on SUUREM kui olulisuse nivoo alpha
Järelikult kehtib sisukas NULLHÜPOTEES ehk korrelatiivne seos EI OLE OLULINE
Insert -> Charts -> Scatter
Tunnuste kulud alkoholile ja kulud tubakale vahel nõrk kasvav lineaarne korrelatiivne seos (r=0,22)
Tunnuste kulud alkoholile ja kulud tubakale vahel nõrk kasvav monotoonne korrelatiivne seos (rho=0,37)
T-test Spearmani korrelatsioonikordaja olulisuse kontrollimiseks usaldusnivool 95%
T-test lineaarse korrelatsioonikordaja olulisuse kontrollimiseks usaldusnivool 95%
3.5
4
4.5
5
5.5
6
6.5
7
2.5
3
3.5
4
4.5
5
hajuvusdiagramm
kulud alkoholile, GBP
k
u
lu
d
t
u
b
a
k
a
le
,
G
B
P
4
4.5
5
5.5
6
6.5
7
2.5
3
3.5
4
4.5
5
hajuvusdiagramm (ilma Northern Ireland)
kulud alkoholile, GBP
k
u
lu
d
t
u
b
a
k
a
le
,
G
B
P
𝑡=(𝑟√((𝑛−2)))/√(1−𝑟^2 )
2
2
6
1
(
1)
i
d
n n
T-testi empiiriline parameeter ei lange kriitilisse piirkonda -> võtame vastu nullhüpoteesi
T-testi empiiriline parameeter langeb kriitilisse piirkonda -> võtame vastu sisuka hüpoteesi
Olulisuse tõenäosus p on suurem kui olulisuse nivoo alpha -> võtame vastu nullhüpoteesi
Olulisuse tõenäosus p on väiksem kui olulisuse nivoo alpha -> võtame vastu sisuska hüpoteesi
T-testi empiiriline parameeter EI LANGE kriitilisse piirkonda ja olulisuse tõenäosus p on SUUREM kui olulisuse nivoo alpha
Järelikult kehtib sisukas NULLHÜPOTEES ehk korrelatiivne seos EI OLE OLULINE
𝑡=(𝑟√((𝑛−2)))/√(1−𝑟^2 )
4
4.5
5
5.5
6
6.5
7
2.5
3
3.5
4
4.5
5
hajuvusdiagramm (ilma Northern Ireland)
kulud alkoholile, GBP
k
u
lu
d
t
u
b
a
k
a
le
,
G
B
P
T-testi empiiriline parameeter ei lange kriitilisse piirkonda -> võtame vastu nullhüpoteesi
T-testi empiiriline parameeter langeb kriitilisse piirkonda -> võtame vastu sisuka hüpoteesi
Olulisuse tõenäosus p on suurem kui olulisuse nivoo alpha -> võtame vastu nullhüpoteesi
Olulisuse tõenäosus p on väiksem kui olulisuse nivoo alpha -> võtame vastu sisuska hüpoteesi
Tudengite ankeetküsitluse vastused arvuti kasutusoskuse kohta
mees
naine
Hii-ruut test hindamaks kas arvuti kasutusoskus sõltub tudengi soost
algaja
algaja
algaja
algaja
Hüpoteesi püstitamine
algaja
algaja
algaja
algaja
arvuti kasutusoskus EI SÕLTU tudengi soost
algaja
algaja
arvuti kasutusoskus SÕLTUB tudengi soost
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
algaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
Empiirilise hii-ruut statistiku valemi komponendid
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
ridade arv k
tavakasutaja
tavakasutaja
veergude arv m
tavakasutaja
tavakasutaja
vabadusastmete arv df=(k-1)(m-1)
tavakasutaja
tavakasutaja
olulisuse nivoo alfa
tavakasutaja
tavakasutaja
teststatistiku kriitiline väärtus h_kr =CHISQ.INV.RT
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
Parameetri empiirilise väärtuse võrdlemine kriitilisega
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
h (empiir.) "<" või ">" h (kriit.)
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
Võrdleme olulisuse tõenäosust olulisuse nivooga
tavakasutaja
tavakasutaja
tavakasutaja
tavakasutaja
olulisuse tõenäosus p =T.DIST
edasijõudnu
tavakasutaja
Hii-ruut test statistilise seose olulisuse kontrollimiseks (kvalitatiivsed tunnused) - eng. Chi-square Test või Pearson's goodness-of-fit test
Nullhüpotees H
0:
Sisukas hüpotees H
1:
Empiiriline sagedustabel n
ij =COUNTIFS
Sõltumatuse hüpoteesile H
0 vastavad oodatavad üliõpilste arvud Nij
edasijõudnu
tavakasutaja
p
"<" või ">"
a
edasijõudnu
tavakasutaja
0.05
edasijõudnu
tavakasutaja
edasijõudnu
tavakasutaja
olulisuse testimine - Logical test
edasijõudnu
tavakasutaja
edasijõudnu
tavakasutaja
Significance =IF(pedasijõudnu
edasijõudnu
edasijõudnu
edasijõudnu
edasijõudnu
Tunnuste sugu ja arvuti kasutusoskus vahel esineb statistiliselt oluline keskmise
Hii-ruut test hindamaks kas arvuti kasutusoskus sõltub tudengi soost
arvuti kasutusoskus EI SÕLTU tudengi soost
arvuti kasutusoskus SÕLTUB tudengi soost
Empiiriline jaotustabel
Empiirilise hii-ruut statistiku valemi komponendid
ridade arv k
veergude arv m
vabadusastmete arv df=(k-1)(m-1)
olulisuse nivoo alfa
0.05
teststatistiku kriitiline väärtus h_kr =CHISQ.INV.RT
Parameetri empiirilise väärtuse võrdlemine kriitilisega
Hii-ruut testi empiiriline parameeter ei lange kriitilisse piirkonda -> võtame vastu nullhüpoteesi
Hii-ruut testi empiiriline parameeter langeb kriitilisse piirkonda -> võtame vastu sisuka hüpoteesi
Võrdleme olulisuse tõenäosust olulisuse nivooga
Hii-ruut test statistilise seose olulisuse kontrollimiseks (kvalitatiivsed tunnused) - eng. Chi-square Test või Pearson's goodness-of-fit test
vastavad oodatavad üliõpilste arvud N
ij
Olulisuse tõenäosus p on suurem kui olulisuse nivoo alpha -> võtame vastu nullhüpoteesi
Olulisuse tõenäosus p on väiksem kui olulisuse nivoo alpha -> võtame vastu sisuska hüpoteesi
olulisuse testimine - Logical test
0 - seos puudub … 1 - tugev seos
tugevusega seos. Saame väita, et eri soost üliõpilaste arvuti kasutusoskused on erinevad.
arvuti kasutusoskus vahel esineb statistiliselt oluline keskmise
Hii-ruut testi empiiriline parameeter ei lange kriitilisse piirkonda -> võtame vastu nullhüpoteesi
Hii-ruut testi empiiriline parameeter langeb kriitilisse piirkonda -> võtame vastu sisuka hüpoteesi
Olulisuse tõenäosus p on suurem kui olulisuse nivoo alpha -> võtame vastu nullhüpoteesi
Olulisuse tõenäosus p on väiksem kui olulisuse nivoo alpha -> võtame vastu sisuska hüpoteesi
Document Outline
- Corr 1
- Corr 2
- Corr 3
- Corr 4
- Corr 5
- Reg 1
- Reg 2
- Reg 3
- Reg 4
- Pearson vs Spearman
- Hii-Ruut Test
Kõik kommentaarid