Tütarlapsed Pikkus Jala nr Aritmeetiline keskmine Mood Mida näitab mood? Mediaan Mida näitab mediaan? Minimaalne väärtus Maksimaalne väärtus Standardhälve Mida näitab standardhälve? 3. Koosta tüdrukute lehele eelmise tabeli alla pikkuse ja jala numbri vaheline korrelatsiooniväli ( Lisa juurde regressioonisirge ning arvuta korrelatsioonikordaja. Kas me saame väita, et mida pikem tüdruk, seda suurem jalanumber? 4. Koosta tulpdiagramm iga tüdruku jalanumbri kohta. (Koosta see tüdrukute lehele) Lisa diagrammile jalanumbrite aritmeetilist keskmist iseloomustav sirge. Värvi kõige suuremat jalanumbrit iseloomustav tulp roheliseks ja kõige väiksemat kolla 5. Salvesta töö ning saada õpetajale [email protected]
......................................................................................... 9 2.3.3 Variatsioonikordaja...............................................................................................9 2.3.4 Mediaan ja mood...................................................................................................9 2.Analüüs..............................................................................................................................10 3.1 Korrelatsiooniväli ja regressioonisirge.......................................................................10 3.2 Korrelatsioonikordaja.................................................................................................10 Kokkuvõte........................................................................................................................ 11 2 Sissejuhatus
................................................................................9 2.4.4 Mediaan ja mood...................................................................................................9 Mo = 3,5............................................................................................................................. 9 3.Analüüs..............................................................................................................................10 3.1 Korrelatsiooniväli ja regressioonisirge.......................................................................10 3.2 Korrelatsioonikordaja.................................................................................................10 4.Kokkuvõte..................................................................................................................... 11 2 Sissejuhatus
4242 -0.0348 0.0647 1. Leidke keskväärtused ja paigutage hinnete alla [=AVERAGE 0.5375 2. Leidke standard hälve ja paigutage keskväärtuste alla [=ST 0.1269 3. Arvutage hinnetest parempoolsed lahtrid 1.5454 4. Kontrolliks leidke tabeli alla funktsioon [=CORREL] 0.8362 5. Leidke korrelatsiooniväli 0.1394 2.2297 0.1269 8.9961 Korrelatsiooni joonis 0.8996 0.8996 20 30 40 50 60 70 80 90
Defineeri mõisted: Statistika Matemaatiline statistika Üldkogum. Näide. Üldkogu uurimisel on kaks võimalust: Valim. Kuidas on seotud üldkogu ja valim? Millised on nõuded valimile? Valimi moodustamise viisid. Statistiline rida. Variatsioonirida. Sagedustabel. Diagramm. Mood. Mediaan. Aritmeetiline keskmine. Variatsiooni ulatus. Hälve. Dispersioon. Standardhälve. Korrelatsiooniväli. Normaaljaotus. Statistika mõisted Andmete esitamine 1.Statistika - teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. 2.Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. 3.Statistikas on oluline uurimise objekt - üldkogum. 4.Üldkogum on kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Üldkogumi uurimisel on kaks võimalust:
Näiteks kui katseseerias on kõigi katsete tulemus sama, siis katsete dispersioon on null. Mida suurem aga dispersioon on, seda enam erinevad katsete tulemused üksteisest. Standardhälve ruutjuur dispersioonist. Variatsioonkordaja Kui uuritavate tunnuste mõõtühikud on erinevad, ei saa nende hajuvust hinnata standardhälbega. Sellisel juhul kasutatakse variatsioonkordajat. V= standardhälve jagatud keskväärtusega Korrelatsioon Korrelatsiooniväli koordinaattasandile kantud punkthulk, kus iga punkti x- koordinaadiks on mingi objekti esimese tunnuse väärtus. Y-koordinaadiks on sama objekti teise tunnuse väärtus. Kahe juhusliku suuruse vahel on positiivne korrelatsioon. Kui esimese suuruse kasvades kasvab ka teine suurus. Tegemist on negatiivse korrelatsiooniga, kui I suuruse kasvades II suurus kahaneb. r = [ -1; 1 ] |r| > = 0,8 Tugev korrelatsioon
Kogu variatsioonirea hälvete summa on 0. 18. Dispersioon hälvete ruutude aritmeetiline keskmine. Tähis ². 19. Standardhälve on ruutjuur dispersioonist. Tähis . 20. Variatsioonikordaja standardhälve ja keskväärtuse suhe. Esitatakse tavaliselt protsentides. Tähis V. 21. Korrelatsioon - nähtuste vastastikune sõltuvus ehk suhe, mille tõttu muutused ühes nähtuses kutsuvad esile ka muutused teises nähtuses. 22. Korrelatsiooniväli on kordinaattasandile kantud punktihulk, kus iga punkti x- koordinaadiks on uuritava objekti esimese tunnuse väärtus ja y- kooridnaadiks sama objekti teise tunnuse väärtus. 2. Andmed ja arvutused 2.1 Ajalugu 1. Statistiline rida: 5;5;4;4;4;4;5;4;5;5;4;5;3;3;3;3;4;4;3;3 2. Variatsioonirida: 3;3;3;3;3;3;4;4;4;4;4;4;4;4;5;5;5;5;5;5 3. Sagedustabel: 4. Sagedustabel protsendina: 5. Arvutused: 6
6.1.3 Determinatsioonikordaja: 2 s 55003940.02 r 1 r2 1 2 sv 47983916,47 6.2 Kontrollime tulemust Exceli funktsiooni abil: r2 = 0.88537005 6.3 Järeldus: Lineaarne regressioonimudel kirjeldab mõõdetud suurusi hästi 0,8 0 88,5% sõltuva muutuja (sündinud laste) kogumuudust on kirjeldatud regressioo 7. X ja Y tunnuste graafik Abiellude arvu ja sündinute laste arvu korrelatsiooniväli koos regressioonisirg Sündinute 30000 laste arv 25000 20000 f(x) = 1.3411860293x + 5767.4714469089 15000 R² = 0.8853700495 10000 5000 4000 6000 8000 10000 12000 14000 Abiellude arv 20000 f(x) = 1.3411860293x + 5767.4714469089
Matemaatika ja füüsika hinded kuuluvad järjestustunnuste alla. Järjestustunnus on tunnus, mille väärtusi saab sisu põhjal järjestada. Järjestustunnused kuuluvad mittearvuliste tunnuste hulka. Järjestustunnuseid saab ka esitada sõnadega, mitte ainult numbritega. Näiteks hindeid saab peale arvude ka väljendada sõnadega: väga hea, hea, keskpärane ja puudlik. 6 8. Kahe tunnuse analüüs 8.1. Hajuvusdiagramm ehk korrelatsiooniväli Korrelatsiooniväljaks nimetatakse koordinaattasandile kantud punktihulka, kus iga punkti x- koordinaadiks on mingi objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Korrelatasioonivälja kuju järgi saab iseloomustada sõltuvust. Kahe juhusliku suuruse vahel on positiivne korrelatsioon, kui esimese suuruse kasvades kasvab ka teine suurus. Kahe juhusliku suure vahel on negatiivne korrelatsioon, kui esimese suuruse kasvades teine suurus kahaneb.
2. Tunnuse väärtus kujuneb paljude üksteisest sõltumatute nõrgalt mõjuvate faktorite toimel. 3. Tunnuse väärtuse suurenemine üle keskmise ja vähenemine alla keskmise on võrdvõimalik. 26. Milles seisneb kolme sigma reegel? Keskväärtuse ja standardhälbe suurusest 68% kuulub lõiku (1 sigma) Keskväärtuse ja standardhälbe suurusest 95% kuulub lõiku (2 sigma) Keskväärtuse ja standardhälbe suurusest 99,7% kuulub lõiku (3 sigma) 27. Mis on korrelatsiooniväli? -Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on mingi objekti esimese tunnuse väärtus ja y-koordinaadiks selle sama objekti teise tunnuse väärtus. 28. Millal on kahe juhusliku suuruse vaheline korrelatsioon positiivne, millal negatiivne? Positiivne kui esimese suuruse kasvades kasvab ka teine suurus. Negatiivne kui esimese suuruse kasvades teine suurus kahaneb. 29
8 7 6 7 8 10 11 12 Sünnikuu sünnikuud 12 1 11 10 2 3 8 5 6 7 7. Korrelatsiooniväli 1) Matemaatika eksami hinnete ja punktide korrelatsioon x y 23 2 23 3 matemaatik 5 25 3 30 3 33 3 35 3 4 36 3 36 3 H
Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon 2 andmetele vastav hälvete keskväärtus. Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse. Korrelatsiooniväli - Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Variatsioonirida - kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida. Variatsioonirea ulatus - minimaalse ja maksimaalse elemendi vahele jääv elementide rida. Sagedustabel - moodustatakse variatsioonirea põhjal. Näitab, mitmel korral antud tunnus saab antud väärtuse.
Kui variatsioonkordaja on umbes 50%, siis tunnus normaalse hajuvusega (keskmine kirjeldab tegelikku tüüpilist väärtust), kui tunduvalt üle 50%, siis tunnus hajus, kui tunduvalt alla 50%, siis tunnus väga vähe hajus. Kui kõik tunnuse kõik väärtused valimis on samad, siis v on 0%. 23. Sagedustabel, - Sagedustabeli võtab andmetabelist kokku, mitmel objektil mingit väärtust esineb, ehk esitab vastava sageduse hajuvusdiagramm, - Hajuvusdiagramm ehk korrelatsiooniväli kajastab kõiki valimi objekte. Punkti x-koordinaadiks on esimese tunnuse väärtus ja y-koordinaadiks teise tunnuse väärtus. Kui hajuvusdiagrammil punktid paiknevad tõusvas või langevas "pilvekeses", siis viitab see ühisele tendentsile tunnuste käitumises erinevad suundumusjooned kas kasvav (kasvavas pilves), kahanev või ilma suundumuseta (ümaras pilves) 24. Aegrida, - nimetatakse arvandmete rida, mis kirjeldab suuruse ajalist muutumist (reas
7) arvutab juhusliku suuruse Rakendusülesande jaotuse arvkarakteristikuid ning d. teeb nende alusel järeldusi Üldkogum ja valim. jaotuse või uuritava probleemi Andmete kohta; kogumine ja 8) leiab valimi järgi üldkogumi süstematiseerimin keskmise usalduspiirkonna; e. Statistilise 9) kogub andmestiku ja analüüsib andmestiku seda arvutil statistiliste analüüsimine ühe vahenditega. tunnuse järgi. Korrelatsiooniväli. Lineaarne korrelatsioonikorda ja. Normaaljaotus (näidete varal). Statistilise otsustuse usaldatavus keskväärtuse usaldusvahemiku näitel. Andmetöötluse projekt, mis realiseeritakse arvutiga (soovitatavalt koostöös mõne teise õppeainega).
variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon andmetele vastav hälvete keskväärtus. 2 Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse. Korrelatsiooniväli - Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Variatsioonirida - kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida. Variatsioonirea ulatus - minimaalse ja maksimaalse elemendi vahele jääv elementide rida. Sagedustabel - moodustatakse variatsioonirea põhjal. Näitab, mitmel korral antud tunnus saab antud väärtuse.
Aritmeetiline keskmine tunnuse kõigi väärtuste summa ja objektide arvu jagatis. Normaaljaotus kirjeldav tunnus, mille keskmise taseme lähedased väärtused asuvad tihti. Suuri kõrvalekaldeid keskmiselt on harva. Korrelatsioon tunnuste vahline seos s.t. kas kaks suurust on omavahel seotud või ei ole. Positiivne korrelatsioon ühe suuruse kasvades kasvab enamasti ka teine suurus. Negatiivne korrelatsioon ühe suuruse kasvades teine suurus enamasti kahaneb. Korrelatsiooniväli - koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Hajuvusmõõdud (Iseloomustavad tunnuse väärtuste hajuvust ehk teisiti öeldes, kas väärtused erinevad üksteisest palju või mitte.) Maksimaalne element tunnuse väärtuste hulgas suurim element. Minimaalne element tunnuse väärtuste hulgas väikseim väärtus.
o Kui juhusliku suuruse asemel vaadatakse üksikmõõtmiste aritmeetilist keskmist, siis selle hajuvus (ja ka dispersioon) vähenevad võrdeliselt katsete arvuga. o Libisevat keskmist kasutatakse aegridade keskmistamisel (nn kaalutud keskmist), kus antud hetkele vastava keskmise arvutamisel võetakse ajaliselt kaugemad väärtused arvesse nõrgema kaaluga. · Korrelatsioon. o Korrelatsioon on tunnustevaheline seos. Korrelatsiooniväli e hajumisellips näitab, kus antud punktid asuvad, ellipsi pikemat pooltelge nimetatakse regressioonisirgeks. o Korrelatsioonikoefitsent näitab kui tugev side on. Omab väärtusi -1 < rxy < 1. Kui =1, siis on punktid tõusval regressioonisirge, kui = -1, siis asuvad punktid langeval regressioonisirgel (mõlemal juhul seos maksimaalne), kui =0, siis seos puudub. · Pidevad juhuslikud suurused, jaotusfunktsioon.
variatsioonreas (j(i)). 3.3. Korrelatiivne sõltuvus Korrelatiivne lineaarne sõltuvus sobib ennekõike kahe pideva (paljude väärtustega) arvtunnuse vahelise seos hindamiseks, praktikas kasutatakse ka alates järjestustunnusest, millel vähemalt 5 võimalikku väärtust. Korrelatsiooni puhul hinnatakse tunnuste vahel esinevat lineaarse seose suunda ja tugevust, visuaalselt annab sellest ülevaate hajuvusdiagramm (korrelatsiooniväli). Kui hajuvusdiagrammil punktid paiknevad tõusvas või langevas "pilvekeses", siis viitab see ühisele lineaarsele seosele tunnuste vahel. Täpsema hinnangu seose tugevusesele ja suunale saame kas eelpool toodud Spearmani astak-korrelatsioonikordaja või lineaarse ehk Pearsoni korrelatsioonikordaja r abil, vastav arvutusvalem avaldub: Andmetöötlus sotsiaalteadustes 13