Leidsid 33 sarnast õppematerjali, mis on seotud failiga "KAS AJALOO JA ÜHISKONNAÕPETUSE HINDED ON OMAVAHEL SEOSES?". Need materjalid aitavad sul teemat sügavamalt mõista.
variatsioonirea, korrelatsioon, ühiskonnaõpetus, ühiskonnaõpetuse, üldkogum, keskväärtus, sagedustabel, hinnete, variatsioonirida, hüpotees, valim, jaotustabel, standardhälve, histogramm, juhendaja, microsoft, excelis, valemitega, esinevate, selgitused, matemaatika, statistiliste, meetodeid, kahanevas, hajuvusmõõdud, variatsioonireastudeUurimustöö matemaatikas Nimi Klass Juhendaja Tallinn 2011 Sisukord Sissejuhatus..................................................................................................................... 3 Uurimustöös esinevad mõisted, tähised ja seletused....................................................... 3 1. Hinnete tabel küsitluse põhjal.......................................................................................... 5 2. Statistiline rida................................................................................................................. 5 3. Variatsioonirida................................................................................................................ 5 4. Sagedus-jaotustabel.....................................................................................
Kooli nimi Õpilase nimi Klass Statistika XII B klassi bioloogia ja geograafia hinnete ning keskmiste hinnete põhjal Uurimustöö matemaatikast Juhendas: Õpetaja nimi Tallinn 2010 Sissejuhatus Antud uurimustöö on koostatud ...(kooli nimi)... XII B klassi küsitluse põhjal. Küsitluse käigus määratleti ära õpilaste bioloogia ning geograafia hinne. Antud töös on vaadeldud statistilisi uurimismeetodeid kasutades kolme tunnust bioloogia hinnet, geograafia hinnet ning nende ainete keskmist hinnet
2) kas sõiduaeg on iga päev sama? 3) mis põhjustab erinevusi? 3 2. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse. · Statistiline rida tunnuse väärtuste järjestamata rida · Variatsioonirida tunnuse väärtuste rida kasvavad või kahanevas järjekorras
1. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides · Jaotustabel tabel, mis näitab tunnuse väärtuste suhtelist esinemissagedust
1 SISUKORD Sissejuhatus.................................................................................................................................3 1.Riigieksami tulemuste koondtabel...........................................................................................5 2. Esimene punkt.........................................................................................................................6 2.1 Kirjandi tulemuste sagedustabel................................................................................6 2.2 Kirjandi sageduspolügoon.........................................................................................6 2.3 Kirjandi tulemuste mood, mediaan ja keskväärtus....................................................6 3. Teine punkt.............................................................................................................................8 3
13000-15000 55 18% 312 KOKKU 312 100% 312 10 Ühe kooli gümnaasiumiastmes õppivate noormeeste jalanumbrid on: 43, 41, 42, 43, 44, 44, 40, 43, 42, 43, 44, 42, 43, 46, 44, 40, 45, 42, 43, 41, 42, 43, 44, 43, 41, 42, 41, 43, 42, 44, 41, 42, 43, 45, 44, 46, antud Moodustada 40, 41,andmete 43, 44 põhjal sagedustabel ja jaotustabel. 11 12 Ühe klassi õpilaste pikkused (cm). 161, 173, 168, 159, 166, 64, 171, 170, 167, 177, 163, 159, 162, 172, 169, 170, 165, 16, 174, 162, 166, 158, 169, 178, 169, 164, 171. Moodustada sagedustabel jaotades andmed 5 klassiks. 13 Tunnuse keskväärtus on tunnuste aritmeetiline keskmine. Kui objekte on palju, siis on mõistlik kasutada sagedustabelit
................................................................................................ 11 Tartu 2010 1. Töös kasutatud statistika mõisted · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides · Jaotustabel tabel, mis näitab tunnuse väärtuste suhtelist esinemissagedust · Statistiline rida tunnuse väärtuste järjestamata rida
5. Diskreetne tunnus – tunnus, mis võib saada vaid üksikuid eraldiseisvaid (tavaliselt täisarvulisi) väärtusi. Nt seemnete arv viljapeas, tähtede arv sõnas, lehekülgede arv raamatus. 6. Statistiline rida – uuritava kogumi objektide mõõtmisel saadav vaadeldava tunnuse väärtuste rida. (andmed ajalises/mõõtmise järjekorras, kõige varasem ees) 7. Statistilise rea maht, kogumi maht – tunnuse väärtuste arv N. N = f1 + f2 + f3 + … + fn 8. Variatsioonirida – rea liikmed kirjutatuna kasvavas või kahanevas järjekorras, kusjuures võrdsed liikmed kirjutatakse järjest 9. Sagedus (f); sagedustabel – näitab mitmel korral antud tunnus saab antud väärtuse, tunnus (x, x1, x2…), sagedus (f, f1, f2). Esitatakse kas horisontaalse või vertikaalsena. 10. Suhteline sagedus – (wi) wi = fi/N; wi(%) = (fi/N) * 100% (kas suhtena või protsentidena) 11. Jaotustabel – tabel, kus tunnuse väärtustele on seatud vastavusse
6 8. Kahe tunnuse analüüs 8.1. Hajuvusdiagramm ehk korrelatsiooniväli Korrelatsiooniväljaks nimetatakse koordinaattasandile kantud punktihulka, kus iga punkti x- koordinaadiks on mingi objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Korrelatasioonivälja kuju järgi saab iseloomustada sõltuvust. Kahe juhusliku suuruse vahel on positiivne korrelatsioon, kui esimese suuruse kasvades kasvab ka teine suurus. Kahe juhusliku suure vahel on negatiivne korrelatsioon, kui esimese suuruse kasvades teine suurus kahaneb. Kui punktid paiknevad mingi joone ümber, siis on tegu korrelatiivse seosega. Mida lähemal on punktid joonele, seda tugevam on seos. 8.2. Korrelatsiooni kordaja Korrelatsioon on seda tugevam, mida lähemal korrelatsioonikordaja absoluutväärtus on ühele. n m f i =l j =l
· Binaarsed tunnused on ainult kaks teineteist välistavat väärtust. Tüüpiline binaarne tunnus on sugu. ___ 1 n = xi n i =1 Tunnuse keskväärtus tunnuste väärtuste aritmeetiline keskmine. Valem: Kodeerimine tunnuste väärtuste hulga teisendamine, milles igale tunnuse esialgsele väärtusele seatakse vastavusse üks uus väärtus kood. Variatsioonrida kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida. Sagedustabel - moodustatakse variatsioonirea põhjal. Näitab, mitmel korral antud tunnus saab antud väärtuse. Jaotustabel tabel, kus tunnuse väärtusele on seatud vastavusse nende esinemise suhteline
Matemaatilise statistika kordamisküsimused õpikust 1. Selgita, millega tegeleb statistika, millega matemaatiline statistika. Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemiste meetodeid. 2. Mis on üldkogum, mis valim? Too näiteid. Üldkogum on looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Üldkogumi osa nimetatakse valimiks. Valim: - Igal üldkogumi objektil peab olema võimalus valimisse sattuda. -Valim peab olema arvukas. Kõikne valim ehk üldkogum. 3. Mis on planeeritud valim, mis juhuslik valim? Millist valimit nimetatakse kõikseks valimiks?
Andmete edukaks töötlemiseks on tarvis lisada andmetele andmekirjeldus. Andmekirjeldus sisaldab:*tunnuste nimesid ehk identifikaatoreid;*tunnuste tüüpe;*kodeerimiseeskirju;*arvuliste (kvantitatiivsete) tunnuste korral ka mõõtühikuid ning on vajalik andmetöötlussüsteemidega suhtlemiseks, lahendust vajavate ülesannete esitamiseks ja tulemuste vormistamiseks. Variatsioonrida on arvude rida, mis on esitatud korrastatud kujul ehk arvude kasvamise (kahanemise) järjekorras. Sagedustabel - võtab andmetabelist kokku mitmel objektil mingit väärtust esineb ehk esitab vastava sageduse. Jaotustabel näitab tunnuse erinevate väärtuste esinemissagedust suhtarvudes, Sagedustabel näitab tunnuse erinevate väärtuste esinemissagedust absaluutarvudes. Tulpdiagramm ja sektor-diagramm on mõeldud sagedustabeli graafiliseks illustreerimiseks.Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. Aritmeetiline keskmine-variatsioonireas
· Ruutkeskmisel on eriti suur rakenduslik väärtus just dispersioonanalüüsis, korrelatsioonikordajate leidmisel ja ka statistilise rea tasandamisel. Peale ruutkeskmise kasutatakse ka kuup ja neljanda astme keskmisi. · Mitme asendikeskmise kasutamine annab valimi kohta rohkem teavet, eriti kui nad üksteisest erinevad ja pole õige väita, et üks neist on parem kui teine. · Sümmeetrilise arvtunnuse korral langevad mediaan ja keskväärtus kokku. Mediaan pole tundlik jämedate vigade suhtes: mediaani väärtust ei mõjuta see, kas variatsioonirea maksimaalne liige on üsna lähedane naaberliikmetele või erineb sellest sadu kordi. Keskväärtust mõjutab jäme viga ehk erind märgatavalt. Eespool oli vaadeldud kogumi uurimist ühe tunnuse seisukohalt. Sageli on vaja kogumit uurida kahe või enama tunnuse järgi. Korrelatsioon. Korrelatsioonikordaja.
Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon 2 andmetele vastav hälvete keskväärtus. Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse. Korrelatsiooniväli - Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Variatsioonirida - kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida.
Maksimaalne element xmax - suurim tunnuste väärtuste hulgas. Sagedustabel näitab, mitmel korral saab antud tunnus antud väärtuse . Variatsioonirida kasvavalt või kahanevalt järjestatud tunnuse väärtuse rida . Variatsioonikordaja V hajuvusmõõt, mis seisneb kogumi standardhälbe ja keskväärtuse suhtes. Korrelatsioon nähtuste vastastikune statistiline sõltuvus ehk suhe, mille tõttu muutused ühes nähtuses kutsuvad esile ka muutused teises nähtuses. Positiivne korrelatsioon ühe suuruse kasvades teine suurus samuti kasvab. Negatiivne korrelatsioon ühe suuruse kasvades teine suurus kahaneb. Korrelatsioonikordaja r - kahe tunnuse vahelise seose tugevust iseloomustav arv. Dispersioon 2 - juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus varieerub. Standardhälve - ruutjuur dispersioonist, iseloomustab tunnuste hajuvust. VALEMID x1 + ... + x n
Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil, - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon andmetele vastav hälvete keskväärtus. 2 Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse. Korrelatsiooniväli - Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Variatsioonirida - kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida.
Enne katse toimumist on tundmata. Üldjuhul tähistatakse X. Diskreetne juhuslik suurus on juhuslik suurus, mille väärtuste hulk on lõplik või loenduv. Praktiliselt vaatleme ainult selliseid DJS, mille võimalikud väärtused on 0, 1, 2, ... või alamhulk eelnevast. DJS jaotusseadus on eeskiri, mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X). kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima väärtuse vahel dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2= standardhälve - Standardhälve on ruutjuur dispersioonist 7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
Andmed mingi tunnus või omadus. Tunnus omadus, nt keskmine pikkus, kummas paralleelklassis läks matemaatika eksamitöö paremini jne. Arvuline tunnus väärtuseks on arvud, nt pikkus, palk, hinne jne. Mittearvuline tunnus väärtuseks ei ole arvud, nt sugu, rahvus, haridus, juuste värv. Järjestustunnus tunnus, mille väärtusi saab sisu põhjal järjestada, nt matemaatika kt hinne, skaala küsitluses. Nominaaltunnus tunnus, millel on rohkem kui kaks erinevat väärtust, kuid ei leidu ühtegi sisulist järjestust, mis haaraks kõik tunnuse väärtused, nt rahvus, silmade värv. Binaarne tunnus ainult kaks teineteist välistavat tunnust, nt sugu. Pidev tunnus võib omandada kõiki reaalarvulisi väärtusi mingist piirkonnast, nt kaal, kasv, aeg, temperatuur. Diskreetne tunnus - tunnus võib omandada vaid üksteisest eraldatud väärtusi, väärtused saadakse tavaliselt loendamise teel, nt elanike arv majas, õpilaste arv klassis vms. Statistiline rida juhus
Ühe peamise ideena tahtsin kindlaks teha, kui palju loevad tegelikult kodused harjumused edasisel elul ning kas tõesti segab alkoholi tarbimine õppimist. Kuna alkohol on alati olnud üheks ühiskonna valupunktiks, otsustasin uurida, kuidas on lood Nõo Reaalgümnaasiumi abiturientidega, kelle seisavad peagi ees eksamid. Kõige selle uurimistöö analüüsiks kasutasin Excelis järgnevaid valemeid: Countif tingimustega loendamine. Average keskväärtus. Max maksimaalne element. Min minimaalne element. Mode mood. Correl korrelatsioon. Median mediaan. Stdev- standardhälve. Andmekirjeldus 1. Sugu : M-mees, N-naine ; binaarne tunnus 2. Klass: 12a, 12b, 12c ; nominaaltunnus 3. Kui vanalt esmalt alkoholi tarbisid? diskreetne arvtunnus 4. Kas tarbid ka pidudel alkoholi? : JAH/EI ; binaarne tunnus 5. Kui tihti alkoholi tarbid? valikvastus: 1 - mitte kunagi
üldistada üldkogumile. Seega kursuse läbinu peab oskama 1) kirjeldada kokkuvõtvalt uuringu käigus kogutud andmeid ja 2) anda selle põhjal statistiliselt usaldusväärseid üldistatud tulemusi. 1. ANDMEANALÜÜSI PÕHIMÕISTED (Valik)uuringu läbiviimisel on kindlad etapid, iga etapp kasutab ja vajab umbes kolmandiku uuringu ressurssidest: 1. Planeerimise alla kuuluvad järgmised mõisted ja etapid - probleemülesanne, statistiline ülesanne, üldkogum, loend, valim, tunnused, mõõtmismeetod ja -vahend; 2. Andmete kogumise all mõtleme andmete kogumist, kodeerimist jms, sisestamist, korrigeerimist; 3. Andmetöötlus on andmete statistiline töötlus, analüüs (interpretatsioon), uuringu väärtustamine, publitseerimine (esitamine). 1.1 Üldkogum ja valim Vastavalt uurija eesmärgile määratletakse üldine uurimisobjekt ehk üldkogum. Üldkogumiks on
· Normaaljaotus kirjeldab tunnust, mille käitumine on normaalne. Normaaljaotus on piirjaotus, millele lähenevad paljud teised jaotused. · Normaaljaotuse üks parameetritest on standardhälve ehk sigma. · Normaaljaotuse omadused: * normaaljaotus on pidev jaotus *normaaljaotus on täielikult kirjeldatav kahe parameetriga: keskväärtusega ja dispersiooniga 2 *normaaljaotusele vastav kõver on sümmeetriline keskväärtuse suhtes * normaaljaotuse keskväärtus, mood ja mediaan ühtivad. · Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe!!! · Mediaan jaotab normaaljaotuse tagurpidi U kaheks osaks. Artitmeetiline keskmine on samas kohas kus mediaan kuna äärmused on normaaljaotusel võrdsed. Mood on samuti keskel ehk seal kus mediaan ja aritmeetiline keskmine kuna kõige suurem sagedus on seal (tipp). Aritmeetiline keskmine = Mood = Mediaan. · Normaaljaotuse puhul on tegu sümeetriaga.
palju, siis ei kasutata sagedustabelit Seal esitatakse tunnuse väärtused (valid), nende esinemissagedus (frequence) ning protsendid (percent). Sagedustabeli järjestamiseks sagduste järgi: uus tabel: analyze/ferquences . tunnus perekonnaseis varialbel väljale ning klõpsame nupule format. Descending counts linnuke. Kui tunnusel on aga palju erinevaid väärtuseid, näiteks sissetulekud on kõikidel vastajatel tõenäoliselt erinevad, siis sagedustabel andmete kokkuvõtmiseks ei sobi. Andmestikus kultuur.sav on selliseks tunnuseks vanus. Koostades vanuse väärtustest sagedustabeli, on see liiga mahukas, et seda andmete esitamiseks kasutada. Statistics – Summarize – Frequencies Variable(s): millistest muutujatest sagedustabelit soovitakse Statistics: võimalus tellida muutuja(te) kohta statistikuid (kvartiile-min/max, keskmist, standardhälvet jne) – ainult rangelt arvandmete korral!
(osakogumi x maht kogumis A / x maht kogumis B) 6) Intensiivsuhtarvud on omavahel kvalitatiivselt erinevate kogumite suhted. Iseloomustatakse 1 nähtuse leviku intensiivsust teise nähtuse suhtes.(rahvastiku tiheduse näitarv, mis iseloomustab rahvastiku levikut[esimene nähtus] riigi territooriumi [teine nähtus] suhtes). Intensiivsuhtarvu 2 liiki: 1) Tihedussuhtarv Leitakse : ( üldkogum x/ üldkogum y). Mitu lugejasoleva kogumi ühikut langeb nimetajas oleva kogumi ühele ühikule. 2)Sagedussuhtarv Leitakse: (sündmuste kogum/ esemete kogum) või (dünaamiline kogum/staatiline kogum). Sellega leitakse näiteks suremuse ja sündivuse koefitsente, nt sünnijuhtumite arv jagatakse keskmise rahvaarvuga. 9. Keskmise mõiste ja tema tunnetuslikud omadused Keskmised on levinumaid kvantitatiivseid üldistusi., keskmisi võib olla ühel kogumil mitu
Pidev suurus - väärtused täidavad mingi vahemiku täielikult ära Jaotusseadus - Diskreetse juhusliku suuruse X jaotusseaduseks nimetatakse vastavust suuruse kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest
3. ei saa olla lineaarhälbest suurem (väiksem) 4. varieeruvas reas = 0 (st puhul rida just varieerub) 5. ei ükski Piiresindusviga on oma sisult: 1. kõikde n-liikmeliste valimte artm. keskmiste keskmine 2. vahe ühe juhuslikult moodustatud valimi ja keskmise taseme ja üldkogumi keskväärtuste vahel 3. väljavõtukeskmiste kvartiilhälve 4. ei ükski Väljavõtukogumi suurus ei tohi sõltuda 1. Üldkogumi suurust (mida suurem üldkogum, seda suurem valim) 2. Üldkogumi keskmisest väärtusest 3. Usaldatavusest (mida suurem usaldatavus, seda suurem valim) 4. Soovitud täpsusest (mida täpsemat tulemust tahan, seda suurem peab olema valim) 5. Väärtuste varieeruvusest üldkogumis (mida suurem dispersioon, seda suurem on valim) Kvalitatiivse (väärtus, mida ei saa arvuna avaldada) tunnuse korral 1. Ei ole võimalik arvutada moodi 2. On võimalik metodoloogiliste vidage tekkimine
2. on alati moodist suurem 3. on alati geomeetrilisest keskmisest suurem 4. normaaljaotuse puhul on moodiga võrdne 5. ei ükski Standardhälve 1. leitav dispersiooni ruuduga 2. paikneb alati vahemikus 0 ... lõpmatus 3. ei saa olla lineaarhälbest suurem 4. varieeruvas reas = 0 5. ei ükski Normaaljaotuse korral 1. puudub sümmeetria 2. st. hälve = 0 3. Mo = Me ei võrdu aritmeetilise keskmisega 4. keskväärtus on alati = 0 5. ei ükski Seos Y = 18,5 + 0,48 X 1. kirjeldab X-i mõju Y-le 2. kirjeldab seose tugevust 3. kirjeldab Y-i mõju X-le 4. on pööratav ka kujule X = 18,5 + 0,48 Y 5. ei ükski Tasandusjoon Y = 18,5 – 0,48 X 1. näitab kasvavat lineaarset tendentsi 2. parameeter b ei tohi olla negatiivne 3. vabaliige 18,5 kirjeldab joone tõusu 4. igal ajaperioodil väärtused vähenevad 0,48 korda 5. ei ükski Eksponentkeskmine
ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks. Kvantiilid Alumine kvartiil punkt, millest väiksemaid väärtusi on kogumis ¼ osa. Ülemine punkt, millest suuremaid väärtusi on kogumis ¼ osa. Detsiil punkt, mis eraldab 1/10 osa väärtustest. Normaaljaotuse sagedamini kasutatavad kvantiilid: mediaan = 0 alumine kvartiil = -0,675; ülemine kvartiil = 0,675 Arvtunnused Mood, Mediaan Kvantiilid Aritmeetiline keskmine ehk keskväärtus Hajuvuse näitajad Standardhälve kui kaugel on keskmine inimene keskmisest. Dispersioon standardhälbe ruut. Variatsioonikordaja tunnuse standardhälbe ja keskmise väärtuse suhe. 5) Jooniste kasutamine tunnuste iseloomustamiseks, eri jooniste tüübid, histogramm. Sagedamini kasutatavad jooniste tüübid tunnuse jaotuse esitamiseks: ·Tulpdiagramm - kategooriaid pole väga palju, Ordinaal - haridus, laste arv
Ms Excelis on rühmitamise jaoks funktsioon FREQUENCY. Kogutud andmed moodustavad statistilise rea, mida korrastatakse, rühmitatake, leitakse nendele statistilised karakteristikud, moodustatakse tabelid ja diagrammid. Kui statistilises reas korrastatakse andmed nende väärtuste kasvavas või kahanevas järjestuses, nim tulemust variatsioonireaks. Lihtsatest ridades on sama palju arve kui on vaatlusega hõlmatud kogumis liikmeid. Intervallitud variatsioonirida hõlmab 2 koostisosa – intervallide loetelu ja igasse interv. langevate rea liikmete arv. 5. Kaalutud aritmeetiline keskmine – tuleb kasutada kui iga variant stat.reas on erisuguse osatähtsusega, kui variantide esinemissagedused erinevad v kui perioodreas perioodide pikkused on erinevad. Arvutades tuleb x korrutada f’ga(sagedus) ja liita järgmise xf’ga jagada f’ide summaga.. Harmooniline keskmine – tuleb kasutada siis kui tunnuse väärtuse
endine suitsetaja, suitsetab vähe, suitsetab palju) · Nominaalsed tunnused tunnused, mille väärtus pole järjestatav (nt sugu, elukoht, veregrupp, diagnoos) · Binaarsed - vastus jah/ei küsimusele, tähistamaks nt haiguse v riskiteguri olemasolu või puudumist. · Mittearvulisi tunnuseid on vahel otstarbekas arvuliseks kodeerida (nt 1 vastab nõrgale valule) 2. ANDMETE KIRJELDAMINE andmeid saab kirjeldada arvuliselt ja graafiliselt. · Sagedustabel kirjeldab ühte olulist valimi omadust valimi jaotust. Mittearvulised või diskreetsed tunnused. Loed kokku mitu korda mingit väärtust esineb ja esitad sagedustabelis. Saad leida väärtuste esinemise suhtelised sagedused e osakaalud (arvutatakse vastava osakaalu ja vastuste koguarvu jagatsena). Pidevad tunnused? suurema informatiivsuse saavutamiseks jagatakse tunnuse võimalikud väärtused intervalidesse. Tehakse sagedustabeli intervallidest, kus
korral) F-test (kahe üldkogumi dispersioonide võrdlemine) Korrelatsioonanalüüs Regressioonanalüüs 2 Kahemõõtmeline sagedustabel, -test Dispersioonanalüüs (pole veel) [email protected] http://ph.eau.ee/~ktanel/kool_ja_too/ märts, 2000 http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/ (2 of 2)29.05.2006 15:08:49
Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud
lineaarhälve on seotud tõenäosusteooria rakendustega, kuid standardhälve ei ole – VALE, vastupidi peavad olema mõlemasuunalised kõrvalekalded keskm.tasemest võrdvõimalikud – VALE võib kasutada dispersiooni – ÕIGE standardhälve (hälvete ruutkeskmine) on varieeruvas kogumis alati keskmisest lineaarhälvest (hälvete aritm keskm) väiksem – VALE, suurem Väljavõtukogumi suurus ei tohi sõltuda: üldkogumi suurusest (mida suurem üldkogum, seda suurem valim) üldkogumi keskmisest väärtusest – ÕIGE usaldatavusest (mida suurem usaldatavus, seda suurem valim) soovitud täpsusest (mida täpsemat tulemust tahan, seda suurem peab olema valim) väärtuste varieeruvusest üldkogumis (mida suurem dispersioon, seda suurem on valim) Keskmine esindusviga on oma sisult: vale keskmise valiku tulemusel tekkinud arvutusviga - esindusviga ei ole arvutusviga, valim esindab üldkogumit
mõjuta. Mediaani omadusi 1) mediaani võib kasutada järjestikskaala ja intervallskaala korral; 2) mediaan ei ole tundlik ekstremaalsetele väärtustele. Tabelarvutusprogrammis MS Excel on mediaani leidmiseks funktsioon MEDIAN. 7 Asendikeskmisi, mis jaotavad korrastatud statistilise rea võrdseteks osadeks, nimetatakse kvantiilideks. MS Excel -is leiab kvartiilid funktsioon QUARTILE, protsentiilid funktsioon PERCENTILE. Aritmeetiline keskmine ehk keskväärtus, kus N on kogumi maht ja x kogumi element. Aritmeetilise keskmise omadusi: 1) saab kasutada vaid intervallskaal korral; 2) võimaldab võrrelda üksikväärtuste suurusi aritmeetilise keskmisega; 3) võimaldab arvutada teisi statistilisi näitajaid (hajuvust iseloomustavaid suurusi); 4) sõltub igast üksikust elemendist; 5) on tundlik ekstremaalsetele väärtustele. Tabelarvutusprogrammis MS Excel on aritmeetilise keskmise leidmiseks funktsioon AVERAGE. 2.2 Variatsiooninäitarvud