Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Matemaatiline statistika - Korrelatsioon, Dispersioon ja standardhälve, Hajuvusmõõdud". Need materjalid aitavad sul teemat sügavamalt mõista.
korrelatsioon, keskväärtus, valim, üldkogum, sigma, standardhälve, suurusest, arvtunnus, kvantitatiivne, diskreetse, suuremaid, kvartiil, normaaljaotus, soovime, valimiks, valimisse, diskreetsed, pidevad, järjestatud, nominaaltunnus, järjestustunnus, binaarne, asendada, eeskiri, summat, bimodaalne, hajuvusmõõdud, variatsioonridaruvuseMatemaatilise statistika kordamisküsimused õpikust 1. Selgita, millega tegeleb statistika, millega matemaatiline statistika. Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemiste meetodeid. 2. Mis on üldkogum, mis valim? Too näiteid. Üldkogum on looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Üldkogumi osa nimetatakse valimiks. Valim: - Igal üldkogumi objektil peab olema võimalus valimisse sattuda. -Valim peab olema arvukas. Kõikne valim ehk üldkogum. 3. Mis on planeeritud valim, mis juhuslik valim? Millist valimit nimetatakse kõikseks valimiks?
Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika uurib statistika teoreetilisi aluseid, ta uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Üldkogum on kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi(Populatsioon).Valimiks nimetatakse mõõtmiseks võetud üldkogumi osa. Juhuslik valim, valimisse kuuluvad objektid valitakse välja täiesti juhuslikult üldkogumi kõigi objektide hulgast. Planeeritud valim valimisse kuuluvad objektid määratakse katseplaani järgi. Kõikne valim, valim langeb ühte üldkogumiga. Valim peab olema:*küllalt arvukas *igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Objekt-tunnustabel saab kasutada:* andmed õpilaste kohta* riigiakadeemiasse sisseastumiskatsed. Arvulised tunnused:*Pidev tunnus võib omandada kõiki
xi - x i =1 i =1 n n -1 Kui objekte on väga palju või tunnuse väärtused on pidevad või tunnus on antud sagedustabeliga, siis leitakse standardhälve valemist : ( ) ( ) k 2 k 2 = f i xi - x või väikese valimi korral =
Enne katse toimumist on tundmata. Üldjuhul tähistatakse X. Diskreetne juhuslik suurus on juhuslik suurus, mille väärtuste hulk on lõplik või loenduv. Praktiliselt vaatleme ainult selliseid DJS, mille võimalikud väärtused on 0, 1, 2, ... või alamhulk eelnevast. DJS jaotusseadus on eeskiri, mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X). kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima väärtuse vahel dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2= standardhälve - Standardhälve on ruutjuur dispersioonist 7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
Kokkuvõte 17 Statistika mõisted Statistika teadus, mis käsitleb andmete kogumist, töötlemist, analüüsimist ja kokkuvõtlikku esitamist. Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Üldkogum kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Valim mõõtmiseks võetud üldkogumi osa. Valim peab olema küllalt arvukas ja igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Valimi moodustamiseks on kolm võimalust: · Juhuslik valim (juhuslikult valitud uuritavad objektid) · Planeeritud valim · Kõikne valim (üldkogum) Hinnang valimi põhjal üldkogumi kohta tehtud järeldus. Tunnused iseloomulik omadus, mille poolest nähtused üksteisega sarnanevad või üksteisest erinevad
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi Assümeetria - Asümmeetria on jaotuskõvera maksimumi kõrvalekaldumine sümmeetriateljest. Kui jaotuskõvera maksimum (mood) on sümmeetriateljest (mediaan) paremal pool, on tegemist on negatiivse ehk vasakkaldelise asümmeetriaga. Kui maksimum on sümmeetriateljest vasakul, on tegemist positiivse ehk paremkaldelise asümmeetriaga
uurib statistiliste andmete põhjal järelduste tegemise meetodeidÜLDKOGUM-looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldus. VALIM-mõõtmiseks võetud üldkogumi osaPLANEERITUD VALIM-uurimisele kuluvat aega ja raha saab kokku hoida, aga tulemused võivad ikkagi tulla vajaliku täpsusegaJUHUSLIK VALIM-saame, kui koostame üldkogumist mingi nimekirja ja võtame sealt juhuslikult välja uuritavad objektidKÕIKNE VALIM-kui valim langeb kokku üldkogumigaARVTUNNUS- kvantitatiivne tunnus; tunnus mille väärtuseks on arvudMITTEARVULISED- kvalitatiivsed tunnused, tunnus mille väärtuseks ei ole arvudPIDEV TUNNUS-võib omandada kõiki reaalarvulisi väärtusi mingist piirkonnast(KAAL, KASV)DISKREETNE TUNNUS-võib omandada vais üksteisest eraldatud väärtusi(pereliikmete arv)JÄRJESTUSTUNNUS-väärtusi saab sisu põhjal järjestada(meeldib ei
küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2. Ettekavatsetud- vastavalt eelteadmistele valitud uuritavad 3
standardvead ei ole korrektsed ja seega ei ole korrektsed ka parameetrite hinnangute usaldusvahemikud. Fkriteeriumi hinnang ei pruugi olla õige; c) mudel võib viia uurija valedele järeldustele, kui tegemist on statistiliste hüpoteeside kontrollimisega. Kasutatakse graafilist analüüsi. Juhuslik liige ehk jääkliige ui on juhuslik suurus, mille keskväärtus ehk matemaatiline ootus on võrdne nulliga. E (ui) = 0. Kui juhuslike liikmete dispersioon pole konstantne ning tema jaotus oleneb Xst, on tegemist heteroskedestatiivsusega. Parki test kui sõltumatute muutujate ln(Xi) vastava regressioonikordaja hinnang a1 on statistiliselt olulisel määral erinev nullist, siis esialgses mudelis on heteroskedestatiivsus. 11
Sagedustabelist graafilise ülevaate saamiseks kasutatakse histogramme(tulpdiagramme). 4.1 4.2 3 5. Füüsika 5.1.Leian keskväärtuse. Tunnuse keskväärtuseks on tunnuste väärtuste aritmeetiline keskmine. Valem: x + x + ... + x n x= 1 2 n Olgu x1 vaadeldava tunnuse väärtus esimese objekti korral, x2 teise objekti korral jne ning n olgu mõõdetud objektide arv. x=4,4 5.2. Leian standardhälve. Standardhälve iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on tunnuse väärtuste hajuvus. Valem: n ( xi - x) 2 = i =l n *Väikese valimi korral(alla 100 objekti), kasutatakse valemis n-1. =0,723974 5.3. Leian variatsioonikordaja. Variatsioonikordaja on standardhälve ja keskväärtuse suhe. Valem: V = x V=0,164539 5.4. Leian mediaani.
astendamisel saadud arvude aritmeetilisi keskmisi. Arvu, millega momendi leidmisel hälbeid astendatakse, nimetatakse momendi järguks. VARIATSIOONINÄITARVUD · Variatsiooniamplituud (R= Xmax-Xmin)näitab äärmuste vahet. Äärmusi kirjeldab, ei kirjelda seda mis on kogumi sees. Väheväärtuslik, infot pea ei olegi. · Absoluutsed variatsiooninäitarvud: variatsiooniamplituud, keskmine lineaarhälve, dispersioon ja standardhälve, kvartiilhälve. Absoluutsete variatsiooninäitarvude suurus sõltub variantide absoluutväärtustest, mis muudab nad erinevate ridade võrdlemisel raskesti kasutatavateks. Teiseks probleemiks absoluutsete varieeruvusnäitarvude kasutamisel on ühik. Neil on mõõdetava suurusega sama ühik, mis muudab võimatuks erinevate ühikutega suuruste hajuvuse võrdlemise. · Keskmine lineaarhälve (d katusega) ehk keskmine absoluuthälve. Hälve ehk erinevus
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
..................................................................................... 8 15. Ülemine kvartiil.............................................................................................................. 8 16. Kvartiilide vahe.............................................................................................................. 8 17. Dispersioon.................................................................................................................... 8 18. Standardhälve................................................................................................................ 8 19. Variatsioonikordaja........................................................................................................ 8 20. Kokkuvõttev tabel.......................................................................................................... 8 Järeldus.............................................................................................................
Andmed mingi tunnus või omadus. Tunnus omadus, nt keskmine pikkus, kummas paralleelklassis läks matemaatika eksamitöö paremini jne. Arvuline tunnus väärtuseks on arvud, nt pikkus, palk, hinne jne. Mittearvuline tunnus väärtuseks ei ole arvud, nt sugu, rahvus, haridus, juuste värv. Järjestustunnus tunnus, mille väärtusi saab sisu põhjal järjestada, nt matemaatika kt hinne, skaala küsitluses. Nominaaltunnus tunnus, millel on rohkem kui kaks erinevat väärtust, kuid ei leidu ühtegi sisulist järjestust, mis haaraks kõik tunnuse väärtused, nt rahvus, silmade värv. Binaarne tunnus ainult kaks teineteist välistavat tunnust, nt sugu. Pidev tunnus võib omandada kõiki reaalarvulisi väärtusi mingist piirkonnast, nt kaal, kasv, aeg, temperatuur. Diskreetne tunnus - tunnus võib omandada vaid üksteisest eraldatud väärtusi, väärtused saadakse tavaliselt loendamise teel, nt elanike arv majas, õpilaste arv klassis vms. Statistiline rida juhus
Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon 2 andmetele vastav hälvete keskväärtus. Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse. Korrelatsiooniväli - Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Variatsioonirida - kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida.
Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed tänud juba ette või lõpus · Lihtsamad küsimused, avaküsimused · Keerulisemad küsimused, põhiküsimused
Maksimaalne element xmax - suurim tunnuste väärtuste hulgas. Sagedustabel näitab, mitmel korral saab antud tunnus antud väärtuse . Variatsioonirida kasvavalt või kahanevalt järjestatud tunnuse väärtuse rida . Variatsioonikordaja V hajuvusmõõt, mis seisneb kogumi standardhälbe ja keskväärtuse suhtes. Korrelatsioon nähtuste vastastikune statistiline sõltuvus ehk suhe, mille tõttu muutused ühes nähtuses kutsuvad esile ka muutused teises nähtuses. Positiivne korrelatsioon ühe suuruse kasvades teine suurus samuti kasvab. Negatiivne korrelatsioon ühe suuruse kasvades teine suurus kahaneb. Korrelatsioonikordaja r - kahe tunnuse vahelise seose tugevust iseloomustav arv. Dispersioon 2 - juhusliku suuruse varieeruvuse mõõt, ta näitab, kui palju uuritav suurus varieerub. Standardhälve - ruutjuur dispersioonist, iseloomustab tunnuste hajuvust. VALEMID x1 + ... + x n
opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus(asendikarakteristik) iseloomustab juhusliku suuruse jaotuse keskkoha asukohta. Keskväärtuse geomeetriline tõlgendus: jaotus raskuskeskme projektsioon x-teljele Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. dispersioon on standardhälve ruudus ja standardhälve on vastavalt dispersiooni ruutjuur. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile
funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus on juhusliku suuruse asendikarakteristik, mille abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta. Keskväärtuse geomeetriline tõlgendus: jaotuse raskuskeskme projektsioon x-teljele. Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile nim detsiilideks, 25%kordseid protsentiile nim kvartiilideks, 50% korral mediaaniks. Mediaan on
Kvantiilid- jagunevad alumine kvartiil- punkt, millest väiksemaid väärtusi on kogumis üks neljandik osa. Ülemine kvartiil- punkt millest suuremaid väärtusi on kogumis üks neljandik osa. Kvantiilid jagavad tunnuse väärtuste järjestatud rea teatud arvuks võrdseteks osadeks. Sagedamini kasutatavad kvantiilid on detsiilid, kvintiilid ja kvartiilid. Keskmine- õenäoliselt kõige sagedamini kasutatav näitaja statistilisel andmete analüüsis on aritmeetiline keskmine ehk keskväärtus. Selle saamiseks liidetakse kokku kõigi vastajate antud tunnuste väärtused ja jagatakse saadud summa vastajate arvuga. Tulemuseks on näitaja, mida võib käsitleda kui tüüpilist või läbilõikelist vastust vaatlusalusele küsimusele. Standardhälve- iseloomustab vastuste hajuvust keskmise ümber. Standardhälbe saab, kui leida kõigi vastajate vastuste erinevus üldisest keskmisest ning arvutada nende erinevuste keskmine
b. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
Majandusstatistika eksamiküsimused FK100 1. Statistika mõiste. Üldkogum ja valim. Rühmitatud andmed. Statistilise materjali graafiline esitamine (histogramm ja kumulatiivse sageduse graafik). Statistika on andmete kogumine ja töötlemine, statistilised andmekogumid, teadusharu, mille põhiülesandeks on massinähtuste vaatlemine, nende kohta andmete kogumine ja analüüsimine ning selle põhjal järelduste ja üldistuste tegemine ning praktiliste lahenduste pakkumine Üldkogum antud tunnustega elementide hulk (nt. koolis õpilaste hulk), N
i=1 20. Bayesi valem ja tema tähendus. Bayesi valem näitab tinglikku tõenäosust P(H k|A), et sündmus A toimus just nimelt P(H k )∙ P (A∨H k ) P ( H k| A )= n sündmusega Hk. ∑ (P ( H i) ∙ P ( A|H i ) ) i=1 DISKREETNE JUHUSLIK SUURUS 21. Mis on juhuslik suurus? Juhuslik suurus on suurus, mis sõltuvalt juhusest võib omandada erinevaid väärtusi. 22. Mis on erinevus diskreetse ja pideva juhusliku suuruse vahel? Diskreetseks juhuslikuks suuruseks nimetatakse juhuslikku suurust, mis võib omandada lõpliku arvu või loenduva hulga väärtusi. Pidevaks juhuslikuks suuruseks nimetatakse juhuslikku suurust, mis võib omandada lõpmatu hulga väärtusi(reaalarvud mingite reaalarvude vahemikust). 23. Mis on diskreetse juhusliku suuruse jaotus, kuidas seda anda? Diskreetse juhusliku suuruse jaotuseks nimetatakse eeskirja P(X), mis seab igale juhusliku
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
2) kas sõiduaeg on iga päev sama? 3) mis põhjustab erinevusi? 3 2. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse. · Statistiline rida tunnuse väärtuste järjestamata rida · Variatsioonirida tunnuse väärtuste rida kasvavad või kahanevas järjekorras
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil, - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon andmetele vastav hälvete keskväärtus. 2 Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse. Korrelatsiooniväli - Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Variatsioonirida - kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida.
Kõikide uurimustöös esinevate mõistete definitsioonid ning nende tähistused on eraldi välja toodud. Kokkuvõte on esitatud viimase leheküljena. 1. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides · Jaotustabel tabel, mis näitab tunnuse väärtuste suhtelist esinemissagedust
1. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides · Jaotustabel tabel, mis näitab tunnuse väärtuste suhtelist esinemissagedust · Statistiline rida tunnuse väärtuste järjestamata rida
Statistika on teadus, mis käsitleb andmete kogumist, töötlemist ja analüüsimist. 1 Üldkogum on objektide hulk, mille kohta soovime teha põhjendatud järeldusi. Uurimise võimalused: a) uuritakse kõiki elemente b) uuritakse mingit osahulka - valim 2 Tunnused jagunevad: arvtunnused (kvantitatiivsed tunnused) pidevad tunnused diskreetsed tunnused mittearvulised tunnused (kvalitatiivsed ) nominaalsed tunnused järjestustunnused binaarsed tunnused 3 Andmete töötlemine Vigaseid väärtusi ei tohi asendada õige väärtusega Andmeid võib kodeerida 4
juhusliku suuruse võimalikud väärtused ja nende tõenäosused pi=P(X=xi).
Tõenäosusfunktsiooni võib esitada valemina, tabelina, arvupaaridena või graafikuna.
Def: Juhusliku suuruse jaotusfunktsiooniks nimetame funktsiooni, mis seab väärtusele
x vastavusse tõenäosuse, et X
1 Valimid ja nende moodustamine........................................................................10 3.2 Valimvaatlus ......................................................................................................11 3.2.1 Valimvaatluse tüübid ..................................................................................11 3.3 Valimvaatluse meetodid ....................................................................................11 3.3.1 Mittetõenäosuslik valim ............................................................................. 12 3.4 Tõenäosuslik valim ............................................................................................12 3.4.1 Vaatlusvead ................................................................................................ 12 3.4.2 Mitte valimi vead.........................................................................................13 3.4.3 Vaatlusvead ............................