Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Matemaatilise statistika mõisted". Need materjalid aitavad sul teemat sügavamalt mõista.
variatsiooni, variatsioonirea, hajuvus, valim, keskväärtus, järjestustunnus, variatsioonrida, kasvamise, järjestatud, sagedustabel, graafiline, kirjeldavad, suuremaid, jagatis, kvartiilid, variatsioonireas, neljaks, ruutude, standardhälve, arvtunnused, kvantitatiivsed, piirkonnast, diskreetne, diskreetse, loendamise, kvalitatiivsed, ükskõikneDefineeri mõisted: Statistika Matemaatiline statistika Üldkogum. Näide. Üldkogu uurimisel on kaks võimalust: Valim. Kuidas on seotud üldkogu ja valim? Millised on nõuded valimile? Valimi moodustamise viisid. Statistiline rida. Variatsioonirida. Sagedustabel. Diagramm. Mood. Mediaan. Aritmeetiline keskmine. Variatsiooni ulatus. Hälve. Dispersioon. Standardhälve. Korrelatsiooniväli. Normaaljaotus. Statistika mõisted Andmete esitamine 1.Statistika - teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. 2.Matemaatiline statistika on matemaatika haru, mis uurib statistiliste
Hajuvuse karakteristikud näitavad, mil määral erinevad tunnuse väärtused üksteisest, hajuvad keskmise ümber. Variatsioonrea ulatus tunnuse suurima ja väikseima väärtuse vahe, xmax-xmin. Hälve tunnuse väärtuse ja aritmeetilise keskmise vahe (d=) Keskmine hälve hälvete aritmeetiline keskmine. Dispersioon hälvete ruutude aritmeetiline keskmine. Standardhälve ruutjuur dispersioonist, iseloomustab tunnuse hajuvust. Mida suurem on standardhälve, seda suurem on hajuvus. Üldkogum ehk populatsioon, selle all mõeldakse kõiki juhtumeid või situatsioone, mille kohta meie poolt püstitatud järeldused, oletused või prognoosid kehtivad. Valim väike objektide grupp, mis valitakse üldkogumist, et selle põhjal teha järeldus kogu üldkogumi kohta. Nõuded valimile peab olema küllalt arvukas, igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Usaldusvahemik väärtuste vahemik.
Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika uurib statistika teoreetilisi aluseid, ta uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Üldkogum on kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi(Populatsioon).Valimiks nimetatakse mõõtmiseks võetud üldkogumi osa. Juhuslik valim, valimisse kuuluvad objektid valitakse välja täiesti juhuslikult üldkogumi kõigi objektide hulgast. Planeeritud valim valimisse kuuluvad objektid määratakse katseplaani järgi. Kõikne valim, valim langeb ühte üldkogumiga. Valim peab olema:*küllalt arvukas *igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Objekt-tunnustabel saab kasutada:* andmed õpilaste kohta* riigiakadeemiasse sisseastumiskatsed. Arvulised tunnused:*Pidev tunnus võib omandada kõiki
Kokkuvõte 17 Statistika mõisted Statistika teadus, mis käsitleb andmete kogumist, töötlemist, analüüsimist ja kokkuvõtlikku esitamist. Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Üldkogum kas looduse või ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Valim mõõtmiseks võetud üldkogumi osa. Valim peab olema küllalt arvukas ja igal üldkogumi objektil peab olema võrdne võimalus valimisse sattuda. Valimi moodustamiseks on kolm võimalust: · Juhuslik valim (juhuslikult valitud uuritavad objektid) · Planeeritud valim · Kõikne valim (üldkogum) Hinnang valimi põhjal üldkogumi kohta tehtud järeldus. Tunnused iseloomulik omadus, mille poolest nähtused üksteisega sarnanevad või üksteisest erinevad
viljapeas, tähtede arv sõnas, lehekülgede arv raamatus. 6. Statistiline rida – uuritava kogumi objektide mõõtmisel saadav vaadeldava tunnuse väärtuste rida. (andmed ajalises/mõõtmise järjekorras, kõige varasem ees) 7. Statistilise rea maht, kogumi maht – tunnuse väärtuste arv N. N = f1 + f2 + f3 + … + fn 8. Variatsioonirida – rea liikmed kirjutatuna kasvavas või kahanevas järjekorras, kusjuures võrdsed liikmed kirjutatakse järjest 9. Sagedus (f); sagedustabel – näitab mitmel korral antud tunnus saab antud väärtuse, tunnus (x, x1, x2…), sagedus (f, f1, f2). Esitatakse kas horisontaalse või vertikaalsena. 10. Suhteline sagedus – (wi) wi = fi/N; wi(%) = (fi/N) * 100% (kas suhtena või protsentidena) 11. Jaotustabel – tabel, kus tunnuse väärtustele on seatud vastavusse nende esinemise suhteline sagedus (x, x1, x2; w, w1, w2) (w1+w2+w3+ …+wn =1 või =100%) 12
Matemaatilise statistika kordamisküsimused õpikust 1. Selgita, millega tegeleb statistika, millega matemaatiline statistika. Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. Matemaatiline statistika on matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemiste meetodeid. 2. Mis on üldkogum, mis valim? Too näiteid. Üldkogum on looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. Üldkogumi osa nimetatakse valimiks. Valim: - Igal üldkogumi objektil peab olema võimalus valimisse sattuda. -Valim peab olema arvukas. Kõikne valim ehk üldkogum. 3. Mis on planeeritud valim, mis juhuslik valim? Millist valimit nimetatakse kõikseks valimiks?
Enne katse toimumist on tundmata. Üldjuhul tähistatakse X. Diskreetne juhuslik suurus on juhuslik suurus, mille väärtuste hulk on lõplik või loenduv. Praktiliselt vaatleme ainult selliseid DJS, mille võimalikud väärtused on 0, 1, 2, ... või alamhulk eelnevast. DJS jaotusseadus on eeskiri, mis seob juhusliku suuruse väärtused ja nende tõenäosused: pi=P(X=xi).( esitatud valemina, tabelina, arvupaaridena või graafikuna). keskväärtus - EX = E(X). kus xi tähistab diskreetse juhusliku suuruse x väärtust ja p i selle tõenäosust. Keskväärtus on juhusest sõltumatu suurus, mis paikneb väikseima ja suurima väärtuse vahel dispersioon, - Dispersioon on hälbe ruudu keskväärtus. DX = D(X) = E(X-EX) 2= standardhälve - Standardhälve on ruutjuur dispersioonist 7. Jaotusfunktsioon. - Juhusliku suuruse jaotusfunktsioon on funktsioon, mis seob väärtusega
Statistika on teadus, mis käsitleb andmete kogumist, töötlemist ja analüüsimist. 1 Üldkogum on objektide hulk, mille kohta soovime teha põhjendatud järeldusi. Uurimise võimalused: a) uuritakse kõiki elemente b) uuritakse mingit osahulka - valim 2 Tunnused jagunevad: arvtunnused (kvantitatiivsed tunnused) pidevad tunnused diskreetsed tunnused mittearvulised tunnused (kvalitatiivsed ) nominaalsed tunnused järjestustunnused binaarsed tunnused 3 Andmete töötlemine Vigaseid väärtusi ei tohi asendada õige väärtusega Andmeid võib kodeerida 4
Kvartiilid on variatsioonrea alumise ja ülemise poole mediaanid. Kvartiilid on iseenesest asendikeskmised, mis iseloomustavad tunnuse paiknevust. Alumise ja ülemise kvartiili vahele jäävad pooled tunnuse väärtustest. Kvartiilide erinevus näitab tunnuse hajuvust (st kvartiilihaare on ühtlasi hajuvuse karakteristikuks) . Vahel kasutatakse statistikas ka detsiile. Detsiilide abil jaotatakse variatsioonrida kümneks osaks. I detsiil on tunnuse väärtus, millest väiksemaid (või võrdseid) on variatsioonreas 10%. Hälve - tunnuse üksiku väärtuse erinevus keskväärtusest (aritmeetilisest keskmisest). Kogu variatsioonrea hälvete summa on 0. Tunnuse väärtuse xi hälve on xi - x . Keskmine hälve (lineaarne hälve) - hälvete absoluutväärtuste aritmeetiline keskmine. k
uurib statistiliste andmete põhjal järelduste tegemise meetodeidÜLDKOGUM-looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldus. VALIM-mõõtmiseks võetud üldkogumi osaPLANEERITUD VALIM-uurimisele kuluvat aega ja raha saab kokku hoida, aga tulemused võivad ikkagi tulla vajaliku täpsusegaJUHUSLIK VALIM-saame, kui koostame üldkogumist mingi nimekirja ja võtame sealt juhuslikult välja uuritavad objektidKÕIKNE VALIM-kui valim langeb kokku üldkogumigaARVTUNNUS- kvantitatiivne tunnus; tunnus mille väärtuseks on arvudMITTEARVULISED- kvalitatiivsed tunnused, tunnus mille väärtuseks ei ole arvudPIDEV TUNNUS-võib omandada kõiki reaalarvulisi väärtusi mingist piirkonnast(KAAL, KASV)DISKREETNE TUNNUS-võib omandada vais üksteisest eraldatud väärtusi(pereliikmete arv)JÄRJESTUSTUNNUS-väärtusi saab sisu põhjal järjestada(meeldib ei
................................................................................................................ 7 10. Aritmeetiline keskmine................................................................................................... 7 11. Tunnuse minimaalne väärtus......................................................................................... 7 12. Tunnuse maksimaalne väärtus...................................................................................... 7 13. Variatsioonirea ulatus.................................................................................................... 7 14. Alumine kvartiil............................................................................................................... 8 15. Ülemine kvartiil.............................................................................................................. 8 16. Kvartiilide vahe.................................................................................................
1 SISUKORD Sissejuhatus.................................................................................................................................3 1.Riigieksami tulemuste koondtabel...........................................................................................5 2. Esimene punkt.........................................................................................................................6 2.1 Kirjandi tulemuste sagedustabel................................................................................6 2.2 Kirjandi sageduspolügoon.........................................................................................6 2.3 Kirjandi tulemuste mood, mediaan ja keskväärtus....................................................6 3. Teine punkt.............................................................................................................................8 3
2. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse. · Statistiline rida tunnuse väärtuste järjestamata rida · Variatsioonirida tunnuse väärtuste rida kasvavad või kahanevas järjekorras · Arvjoonis andmete esitamise graafiline viis, mis aitab neid paremini analüüsida ja nähtuste olemusest aru saada.
2) Statistilise uurimistöö etapid Uuringu ettevalmistamine (eesmärk, plaan, andmete vajadus, andmete kogumisviis, töötlemisviis, võimalikud järeldused). Statistiline vaatlus (küsitlus, dokumentide läbivaatamine, ankeedi korraldamine, andmete hankimine statistilistest andmebaasidest). Vaatlusandmete kokkuvõtt ja esialgne töötlemine. Andmete analüüs, järelduste ja üldistuste sõnastamine. 3) Statistilise vaatluse vead Metodoloogilised vead – valim ei kirjelda üldkogumit adekvaatselt. – vaatluse eesmärk ja objekt pole täpselt piiritletud. – vaatlusviis on ebaõnnestunult valitud. – vaatluse juhendmaterjalid pole üheselt mõistetavad. Registreerimisvead (tahtlikult tekitatud vead; mittetahtlikud vead). tahtlikud vead – andmeid moonutatakse meelega. mittetahtlikud vead – jämedad vead (tekivad mõõtmist, vaatlust või küsitlemist segava
Matemaatiline statistika - Statistika on teadus, mis käsitleb arvandmete kogumist, töötlemist ja analüüsimist. - Üldkogum on looduse/ühiskonna nähtus või objektide hulk, mille kohta soovime teha teaduslikult põhjendatud järeldusi. - Üldkogumi osa nimetatakse valimiks. Valim: - Igal üldkogumi objektil peab olema võimalus valimisse sattuda. -Valim peab olema arvukas. Kõikne valim ehk üldkogum. Andmete kogumine ja ettevalmistamine töötlemiseks 1) Arvtunnus (kvantitatiivne) - diskreetsed -pidevad -Juhuslik valik -Planeeritud valik -Järjestatud 2) Mittearvtunnus (mittekvantitatiivne) -kodeeritud -Nominaaltunnus: Pärast kodeerimist ei ole mõtet järjestada. -Järjestustunnus: 5 v.hea; 4 hea; 3 rahuldav jne.
1. Uurimustöös esinevate mõistete ja tähistuste selgitused 1. Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist. 2. Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid. Statistikas on oluline uurimise objekt ja üldkogum. 3. Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi. 4. Valim mõõtmiseks võetud üldkogumi osa. 5. Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti 6. Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides. 7. Jaotustabel tabel, mis näitab tunnuse väärtuste suhtelist esinemissagedust. 8. Statistiline rida tunnuse väärtuste järjestamata rida. 9. Variatsioonirida tunnuse väärtuste rida kasvavad või kahanevas järjekorras. 10
1. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides · Jaotustabel tabel, mis näitab tunnuse väärtuste suhtelist esinemissagedust · Statistiline rida tunnuse väärtuste järjestamata rida
Ekse – jäme viga, enamasti põhjustatud inimlikest eksimustest – näiteks jäeti sisestamata üks arvus esinev 0 (või on üks 0 ülearu) 2. KESKMISED Aritmeetiline keskmine – saab leida ainult intervallskaala korral. Aritmeetiline keskmine on tundlik ekstremaalsetele väärtustele. Valem: Kaalutud aritmeetiline keskmine – kasutame siis, kui on antud väärtuste xi esinemissagedused fi ehk kaalud. Valem: Mediaan - järjestatud variatsioonrea keskmine liige, millest mõlemale poole jääb võrdne arv väärtusi. Mediaani võib kasutada intervallskaala ja järjestusskaala korral Mediaan ei ole tundlik ekstremaalsetele väärtustele Mediaan on asendikeskmine. Valem: Mood on variatsioonreas kõige sagedamini esinev väärtus. Mood on kõige tüüpilisem väärtusMoodi saab kasutada nii nimiskaala, järjestusskaala kui ka intervallskaala korral Mõnedel andmekogumitel
Kokkuvõte on esitatud viimase leheküljena. 1. Uurimustöös esinevate mõistete ja tähistuste selgitused · Statistika teadus, mis käsitleb arvuandmete kogumist, töötlemist ja analüüsimist · Matemaatiline statistika matemaatika haru, mis uurib statistiliste andmete põhjal järelduste tegemise meetodeid Statistikas on oluline uurimise objekt ja üldkogum. · Üldkogum esemete hulk, mille kohta tahetakse teha teaduslikult põhjendatud järeldusi · Valim mõõtmiseks võetud üldkogumi osa · Tunnus omaduste seisukoht, mille kohaselt uuritakse objekti · Sagedus-jaotustabel tabel, mis näitab, mitmel korral on antud tunnus saanud antud väärtuse ning nende väärtuste sagedust protsentides · Jaotustabel tabel, mis näitab tunnuse väärtuste suhtelist esinemissagedust · Statistiline rida tunnuse väärtuste järjestamata rida
Konkreetsed uurimisküsimused: mida teada tahan, millistele küssadele tahan vastust, hüpoteeside sõnastamine. Uurimismeetodid: Millised meetodid aitavad lahendada. Kvantitatiivsed meetodid- kui palju midagi esineb, arvuline, suhteliselt palju uuritavad. Kvalitatiivsed meetodid- Kuidas midagi kirjaldatakse, sõnaline, vähem uuritavad. Kombineeritud meetodid- kasut koos. Andmed.kas olemas või vaja koguda. Keda uurida: kas valim või üldkogum. Kuidas andmeid koguda: küsitlus, intervjuu, Vaatlus Andmete sisestamine ja analüüs, tulemuste esitamine ja järelduste tegemine 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed tänud juba ette või lõpus · Lihtsamad küsimused, avaküsimused
palju, siis ei kasutata sagedustabelit Seal esitatakse tunnuse väärtused (valid), nende esinemissagedus (frequence) ning protsendid (percent). Sagedustabeli järjestamiseks sagduste järgi: uus tabel: analyze/ferquences . tunnus perekonnaseis varialbel väljale ning klõpsame nupule format. Descending counts linnuke. Kui tunnusel on aga palju erinevaid väärtuseid, näiteks sissetulekud on kõikidel vastajatel tõenäoliselt erinevad, siis sagedustabel andmete kokkuvõtmiseks ei sobi. Andmestikus kultuur.sav on selliseks tunnuseks vanus. Koostades vanuse väärtustest sagedustabeli, on see liiga mahukas, et seda andmete esitamiseks kasutada. Statistics – Summarize – Frequencies Variable(s): millistest muutujatest sagedustabelit soovitakse Statistics: võimalus tellida muutuja(te) kohta statistikuid (kvartiile-min/max, keskmist, standardhälvet jne) – ainult rangelt arvandmete korral!
Statistiline representatiivsus (esinduslikkus)- eeldab väljavõtukogumi koostise vastavust üldkogumi koostisele. (eeldused: kõikidel üldkogumi liikmetel peab olema valimisse sattumiseks võrdne võimalus, üldkogumi kõikide struktuuriliste osade kajastumine valimis, valimi liikmete piisav arv). Nominaalsed tunnused- näitavad ainult seda, kas objekt kuulub mingisse kindlasse teistest erinevasse kategooriasse (rahvus, silmade värv, ilmakaar jne)- binaarne ehk dihhotoomne tunnus nt sugu. Järjestatud tunnused- väärtuste hulga sisulise järjestamise võimalus (eksamihinne, linn, riik-rahvaarvu järgi). Arvulised tunnused- mõõteskaalaks kõikide võimalike arvude hulk. Jagatakse: Pidevad arvulised tunnused- sisaldavad väga palju erinevaid väärtusi, Diskreetsed arvulised tunnused- sisaldavad väikese hulga erinevaid väärtusi (alla 10 väärtuse). Nominaal- ja järjestustunnuseid tuleb kodeerida, sest tegelikus andmeanalüüsi protsessis opereeritakse ainult arvudega
Mood- kõige sagedasem väärtus või väärtusklass Mediaan-Punt tunnuse skaalal, millest väiksemaid ja suuremaid väärtusi on variatsioonreas ühepalju. Mediaan jaotab skaala vaadeldava tunnuse seisukohalt kaheks võrdsagedaseks osaks. Kvantiilid- jagunevad alumine kvartiil- punkt, millest väiksemaid väärtusi on kogumis üks neljandik osa. Ülemine kvartiil- punkt millest suuremaid väärtusi on kogumis üks neljandik osa. Kvantiilid jagavad tunnuse väärtuste järjestatud rea teatud arvuks võrdseteks osadeks. Sagedamini kasutatavad kvantiilid on detsiilid, kvintiilid ja kvartiilid. Keskmine- õenäoliselt kõige sagedamini kasutatav näitaja statistilisel andmete analüüsis on aritmeetiline keskmine ehk keskväärtus. Selle saamiseks liidetakse kokku kõigi vastajate antud tunnuste väärtused ja jagatakse saadud summa vastajate arvuga. Tulemuseks on näitaja, mida võib käsitleda kui tüüpilist või läbilõikelist vastust vaatlusalusele küsimusele.
Leidke kõik paiknevuse karakteristikud. 1 =450 :15=30a ; Mo = 20a ; Me = xi ; i= N 1 ; i = 8 ; Me = 23. X 2 =476 : 29,7530a ; Mo = 20a ; Me= x i xi 1 i= N ; i=8 1 X 2 2 1 Me= 2324=23,5 2 Hajuvuse karakteristikud iseloomustavad tunnuse hajuvust. Variatsiooni ulatus [max min = 75 - 18 = 57 (*ülesanne 05)] Alumine ja ülemine kvartiil q ; q Dispersioon ja standarthälve Variatsiooni kordaja Alumine kvartiil on tunnuse väärtus, millest väiksemaid väärtusi on variatsioonireas 25% ja ülemine kvartiil on tunnuse väärtus, millest suuremaid väärtusi on variatsioonireas 25%. 1 N Me= x i x i1 i= =4 N = 8 2 2 1 Me= 2020=20 <- q 2 1 Me= 2729=28 <- q (*ülesanne 05) 2
Maksimaalne element, Xmax - tunnuse väärtuste hulgas suurim element. Minimaalne element, Xmin - tunnuse väärtuste hulgas väikseim väärtus. Ülemine kvartiil - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Alumine kvartiil - tunnuse väärtus, millest väiksemaid (või võrdseid) liikmeid on variatsioonireas ¼ ehk 25%. Dispersioon 2 andmetele vastav hälvete keskväärtus. Standardhälve dispersiooni ruutjuur. Andmed ühesugused dispersioon=0. Korrelatsioon - statistiline sõltuvus- ühe muutuja iga väärtusega saab seada vastavusse teise muutuja sagedusjaotuse. Korrelatsiooniväli - Koordinaattasandile kantud punktihulk, kus iga punkti x-koordinaadiks on objekti esimese tunnuse väärtus ja y-koordinaadiks sama objekti teise tunnuse väärtus. Variatsioonirida - kasvavalt või kahanevalt järjestatud tunnuse väärtuste rida.
küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2. Ettekavatsetud- vastavalt eelteadmistele valitud uuritavad 3
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
on variatsioonreas ligikaudu 1/4 ehk 25%. Ülemine kvartiil Kv - tunnuse väärtus, millest suuremaid (või võrdseid) liikmeid on variatsioonreas ligikaudu 1/4 ehk 25%. Minimaalne element xmin - vähim tunnuste väärtuste hulgas. Maksimaalne element xmax - suurim tunnuste väärtuste hulgas. Sagedustabel näitab, mitmel korral saab antud tunnus antud väärtuse . Variatsioonirida kasvavalt või kahanevalt järjestatud tunnuse väärtuse rida . Variatsioonikordaja V hajuvusmõõt, mis seisneb kogumi standardhälbe ja keskväärtuse suhtes. Korrelatsioon nähtuste vastastikune statistiline sõltuvus ehk suhe, mille tõttu muutused ühes nähtuses kutsuvad esile ka muutused teises nähtuses. Positiivne korrelatsioon ühe suuruse kasvades teine suurus samuti kasvab. Negatiivne korrelatsioon ühe suuruse kasvades teine suurus kahaneb.
iseloomustamiseks. Juhul kui rea liikmete arv on suur, tuleks rida enne moodi leidmist korrastada ning leida variantide esinemissagedused. · Mediaan ehk keskliige (reas keskel asuv). Eeldab korrastatud rida. Mediaani kasutatakse juhul , kui aritmeetilist keskmist leida ei ole võimalik. Tugevalt ebasümmeetrilise rea korral on ta tüüpilisem kui aritmeetiline keskmine. Kui reas on paaritu arv liikmeid, siis võrdub mediaan järjestatud rea asendilt keskmise liikmega, mistõttu moodi nimetatakse ka rea keskliikmeks. Kui reas on paarisarv liikmeid, siis leitakse ta järjestuses kahe keskmise liikme aritmeetilise keskmisena, mistõttu mediaan ei pruugi võrduda ühegi rea liikmega. · Kvartiil 4 võrdset osa (xmin, q1, q2 ehk mediaan, q3 ja xmax), pentiil 5 võrdset osa, sekstiil 6 võrdset osa, detsiil 10 võrdset osa, protsentiil 100 võrdset osa.
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
4. Dispersioon iseloomustab juhusliku suuruse Xi erinevust keskväärtusest, seega iseloomustab tunnuse hajuvust. Valimi dispersiooni kui üldkogumi dispersiooni hinnangu tähiseks on tavaliselt Sruut, üldkogumi dispersiooni tähiseks ruut (kasutatakse teisi tähiseid ka: var, D(X)). Seega, mida suurem on Xi väärtus võrreldes keskväärtusega, (aritmeetilise keskmisega) seda suurem on hajuvus e dispersiooni. 5. Dispersiooni meetod 6. Diskreetne arvuline tunnus omab vaid täisarvulist väärtust, n laste arv perekonnas, eesti elanike arv. 7. DurbinWatsoni test. Kasut 1. järku autokorrelatsiooni avastamiseks. Kasut.tingimused: reg.mudel sisaldab vabaliiget. Mudel ei sisalda sõltuva muutuja viitajaga liikmeid (nt Yt1, Yt2) 8. Fiktiivne muutuja (dummy) iseloomustavaid binaarseid muutujaid. Binaarne muutuja
1 Valimid ja nende moodustamine........................................................................10 3.2 Valimvaatlus ......................................................................................................11 3.2.1 Valimvaatluse tüübid ..................................................................................11 3.3 Valimvaatluse meetodid ....................................................................................11 3.3.1 Mittetõenäosuslik valim ............................................................................. 12 3.4 Tõenäosuslik valim ............................................................................................12 3.4.1 Vaatlusvead ................................................................................................ 12 3.4.2 Mitte valimi vead.........................................................................................13 3.4.3 Vaatlusvead ............................
Alustatud esmaspäev, 18. jaanuar 2021, 14.00 Olek Lõpetatud Lõpetatud esmaspäev, 18. jaanuar 2021, 14.22 Aega kulus 21 min 51 sekundit Hinne 27.25, maksimaalne 30.00 ﴾91%﴿ Tagasiside Suurepärane! Küsimus 1 Millise kujuga on uuritava tunnuse jaotus juhul, kui keskväärtus on oluliselt suurem kui mediaan? Õige Hindepunkte Valige üks: 1.00/1.00 a. Paremale kallutatud jaotus Märgi küsimus lipuga b. Vasakule kallutatud jaotus c. Sümmeetriline jaotus Küsimus 2 Millises vahemikus asub lineaarse korrelatsioonikodaja r väärtus? Õige Hindepunkte Valige üks: 1.00/1.00 a. 0 kuni 1 Märgi küsimus lipuga b