Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Andmeanalüüsi netitest". Need materjalid aitavad sul teemat sügavamalt mõista.
reast, tudengite, tendentsi, korrektne, poisi, väited, standardhälve, vastuste, mediaani, andmeanalüüsi, netitest, kirjeldavad, reastatud, kvartal, kvartiili, mediaanid, keskväärtus, 8200, 6200, variatsioonirida9, 8, 6, 3, 5, 1, 7, 4 1, 3, 4, 5, 6, 7, 8, 9 9, 8, 7, 6, 5, 4, 3, 1 Küsimus 2 Pole veel vastatud Võimalik punktisumma 5'st Märgista küsimus Küsimuse tekst Erinevates ühikutes mõõdetud tunnuste varieerumist saab võrrelda, võrreldes ... Vali üks: dispersioone variatsiooniamplituude variatsioonikoefitsiente standardhälbeid Küsimus 3 Pole veel vastatud Võimalik punktisumma 5'st Märgista küsimus Küsimuse tekst Tudengite testitulemused olid järgmised: 45 12 21 93 36 31 28 Leia testitulemuste mediaan. NB! Kirjuta vastuseks ainult arv! Vastus: Küsimus 4 Pole veel vastatud Võimalik punktisumma 5'st Märgista küsimus Küsimuse tekst Uuritud grupi keskmine laste arv on 1,56. Millisel viisil oleks korrektne antud tulemus esitada? Vali üks või enam: Uuritud grupi keskmine laste arv on 1,56 Uuritud grupi keskmine laste arv on 1,6 Uuritud grupi keskmine laste arv on 1,5
BCU0431 STATISTIKA (PÄEVAÕPE) Started on esmaspäev, 20 veebruar 2017, 7:23 State Finished Completed on esmaspäev, 20 veebruar 2017, 8:24 Time taken 1 hour Marks 37.5/70.0 Grade 3.2 out of 6.0 ( 54 %) Question 1 Millised väited on korrektsed? Incorrect Select one or more: Mark 0.0 out of 5.0 Keskväärtus võib olla ka selline väärtus, mida reaalsete vastuste hulgas ei esine Mood on alati reaalne väärtus uuritud valimi väärtuste hulgast Mediaan on alati reaalne väärtus uuritud valimi väärtuste hulgast
Õige Hindepunkte Valige üks: 1.00/1.00 a. -1 kuni 0 b. -1 kuni 1 c. 0 kuni 1 Küsimus 15 Ühes väikses linnas on korterite hinna aritmeetiline keskmine 65 000 eurot, kuid hinna mediaan on 35 000 eurot. Kuidas on see Õige võimalik? Hindepunkte 1.00/1.00 Valige üks: a. Väike protsent väga kalleid kortereid teeb mediaani väiksemaks, kuid ei mõjuta eriti aritmeetilist keskmist. b. Väike protsent väga kalleid kortereid suurendab aritmeetilist keskmist, kuid ei mõjuta eriti mediaani. c. Rohkem kui poolte korterite hinnad on väiksemad, kui 35 000 eurot. Sinu vastus on õige. Küsimus 16 Millised väited on õiged? Osaliselt õige Hindepunkte Valige üks või mitu: 0.33/1.00 a
Tunnuste vahel on keskmine kasvav monotoonne seos. e. Tunnuste vahel on keskmine kahanev monotoonne seos. Küsimus 22 Millised järgmistest karakteristikutest on hajuvuse karakteristikud? Õige Hindepunkte Valige üks või mitu: 1.00/1.00 a. Dispersioon Märgi küsimus lipuga b. Mood c. Mediaan d. Keskväärtus e. Standardhälve Küsimus 23 Leidke järgmiste variantide seast õiged paarid: Õige Hindepunkte Tegeleb reaalsete andmete kirjeldamise, organiseerimise ning visualiseerimisega kasutades tabelid, diagrammid ja arvkarakteristikud kirjeldav statistika 1.00/1.00 Märgi
g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c. ettevõte saadab perioodiliselt andmeid statistikaametile korrespondentvaatlus d. küsitleja vestleb inimesega ja täidab vastuste põhjal küsitlusankeeti suuline vaatlus e. ülevaade ettevõtte telefoniarvetest dokumentaalvaatlus 4. Andmete kogumise meetodid on vaatlus ja eksperiment 5. Jäme mõõtmisviga, mis enamasti on põhjustatud inimlikust eksimusest, on ekse 6. Inimese vanus täisaastates on diskreetne intervallskaala. 7. Kogumi maht on kogumi elementide arv 8. Kauplusse sisenejate loendamine on otsene vaatlus. 9. Tööjõu-uuringu ankeedis oli järgmine küsimus:
harmooniline keskmine, geomeetriline keskmine, ruutkeskmine) - sõltuvad rea mahust. ASENDIKESKMISED Mediaan variatsioonrea keskmine liige. Tähis Me. Kui liikmeid on paaritu arv, siis keskmine liige. Kui liikmeid on paaris arv, siis kahe keskmise liikme aritmeetiline keskmine. Suure kogumi korral on mediaaniks statistiliste andmete 50% punkt. Mediaani kasutatakse juhul, kui andmete hulgas on ekstremaalseid väärtusi, mis oluliselt mõjutavad keskväärtust. Mood variatsioonrea kõige suurema esinemissagedusega liige. Tähis Mo Bimoodaalne - 2 moodi; multimoodaalne - rohkem moode (tegelikult mood puudub); antimodaalne - andmete reas esinevad ainult ühesuguse sagedusega tunnuse väärtused. Mood on tunnuse kõige tüüpilisem väärtus. Mood on ainus keskmine , mida
mediaani. 1.2. Andmete paiknemist kirjeldavad arvnäitajad. Kvartiilid - jagavad vaatlustulemused nelja võrdsesse ossa. Standardhälve – hajuvuse näitaja, mis arvestab kõiki vaatlustulemusi ning näitab kui palju üksikud tulemused erinevad keskmisest. Mida suurem on hajuvus, seda rohkem nad erinevad ning seda suurem on standardhälve. Kui kõik vaatlustulemused on ühesugused (Nt. kõik tudengid said kontrolltööl 15 palli), siis hajuvust ei ole ja standardhälve on 0. (standardhälve ei ületa tavaliselt poolt jaotuse ulatusest) 2. Kirjeldavate arvnäitajate arvutamine programmis SPSS Arvutame tunnuse koolikäidud aastate arv kohta kirjeldavad arvnäitajad. Vali Analyze/Descriptive Statistics/Frequencies... Vii tunnus kooliskäidud aastate arv Variable(s) väljale ning klpsa nupul Statistics ja vali soovitud statistikud: Andmeanalüüsi ülesanne: anda ülevaade meeste-naiste jaotumisest rahvuste lõikes. Teie ülesanded:
Hindepunkte 1.00/1.00 väärtused. väiksemad Kahe tunnuste vahel on kahanev seos, kui ühe tunnuse suurematele väärtustele vastavad teise tunnuse väärtused. Küsimus 2 Millised väited käivad pildil esitatud jaotuse kohta? Õige Hindepunkte 1.00/1.00 Valige üks või mitu: a. Jaotuse asümmeetriakordaja on positiivne b. Jaotuse asümmeetriakordaja on negatiivne c. Jaotuse asümmeetria- ja ekstsessi (järsakuse) kordajad võrduvad nulliga d. Jaotuse ekstsessi (järsakuse) kordaja on positiivne e
vahe. Ei anna varieerumisest täielikku pilti, sest sõltub ainult kahest äärmisest väärtusest Keskmine absoluuthälve - Dispersioon - Hälvete ruutude aritmeetiline keskmine on dispersion. Puudus - ühikuks on tunnuse X ühik ruudus. Standardhälve - ruutjuur dispersioonist. Standardhälbe ühik on sama, mis tunnusel X Variatsioonikordaja on standardhälbe ja aritmeetilise keskmise suhe: Esitatakse tavaliselt protsentides. Näitab, mitu protsenti moodustab standardhälve aritmeetilisest keskmisest. Standardiseeritud väärtus näitab, mitmekordse standardhälbe σ kaugusel aritmeetilisest keskmisest asub vaadeldav väärtus xi Assümeetria - Asümmeetria on jaotuskõvera maksimumi kõrvalekaldumine sümmeetriateljest. Kui jaotuskõvera maksimum (mood) on sümmeetriateljest (mediaan) paremal pool, on tegemist on negatiivse ehk vasakkaldelise asümmeetriaga. Kui maksimum on sümmeetriateljest vasakul, on tegemist positiivse ehk paremkaldelise asümmeetriaga
4 2 0 4 3 0 1 3 1 0 1 4 0 1 2 0 3 0 4 5 0 1 1 3 3 2 3 4 5 0 2 0 1 5 0 3 4 1 1 2 4 2 2 2 2 3 ÜLESANNE Sagedustabel Mitmesugustest uuringutest kokkuvõtete tegemiseks kasutatakse tihti sagedustabeleid. 68 inimest vastasid mitmest küsimusest koosnevale ankeedile. Vastusevariandid olid ette antud. Esimese kahe küsimuse vastused on toodud veergudes J ja K. Küsimuse 1 vastusevariante oli kuus ja vastav sagedustabel on toodud allpool. ÜLESANNE: koosta samasugune sagedustabel küsimuse 2 vastuste kohta. Küsimuse 1 vastuste jaotus Antud vastusevariandi sageduse leidmiseks Vastusevariant Sagedus Suhteline sagedus kasutatakse funktsiooni COUNTIF Range andmetega lahtrite piirkond 1 13 19,1% Criteria lahter, kus asub väärtus, mille 2 15 22,1% esinemissagedust soovitakse leida.
Valimi valikumeetodid jagatakse kaheks, tõenäosuslikud ja empiirilised valikud: · Tõenäosuslikud valikud eeldavad, et iga üldkogumi indiviidi kohta on teada tema valimisse sattusime tõenäosus. Tõenäosuslik valik eeldab loendi olemasolu (N on teada), millest uurija mingi valikueeskirja alusel kaasab uuritavad. · Lihtne juhuvalik tähendab, et igal üldkogumi indiviidil on võrdne võimalus valimisse sattuda, vastav lihtsaim korrektne valikumeetod on süstemaatiline juhuslik valik mingist registrist, näiteks äriregistrist iga 100. ettevõtte, telefoniraamatust iga 50. elanik jm. Teine sobiv lahendus on valitavate objektide järjekorranumbri määramine juhuslike arvude genereerimisega. Tõenäosuslike valikute probleemiks on üldkogumi jaoks registri olemasolu ja sellele juurdepääs ning seejärel valitud objektidega koostöö saavutamine.
täpselt kaks korda tugevam hinde "2" saanust. Järjestuskaalas mõõdetud suurustega võib teha tehteid, mis ei muuda tunnuse väärtuste järjekorda. Näiteks numbriliste väärtuste asendamine tähestiku järjekorras tähtedega, logaritmimine, ruutu tõstmine.Ei tohi liita ja lahutada, leida aritmeetilist keskmist vms. 3. Intervallskaala (scale). Skaalajaotuse intervallid on täpselt ühepikkused. Näiteks inimese vanus, testimisel saadud õigete vastuste arv, ülesande lahendamiseks kulunud aeg, pulsi sagedus, töötajate arv. Intervallskaalad jagunevad veel kaheks: 5 · vahemikskaala - nullpunkti asukoht on kokkuleppeline (Celsiuse skaala temperatuuri mõõtmiseks, aeg). Võib leida vahesid, ei tohi leida suhteid. · suhteskaala - nullpunkt on fikseeritud absoluutselt (pikkus, kaal). Intervallskaala võib olla a) diskreetne, b) pidev.
Lineaarne regressioonimudelil: 1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi eesmärk on: 1. dispersioonide leidmine 2. uuritava nähtuste tegurite mõju olulisuse hindamine Valimi andmete põhjal saadi järgmised tulemused: aritm.keskmine=80 ja standardhälve 20. Üldkogumi maht 1200. Kui suur peaks olema valim, et teha kindlaks üle 110 väärtusega elementide osakaalu üldkogumis täpsusega +/-4 ühikut, usaldatavusega 95%. 1. 1700 (üldkogum 1200) 2. 1280 (üldkogum 1200) 3. Ei saa arvutada, sest dispersioon ei ole teada (standarthälbe väärtus on olemas, tõstam ruutu saan dispersiooni, 2. Tahan teha kindlaks elementide osakaalu, ehk et kui dispersiooni ei tea, saan arvutada võttes maksimaalse dispersiooni)
ajalõigud on võrdsed. Geomeetriline keskmine – kasutatakse siis, kui tunnuse väärtuseks on kordarvud, millest iga järgnev näitab seda, mitu korda on ta eelmisest suurem. 6) Mediaan – korrastatud statistilise rea keskliige (50% liimetest väiksemad ja 50% n 1 2 suuremad). Kui reas on n liiget, siis mediaani järjekorra number on . Kui n on paaritu, siis mediaan on rea konkreetne element, millest kummalegi poole jääb võrdne arv elemente. Kui n on paarisarv, siis mediaan on kahe keskmise liikme poolsumma. Kvartiilid – jagavad statistilise rea neljaks osaks, milles igas on võrdne arv liikmeid. Esimene kvartiil on mediaan rea esimesest poolest; teine on mediaan; kolmas on mediaan rea teisest poolest. Detsiilid – jaotavad statistilise rea kümneks osaks (D1,D2…, D9).
4. varieeruvas reas = 0 5. ei ükski Normaaljaotuse korral 1. puudub sümmeetria 2. st. hälve = 0 3. Mo = Me ei võrdu aritmeetilise keskmisega 4. keskväärtus on alati = 0 5. ei ükski Seos Y = 18,5 + 0,48 X 1. kirjeldab X-i mõju Y-le 2. kirjeldab seose tugevust 3. kirjeldab Y-i mõju X-le 4. on pööratav ka kujule X = 18,5 + 0,48 Y 5. ei ükski Tasandusjoon Y = 18,5 – 0,48 X 1. näitab kasvavat lineaarset tendentsi 2. parameeter b ei tohi olla negatiivne 3. vabaliige 18,5 kirjeldab joone tõusu 4. igal ajaperioodil väärtused vähenevad 0,48 korda 5. ei ükski Eksponentkeskmine 1. kasutatakse keskmise kasvutempo leidmisel 2. ei arvesta rea kõiki väärtusi 3. on alati aritmeetilisest suurem 4. kasutatakse aegrea tasandamisel 5. ei ükski Keskmine esindusviga 1. on vale keskmise valiku tulemus 2. on väljavõtukeskmiste lineaarhälve
olnud: 60+120/2=90 km/h · Mood ehk dominant (domineeriv e kõige sagedasem näitaja). Intervallrea moodi hinnatakse graafiliselt. Mood sobib ka järje- ja nimeskaalas mõõdetud tunnuste iseloomustamiseks. Juhul kui rea liikmete arv on suur, tuleks rida enne moodi leidmist korrastada ning leida variantide esinemissagedused. · Mediaan ehk keskliige (reas keskel asuv). Eeldab korrastatud rida. Mediaani kasutatakse juhul , kui aritmeetilist keskmist leida ei ole võimalik. Tugevalt ebasümmeetrilise rea korral on ta tüüpilisem kui aritmeetiline keskmine. Kui reas on paaritu arv liikmeid, siis võrdub mediaan järjestatud rea asendilt keskmise liikmega, mistõttu moodi nimetatakse ka rea keskliikmeks. Kui reas on paarisarv liikmeid, siis leitakse ta järjestuses kahe keskmise liikme aritmeetilise keskmisena, mistõttu mediaan ei pruugi võrduda ühegi rea liikmega.
Asendikarakteristikud(annavad infot selle kohta, kuidas tunnuse väärtus paikneb). Need on aritmeetiline keskmine, mediaan ja mood. Nende välja arvutamine oleneb sellest, pas meil on tegu pidevate(mingi vahemik) või diskreetsete(1 väärtus) andmetega. Hajuvuskarakteristikud(kui erinevad on väärtused valimi erinevatelobjektidel).Nende eesmärgiks on mõõta andmete varieeruvust andmekogumis(iseloomustavad tunnuse üksikväärtuseerinevust keskmisest) Need on dispersioon ja standardhälve. ASENDIKARAKTERISTIKUTE ARVUTAMINE 1.1. Tabuleerimata(rühmitamata) diskreetsed andmed Keskmine- näiteks KOKKU TOOTEID/NENDES ESINENUD VIGADE ARV. Näitetabelis= 2190/1500=1,46 viga on keskmiselt. X= / Mediaan- kasutatakse kumulatiivset sagedust. Me=(n+1)/2. Mediaan näitetabelis on 750,5, sellele vastav vigade arv on 1. Samamoodi arvutatakse teisi kvartiile. Mood- kõige sagedasem suurus. Näitetabelis on kõige rohkem(440 korda) 0 viga. Mood on 0.
Millised on alternatiivid kvantitatiivsetele meetoditele. Kvalitatiivsed ja kombineeritud meetodid. Kvantitatiivsed meetodid- kui palju midagi esineb, seoste analüüsimine, hüpoteeside testimine; arvuline; suhteliselt palju uuritavaid Kvalitatiivne- kuidas midagi kirjeldatakse, tihti uuritakse arvamusi, hoiakuid; sõnaline; vähem uuritavaid 2) Ankeedi koostamine: mida tuleks silmas pidada hea ankeedi koostamisel; küsimuste tüübid, vastuste tüübid. Ankeedi struktuur · Sissejuhatus: miks uurimust tehakse, anonüümsus, võimalik tasu, tulemuste esitus, kontaktandmed tänud juba ette või lõpus · Lihtsamad küsimused, avaküsimused · Keerulisemad küsimused, põhiküsimused · Sotsiaal-demograafiline osa (sugu, vanus) · Lõpuosa, tänusõnad Avatud küsimused vastaja vastab oma sõnadega · Hea intervjuudes
funktsionaale, millega opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus on juhusliku suuruse asendikarakteristik, mille abil iseloomustatakse juhusliku suuruse jaotuse keskkoha/tsentri asukohta. Keskväärtuse geomeetriline tõlgendus: jaotuse raskuskeskme projektsioon x-teljele. Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile nim detsiilideks, 25%kordseid protsentiile nim kvartiilideks, 50% korral mediaaniks. Mediaan on
Likerti skaala ● suhtumisi ja arvamusi uuriva küsimustiku skaala, mis määrab ära teatud väitega nõustumise astme (nt täiesti nõus, pigem nõus, ei ole nõus). Summeeritud hinnangute skaala ehk Likerti skaala – hoiakute mõõtmisel kasutatav skaala, mis koosneb väidetest, millest igaüht hinnatakse positiivselt ja negatiivselt orienteeritud mitmepunktilisel (kõige sagedamini 5-punktilisel) skaalal; saadud hinnangud summeeritakse 4. Andmete kirjeldamise viisid: jaotus; tsentraalse tendentsi karakteristikud; variatiivsus; korrelatsioon Normaaljaotus - Praktiline väärtus on normaaljaotuskõvera eri piirkondade protsentuaalse suuruse ja standardhälbe ühikute vahelisel seose teadmisel. Kujutame histogrammina ehk tulpdiagrammina. Normaaljaotus on väga paljudele psühhol. omadustele iseloomulik. Tsenteraalse tendentsi karakteristikud: Näitab skooride keskmist suurust erinevatel viisidel. Need on mood, mediaan ja aritmeetiline keskmine. Mood - kõige sagedasem väärtus
opereerimine/arvutused on enamasti lihtsamad kui kogu jaotusseadusega opereerimine. Juhusliku suuruse arvkarakteristikuid võib jagada: moment ja mittemomentkarakteristikud, asendi-,hajuvus- ja kujukarakteristikud, kvantiilkarakteristikud. Keskväärtus(asendikarakteristik) iseloomustab juhusliku suuruse jaotuse keskkoha asukohta. Keskväärtuse geomeetriline tõlgendus: jaotus raskuskeskme projektsioon x-teljele Dispersioon ja standardhälve on arvkarakteristikud juhusliku suuruse hajuvuse iseloomustamiseks keskväärtuse suhtes. dispersioon on standardhälve ruudus ja standardhälve on vastavalt dispersiooni ruutjuur. Juhusliku suuruse p-kvantiil xp on selline juhusliku suuruse väärtus, millest vasakule jäävale jaotuse osale vastab tõenäosus p. Kvantiile nim ka protsentiilideks, siis tõenäosus p väljendatakse protsentides. 10% kordseid protsentiile
rahvastiku vahelist seost. Rahvastiku sookoostist ehk soojaotust kui tõenäoliselt esineb patsiendil uuritav haigus või seisund. Ei anna karpdiagramm. Üksikute äärmuslikke vaatsluste korral kasutame iseloomustatakse tavaliselt suhtarvuga, mis näitab ühe sugupoole tulemuseks kindlat diagnoosi, vaid ainult tõenäosuse, et testitav põeb mediaani. esindajate arvu vastassugupoole esindajate arvu kohta. Muude uuritavat haigust. Milleks diagnostilised testid? *Diagnoosimiseks rahvastikku iseloomustavate tunnuste hulka kuuluvad veel olukorras, kus täpsed meetodid puuduvad, on liiga kallid või kodakondsus, etniline ja rassiline kuuluvus, jaotamine haridustaseme, aeganõudvad. *Nn sõeluuringu e skriiningu eesmärkidel: leida Dispersioon s2
väärtus. Valitakse variatsioonirea keskelt meelevaldne arv a. Intervalli pikkus on k. b= beeta2-beeta1/ sageduste summa *k X= a+b protsenti 15. mediaan ja tema kasutusala mediaan on korrastatud statistilise rea keskmise liige, millest mõlemale poole jääb võrdne arv liikmeid. Kui reas on paaritu arn nubreid nt 9, siis mediaan on viies arv, sest mõlemale poole teda jääb neli arvu. Kui on aga paaris arv reas, siis liidetakse kask keskmist arvu kokku ja jagatakse kahega. Mediaani kasutatakse mitmesuguste teeninduspunktide, autobusside-,trammi-,trollipeatuste jms asukohtade planeerimisel, sest variantide individuaalväärtuste ja n´mediaani vaheliste hälvete absoluutväärtuste summa on väikseim. 16. mood ja tema kasutusala Mood on satatistilise rea kõige sagedamini korduv arvväärtus. Lihtsas arvreas on see silmaga näha, ilma et oleks vaja arvutusi teha. Intervallitud variatsioonireas leitakse mood , aga
3. Mediaan (median) • Jaotuse keskmine liige, millest mõlemale poole jääb võrdne arv elemente. • Mediaan jaotab järjestatud statistilise rea kaheks • Paarituarvulise rea korral on mediaan järjestatud rea keskmine liige • Paarisarvulise rea korral leitakse mediaan kahe keskmise liikme aritmeetilise keskmisena Variatsiooninäitarvud • Variatsioonnäitarvud iseloomustavad uuritava suuruse varieerumist ehk hajuvust. • Dispersioon ehk keskmine ruuthälve • Standardhälve ehk ruutkeskmine hälve on ruutjuur dispersioonist (realiikmetega samades ühikutes) • Standardhälbe kaudu iseloomustatakse tunnuse väärtuse hajuvust keskmise väärtuse suhtes • Mida suuremad on dispersioon ja standardhälve, seda suurem on tunnuste väärtuste hajuvus • Mida suurem on hajuvus, seda moonutatum on ka aritmeetiline keskmine Nähtustevahelised seosed: • Seosed – ühtede objektide olemasolu, puudumine või muutumine on teiste objektide olemasolu,
· Mittearvulisi tunnuseid on vahel otstarbekas arvuliseks kodeerida (nt 1 vastab nõrgale valule) 2. ANDMETE KIRJELDAMINE andmeid saab kirjeldada arvuliselt ja graafiliselt. · Sagedustabel kirjeldab ühte olulist valimi omadust valimi jaotust. Mittearvulised või diskreetsed tunnused. Loed kokku mitu korda mingit väärtust esineb ja esitad sagedustabelis. Saad leida väärtuste esinemise suhtelised sagedused e osakaalud (arvutatakse vastava osakaalu ja vastuste koguarvu jagatsena). Pidevad tunnused? suurema informatiivsuse saavutamiseks jagatakse tunnuse võimalikud väärtused intervalidesse. Tehakse sagedustabeli intervallidest, kus näidatakse mitu väärtust valimis langeb ühte või teise intervalli. Intervallide arv ei tohi olla liiga suur! Saadakse histogramm pideva tunnuse jaotumise kirjeldamiseks (järjestikuste tulpade vahele vahesid ei jäeta). · Suhteline sagedus · Protsent · Keskmine vt valemit
koefitsient on nimetu suurus, ta on võrreldav mistahes teise nähtuse kohta arvutatud variats.koef.ga. Dispersioon – selle arvutamisel tõstetakse individuaalväärtused ja nende aritmeetiliste keskmiste vahelised hälved ruutu. See omadus ongi teinud disp. Kõige rohkem kasutatava variatsiooninäitarvu. Puuduseks on see, et tema mõõtühikuks on variandi mõõtühiku ruut. Nimetatud puudusest ülesaamiseks kasutatakse standardhälvet, mis on ruutjuur dispersioonist. Standardhälve on alati samades mõõtühikutes, milles variandidki. Variatsioonikoefitsienti standardhälve järgi kasutatakse siis kui on vaja võrrelda niisuguste tunnuste hajuvust, mis on mõõdetud erinevates mõõtühikutes. Nt mis varieerub rohkem, kas inimese pikkus v kaal. 9. Asümmeetria koefitsient (asümmeetria kordaja) – vasakkaldeline siis on väiksema väärtusega variante rohkem. Paremkaldeline siis on suurema väärtusega variante rohkem.
Antud aruande andmestik koosnes sellistest andmetest nagu üliõpilaste sugu, matemaatika keskkooli hinne, eriala, kood, matemaatika riigieksamieksami tulemus, matemaatika testi tulemus. Analüüs on koostatud 2000, 2002, 2003 ja 2008 aasta andmete põhjal. Matemaatika andmestiku analüüsi koostamiseks kasutati erinevaid analüüsimise meetodeid. Tunnuste esmaanalüüsis hinnati igat tunnust eraldi. Leiti tunnuste maksimaalne ja minimaalne väärtus, keskmine, mood, mediaan, standardhälve. Otsustati ka kas tunnus läheneb normaaljaotusele. Seoste analüüsist saadi teada, et matemaatika eksami tulemus sõltub keskkooli hindest ja aastast ning ei sõltu eksami kirjutaja soost. Samuti saadi teada ka, et eksamitulemus ja valitud eriala ülikoolis on omavahel sõltumatud. Uuriti ka matemaatika testi tulemuste sõltuvust ning saadi teada, et testi tulemus ei sõltu testi tegija soost, kuid sõltub aastast ning eksamitulemusest. Samas leiti ka, et 2002. ja 2003
Andmeanalüüs MS Exceli abil Andmeanalüüs MS Exceli abil Järgnev õpetus püüab võimalikult 'puust ja punaselt' ette näidata elementaarse andmeanalüüsi teostamise võimalused MS Excelis. Samas ei ole see materjal mõeldud matemaatilise statistika konspektiks, vastavad teadmised/materjalid eeldatakse kasutajal enesel olemas olevat. Seetõttu pole ka eriti tegeletud konkreetsete näidetega ega tulemuste tõlgendamisega.
nullpunkt (nt raha) o Lickerti skaalal tehtud mõõtmisi on lubatud käsitleda vajadusel pideva muutujana Jaotused (normaaljaotus, negatiivne asümmeetria, positiivne asümmeetria): Andmetöötluse alused: Valemid ja tähised n või N – juhtumite arv x – muutuja X̅ või µ – keskmine i – indekseerimistähis σ või SD – standardhälve (standard deviation) σ2 või SD2 – hajuvus Σ – summeerimine Standardhälve Näitab, kui hästi keskmine esindab mõõdetud andmeid. Muutjal on keskmine väärtus ja iga juhtum on sellest teatud kaugusel: x1- X̅ Hajuvus on keskmine ruutkaugus, seega standardhälve on nö keskmine kaugus keskmisest: Normaaljaotuse puhul paikneb kõigist mõõtetulemustest 68,27% ±1SD, 95,45% ±2SD ja 99,73% ±3SD kaugusel keskmisest.
kvantitatiivsest ja kvalitatiivsest metoodikast. Andmete kogumisest rääkides eelistan sõnapaarile kvantitatiivne kvalitatiivne kasutada sisult konkreetsemaid märksõnu: struktureeritud ja struktureerimata andmekogumise instrumendid ja/või andmed. Struktureeritud instrumendi tüüpilise näitena võib ette kujutada üht tavapärast ankeeti, kus vastajale on ette antud nii küsimused kui ka võimalikud vastuste variandid, mille hulgast ta vastavalt juhendile sobiva(d) välja peab valima; struktureerimata andmekogumise tüüpilise näitena võib ette kujutada avatud intervjuud, mis sarnaneb vabale vestlusele, kus intervjueerija ei esita konkreetseid lühivastust eeldavaid küsimusi, vaid suunab intervjueeritavat teatud teemadest rääkima, esitab kuuldu põhjal täpsustavaid küsimusi ning julgustab teda oma mõtteid põhjalikult lahti seletama ja põhjendama. Loomulikult võib ette
kvantitatiivsest ja kvalitatiivsest metoodikast. Andmete kogumisest rääkides eelistan sõnapaarile kvantitatiivne – kvalitatiivne kasutada sisult konkreetsemaid märksõnu: struktureeritud ja struktureerimata andmekogumise instrumendid ja/või andmed. Struktureeritud instrumendi tüüpilise näitena võib ette kujutada üht tavapärast ankeeti, kus vastajale on ette antud nii küsimused kui ka võimalikud vastuste variandid, mille hulgast ta vastavalt juhendile sobiva(d) välja peab valima; struktureerimata andmekogumise tüüpilise näitena võib ette kujutada avatud intervjuud, mis sarnaneb vabale vestlusele, kus intervjueerija ei esita konkreetseid lühivastust eeldavaid küsimusi, vaid suunab intervjueeritavat teatud teemadest rääkima, esitab kuuldu põhjal täpsustavaid küsimusi ning julgustab teda oma mõtteid põhjalikult lahti seletama ja põhjendama. Loomulikult võib ette
kvantitatiivsest ja kvalitatiivsest metoodikast. Andmete kogumisest rääkides eelistan sõnapaarile kvantitatiivne – kvalitatiivne kasutada sisult konkreetsemaid märksõnu: struktureeritud ja struktureerimata andmekogumise instrumendid ja/või andmed. Struktureeritud instrumendi tüüpilise näitena võib ette kujutada üht tavapärast ankeeti, kus vastajale on ette antud nii küsimused kui ka võimalikud vastuste variandid, mille hulgast ta vastavalt juhendile sobiva(d) välja peab valima; struktureerimata andmekogumise tüüpilise näitena võib ette kujutada avatud intervjuud, mis sarnaneb vabale vestlusele, kus intervjueerija ei esita konkreetseid lühivastust eeldavaid küsimusi, vaid suunab intervjueeritavat teatud teemadest rääkima, esitab kuuldu põhjal täpsustavaid küsimusi ning julgustab teda oma mõtteid põhjalikult lahti seletama ja põhjendama. Loomulikult võib ette kujutada ka
Mainori Kõrgkool Matemaatika ja statistika Loengukonspekt Silver Toompalu, MSc 2008/2009 1 Matemaatika ja statistika 2008/2009 Sisukord 1 Mudelid majanduses ............................................................................................................. 4 1.1 Mudeli mõiste ......................................................................................................................... 4 1.2 Matemaatilise mudeli struktuur ja sisu ................................................................................... 4 2 Funktsioonid ja nende algebra............................................................................................... 5 2.1 Funktsionaalne sõltuvus ....................................