Leidsid 33 sarnast õppematerjali, mis on seotud failiga "Statistika moodle vastused". Need materjalid aitavad sul teemat sügavamalt mõista.
korrelatsioon, hüpotees, keskväärtus, normaaljaotus, valim, empiiriline, sisukas, kvartiil, standardhälve, alusindeks, ahelindeks, standardviga, nullhüpotees, anova, teststatistik, kovariatsioon, alusjuurdekasv, aheljuurdekasv, juurdekasvutempo, sesoonne, detsiil, järjestusskaala, geomeetriline, püstakus, tinglik, jaotusfunktsioon, diskreetneb. suurema informatiivsusega järjestusskaala c. kõige informatiivsem intervallskaala 2. Uuringufirma viib Eesti elanikkonna hulgas läbi tööjõu-uuringut. Vali õiged terminid, mis tähistavad toodud mõisteid. a. Eesti elanik objekt b. Uuringu teostamiseks kasutatakse intervjuusid mõõtmismeetod c. Tallinna elanikud osakogum d. need isikud, keda küsitletakse valim e. Intervjuul esitatavate küsimuste komplekt mõõtmisvahend f. Eesti elanikkond üldkogum g. inimese vanus tunnus h. need inimesed, kelle sissetulek on väiksem kui 5000 kr osakogum i. inimese sissetulek tunnus 3. Milliste vaatlustega on tegemist? a. küsimustiku täitmine veebis ankeetvaatlus b. andmete hankimine internetist dokumentaalvaatlus c
Pidev suurus - väärtused täidavad mingi vahemiku täielikult ära Jaotusseadus - Diskreetse juhusliku suuruse X jaotusseaduseks nimetatakse vastavust suuruse kõikvõimalike väärtuste xi ja nende tõenäosuste pi vahel. Jaotusfunktsioon - tõenäosus, et juhusliku suuruse X väärtus on väiksem-võrdne mingist reaalarvust x. Valem: F(x)=P(X<=x) Keskväärtus ehk oodatav väärtus - Kui juhusliku suuruse X väärtuse xi esinemise tõenäosus on pi , siis selle juhusliku suuruse keskväärtus ehk oodatav väärtus. Oodatav väärtus on otsustamisel kriteeriumiks. Valitakse see alternatiiv, mille korral oodatav väärtus on ekstremaalne. Näiteks: oodatav kasum maksimaalne,oodatav kulu minimaalne Valem: µ=E[X]= ∑ pixi Dispersioon – diskreetse juhusliku suuruse dispersioon σ^2=∑(xi-µ)^2*pi Pidev juhuslik suurus - Pideva juhusliku suuruse korral ei saa rääkida mingi üksiku konkreetse väärtuse esinemise tõenäosusest
mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang Hinnangu nihe võrdub parameetri hinnangu keskväärtuse ning parameetri tegeliku väärtuse vahega. Iseloomustab süstemaatilist viga. Nihketa hinnang – Parameetri hinnang on nihketa kui hinnangu keskväärtus võrdub parameetri tegeliku väärtusega. 8) Hinnangu efektiivsus, efektiivne hinnang: Hinnangu efektiivsus – Parameetri nihketa hinnang, kus dispersioon on väiksem on efektiivseim. Kasutatakse hinnangute võrdlemisel. Efektiivne hinnang – nihketa vähima dispersiooniga hinnang kõigi nihketa hinnangute seas. Iseloomustab hinnangute hajuvust. 9) Mõjus hinnang- Hinnang on mõjus, kui ta koondub tõenäosuse järgi parameetri tegelikuks väärtuseks
Kordamine arvestustööks 1. Üldkogum (uurimisobjekt, populatsioon) on teatud nähtuste (objektide) hulk, mida soovitakse objektiivsete meetoditega tundma õppida. 2.. Valimiks nimetatakse teatud hulka üldkogumi elemente, mille mõõtmisandmed on uurija käsutuses. Esinduslik valim. 3. Valimi mõõtmisandmed moodustavad andmestiku. Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidev võib omada väärtusi mingil lõigul. Diskreetne arvuliste tunnuste võimalike väärtuste hulk on lõplik või loenduv 5. Mittearvuline tunnus järjestustunnus, nominaaltunnus. Järjestustunnus mittearvuline tunnus, mille väärtused on järjestatavad (Krafti klass, puistu Orlovi boniteet).
● Juhuslik komponent ehk vealiige (u). 2. Andmetüübid. Ökonomeetriline mudel baseerub arvandmetel: ● Ristandmed (cross-sectional) ● Aegread (time series) ● Paneelandmed (panel data) Andmed saavad olla kas ● Kvalitatiivsed (ei saa mõõta arvudega, nt haridustase) ● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele.
aasta sügissemestri KT õppimiseks Teooria 1. Ökonomeetrilise mudeli komponendid. Endogeensed (sõltuvad Y), eksogeensed (sõltumatud, X), hinnatavad parameetrid (beeta) ja juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on
1. Üldkogum – ehk populatsiooni all mõeldakse kõiki juhtumeid või situatsioone, mille kohta uurijad soovivad, et nende poolt saadud järeldused või prognoosid kehtiksid. Valim – liikmed tuleb valida juhuslikult, st igal üldkogumi liikmel peab olema võrdne võimalus saada valitud valimisse. Valimimaht – Valimisse valitavate objektide arv. Tunnuste- all mõistetakse liikmeid kirjeldavaid erinevaid omadusi. 2. Statistilise uurimistöö etapid. Mingi probleemi statistilise uurimisel läbitakse 4 tööetappi: Uuringu ettevalmistamine Statistiline vaatlus või eksperiment Vaatlusandmete kokkuvõtte ja esialgne töötlemine
· Mõõteskaalad, keskmised (aritmeetiline, mediaan, mood), · Põhiõpik varieerumine. Gujarati, D., Basic Econometrics · Tõenäosus p(A), tinglik tõenäosus p(A|B). · 3. trükk, TTÜ raamatukogus 20 eks · Keskväärtus E(x), dispersioon 2 (x), var(x). · 4. trükk, võimalik leida pdf fail · Jaotusseadused: normaaljaotus, t-jaotus, F-jaotus, 2 jaotus. · Täiendav kirjandus Paas, T. Sissejuhatus ökonomeetriasse. Tartu, 1995. · Valimvaatlused, usalduspiirid. (TTÜ rmtk momendil saadaval 18 eks)
Standardhälve ON ALATI varieeruvas kogumis keskmisest lineaarhälbest suurem. Normaaljaotuse üks parameetritest on standardhälve ehk sigma. Mida suurem on standardhälve seda laugem (suurem) on äärmuste vahe. NORMAALJAOTUS · Jaotuse püstakuse ehk ekstessi mõõtmisel tuginetakse neljandat järku normeeritud momendile ning jaotust võrreldakse normaaljaotusega (selle neljandat järku normeeritud moment on 3). · Normaaljaotus kirjeldab tunnust, mille käitumine on normaalne. Normaaljaotus on piirjaotus, millele lähenevad paljud teised jaotused. · Normaaljaotuse üks parameetritest on standardhälve ehk sigma. · Normaaljaotuse omadused: * normaaljaotus on pidev jaotus *normaaljaotus on täielikult kirjeldatav kahe parameetriga: keskväärtusega ja dispersiooniga 2 *normaaljaotusele vastav kõver on sümmeetriline keskväärtuse suhtes * normaaljaotuse keskväärtus, mood ja mediaan ühtivad.
Kordamine arvestustööks 1. Mis on üldkogum? Üldkogumehk populatsioon huvialuste objektide hulk (lõpmatu). on objektide (nähtuste, isendite, protsesside) hulk, mille kohta soovitakse teha teaduslikult põhjendatud järeldusi 2. Mis on valim? Esinduslik valim. Valimmõõdetud objektide hulk (lõplik). on üldkogumist eraldatud objektide hulk, mille mõõtmise ja vaatlemise alusel tehakse järeldusi üldkogumi kohta. Igal üldkogumi elemendil peab olema võrdne võimalus valimisse sattumiseks Esinduslik valim -valimisse saGunud isikud peavad esindama populatsioonis esinevaid uuritavaid tunnuseid 3. Mis on andmestik? Rühmitamata ja rühmitatud andmestik. 4. Arvuline tunnus pidev, diskreetne. Pidevvõib omada väärtusi mingil lõigul.
Kvalitatiivse suuruse keskväärtuse muutumist, mis on tingitud nii kvantitatiivse teguri muutustest kui ka kvalitatiivse teguri enda muuutustest, iseloomustab Vali üks vastus. a. püsiva struktuuri indeks b. struktuurinihete indeks c. muutuva struktuuri indeks Vale Selle esituse hinded: 0/1. Question 2 Hinded: 1 Hüpoteesi statistilisel kontrollimisel võetakse vastu sisukas hüpotees, kui Vali üks vastus. a. parameetri empiiriline väärtus on suurem kui kriitiline b. parameetri empiirilise väärtuse absoluutväärtus on väiksem kui kriitilise väärtuse absoluutväärtus. c. parameetri empiirilise väärtuse absoluutväärtus on suurem kui kriitilise väärtuse absoluutväärtus; Vale Selle esituse hinded: 0/1. Question 3 Hinded: 1 Diskreetsel juhuslikul suurusel võib olla kolm väärtust : väärtus "2" tõenäosusega 0,2; väärtus "4" tõenäosusega 0,5 ja väärtus "7" tõenäosusega 0,3
Kvalitatiivse suuruse keskväärtuse muutumist, mis on tingitud nii kvantitatiivse teguri muutustest kui ka kvalitatiivse teguri enda muuutustest, iseloomustab Vali üks vastus. a. püsiva struktuuri indeks b. struktuurinihete indeks c. muutuva struktuuri indeks Vale Selle esituse hinded: 0/1. Question 2 Hinded: 1 Hüpoteesi statistilisel kontrollimisel võetakse vastu sisukas hüpotees, kui Vali üks vastus. a. parameetri empiiriline väärtus on suurem kui kriitiline b. parameetri empiirilise väärtuse absoluutväärtus on väiksem kui kriitilise väärtuse absoluutväärtus. c. parameetri empiirilise väärtuse absoluutväärtus on suurem kui kriitilise väärtuse absoluutväärtus; Vale Selle esituse hinded: 0/1. Question 3 Hinded: 1 Diskreetsel juhuslikul suurusel võib olla kolm väärtust : väärtus "2" tõenäosusega 0,2; väärtus "4" tõenäosusega 0,5 ja väärtus "7" tõenäosusega 0,3
.. 200-300 200-300 250 28 7000 38 -179,5 32220,25 ... 300-400 300-400 350 42 14700 80 -79,5 6320,25 ... 400-600 400-600 500 50 25000 130 70,5 4970,25 ... Üle 600 600-1000 800 20 16000 150 370,5 137270,3 ... Kokku 150 64425 4822025 USALDUSINTERVALLID Usaldusintervalle on vaja selleks, et hinnata valimi ja üldkogumi vastavust. Valim on juhuslik,võib esineda erinevaid tulemusi. Tehes üldistusi üldkogumile,peame veaga arvestama. Usaldusintervalle kasutataksegi selle vea hindamiseks. Keskmine esindusviga. Valimi suurenedes esindusviga väheneb. Selle leidmiseks on erinevad valemid lähtuvalt sellest, kas üldkogumi suurus on teada või ei ole.(valimi mahu võtmisel ei arvestata missing lahtrit) Piiresindusviga. Jälle kaks valemit lähtuvalt üldkogumist. Kasutatakse t-jaotuse täiendkvantiili
standardvead ei ole korrektsed ja seega ei ole korrektsed ka parameetrite hinnangute usaldusvahemikud. Fkriteeriumi hinnang ei pruugi olla õige; c) mudel võib viia uurija valedele järeldustele, kui tegemist on statistiliste hüpoteeside kontrollimisega. Kasutatakse graafilist analüüsi. Juhuslik liige ehk jääkliige ui on juhuslik suurus, mille keskväärtus ehk matemaatiline ootus on võrdne nulliga. E (ui) = 0. Kui juhuslike liikmete dispersioon pole konstantne ning tema jaotus oleneb Xst, on tegemist heteroskedestatiivsusega. Parki test kui sõltumatute muutujate ln(Xi) vastava regressioonikordaja hinnang a1 on statistiliselt olulisel määral erinev nullist, siis esialgses mudelis on heteroskedestatiivsus. 11
Loenguplaan · Seos kahe tunnuse vahel kovariatsioon korrelatsioon Harilik lineaarne · Harilik lineaarne regressioonmudel Vähimruutude meetod parameetrite hinnangute leidmiseks regressioonmudel
Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate mõningane vastastikune sõltuvus, normaaljaotusega liidetavate summa jaotus on täpselt normaaljaotus, katseandmete analüüsi kogemus paljudes valdkondades on näidanud, et suur enamus katseandmeid on hästi kirjeldatavad normaaljaotusega. Normaaljaotusel on kaks parameetrit, mis on vastava juhusliku suuruse keskväärtus ja standardhälve. Normaaljaotus on sümmeetriline. Normeeritud normaaljaotus on normaaljaotuse erijuhtum, kui keskväärtus ja standardhälve on vastavalt 0 ja 1. Tähistatakse X-N(0,1). K sigma reegel: näitab, kui suur on juhusliku suuruse normaaljaotuse korral tõenäosus sattude piirkonda keskväärtus pluss-miinus k standardhälve. Lognormaalne jaotus tekib, kui vaadeldava juhusliku suuruse logaritm on jaotunud
muutumisvahemiku sees kõik juhusliku suuruse väärtused on tekke mõttes samaväärsed. Jaotuse parameetriteks on juhusliku suuruse muutumisintervalli alumine piir a ja ülemine piir b. Eksponentjaotus (pidev) kirjeldab mingi sündmuse toimumisaja jaotust eeldusel, et sündmuse tekkimise jaoks kõik ajahetked on samaväärsed. Kasutatakse töökindlustehnikas, teenindussüsteemides jm. Jaotuse kirjeldamiseks üks parameeter lambda, mis on sündmuste voo intensiivsus/sagedus. Normaaljaotus on esmajoones seotud keskse piirteoreemiga tõenäosusteoorias. Suvalise ühesuguse jaotusega sõltumatute juhuslike suuruste summa või keskväärtuse jaotus läheneb liidetavate arvu kasvades normaaljaotusele. Seega saab juhuslike suuruste liitumisel tekkivate juhuslike suuruste jaotust vähemalt ligikaudu kirjeldada normaaljaotusega. Ei ole vaja suur liidetavate arvu, lubatav on liidetavate
küsimustele tahan vastuseid. Andmete kogumine. Enne kogumist kontrollida, ehk on andmed juba olemas ja arvestada aja- ning raharessursiga. Vaatlus: otsevaatlus, varjatud vaatlus, osalusvaatlus Eksperiment Intervjuu: struktureeritud, poolstruktureeritud või struktureerimata Küsitlus Kas uurida valimit või üldkogumit? Üldkogum ehk populatsioon. Valim on üldkogumist uurimiseks eraldatud osa, mille põhjal tehakse statistilisi järeldusi üldkogumi kohta. Valimi moodustamine: a)tõenäosuslik: 1. Lihtne juhu- nimekiri 2. Süstemaatiline juhu- nimekiri, millest iga 10. 3. Kiht- valin grupid, keda küsitlen 4. Klaster- valin kellegi grupist b) mittetõenäosuslik: 1. Mugavus- pilootuuring testina 2. Ettekavatsetud- vastavalt eelteadmistele valitud uuritavad 3
Statistika üldiseks eesmärgiks on: asjakohastest eeldustest lähtudes leida vaadeldava stohhastilise objekti kohta mingi tõenäosuslik mudel, sh hinnates mudeli arvparameetreid ja kontrollides erinevaid hüpoteese objekti mudeli kohta. Mediaani hinnang: - kasvavalt järjestatud valimi keskelement (kui valimi maht on paaritu arv) - kasvavalt järjestatud valimi keskelementide poolsumma (kui valimi maht on paarisarv) Haare: valimi suurima ja vähima elemendi vahe Statistika põhiteoreem: Empiiriline jaotusfunktsioon FN(x) on teoreetilise (üldkogumi) jaotusfunktsiooni F(x) nihutamata ja mõjus hinnang. Histogramm: Histogramm on enimkasutatav (üldkogumi) jaotustiheduse hinnang. Histogrammi kasutatakse ettekujutuse saamiseks üldkogumi jaotusseadusest ning ta kujutab endast tulpdiagrammi, mille tulpade kõrgused näitavad vastavasse vahemikku sattumise sagedust. 2-jaotus on kasutusel normaaljaotusega juhusliku suuruse dispersiooni hinnangu jaoks usaldusvahemike arvutamisel.
1. pole põhjus ega tagajärge 2. kordaja võb olla nii pos kui neg 3. vabaliikme abil saame kirjeldada seoste tugevust 4. regressiooni kordaja b abil saame kirjeldada seose tugevust Dispersioonanalüüsi eesmärk on: 1. dispersioonide leidmine 2. uuritava nähtuste tegurite mõju olulisuse hindamine Valimi andmete põhjal saadi järgmised tulemused: aritm.keskmine=80 ja standardhälve 20. Üldkogumi maht 1200. Kui suur peaks olema valim, et teha kindlaks üle 110 väärtusega elementide osakaalu üldkogumis täpsusega +/-4 ühikut, usaldatavusega 95%. 1. 1700 (üldkogum 1200) 2. 1280 (üldkogum 1200) 3. Ei saa arvutada, sest dispersioon ei ole teada (standarthälbe väärtus on olemas, tõstam ruutu saan dispersiooni, 2. Tahan teha kindlaks elementide osakaalu, ehk et kui dispersiooni ei tea, saan arvutada võttes maksimaalse dispersiooni) 4. Ei ükski eelpool toodud valikutest
vähemalt viis korda rohkem. Kvantitatiivne andmeanalüüs: · Statistilised andmetöötlusprogrammid, näiteks SPSS · Atribuudid o sõltumatu atribuut - manipuleeritav atribuut o sõltuv atribuut - see, mida mõõdetakse · Eeldused (normaaljaotus) · Andmeanalüüsid o Parameetrilised testid (peavad vastama eeldustele) o Testid muutujate vaheliste seoste leidmiseks (pideva atribuudi keskväärtuste võrdlemine) Korrelatsioon - seose tugevus kahe pideva atribuudi vahel Regressioon - millisel määral sõltumatud atribuudid mõjutavad sõltuvat atribuuti, mängitakse läbi erinevad kombinatsioonid Faktoranalüüs - lubab vähendada atribuutide arvu vähemaks hulgaks faktoriteks o Testid gruppide vaheliste erinevuste leidmiseks T-test ANOVA - kahe või enama grupi omavaheline võrdlus
3) Normaal- olulisim, ka Gaussi jaotus, seotud keskse piirteoreemiga: suvalise ühtmoodi jaotunud sõltumatute juh.su. summa v keskv jaotus läheneb liidetavate arvu kasvades norm.jaotusele. aspektid: 1)pole vaja suurt liidet. Arvu 2) lubatav mõningane vastastikune sõltuvus 3)normjaotusega liidetavate summa on normajaotus ERIJUHT: keskv=0, standrdh= 1, normeeritud normjaotus. ,,k-sigma reegel" näitab, kui suur on juh.su. P normajaotuse korral sattuda piirkonda keskväärtus + - k standardhälvet. 4)Lognormaalne: kui juh.su. logaritm on jaotunud normaaljaotuse kohaselt. Kui Y on norm.jaotuse järgi, siis X=exp Y on lognormaalse järgi. Juh. Vektor vektor, mille komponentideks juh.su. Olulised aspektid:komponentide arv ja vastastikune sõltuvus ning jaotusseadus Diskr 2-komp vektor jaotus antakse 2mõõtmelise jaotustabelina v valemina Pidev x ja y funktsioon, saab esitada jaotusfunkts v tihedus Marginaaljaotus 1 komp jaotus nö eraldi vaadatuna
Mitmese lineaarse regressioonmudeli parameetrite hindamine Parameetrite tõlgendus Standardiseeritud kordajad Mitmene regressioonmudel I ANOVA tabel F-test ja mudeli statistilise olulisuse kontroll Korrigeeritud determinatsioonikordaja Parameetrite statistilise olulisuse kontroll
nullpunkt (nt raha) o Lickerti skaalal tehtud mõõtmisi on lubatud käsitleda vajadusel pideva muutujana Jaotused (normaaljaotus, negatiivne asümmeetria, positiivne asümmeetria): Andmetöötluse alused: Valemid ja tähised n või N – juhtumite arv x – muutuja X̅ või µ – keskmine i – indekseerimistähis σ või SD – standardhälve (standard deviation) σ2 või SD2 – hajuvus Σ – summeerimine Standardhälve Näitab, kui hästi keskmine esindab mõõdetud andmeid. Muutjal on keskmine väärtus ja iga juhtum on sellest teatud kaugusel: x1- X̅ Hajuvus on keskmine ruutkaugus, seega standardhälve on nö keskmine kaugus keskmisest: Normaaljaotuse puhul paikneb kõigist mõõtetulemustest 68,27% ±1SD, 95,45% ±2SD ja 99,73% ±3SD kaugusel keskmisest.
MAINORI KÕRGKOOL Juhtimise instituut Annika Krutto ANDMEANALÜÜS SOTSIAALTEADUSTES Loengukonspekt Tartu 2009 SISUKORD SISSEJUHATUS...........................................................................................................................3 1. ANDMEANALÜÜSI põhimõisted ......................................................................................... 3 1.1 Üldkogum ja valim............................................................................................................... 3 1.2. Valimi valikumeetodid.........................................................................................................4 1.3. Mõõtmismeetod ja mõõtmisvahend ....................................................................................5 1.4. Andmetabel.....................................................................................................
Keksmised jagunevad mahukeskmised ja asendkeskmised. Mahukeskmised on rea liikmete individuaalväärtuste summa : a. ARTIMEETILINE KESKMINE b. HARMOONILINE c. GEOMEETRILINE d. RUUTKESKMINE e. KRONOLOOGILINE Asendkeskmised reageerivad ainult sellistele muutustele rea üksikliikmete väärtuses, millega kaasneb olulisis nihkeid ka rea struktuuris. MOOD MEDIAAN KVARTIIL, DESTSIIL JA TSENTRIIL 11. Mahukeskmiste majorantsus Samadest arvudest leitud eri keskmiste arvväärtused ei ole ühesugused. Sellises mittevõrdsuses avalduvat keskmiste omadust nim nende majorantsuseks. Näiteks Xharm <= Xgeom <= Xarit<=Xruut jne 12. Millal, millist mahukeksmist kasutada Lihtsat aritmeetlilist keskmist kasutatakse siis kui : I Tee kindlaks milline suurus on variant ja milline on keskmine. Variant on see suurus mille keskmist otsitakse. (teepikkus k, kiirus – variant).
2. on alati moodist suurem 3. on alati geomeetrilisest keskmisest suurem 4. normaaljaotuse puhul on moodiga võrdne 5. ei ükski Standardhälve 1. leitav dispersiooni ruuduga 2. paikneb alati vahemikus 0 ... lõpmatus 3. ei saa olla lineaarhälbest suurem 4. varieeruvas reas = 0 5. ei ükski Normaaljaotuse korral 1. puudub sümmeetria 2. st. hälve = 0 3. Mo = Me ei võrdu aritmeetilise keskmisega 4. keskväärtus on alati = 0 5. ei ükski Seos Y = 18,5 + 0,48 X 1. kirjeldab X-i mõju Y-le 2. kirjeldab seose tugevust 3. kirjeldab Y-i mõju X-le 4. on pööratav ka kujule X = 18,5 + 0,48 Y 5. ei ükski Tasandusjoon Y = 18,5 – 0,48 X 1. näitab kasvavat lineaarset tendentsi 2. parameeter b ei tohi olla negatiivne 3. vabaliige 18,5 kirjeldab joone tõusu 4. igal ajaperioodil väärtused vähenevad 0,48 korda 5. ei ükski Eksponentkeskmine
2015 plaan : • Vähendada kodutöö kirjaliku osa mahtu • Uurida ettevõtete asemel kaastudengeid • Alustame uuringu ettevalmistust kohe esimestes seminarides Kodutöö üldteema ‘innovatsioon/ õppimisvõime’ Kvantitatiivne küsimustik Kvalitatiivne case-study – intervjuud (avatud küsimused, läheb sügavuti) Kodutöös on kohustuslik leida 25 kontakti Kvantitatiivne küsimustik: statistiline analüüs, seosed kodutööti erinevad – valim 50 Kvalitatiivne intervjuu – trantskribeerimine, within-case analüüs, märksõnade leidmine. Psühholoogilised faktorid: • Values • Traits • Beliefs • Emotions • Cognitive bias Väärtused – saavutus, võim, traditsioonid Omadused – ausus, integrity Cognitive bias – tsempion, üleoptimism, tatus quo Emotisoonid – õnnelik – kurb, excited – calm, controlling - controlled Õppimisvõime: ACAP process: • Acquisition • Assimilation • Transformation • Exploitation
Teiseks on kõigi enamkasutatavate arvkarakteristikute leidmiseks MS Exceli funktsioon, näiteks AVERAGE - aritmeetiline keskmine, STDEV - standardhälbe valimhinnang, SKEW - asümmeetriakordaja jne. Kõigi nende funktsioonide argumendiks on uuritava tunnuse väärtusi sisaldav andmeblokk. Tunnuse 'Pikkus' keskväärtus leituna funktsiooni AVERAGE abil. http://www.htg.tartu.ee/~a9tp/mirror/www.eau.ee/%257Ektanel/kool_ja_too/stat_excelis/arvkar.html (1 of 5)29.05.2006 15:08:55 Andmeanalüüs MS Exceli abil - sagedustabelid Funktsiooni argumentidena on ette antud lahtrid B1-J1, mis sisaldavad uuritava tunnuse väärtusi. NB! Funktsioonide korral sisestatakse andmeblokk ilma
i 1 i x keskmine lineaarhälve d n kus n on i-ndate subjektide või objektide arv. n ¦ y y 2 i V2 i 1 x dispersioon n standardhälve V V 2 x x suhtelised variatsiooninäitajad (variatsioonikoefitsiendid variatsioon keskmise suhtes). Kui see on üle 33% siis kogum mittehomogeenne. Äkki mingid ekstreemumid välja visata? Suur variatsioon-suur mänguruum. d d V Vd Vd VV y y y yi y x standardiseeritud väärtus y ic
kirjeldatud regressioonimudeli poolt. Determinatsioonikordaja mõõdab, kui hästi regressioonisirge lähendab vaatlusandmeid. Determinatsioonikordaja väljendab regressioonimudeli poolt kirjeldatud hajuvuse (ESS) suhet modelleeritava näitaja (endogeense - sõltuva muutuja) koguhajuvusse (TSS). KOVARIATSIOONIKORDAJA Kahe muutuja vahelise seose tugevuse ja suuna kirjeldamiseks võib kasutada kovariatsioonikordajat: · muutujate X ja Y hälvete korrutiste keskväärtus · andmepaaride hälvete keskmine (murrujoone pealne osa on jagatud n-ga) iseloomustab tunnuse ühismuutuvuse (kovariatsiooni) astet Kovariatsiooni väljendav juhuslik suurus cov(X,Y) võib olla vahemikus (-, ) Kovariatsioon on : · positiivne, kui muutujate X ja Y keskmine hajumine ümber nende keskväärtuste toimub samas suunas; · negatiivne kui vastassuunas; · cov (X, Y)= 0, kui juhuslikud suurused on sõltumatud.
mediaani. 1.2. Andmete paiknemist kirjeldavad arvnäitajad. Kvartiilid - jagavad vaatlustulemused nelja võrdsesse ossa. Standardhälve – hajuvuse näitaja, mis arvestab kõiki vaatlustulemusi ning näitab kui palju üksikud tulemused erinevad keskmisest. Mida suurem on hajuvus, seda rohkem nad erinevad ning seda suurem on standardhälve. Kui kõik vaatlustulemused on ühesugused (Nt. kõik tudengid said kontrolltööl 15 palli), siis hajuvust ei ole ja standardhälve on 0. (standardhälve ei ületa tavaliselt poolt jaotuse ulatusest) 2. Kirjeldavate arvnäitajate arvutamine programmis SPSS Arvutame tunnuse koolikäidud aastate arv kohta kirjeldavad arvnäitajad. Vali Analyze/Descriptive Statistics/Frequencies... Vii tunnus kooliskäidud aastate arv Variable(s) väljale ning klpsa nupul Statistics ja vali soovitud statistikud: Andmeanalüüsi ülesanne: anda ülevaade meeste-naiste jaotumisest rahvuste lõikes. Teie ülesanded:
.................................................... 71 11.1 Korrelatsioonanalüüs ............................................................................................................ 71 11.2 Lineaarse korrelatsioonikordaja puudused ........................................................................... 72 11.3 Determinatsioonikordaja ...................................................................................................... 74 11.4 Mitmene korrelatsioon ......................................................................................................... 74 11.5 Regressioonanalüüs............................................................................................................... 75 12 Aegridade analüüs .............................................................................................................. 81 12.1 Aegrea mõiste ..............................................................................