TALLINNA TEHNIKAÜLIKOOL Majandusteaduskond Rahvamajanduse instituut Statistika ja ökonomeetria õppetool Birgit Aavik ANDMEKOGUMITE KIRJELDAMINE Kodune töö nr 1 õppeaines statistika Juhendaja: lektor Jelena Hartsenko Tallinn 2009 1.Sissejuhatus Oma andmekogumite jaoks olen võtnud andmed Statistika ameti kodulehelt. Esimene andmekogu kujutab endast Meeste ja naiste abielusid aastatel 1978- 2007. Teine andmekogu kujutab elussündisid samuti aastatel 1978-2007. Võtsin huvi pärast just sellised andmed, kuigi ega nad üksteisest täiesti ei sõltu, on siiski huvitav võrrelda abielusid ja elussünde (lapsesaamisi). Eelnimetatud andmete põhjal leidsin keskmised, , jaotuse kuju iseloomustavad näitarvud, sagedusklassid ning
mitte. Nt turuuuring, ankeedid, laevade tööaeg c)Monograafiline vaatlus - see tähendab, et uuritakse üht tüüpilist elementi. Nt bioloogias, meditsiinis, puuviljakasvatuses (nt mingit ploomisorti vms) 4. Andmete hankimise viisi järgi a)Otsene ehk visuaalne vaatlus. Nt vahetu loendamine, mõõtmine, jne b)Dokumentaalvaatlus dokumentide ja andmekogumite, baasil tehtavad uuringud c)Küsitlused need on isiklikud andmed või arvamused. 1)suulised küsitlused(intervjuud) ja need peavad olema enne ette valmistatud. 2) Isevastatavad küsitlused ankeedid 5. Korrespondentvaatlus nt ilmavaatlus Vaatluste tulemused on seda täpsemad, mida suurem on vaadeldav kogu või väljavõte kogumist (valim)
eesmärk. Sellest lähtuvalt vali sobiv graafik. 2. Mõtle telje ulatuse ja ühikute peale. Mis on sinu andmete väikseim ja suurim väärtus? Kas teljed on lineaarsed? Kas peaksid telge alustama nullist või kui ei, siis kas muust punktist alustamine moonutab joonisel kujutatut? 3. Vali esitluselemendid. Näiteks kui kasutad sektordiagrammi, vali sektorite värvid ja varjustus. Otsusta, mis sümboleid andmekogumite tähistamiseks kasutada. Jooniste koostamine · Joonisel on number ja allkiri (joonise all) (NT Joonis 1. Pühajõe aastase vooluhulga jaotvus) · Allkirja, graafikule või selle alla tuleb kirjutada sümbolite tähendus · Joonisel võiks olla ka lühiteave andmete kohta, mis aitavad lugejal joonist mõista ilma teksti muid jaotusi vaatamata. Selle asja ajavad ära ka sümbolid, mis on lahti seletatud
Kui kogumi liikmetel ühe ja sama tunnuse arvväärtused erinevad siis tema väärtus varieerub. Variatsiooninäitarv- iseloomustab kogumi üksikliikmete kõrvalekaldumist kesktasemest. Jagunevad: absoluutsed näitajad- seotud mõõtmisdimensiooniga ning seetõttu võimaldavad võrrelda vaid sarnastes mõõtühikutes mõõdetud andmehulki. Suhtelised näitajad arvutatakse kas osatähtsustena või protsentuaalselt ning nad võimaldavad võrdlusi ka erinevates mõõtühikutes väljendatud andmekogumite puhul. Dispersioon ehk keskmine ruuthälve- on variantide individuaalväärtuste ja nende aritmeetiliste keskmiste vaheliste hälvete ruutkeskmine. Dispersiooni tõlgendusraskused on hõlpsasti ületatavad dispersioonist ruutjuure leidmise teel. Dispersiooni ruuthälve annab standardhälbe ehk keskmise ruuthälbe s. Kõige lihtsamini mõistetavamaks ja hajuvuskarekteristikuks on variatsiooniamplituud, mis näitab andmete varieeruvuse ulatust ja sõltub ainult
väliste võrkude jaoks. Kuidas GPRS toimib GSM puhul tähendas üks kõne (või üks GSM Data ühendus) ühte hõivatud kanalit. GPRS võimaldab rohkem kanaleid hõivata, seetõttu saavutataksegi suurem andme-edastuskiirus. Kanalite paremaks ära kasutamiseks on 4 erinevat kodeerimisviisi (vastavalt CS-1 9,05; CS-2 13,4; CS-3 15,6 ja CS-4 21,4 kbps ühe kõnekanali kohta). Märkused suurem edastuskiirus avaldub eelkõige just suurte ühes tükis andmekogumite edastamisel, nagu näiteks failitransport. Juhul, kui edastatav info on paljudes pisikestes tükki-des (nagu näiteks veebileht) ei pruugi efektiivne edastuskiirus sama suureks kujuneda kui oodatud. Telefonid GPRS vajab kasutamiseks uusi telefone, mis jagatakse toetatud kommunikatsiooniliikide järgi kolmeks. A-klass toetabsamaaegselt nii pakett- kui ka kanalkommutatsiooni (saab korraga nii andmeid edastada kui rääkida). B-Klass Toetab pakett- ja kanalkommutatsiooni aga
2000, Windows 98 ei ole, ega see võiks pakkuda Desktop Update. Indekseerimine on ka integreeritud operatsioonisüsteem ja sisseehitatud Explorer otsingupaneel lubab otsida oma andmebaasis indekseeritud faile. NTFS Microsoft väljastas NTFS versiooni 3.0 (mõnikord ekslikult kutsutud NTFS 5 seoses tuuma versiooni numberiga) osana Windows 2000s, see kehtestab kettakvoodi, faili-süsteemi tasemel krüpteerimist, säästa faile ja sõelumispunkte. Sõelumispunktid võimaldavad tõhusat andmekogumite ladustamist, mis on väga suur, aga sisaldavad veel palju valdkondi, mis on ainult nullid. Sõelumispunktid võimaldavad objektijuhtil uuendada faili nime leidmist ja lasta failisüsteemi draiverid rakendada muudatused. Sõelumispunktide rakendamiseks kasutatakse mahu haakepunktite, ristmikuid, hierarhilist Storage Managementi. Failikrüptimissüsteem Failikrüptimissüsteem (EFS) tutvustas tugevat failisüsteemi tasemel krüpteerimist Windowsile. See
ümber, siis saadakse suhteliselt väikesed variatsiooninäitarvude väärtused, kui aga andmed on hajutatud, on tulemuseks suhteliselt suured väärtused. Vatiatsiooninäitarvud jagunevad: absoluutseteks(on seotud mõõtmisdimensiooniga ja õimaldab võrrelda ainult sarnastes mõõtühikutes mõõdetud andmehulik.) ja suhtelisteks(arvutatakse osatähtsustena või protsentuaalselt ja võimaldavad võrdlemist ka erinevate mõõtühikutes väljendatud andmekogumite puhul). 18. Alternatiivsel tunnusel saab olla tema tema väärtusarvu piires ainult kaks väärtust. Alternatiivse tunnuse arit keskmine = p Alternatiivse tunnuse dispersioon s2=p(1-p) 19. Dispersioonide liitmise lause. Jagame rühma tunnuste järgi, võtame neist eraldi keskmised. Üldkeskmine leitakse liites üksikud keskmiste ja liikmete arvu korrutise ja jagades liikmete arvu summaga.
microsoft.com); StarOffice (www.stardivision.com) Tüüpilisteks kontorirakendusteks on: Tekstitöötlus kõikvõimalike tekstide ja dokumentide loomiseks ja muutmiseks; tabelarvutus arvandmete töötlemiseks, nendevaheliste seoste mõju hindamiseks ja arvnäitajate graafiliseks esitamiseks; esitlusgraafika esitluste ettevalmistamiseks ja nende presenteerimiseks; graafikavahendid pildilise informatsiooni ja skeemide töötlemiseks; andmebaasid lihtsamate andmekogumite loomiseks ja andmete töötlemisega seotud protseduuride realiseerimiseks. Lisaväärtus. Kontorilahenduste kasutamise efekt on seotud dokumentide loomisele, nende muutmisele ja täiendamisele kuluva aja lühenemisega. Tänu sarnaste kontorilahenduste laiale levikule ja ka erinevate tootjate kontorilahenduste vahelisele andmevahetusele lihtsustub ka ettevõtetevaheline kommunikatsioon. Nende analoogne
kollektiive, nende sisemisi nähtusi ja ühiskondlikke sündmusi ning olukordi. Ühiskondlike struktuuride kogum hõlmab näiteks majanduslikke, poliitilisi, hariduslikke jne süsteeme. Igas üldkogumis võib valimeid koostada erinevatel tasemetel. Näiteks Flick (2011c, lk 2933) toob välja 5 valimivõtu taset: inimeste eraldamine valimisse; sündmuste ja sündmuskohtade valik; rühmade konstrueerimine; andmekogumite moodustamine; valimi koostamine sündmuste ja materjalide sees. Materjalide kogum Valimi koostamine materjalide kogumist võib toimuda erinevatel tasemetel: materjali tüübi tasand ja materjali sisu tasand. Esimesel juhul toimub mitmesuguste objektide valik nende tüübi järgi, teisel juhul materjali sees. Materjali tüübi tasandil kerkib küsimus, milliseid, mis tüüpi objekte valida üldkogumist, millised on
Enamik perifeeriaseadmeid töötab autonoomselt ning pole sünkroniseeritud arvuti või mikrokontrolleri taktigeneraatoriga. 1.2.3 Mälu hierarhia Arvutisüsteemis on tavaliselt mitut tüüpi mälusid, mis moodustavad omamoodi mälude hierarhia.Seda võiks ette kujutada püramiidina. Kõrgema taseme mälud on kiiremad, väiksemad ja kallimad. Alamate tasemete mälud on aeglasemad, suuremad ja odavamad. Alama taseme mäludeks on suure mahuga mälud, mida kasutatakse andmekogumite püsivaks salvestamiseks. Joonis 1-12. Mälu hierarhia (Allikas: Learning Materials for Information Technology Professionals (EUCIP-Mat)) Kõrgema taseme mälud on registrid, protsessori vahemälu ja täiendav vahemälu ja alama taseme mäludeks on põhimälu ja massmälu. Kõrgema taseme mälus tuleb hoida andmeid, mis on vajalikud jooksva töö tegemiseks ja ülejäänud andmed püütakse hoida alama taseme mälus. 1.2.4 Arvutisüsteemide erinevused sõltuvalt kasutusotstarbest
· Veeb (WWW Word Wide Web) on ülemaailmne Interneti multimeediateenistus, mis on muutunud peaaegu Interneti sünonüümiks; sisaldab tohutul hulgal HTML-keele (hüpertekst Hypertext Markup Language) abil loodud hüpertekstdokumente, millede arv kiiresti kasvab. HTML-keeles on ühendatud tekst, pildid, heli ja viited teistele HTML dokumentidele, mis võivad paikneda hoopis teistes arvutites. · Faili transport (FTP File Transfer Protocol) on vahend andmekogumite ülekandmiseks ühest arvutist teise. Et mingi kaugarvutiga andmeid vahetada, peate omama selleks vastavat õigust. Kui omate kasutajatunnust mingis Internetti kuuluvas arvutis, siis on Teil õigus panna selles arvutis oma kataloogidesse faile ja neid sealt mujale kopeerida ("tõmmata"). Lisaks sellele on üle kogu maailma loodud elektroonseid arhiive, kuhu kõigil on vaba ligipääs ja kust igaüks võib endale tarkvara, infot, mänge jne hankida. Neid arhiive
Ülekande kiirus Fikseeritud Muutuv Tavalised, vanemad CD- Uued ja kiired CD-ROM seadmed, Kasutusala ROM seadmed kõvakettad, disketi seadmed Üldjuhul ei ole seadme kiirus, mingite programmidega töötamisel plaadilt eriti tähtis, sest need ei vaja tavaliselt väga suurt pöördumiskiirust. Olulisemaks muutub kiirus juhul, kui on tegu suurte andmekogumite kopeerimisega plaadilt või on vaja teha ulatuslikke päringuid nt. andmebaasidest. 4.3.6. Ühilduvus Mida suurema arvu erinevate standardite ja reeglitega CD - lugeja ühildub, seda väiksem on tõenäosus, et kasutajal tuleb silmitsi seista ühilduvusprobleemidega. Kui kavatsete lugeda CD-ROM-ilt ka fotosid (Photo-CD), siis on vaja eri programmi. Fotosid sisaldavad CD-d võivad olla salvestatud ka nn. multisessioon vormingus; nende lugemiseks on vajalik CD-