DSD Statistik beschreiben Die steigende lebenserwartung der Deutscher Das Diagramm zeigt die Entwicklung der Lebenserwartung der Deutschen von 1910 bis heute. Die Angaben in der Grafik bezichen sich auf die Jahre 1910, 1932, 1960 und heute. Die Daten stammen von Statistischen Bundesamt und wurden in vier unterschiedlichen zuiträumen erhoben. Die Lebenserwartung wird in Form von Säulen pro Zeitraum, eine blaue und eine rote Säule. Rot ist für die Lebenserwartung der Frauen und blau ist für die Männer. Es ist interessant, dass die Deutschen immer älter werden. Am Anfang des letzten Jahrhunderts wurden die deutschen Männer nur ungefähr 45 Jahre alt und die Frauen nur 48 Jahre alt. Heute werden sie fast doppelt so alt. Die Frauen in Deutschland werden im Durchschnitt knapp 82 Jahre alt und die Männer ungefähr 76 Jahre alt. Wie die Tabelle auch zeigt, werden Männer, die 1932 geboren wurden, ungefähr 60 Jahre und die Frauen ungefähr 63 Ja...
Valim B1: Paarisvalim (xi, yi) regressioonimudeli leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,3 2,0 4,6 3,9 3,0 2,7 6,3 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon:814,0567 Standardhälve:28,53 Mediaan: Me = 41 Haare: 2 Keskväärtuse usaldusvahemik: (35,08 ; 54,60) Dispersiooni usaldusvahemik: (536,45 ; 1410,64) 3. 3.1 t-statistik: t=0,90 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 44,84 27,97 - statistik: Järeldus: peab paika 4.2 0,022 - statistik:14,98 Järeldus:lükatakse tagasi 4.3 U (0,100) - statistik: 1,4 Järeldus:lükatakse tagasi
Rühmade dispersioonid: ( ) Üldkeskmine: Üldine rühmasisene dispersioon: ( ) Rühmadevaheline dispersioon: ( ) ( ) ( ) ( ) ( ) ( ) F-statistik: F-statistiku kriitiline väärtus (tabelist): ( ) ( ) Hüpoteesi vastuvõtmiseks peab F < Fkr: nii see on (0,44 < 2,87). Seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks. 8
3 1,7 2,5 -1,18 -4,32 1,3924 18,6624 5,0976 4 3,8 9,4 0,92 2,58 0,8464 6,6564 2,3736 5 3,2 5,1 0,32 -1,72 0,1024 2,9584 -0,5504 keskväärtus ed 2,88 6,82 Läbi keskväärtuste leiame Korrelatsiooniteguri : 0,927071 t-statistik : 4,283259 Determinatsioonitegur: 0,85946 z-statistik : 2,31526 11. Leida ühefaktoriline lineaarne regressioonimudel y = b0 + b1 x ja analüüsida selle täpsust (võttes vastavates testides jm arvutustes olulisuse nivooks = 0.05) xi 0,8 4,9 1,7 3,8 3,2 yi 2,7 14,4 2,5 9,4 5,1 10.1 Leida parameetrite hinnangud b0 ja b1 Kasutame järgmisi valemeid: x = 2,88 Vx = 10,75 = 6,82 b1 = 2,87 b0 = -1,43 Regressioonimudel: y = 2,87x 1,43 11
72 1.710882 σ 868.7933 13.84843 s 29.4753 7 36.41503 M 44 Haare 90 8 2 Δμ 10.08575 Alumine piir 39.63425 9 Ülemine piir 59.80575 σ al piir 572.5944 σ ül piir 1505.661 3 10 t-statistik 0.047497 X -statistik 2 26.0638 N(μ,σ) X2-statistik U(0,100) X2-statistik DN-statistik 0.13 F-statistik 0.142 Seerijate arv 7 Pikima seeria pikkus 4 Käänupunktid 9 Korrelatsioonitegur 0.973 t-statistik Determinatsioonitegur 0.946 z-statistik 6.331 11 4.400 b0
leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 3,4 3,2 6,4 4,2 7,1 5,5 4,9 Lahenduse kontrollelemendid 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 51 Haare: 2 Keskväärtuse usaldusvahemik: (9,09 ; 44,15) Dispersiooni usaldusvahemik: (464,93 ; 1223,02) 3. 3.1 t-statistik: t= 0,61 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 53,24 25,68 - statistik: Järeldus: lükatakse tagasi 4.2 0,019 - statistik:22,39 Järeldus:lükatakse tagasi 4.3 - statistik: 4,8 Järeldus:lükatakse tagasi
leidmiseks (mahuga N=5) Valim B2: Korduskatsete sari väljundi dispersiooni leidmiseks (mahuga w=7) 1,3 0,2 0,7 4,2 3,6 2,6 1,9 Lahenduse kontrollelemendid Ülesanne/alamülesanne 1 Keskväärtus: Dispersioon: Standardhälve: Mediaan: Me = 74 Haare: 2 Keskväärtuse usaldusvahemik: (47,38 ; 69,34) Dispersiooni usaldusvahemik: (679 ; 1791) 3. 3.1 t-statistik: t=1,3 Järeldus: võetakse vastu 3.2 - statistik: Järeldus: võetakse vastu 4 4.1 58 30,5 - statistik: Järeldus: lükatakse tagasi 4.2 0,017 - statistik: 31,46 Järeldus:lükatakse tagasi 4.3 - statistik: 6 Järeldus:lükatakse tagasi
8484 22 739.84 χ2 1-α/2(f) 36.4150 23 635.04 24 163.84 Dispersiooni usaldusvahemikud 25 1075.84 alumine 638.36 ülemine 1678.61 H0:μ 50 Kriitiline piirkond ǀtǀ > 1,7109 t-statistik 0.2892 H0 hüpotees vastab tõele, kuna ǀ0,2892ǀ < 1,7109 H0:σ2 800 Kriitiline piirkond 13,8484 < χ2 < 36,4150 hii-statistik 29.0575 H0 hüpotees vastab tõele, kuna 13,8484 < 29,0575 < 36,4150 xi 4. 1 2 2 14 17 19 21 22 39 45 48 52 62 70 71 73 4.1. k 74 1 75 2 77 3 79 4
Pidevad jaotused Olgu meil mõõdetud kuusenoorendikus puude kõrgused sentimeetrites rühmitatud andmetena (ülesannete 1 kuni 4 algandmed). Kõrguse Kõrguse Sage- Aritm. Standard- Teoreet. Teoreet. ülemised keskmisedx dused keskmine hälve tõen.-d pi saged. Hii-ruut xü ni ni*xi ni*(xi-xkaet)2 N*pi statistik i Normj. F(xü) 215 210 8 1680 6940,1 0,045 0,045 8 0,0086284 225 220 19 4180 7190,4 0,158 0,113 21 0,1432402 235 230 43 9890 3842,9 0,379 0,220 40 0,1748117
KODUTÖÖ METEROLOOGIA JA MÕÕTETEHNIKA MHT0010 Esitamise kuupäev: 19.05.2011 Üliõpilane: Matrikli number: Õpperühm: MAHB-41 Variandi number: 7 Lahenduste kontrollelemendid: Eksed 1 47,05 algandmetes: 2 mittejuhusliku komponendi olemasolu, dispersioonanalüüs F-statistik. järeldus: homogeensus hüpotees ei kehti tulpades 5 ja 8 (vt. tabel 1 ) 4 Keskväärtus: dispersioon: Standardhälve: Mediaan: 37,5 0,069 0,262 37,48 Keskväärtuse Standardhälbe usaldusvahemik usaldusvahemik 37,44 < 37,50 <
20 =792,14 Rühmadevaheline dispersioon: k 1 1,5376+27,4576+30,9136+ 97,6096+71,2336 2 s = A ∑ k−1 i=1 ( ´y i− ´y )2= 4 =54,688 F-statistik: 2 s A 54,688 F= 2 = =0 , 014 s 0 3960,7 F-statistiku kriitiline väärtus (tabelist): F kr=F 1−α ( k−1, N−k )=F 0,95 ( 4,20 )=2 , 87 Hüpoteesi vastuvõtmiseks peab F < Fkr: 0,014 < 2,87 Seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks. 9. Käsitleda valimit A aegreana pikkusega N=25, koostada selle aegrea graafik. Kontrollida
70,00 0,925 0,3238 28,25 5,65 5,00 -23,25 540,66 19,14 90,00 1,645 0,4505 39,31 13,10 3,00 -36,31 1318,19 33,54 X2 -27,72787048 statistik Vabadusastmete arv k = m 1 r = 5 1 1 = 2 X2kr (0,1;2) = 4,605 Kuna kriitiline teststatistik on suurem kui teststatistik, siis peab hüpotees paika. 4.2 põhikogumi jaotuseks on eksponentjaotus (mille parameeter tuleb hinnata valimi järgi) k xm ni F0(m) pi ni' ((ni-n'i)2)/n'i 1 20,00 6,00 0,29 0,29 7,25 0,215517241 2 40,00 7,00 0,50 0,21 5,15 0,664563107
Joonisel 1 on esitatud tarkvarapaketis EViews kasutatav korrelogramm , mille korral esitatakse autokorrelatsiooni-(AC) ja osaautokorrelatsioonikordajad (PAC) nii arvuliselt kui graafiliselt tärnidega. Joonis 1 USA agregeeritud tarbimise (1966-2007, kvartaalsed andmed) esimeste diferentside korrelogramm. Stohhastilise protsessi kirjeldamiseks kindlasti on vaja teha, kas mingi k Ta osutub, et juhul kui nullhüpotees kehtiks, siis mõlemad statistikud on asümptootiliselt Seega, kui statistik on suurem tabelis antud kriitilisest väärtusest, siis lükkame nulli tagasi. Väikeste valimite jaoks on Q- statistiku kasutamine praktikas eelistatavam, kuna testi võimsus on Box-Pierce testi omast suurem. Tarkvarapaketi EViews korrelogrammil on Ljung-Boxi testi statistik ning testi olulisuse tõenäosus. Kui olulisuse tõenäosus m-ndas reas on väiksem kui etteantud olulisuse nivoo (mis tavaliselt on kas 0.05 või 0
Der Berliner Fernsehturm JOOSEP, KARL Statistik Das höchste Bauwerk Deutschlands (368 Meter) Wurde von 1965 bis 1969 errichtet Jährlich etwa 1,2 Millionen Besuchern Hauptfunktion: Standort mehrerer Rundfunksender für Hörfunk und Fernsehen zu sein 60 Fenstern - ein Panoramablick über ganz Berlin Information Befindet sich südwestlich des Bahnhofs Alexanderplatz und nordöstlich des Marx-Engels-Forums Aussichtsturm mit einer Aussichtsetage mit einer Bar auf 203
DN=max[Femp(Xi)- F0(Xi)] Et hüpotees vastu võetaks, peab DN≤Dkr, siin on 0,16<0,238 , üldkogumi jaotuseks on ühtlane jaotus. 8) 1 2 3 1.- 4. 10 5 12 11.- 14. 50 28 82 21.- 24. 68 14 95 1397.625 üldine rühmasisene dispersioon 105.2524 Rühmavaheline dispersioon F= 0.075308 F- statistik Hüpoteesi vastu võtmiseks ja keskväärtused loetakse h Fkr= 2.9 4.26 11.2) 11,3) 11.4) 1.9600 3.2400 4.4100 18.49 7.84
Nominaaltunnus: kasutage protsente, vastajate arve Järjestustunnus: kasutage protsente, vastajate arve Arvuline tunnus: kasutage keskmisi, standardhälbeid Arvtunnus Järjestustunnus Nominaaltunnus Nominaal-tunnus Keskmiste võrdlus. Risttabelid. Risttabelid. Usalduspiirid, T-test Seosekordajad (hii- Seosekordajad (hii- ruut-statistik) ruut-statistik) Järjestus-tunnus Keskmiste võrdlus. Risttabelid. Usalduspiirid, T-test Seosekordajad (hii- ruut-statistik) Arvtunnus Korrelatsiooni- kordajad Pärast analüüsi esitada tulemused, teha järeldused, uute uurimisküsimuste püstitamine. Millised on alternatiivid kvantitatiivsetele meetoditele. Kvalitatiivsed ja kombineeritud meetodid.
44,84 Keskväärtus 44,84 ül4 1 Dispersioon 814,056666667 814,05667 intervalli nr. 1 Mediaan 38 28,531678 1 7 Haare 86 2 10 t-statistik -0,9043112513 3 15 50 4 16 5 19 1,7108820799 24 35 Histogr 38 0,4780363352 38 0,4168338365 8 41 1,7108820799 7 6 41 36,4150285018
11.-15. 38 16 58 7 24 28,6 399,8 262,44 16.-20. 19 82 1 40 38 36 912,5 77,44 21.-25. 35 87 51 1 69 48,6 1086,8 14,44 Kokku 224 3994,6 713,52 Üldine rühmasisene dispersioon: Üldkeskmine: Rühmadevaheline dispersioon: F-statistik: F-statistiku kriitiline väärtus (tabelist): Hüpoteesi vastuvõtmiseks peab F < Fkr , antud juhul on 0,22 < 2,87, seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks 9. Käsitledes valimit A aegreana pikkusega N = 25, koostada selle aegrea graafik. Kontrollida olulisuse nivoo = 0.05 juures selle aegrea juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi.
Herman Hollerith Algis Suurkivi Aap-11, VKHK [email protected] Hollerithist Sünd 29. veebruaril 1860 Buffalo, New York Surm 17. novembril 1929 (69) Washington, D.C. Haridus City College of New York (1875) Columbia University School of Mines (1879) Elukutse Statistik, leiutaja, ärimees Tuntud kui perfokaartide leiutaja IBM asutaja Abikaasa Lucia Beverley Talcott Autasud Elliott Cresson Medal (1890) Herman Hollerithi isiklik elu Hollerith on sündinud Buffalos, New Yorkis Õppis New Yorki linnakolledzis kolis Georgtowni, Washington, D.C.'s lõi oma tabulatsinoonimasinate tehase 31. tänava ja C&O Kanali ristmikule täna on sinna paigutatud IBM koos tänutahvliga Perfokaart Perfokaart on nelinurkne kartongist kaart
6.-10. 54 9 94 51 69 55,4 2,16 4,6656 962,3 11.- 19 15 33 88 37 38,4 -14,84 220,2256 853,8 15. 16.- 87 94 49 18 85 66,6 13,36 178,4896 1044,3 20. 21.- 43 43 41 62 81 54 0,76 0,5776 301 25. 266,2 406,032 3726,6 F-statistik: F-statistiku kriitiline väärtus (tabelist): Hüpoteesi vastuvõtmiseks peab F < Fkr , seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks 9. Käsitledes valimit A aegreana pikkusega N = 25, kontrollida olulisuse nivoo = 0.05 juures selle juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. Seeriate ( märgirea osad, mis koosnevad järjestikustest ,,+" või ,,-" märkidest) arv: Ns = 7
46,2 Keskväärtus 46,2 ül4 99 Dispersioon 867,9167 intervalli nr vahemik 32 Mediaan 38 1 0-20 10 Haare 99 2 20-40 96 t-statistik -0,644942 3 40-60 2 50 4 60-80 79 5 80-100 46 1,7108820799 31 29,46043 68 46 7 Histog 47 0,4780363352 6 28 0,4168338365
und 48. Breitengrad und verfügt über die Quellgebiete von Flüssen, die sich in die Nordsee, das Mittelmeer und das Schwarze Meer ergiessen Gletscher Das Schweizer Hochgebirge wird massgeblich durch die vielen Gletscher dominiert. Der grösste und längste Alpen-Gletscher ist der Grosse Aletschgletscher, gefolgt vom Gornergletscher (nach Fläche). Sprachen Gemäss einer Erhebung des Schweizer Bundesamtes für Statistik aus dem Jahr 2010 ist Deutsch mit einem Anteil von 65,6 Prozent an der Gesamtbevölkerung bzw. 73,3 Prozent der Schweizer die meistverbreitete Sprache. Städte und Gemeinden Die grösste Stadt der Schweiz ist Zürich mit 380 777 Einwohnern (31. Dezember 2012). Die kleinste Gemeinde ist Corippo mit 12 Einwohnern (31. Dezember 2012). Kanton Graubünden, im Alpengebiet gelegen, beträgt die Einwohnerdichte nur einen Bruchteil davon (ca. 27 Personen
See tähendab seda, et süstemaatiliste vigade puudumisel mõõtmisseerias peaks erimärgilisi vigu olema ligikaudu võrdselt. Märgikriteeriumi testi tegemiseks peab esmalt loendama valimis olevad nullist suuremad ja väiksemad vead. Exceli's on selleks käsklus (COUNTIF). Praktikumis loendasime kui palju on valimis nullist suuremaid vigu. Tulemuseks saime suuruse k, mis ühes valimi mahuga n, annab meile võimaluse arvutada statistik R (R= |2 k-n| ). Teststatistikut R võrreldakse kriteeriumiga 2 n . Süstemaatiliste vigade mitteesinemisel kehtib võrdus R<2 n . Meie arvutuste tulemusena saime etteantud valimi põhjal otsitavatele suurustele järgnevad väärtused: k= 11; n=12; R=10; 2 n =6,9. Vastavalt võrdusele R<2 n näeme, et statistik R on etteantud kriteeriumist suurem. See tähendab seda, et meie valimis esineb süstemaatilisi vigu.
juhuslik komponent ehk vealiige (u) 2. Andmetüübid. Kvalitatiivsed, kvantitatiivsed, ristandmed, aegread, paneelandmed 3. Valimvaatlused ja parameetri hinnangu mõiste. Uuritav objekt on üldvalim, andmebaas on üldjuhul valim. Järledusi teeme üldkogumi kohta ja selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valim on juhuvalim, hinnang on juhuslik suurus. Suvaline valimi andmete põhjal arvutatud funktsioon on statistik ning erinevad valimid annavad statistikutele erinevad väärtused. Statistik on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang on statistik, mis annab parameetrile ühese väärtuse (nt valimi arit. Keskmine on punkthinnang kogumi keskväärtusele). Intervallhinnang on lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5. Hinnangfunktsioon. Hinnangfunktsioon on reegel parameetrite hinnangute leidmiseks. Tuntudmad
sarnased. 12) Risttabel- on selline tabel, kus on esitatud vastajate jaotus kahe tunnuse lõikes. Risttabeli elementideks on read, veerud ja lahtrid, mille järgi nimetatakse ka tabelisse märgitavaid protsente. Rea protsendid: mitu % selle rea inimestest kuulub ühte või teise veergu. Veeru protsendid: mitu % selle veeru inimestest kuulub ühte või teise ritta. Üldised protsendid: mitu % selle tabeli inimestest kuulub ühte või teise lahtrisse. 13) Hii-ruut-statistik, selle kasutamine seose uurimiseks risttabelis, Crameri V Tunnuste vahel on statistiline seos siis, kui ühe tunnuse käitumine sõltub teise tunnuse väärtustest. Näiteks kui inimese valimiseelistus sõltuks tema soost. Uurides seost nominaaltunnuste vahel võetakse appi risttabel. Seost risttabelis mõõdetakse hii- ruut-statistiku (c²-statistiku) abiga. Hii-ruut statistiku arvutamisel võrreldakse omavahel tegelikku tabelit ja seda tabelit, milles seost pole.
11) T-test keskmiste võrdlemiseks. 12) Risttabel, protsendid risttabelis. Risttabeli elementideks on read, veerud ja lahtrid, mille järgi nimetatakse ka tabelisse märgitavaid protsente. · Rea protsendid: mitu % selle rea inimestest kuulub ühte või teise veergu. · Veeru protsendid: mitu % selle veeru inimestest kuulub ühte või teise ritta. Üldised protsendid: mitu % selle tabeli inimestest kuulub ühte või teise lahtrisse 13) Hii-ruut-statistik, selle kasutamine seose uurimiseks risttabelis, Crameri V · Hii-ruut statistiku arvutamisel võrreldakse omavahel tegelikku tabelit ja seda tabelit, milles seost pole. · Kui nende tabelite erinevus on suur, siis on ka hii-ruut-statistik suure väärtusega. · Kui need tabelid on täpselt ühesugused, on hii-ruut-statistiku väärtuseks 0. Seega: leitakse, kui palju tegelik jaotus erineb hüpoteetilisest jaotusest.
Ühe tunnuse keskmiste väärtuste võrdlus kahes v rohkemas grupis: mitteparameetrilised testid, dispersioonanalüüs LOENG 2 12.09.18 Tunnuse jaotus Mida vaadata tunnuse jaotuse puhul? -Absoluutarvudes, protsentides, kumulatiivse protsendina? - tipp - ulatus - sümmeetria - Sarnasus mõne meile seni teada oleva jaotusega Tihti on vaja jaotusi võrrelda -Omavahel -Mõne teadeoleva jaotusega Hii-ruut-statistik Kas kõrvalekalle 1,04 on ok? Olulisuse tõenäosus: kui suur on tõenäosus, et selline kõrvakalle on tekkinud juhuslikkusest (enamasti meil on tegemist valimiuuringutega, kus võib tekkida juhuslik viga)? Olulisuse nivoo: maksimaalne endale lubav viga Kui meie poolt leitud hii-ruut-statistiku väärtus on suurem tabelis näidanud hii-ruut.statistiku väärtuses, siis - järelikult ei ole erinevus tulnud lihtsalt juhuslikkusest
või välgutabamuse korral on põletusarmid harvad, kuid tekib südameseiskus. · Kõrgepingeliinidega kokkupuutel võivad aga tekkida nekrootilised nahahaavad ning siseorganite kahjustused. Tekib kudede turse, elektrolüütide tasakaalu häired, neerupuudulikkus, sokk Kasutatud kirjandus: · http://www.tooelu.ee/et/uudised/1491/elektrioht-%E2 %80%93-nahtamatu-kuuldamatu · https://www.riigiteataja.ee/akt/12894666 · http://www.ti.ee/est/meedia-trukised-statistika/statistik a/tooonnetused/ · http://www.inimene.ee/haigused-ja-seisundid/list/haigus ed-ja-seisundid/elektritrauma-330 · parsek.yf.ttu.ee/~mars/hg/elektriohutus.ppt
Nullhüpoteesi lükkame tagasi kui 2 χ 2α 2 χ2 α χ> 2 või χ < 1− 2 . Arvutatud statistiku väärtuseks saame 15,21. Kasutades statistiliste jaotusfunktsioonide kalkulaatorit, saame kriitilisteks väärtusteks χ 2α =398,35 χ2 α =295,44 2 ja 1− 2 . Arvutatud statistik on seega 1st oluliselt väiksem. Seega on alust arvata, et esialgsed veahinnangud olid liialt pessimistlikud. Võrgu tasandusjärgne liiasus on 0,88.
11.-15. 81 73 74 52 79 71,8 133,7 400 16.-20. 45 14 70 2 71 40,4 1001,3 129,96 21.-25. 48 79 77 39 19 52,4 656,8 0,36 Kokku 259 4951,3 688,16 Üldine rühmasisene dispersioon: Üldkeskmine: Rühmadevaheline dispersioon: F-statistik: F-statistiku kriitiline väärtus (tabelist): Hüpoteesi vastuvõtmiseks peab F < Fkr , antud juhul on 0,17 < 2,87 Seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks 9. Käsitledes valimit A aegreana pikkusega N = 25, koostada selle aegrea graafik. Kontrollida olulisuse nivoo α = 0.05 juures selle aegrea juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi.
0 1 2134,44 Keskväärtus 46,20 2 1 1953,64 Dispersioon 867,92 7 1 1536,64 Standardhälve 29,46 10 1 1310,44 Mediaan 46 15 1 973,44 Haare 99 28 1 331,24 t-statistik 29 1 295,84 30 1 262,44 31 1 231,04 t,alfa,n-1 1,7108820799 32 2 201,64 32 2 201,64 ÜL 2 42 1 17,64 Usaldusvahemikkude arvutamine: 46 1 0,04 47 2 0,64 36,415028502 36,4150285018
sageduste veeruga. Kui nii ei ole ja vastav erinevus (ebaühtlus) on piisavalt oluline, siis on tegemist sõltuvate tunnustega. Olulise hindamiseks kasutatakse hii-ruut statistikut, tähis 2 : m k (n nij - ni. n. j ) 2 2 = i =1 j =1 n ni . n. j Selle statistiku kasutamiseks peab kehtima eeldus, et iga lahtri oodatav absoluutne sagedus on vähemalt 5. Statistik 2 annab väärtuse seose olulisuse hindamiseks, kuid seose tugevuse hindamiseks on levinuim näitaja Crameri V: 2 V = n *l l = min(m -1, k -1) Andmetöötlus sotsiaalteadustes 12
Ülesanne 2: Tabeli 2 mõõtmisseeria joonepikkused (m) on mõõdetud valguskaugusmõõturiga, mis tehase spetsifikatsiooni kohaselt mõõdab täpsusega ±(5 mm + 5 ppm). a) Püstitage hüpoteesid? Nullhüpotees: mõõtmistulemustest arvutatud dispersioon langeb kokku tehase andmetest leitud dispersiooniga. Alternatiivne hüpotees: mõõtmistulemustest arvutatud dispersioon on suurem kui tehase spetsifikatsioonis ette nähtud. 2 χ -statistik valik teeb hüpoteeside kontrolli valimi dispersiooni σ² (tehase andmetega arvutatud dispersioon) jaoks ning kasutab selleks valimi dispersiooni S2, vabadusastmete arvu ja ette antud usaldusnivood. Sisestatud suurused ja nende põhjal saavutatud tulemus on näha joonisel 2. 2 Test võrdleb kahte dispersiooni valitud olulisuse nivool ja otsustab, kas need on statistiliselt võrdsed või mitte
allem stehlen die Jugendlichen, die kein Geld haben. Sachbeschädigungen sind auch sehr verbreitet: viele Jugendlichen lassen ihre Wut zB. auf Bushaltestellen aus. Zur Körperverletzungen gehören zum Beispiel Schlägereien. Sexualdelikte ist zum Beispiel dann, wenn ein Schüler eine pornografische Zeitung im Klassenzimmer blickt oder onaniert. Drogen- und Alkoholmissbrauch ist wahrscheinlich das gröBte Problem unter den Jugendlichen. Schon Kinder mit 9 Jahren haben damit Probleme. Dann Statistik- in Deutschland, in vielen Bundesländer gibt es im Vergleich zum Jahr 1997 viel weniger Kriminalität. Aber es gibt auch solche Bundesländer, in denen es gestiegen ist. Im Vergleich zum Estland hat Deutschland natürlich mehr Straftaten. In beiden Ländern gibt es immer mehr weniger Jugendkriminalität, aber die Mehrzahl der Straftaten von Jugendlichen wird unter Alkoholeinfluß begangen. Es gibt viele Erziehungsmethoden für die kriminellen Jugendlichen. Man kann das schon im
45.04 Keskväärtus 45 ül4 1 Dispersioon 1167.833 1164.123 intervalli 4 Mediaan 38 1 6 Haare 97 2 7 t-statistik -0.706614 3 10 μ 50 4 11 5 12 1.7108820667 15 20 25 0.4780363352 10 H 27 0.4168338365 9 33 1.710882 8 38 36.41503 7 46 13.84843 52 1164.123 6
45,04 Keskväärtus 45 ül4 1 Dispersioon 1167,833 1164,123 intervalli nr vahemik 4 Mediaan 38 1 0-20 6 Haare 97 2 20-40 7 t-statistik -0,706614 3 40-60 10 50 4 60-80 11 5 80-100 12 1,7108820799 15 20 10 Histogra 25 0,4780363352 9 27 0,4168338365 8 33 1,710882 7 38 36,41503 6
korreleerimatuse kontrollimine viib järgmise hüpoteesipaari kontrollile: H0: p=0, H1: p ei võrdu 0. Nullhüpoteesi kontrolliks kasutatakse korrelatsiooni hinnangu põhjal lleitud statistikut t, mis x ja y normaaljaotuse korral on f=N-2 vabadusastmetega t-jaotusega. Seega, kui valitud olulisuse nivoo juures kriitiline väärtus on suurem kui leitud t, võtakse nullhüpotees vastu. Kasutatakse ka Fisheri teisendust: korreleerimatuse nullhüpoteesi kontrolliks arvutatakse z-statistik, mis on jaotunud normeeritud normaaljaotusega N(0,1). Lineaarne ühefaktoriline regressioonimudel. Mudeli leidmiseks vajalike katsetulemustena on vaja paarisvalimit, mis koosneb katse tulemusel saadud paarisvaatlustest. Vastav lineaarne seosemudel x ja y vahel on esitatav kujul: yi=b0+b1xi+ei, kus e tähistab juhuslikku müra i'ndas katses. Suurus x on sõltumatu muutuja, y sõltuv muutuja. Eeldatakse, et:
Statistiliste meetoditega hinnatavad mudeli parameetrid β Juhuslik komponent – vabaliige u Y= f (X, β, u) 2) Andmetüübid: Arvandmed, ristandmed (erinevad objektid samal ajamomendil), aegread (sama objekti erinevatel ajamomentidel), paneelandmed (ristandmed + aegread) 3) Valimivaatlused ja parameetri hinnangu mõiste: Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. 4) Punkthinnang, intervallhinnang Punkthinnang – statistik, mis annab parameetrite ühese väärtuse (aritmeetiline keskmine on valimi punkthinnang kogumi keskväärtusele) Intervallhinnang – usaldusvahemik, lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. 5) Hinnangufunktsioon: Reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks 6) Hinnangute omadused: Nihe, efektiivsus, mõjusus, asümptootiline jaotus, asümptootiline efektiivsus 7) Hinnangu nihe, nihketa hinnang
● Kvantitatiivsed (mõõdetakse arvudega, nt vanus) 3. Valimvaatlused ja parameetri hinnangu mõiste. ● Uuritav objekt on üldkogum ● Andmebaas on üldjuhul valim Järeldusi soovime teha üldkogumi kohta, selleks kasutame valimit. Valimi parameetrite põhjal leitakse üldkogumi parameetrite hinnangud. Valimi põhjal leiame mudeli parameetrite hinnangud. Valim on juhuvalim => hinnang on juhuslik suurus. 4. Punkthinnang, intervallhinnang. Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näiteks valimi aritmeetiline keskmine on punkthinnang kogumi keskväärtusele. Intervallhinnang (interval estimate) on lõik, mis sisaldab parameetri tegelikku väärtust mingi etteantud tõenäosusega. Ka usaldusvahemik (confidence interval) 5. Hinnangfunktsioon. Hinnangfunktsioon (estimator) on reegel üldkogumi parameetri(te) hinnangu(te) leidmiseks. ● Ühe ja sama parameetri hindamiseks võib kasutada erinevaid
Standardse normaaljaotusega sõltumatute juhuslike suuruste X 1 kuni Xy ruutude summa Y=( X1)2 +( X2)2 +...+( Xy)2 on χ2-jaotusega (hii-ruut jaotusega) juhuslik suurus Y~ χ2(v), kus liidetavate arv v on χ2-jaotuse parameeter, mida nimetatakse vabadusastmete arvuks. MATEMAATILINE STATISTIKA ÜLDKOGUMI KARAKTERISTIKUTE PUNKIHINNANG 22. Mõisted: üldkogum, objekt, tunnus, tunnuse jaotus, üldkogumi karakteristik, valim, valimi statistik, üldkogumi karakteristiku hinnang, hinnangu tüübid. Ülkogum - mingil printsiibil määratletud, vaatluse alla võetav objektide koguhulk. Tunnus - iga objekti iseloomustavad temal mõõdetud tunnused. Tunnuse jaotus - iga arvulist tunnust võib vaadelda kui juhuslikku suurust, mis omandab väärtusi kindlast vahemikust. Iga tunnuse kui juhusliku suuruse korral saame leida tema jaotuse. Karakteristik - üldkogumi iga tunnuse korral võib leida seda tunnust iseloomustavad
11.-15. 95 10 71 0 79 51,0 1850,5 16.-20. 24 86 91 96 5 60,2 1813,3 21.-25. 40 85 69 82 39 63,0 496,5 Kokku 291,6 5920,3 Üldine rühmasisene dispersioon: Üldkeskmine: Rühmadevaheline dispersioon: F-statistik: F-statistiku kriitiline väärtus (tabelist): Hüpoteesi vastuvõtmiseks peab F < Fkr , seega võetakse hüpotees vastu ja keskväärtused loetakse hüpoteesi põhjal homogeenseteks 9. Käsitledes valimit A aegreana pikkusega N = 25, kontrollida olulisuse nivoo = 0.05 juures selle juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. 22 96 91 75 74 75 25 79 12 38 95 10 71 0 79 24 86 91 96 5 40 85 69 82 39 Lähterid Märgirid Käänupunkti Järjestatud
kogumisele ja analüüsimisele, probleemide lahenduste otsimisele, tulemustele ja saavutustele nii teaduses kui ka muudel aladel. Väldib olukordi, mis on rangelt reglementeeritud (reeglite ja käskudega paigas). Seejuures on ise distsiplineeritud, mõtetes ja tegudes täpsust nõudev. Väldib ajuvabadust. Sobivad ametid: kuraator, lennundustehnoloog, geneetik, neuroloog, füsioloog, teadustöö assistent, andmebaaside administraator, keemik, hambaarst, lendur, statistik, psühhiaater, joonestaja, lastearst, tolliametnik, teadustöötaja jne. 3. Kunstniku tüüp ehk artistlik isiksustüüp Isikupärane, originaalne, sõltumatu, tundlik, paindlik, impulsiivne, idealistlik, väljendusrikas, loominguline. On väga originaalne ja individualistlik. Soovib hallist massist erineda. Talle meeldib oma isikupära väljendada sõnades, helides, mitmesugustes materjalides, aga ka kehaliselt (näideldes ja tantsides). Teda iseloomustab keerukas maailmataju
11.-15. 44 44 48 34 18 37,6 146,8 16.-20. 98 4 90 26 9 45,4 2042,8 21.-25. 62 96 84 24 47 62,6 826,8 Summa: 228,8 5932,4 Rühmade keskväärtused: Rühmade dispersioonid: Üldkeskmine: Üldine rühmasisene dispersioon: Rühmadevaheline dispersioon: F-statistik kui rühmadevahelise ja rühmadesisese dispersiooni suhe: Nullhüpoteesi vastu võtmiseks peab . Seega võetakse nullhüpotees vastu. Keskväärtused on hüpoteesi põhjal homogeensed. Keili Kajava Osa B 9. keskmine x 2,2 2,7 4,8 0,9 4,1 2,94 y 7,1 9,8 10,2 2,1 11,1 8,06 9.1 9.2 Usaldusvahemiku leidmine: Keili Kajava Hinnangu b0 usaldusvahemik:
X ja Y korreleerimatuse kontrollimine viib järgmise hüpoteesipaari kontrollile: H 0: p=0, H1: p ei võrdu 0. Nullhüpoteesi kontrolliks kasutatakse korrelatsiooni hinnangu põhjal lleitud statistikut t, mis x ja y normaaljaotuse korral on f=N-2 vabadusastmetega t- jaotusega. Seega, kui valitud olulisuse nivoo alfa juures kriitiline väärtus on suurem kui leitud t, võtakse nullhüpotees vastu. Kasutatakse ka Fisheri teisendust: korreleerimatuse nullhüpoteesi kontrolliks arvutatakse z-statistik, mis on jaotunud normeeritud normaaljaotusega N(0,1). Lineaarne ühefaktoriline regressioonimudel. Mudeli leidmiseks vajalike katsetulemustena on vaja paarisvalimit, mis koosneb katse tulemusel saadud paarisvaatlustest. Vastav lineaarne seosemudel x ja y vahel on esitatav kujul: yi=b0+b1xi+ei, kus e tähistab juhuslikku müra i'ndas katses. Suurus x on sõltumatu muutuja, y sõltuv muutuja. Eeldatakse, et: *mudeli parameetrite väärtused on mingid fikseeritud arvud, mida tuleb hinnata
· Kvartiilid saab hinnata valimi varieeruvust. Alumine kvartiil on tunnuse selline väärtus, millest väiksemaid väärtusi on valimis 25% ja suuremaid 75%. Ülemine kvartiil e 3.kvartiil tunnuse selline väärtus, millest väiksemaid väärtusi on valimis 75% ja suuremaid 25%. · Miinimum lihtsaimad statistikud · Maksimum lihtsaimad statistikud · Sagedus mittearvulised või diskreetsed tunnused (erinevaid väärtusi suht vähe). · Statistik valimit iseloomustab arvkarakteristik, mis arvutatakse tunnuse väärtuste põhjal. 3. Valimi jaotuseks nim valimi jagunemist erinevate tunnuse väärtuste vahel (nt veregrupi tabel). 4. Normaaljaotus pideva tunnuse jaotu, mille korral histogrammi kuju on sümmeetriline ja nn kellukesekujuline. · Normaaljaotuse kirjeldab ära 2 parameetrit: keskmine (asukoht) ja standardhälve (järsakus). · · 95% valimist jääb ligikaudu 2 standardvea kaugusele keskmisest.
· Matemaatilise statistika üheks põhieesmärgiks on valimi andmeid kasutades hinnata mingit üldkogumi parameetrit Hinnangfunktsioon (estimator) on reegel või parameetrite hulka . üldkogumi parameetri(te) hinnangu(te) · Suvaline valimi andmete põhjal arvutatud funktsioon on leidmiseks. statistik. · Erinevad valimid annavad statistikutele erinevad Parameeter =? väärtused: statistik on juhuslik suurus. · Punkthinnang (point estimate) on statistik, mis annab parameetrile ühese väärtuse. Näit valimi aritmeetiline keskmine on punkthinnang kogumi Hinnang- Parameetri keskväärtusele
163 2189 277 üldine rühmasisene dispersioon 1094 rühmavaheline dispersioon 139 ykesk 54 F= 0,13 Fkr(4,20)= 2,87 Üldine rühmasisene dispersioon: Üldkeskmine: Rühmadevaheline dispersioon: F-statistik: F-statistiku kriitiline väärtus: Hüpoteesi vastuvõtmiseks peab F < Fkr , seega võetakse hüpotees vastu. 9. Käsitledes valimit A aegreana pikkusega N = 25, kontrollida olulisuse nivoo = 0.05 juures selle juhuslikkust mediaankriteeriumi ja käänupunktide kriteeriumi järgi. 69 "+" 9 "-" K 51 "+" K 33 "-" K 81 "+" K 54 "+" 54 "+" 30 "-" K 94 "+" K 37 "-" K
nii, et valge rassi omad oleksid suuremad (nt. sakslaste koljumahtu taandab ta suuremaks ning mustadel väiksemaks) Peatüki lõpus jaotab Gould Mortoni enda tüssasaamis meetodid 4 erinevasse lõiku, seletades ära kõik vead mina Morton ise ei pannud tähele , kas siis tahtlikult või tahtmatult. Teine peatükk ,,Peade mõõtmine" Paul Bronca ja kranioloogia õitseaeg": Selles peatükis peatükis kirjutab autor esiteks väikseks vahepalaks räägib ta Francis Galtonist, kes oli kiindunud statistik. Ta kogus andmeid isegi igavlemise määra mõõtmiseks. Galton hiljem avas Rahvusvahelisel Näitusel oma laboratooriumi, kus inimesed said kolme penni eest testida ja mõõta, sealt tuli ka tema huvi koljude ja kehade mõõtmise vastu. Edasi võib lugeda Robert Bennett Bean´ist. Bean mõõtis ajusid ja pani kindlalt arvudega kirja, et valge rass on intelligentsem teistest. Sama süsteemi kasutades võrdles ta mehi ja naisi.
Jääkide ruutude summa Korrigeeritud Determinatsiooni- determinatsiooni- kordaja kordaja F-testi statistik Logaritmiline tõepära Schwarzi Hannan-Quinni Akaike F-testi olulisuse informatsiooni- informatsiooni- informatsiooni- tõenäosus kriteerium kriteerium kriteerium 4. Tulemuste analüüs: Aruandes on * märgitud statistiliselt olulised regressioonikordajad.
Võib oletada, et vanemate (kui 27 aastat) inimeste rahulolematus turvalisusega on seotud laste 2 olemasoluga. Korrelatsioonanalüüs näitas aga, et laste arvu ja turvalisuse hinnangu vahel statistiliselt olulist seost ei ole (r= -0,032, p= 0,507). Viimaks vaatasin turvalisuse rahulolu neljas erinevas linnaosas, kus esines statistiliselt olulisi erinevusi: hii-ruut-statistik= 126,95 (df= 15, p= 0,000). Nagu ka eelmises tabelis, on ka siin kokku liidetud kategooriad „üldse ei ole rahul” ja „üldiselt ei ole rahul”; „üldiselt rahul” ja „väga rahul” ning „ei rahul ega mitterahul” ja „ei oska öelda”. Tabel 2. Hinnang turvalisusele vastavalt linnaosale Linnaosa Ei ole rahul On rahul Erapooletu Tähtvere 0% 98 % 2%