Puu lehed on nodes without children / alluvateta tipud Dijkstra algorithm on graphs is for finding Dijkstra algoritmiga arvutatakse graafis shortest paths from a given vertex to all reachable vertices antud tipust algavaid lühimaid teid kõigisse saavutatavatesse tippudesse Floyd-Warshall algorithm on graphs is for finding Floyd-Warshalli algoritmiga arvutatakse graafis lengths of shortest paths between all pairs of vertices lühimate teede pikkusi kõigi tipupaaride vahel Kruskal algorithm on graphs is for finding Kruskali algoritmiga arvutatakse graafis minimal spanning tree minimaalset toesepuud Prim algorithm on graphs is for finding Primi algoritmiga arvutatakse graafis minimal spanning tree minimaalset toesepuud Which algorithm uses cyclic hash functions for pattern matching Milline algoritm kasutab tsükliliste räsifunktsioonide arvutamist alamsõne otsimiseks Rabin-Karp Which algorithm uses prefix functions (failure functions) for pattern matching
(Nt meeste ja naiste üldine rahulolu, kus mehed ja naised on 2 erinevat gruppi ja rahulolu on intervalltunnus). ANOVA-Nagu sõltumatute v. T-test 3 või enama grupiga. Sõltuv tunnus peab olema intervalltunnus. Võrreldavad grupid (3 või enam gruppi!) sõltumatud. Hajuvused peavad olema gruppides sarnased (Levens test). Tulemuste jaotus vastab normaaljaotusele (loetakse kehtivaks ilma kontrollimata). Kui ANOVA eeldused ei ole täidetud, siis MPAR (mitteparameetrilised väärtused) test Kruskal-Wallis või Games-Howell. Kui H1, siis Post-Hoc testid, et välja selgitada, milliste gruppide vahel on erinevused. Tukey – gruppide suurused sarnased. Bonferroni – gruppide suurused erinevad. Korrelatsioon näitab seost kahe tunnuse vahel. Korrelatsiooni koefitsent on alati -1…1 ja näitab kahte asja: seose suunda ja tugevust. Pearson r eranditeta invervalltunnused, pole erandlikke väärtusi, seos lineaarne
Kui S-W ei kinnita normaaljaotuslikkust, saab seda kontrollida ka vastata uue tulba loomise kaudu (mõõtmistulemuste lahutustehe). Mitteparameetrilised testid Järjestustunnuste (nt Likerti skaala tulemused), normaaljaotusest erineva jaotuse ja väga väikeste valimite puhul (<30) tuleks eelistada mitte-parameetrilisi analooge. Sõltumatu t-testi asemel nt Mann-Whitney test Sõltumatu ANOVA asemel nt Kruskal-Wallis test Sõltuvate rühmade t-testi asemel nt Wilcoxoni test Sõltuva ANOVA asemel nt Friedmani test Võrreldakse järjestusi, tavaliselt peamine mõõtmisalus keskmise asemel mediaan Dispersioonanalüüs ehk ANOVA Rohkem kui kahe võrreldava grupi vahel tehakse mõõtmised ANOVAga (ANalysis Of VAriance) Sõltumatute gruppidega (between subjects) ANOVA Ühefaktoriline dispersioonanalüüs (One-Way ANOVA)
komplitseeritumad hüpoteesid. Bonferroni meetod kui paariviisiliste võrdluste arv on väike. Taham, et tõenäosus, et me mitte üheski võrdluses I liiki viga ei tee, oleks samuti 5%. Seega peame iga üksiku testi korral kas väiksemat olulisuse nivood soovitavalt a/testide arv, kus a on soovitav lõplik olulisuse nivoo (tav a=0,05) · Kruskal-Wallis test ei eelsa normaaljaotust ega võrdset gruppidesisest hajuvust! Põhineb astakutel ning võrdleb, kas astkute keskmised gruppides
Sig=0.822 Dispersioonanalüüsiks alati kontrollime, kas hajuvused on võrdsed. Kui jah, siis jätkame a-novaga ja tõestame hüpoteese. Kui hajuvused ei ole võrdsed, siis tulevad Krustkal -Wallise test ja siit samamoodi H0 v H1. A- Nova H1 tähendab seda, et leidub vähemalt kaks gruppi, mille keskväärtused on statistiliselt oluliselt erinevad. Tulevad järgmisena mängu Post Hoc testid, kui me oleme tõestanud H1 teema. Post Hoci testi valikute tegemine sõltub valimi suurusest. Kruskal-Wallis Tulemus Ei ole statistiliselt oluline, sest Sig=0,794
Kruskali algoritm- efektiivseim teadaolev algoritm minimaalse kaaluga aluspuude leidmiseks. Sammud algoritmi kasutamiseks: a). Olgu G kaalutud n-tipuline graaf. b). Valime graafist G vähima kaaluga serva e1. c). Iga järgneva i = 2,3,...n-1 korral valime graafist G sellise vähima kaaluga serva ei, mis erineb servadest e1,e2,...,ei-1 ja ei moodusta koos eelnevate servadega tsüklit. Teooria arendajaks oli Martin Kruskal(20. saj). Vähima kaaluga aluspuude leidmise ülesanne on äärmiselt aktuaalne näiteks logistikavaldkonnas (selgitamaks välja veokite optimaalset trassi, maanteede efektiivseimat paigutust jne). Kruskali algoritm kuulub nö. ,,ahnete algoritmide klassi", nende algoritmide iseloomulik tunnus on see, et igal sammul täiendatakse kontruktsiooni just niisuguse objektiga, mille valimine näib just sel hetkel kõige soodsam, pööramata aga tähelepanu sellele, et
tulp- ja sektordiagramm PAR keskväärtus, st.hälve, jne Vahemikhinnang (ÜK proportsioonide hindamine) PAR Pearsoni kordaja St.olulisustest MPAR Spearmani kordaja Crameri kordaja St.olulisustest PAR Parameetrilised meetodid eeldavad intervalltunnust MPAR Mitteparameetrilised meetodid eeldavad nimi- või järjestustunnust, ka intervalltunnus 3 ja rohkem 2 T-test MPAR Risttabel, vrdl tulpdiagramm Hii ruuttest PAR keskväärtus, st.hälve, jne ANOVA MPAR Risttabel, vrdl tulpdiagramm Kruskal-Wallis Üldistav statistika Millest sõltub andmeanalüüsimeetodi valik? • Uurija teadmised/oskused • Kellele esitab, kuidas? Sihtrühmast • Uurimisküsimus: laiem • Analüüsiküsimus: nt. kas kaks gruppi on erinevad/seotud? Küsimuse tüübist • Nimitunnused • Nimitunnuse väärtuseid ei saa järjestada, järjestustunnusel saab • Järjestustunnused • Intervalltnnuse skaalavahemikud on võrdsed, järjestustunnusel mitte • Intervalltunnused