Bioinformaatika ülesanded II Fülogeneetilised puud. 1. DNA järjestuste fülogeneetiliste puude käsitsi koostamine kasutades kaugusmeetodeid (UPGMA, NJ). a. Moodustada antud 5 järjestuse kaugusmaatriks ning joonistada kvantitatiivne juurtega fülogeneetiline puu kasutades UPGMA meetodit. 1 ACAAACAGTT CGATCGATTT GCAGTCTGGG 2 ACAAACAGTT TCTAGCGATT GCAGTCAGGG 3 ACAGACAGTT CGATCGATTT GCAGTCTCGG 4 ACTGACAGTT CGATCGATTT GCAGTCAGAG 5 ATTGACAGTT CGATCGATTT GCAGTCAGGA b. Koostada eelpool toodud järjestuste fülogeneetiline puu kasutades Neighbour Joining meetodit. c. Valida 4 järjestust (ülevalt) ja leida informatiivsed positsioonid (ML meetod). Koostada kõik võimalikud sugupuud (ML meetod) kasutades ainult
järjekorrast. Optimummeetodid valivad puude hulgast kõige sobivamad kasutades mingit optimaalsuskriteeriumit. Võimaldavad hinnata iga puu sobivust andmetele. Võimaldavad võrrelda konkureerivaid hüpoteese/puid. Kuid on arvutuslikult väga kallid ning optimaalse puu leidmiseks pole teada tõhusaid algoritme. Suurema arvu järjestuste korral pole parima puu leidmine garanteeritud. 30. Iseloomustage kaalumata paaride meetodit aritmeetilise keskmisega (UPGMA). UPGMA meetod on distantsmeetod, mis kasutab klasterdamisalgoritmi. UPGMA eelduseks on, et puu on ultrameetriline ehk juurest kõigi tippudeni peab harudepikkuste summa olema sama. Eeldab, et evolutsiooni kiirus on konstantne üle kogu puu. 31. Võrrelge minimaalse evolutsiooni (minimum evolution) ja naabrite ühendamise (neighbour joining) meetodit. Minimaalse evolutsiooni meetod on distantsmeetod aditiivsete puude konstrueerimiseks
Kristina Raud YAGB-41 060290 10.04.07 Bioinformaatika ülesanded Fülogeneetilised puud. 1. DNA järjestuste fülogeneetiliste puude käsitsi koostamine kasutades kaugusmeetodeid (UPGMA, NJ). a. Moodustada antud 5 järjestuse kaugusmaatriks ning joonistada kvantitatiivne juurtega fülogeneetiline puu kasutades UPGMA meetodit. 1 ACAAACAGTT CGATCGATTT GCAGTCTGGG 2 ACAAACAGTT TCTAGCGATT GCAGTCAGGG 3 ACAGACAGTT CGATCGATTT GCAGTCTCGG 4 ACTGACAGTT CGATCGATTT GCAGTCAGAG 5 ATTGACAGTT CGATCGATTT GCAGTCAGGA Vastus: A B C D B 9
klasteranalüüsi kasutades. Allpool vaatleme klasteranalüüsi teostamist. 7.2.1. Enim kasutatud vorm on klasteranalüüs, mille tulemuseks on haru- nev, sarnasust kujutav fenogramm. Sarnased OTUd on selles ühendatud hierar- hiliselt harunenud ühise "juurega" puu harudeks, kobaraiks, klastreiks. Klasterdamismeetodeid on rohkelt, neist levinumad on lähimnaabri meetod (simple-linkage clustering), aritmeetilisi keskmisi kasutav kaalumata paa- ride meetod (UPGMA - unweighted pair-group method using averages) ja täis- sideme-klasterdus (complete-linkage clustering). 7.2.1.1. Lähimnaabri meetodi puhul leitakse kaks OTUt, mille erinevus on minimaalne, ja ühendatakse need arvestades OTUDe distantsi teineteisest (joon. 2). Edasi arvutatakse distants selle klastri ja ülejäänud OTUde va- hel; järgmisena ühendatakse klastrisse OTUd (või üks OTU ja juba olemasolev klaster), mille distants on väikseim. Nii jätkates saadakse fenogramm, mil-