Genoomika kursuse
kordamispunktid1.
Mis on ja mida uurib genoomika?
Genoomika - teadus genoomide ehitusest. Genoomika uurib põhjusi,
miks konkreetne DNA järjestus on
evolutsioonis välja valitud
(säilunud). Genoomika ülesandeks on mitte ainult teada konkreetse
geeni ja selle
produkti funktsiooni organismis, vaid ka kõikide
geenide, nende produktide, funktsioonide ja regulatsiooni
seoseid ,
mis viivad organismi tekkeni.
GENes and chromosOMEs (kromosoomide täielik kogu koos neis sisalduvate
geenidega). Genoomika on
geneetika edasiarendus tegeledes:
Genoomikaartide ja ülesehitusega, DNA sekveneerimisprobleemidega,
Andmete säilitamise ja töötlemisega (
bioinformaatika ), Geenide
identifitseerimisega, Funktsionaalse analüüsiga (funktsionaalne
genoomika), Genoomide evolutsiooniga, Farmakogeneetiliste
probleemidega jne.
3.
Genoomika suundumused ja probleemid. Post-genoomika
e. modulaarne
bioloogia : Genoomide tasemel -
Molekulaarne fülogenees,
võrdlev genoomika, käitumise genoomika, strukturaalne ning
funktsionaalne genoomika ja proteoomika jne; Funktsionaalne genoomika
oleks DNA järjestuses leiduva informatsiooni
taandamine funktsioonile ehk
struktuurilt funktsioonini; Metodoloogiliseks
aluseks geneetilised meetodid;
Genoom on erinevate DNA (RNA)
molekulide (nukleaarse,
mitokondriaalse , plastiidse, plasmiidse jne.)
summa mingi kindla liigi rakku(de)s. Genoomide sekveneerimise ning
bioinformaatika tulemused: Aheldatusgruppide leidmine, Genoomide
ehituse võrdlused, Genoomse DNA, EST-de ja
cDNA -de kombineerimine >
valkude iseloomustamine, Geeniregulatsiooni alused, Evolutsiooni,
ligitekke ja fülogeneesi alused, Liigisiseste genoomsete
variatsioonide ja neist tulenevate erinevate fenotüüpide
tuvastamine (HapMap). Viie peamise
metodoloogia areng genoomikas:
1956 – “kromosomoloogia”, 1966 –
somaatiliste rakkude
geneetika (geenide kaardistamine, kaasasündinud ainevahetushäired,
vähiga seotud
somaatilised mutatsioonid ), 1976 –
molekulaargeneetika , 1986 – transgeensed, KO jne hiired, 1996 –
andmebaasidest otsimine (“uuringud arvutis”). Paradigmade muut on
viinud genoomika: Strukturaalsetest uuringutest funktsionaalsetele,
Geenikaardi põhiselt geenide tuvastamiselt järjestuspõhilisele,
Haiguste
etioloogia (põhjuslikest) uuringutest patogeneesi
uurimiseni (mehhanismini). Küsimus momendil mitte miks vaid kuidas,
Haiguse diagnoosist haigussoodumuse tuvastamisele (personaalse
meditsiini tekkeni). Probleemsed aspektid töös genoomidega:
Genoomika andmed on väiksema “väärtusega”, kui
ad
hoc
(märgade) eksperimentide tulemid, Metoodikate ja suurte andmehulkade
tõttu esineb palju vigu, Kompuuteranalüüs,
algoritmid ning neil
põhinev andmetöötluse
loogika on suhteliselt
algeline (
post
hoc ergo propter hoc – pärast seda, järelikult selle pärast),
Kellele kuuluvad andmed, Viib paradigmani, et uuringute aluseks pole
hüpotees vaid andmed ise. Millised peaksid olema ideaalsed genoomika
metoodikad: Odavad, kättesaadavad, mitte kaetud patentidega ning
käsitletavad suurte investeeringuteta, Üldised s.t. mitte sõltuma
teatava organismi omadustest, Lihtsad s.t. mitte sõltuma
keerulistest ristamistest, geneetikast, vaatlemistehnikatest,
Kokkuvõtvalt: NEED EI TOHI NÕUDA VAATLEJATELT KEERULISI OSKUSI.
4.
Prokarüootsete genoomide omadused (suurused, G+C, funktsionaalsed grupid).
Prokarüootsete genoomide uurimise põhjused: Rakuliste protsesside
ja geenide funktsiooni uuringud: evolutsiooniliselt konserveerunud,
Patogenees : haiguste molekulaarse tagapõhja ja ravivõimaluste
leidmine,
Evolutsioon : kuidas on organismid üksteisega seotud,
millises suunas liigub evolutsioon, Kõige
arvukam organismiderühm
Maal (~6x1030
rakku, ~5x1017g,
~4x105-4x106
liiki).
Prokarüootsete
genoomide omadused:
Genoomid valdavalt tsirkulaarsed, esineb ka
lineaarseid sisaldades telomeere (
B.burgdorferi),
Tihti esineb ekstrakromosomaalseid geneetilisi elemente, Enamik
baktereid haploidseid, mõned ka di- ja tetraploidsed
(
D.radiodurans).
Teatavates situatsioonides ka 10
koopiat (
M.jannaschi),
Genoomide suurus jääb 1-5Mb vahele. Väiksem
genoom M.genitalium
517 geeni (genoomi suurus 580 kb), suurim
M.xanthus
9,2 Mb. Genoomi suurus sõltub geeniduplikatsioonidest (sage
arhebakteritel) ja korduselementide olemasolust ning arvust, ~85%
genoomist valke
kodeeriv (parasitaarsel
M.leprae
vaid 47,5%), GC hulk
varieerub 67%-25%, Eukarüootidest erinev
koodonite kasutamissagedus. Geeniproduktide funktsionaalsed grupid:
energiametabolismiga seotud,
transportvalgud , valgusünteesiga
seotud, rakuliste protsessidega seotud, regulatoorse funktsiooniga,
rakukest, DNA metabolismiga seotud jne.
5.
Prokarüootsete mudelorganismide genoomiprojektid (E.coli,
bakteriofaagid, multiresistentsuplasmiidid).
Bakteriofaagide genoom enamasti kaheahelaline DNA (ka üheahelaline
DNA või RNA). Suurus 1.6 kb –150 kb, umbes 200 geeni,
lugemisraamid tihti kattuvad.
E.coli
(soolekepike) genoom: Sekveneeritud 1997 a. Genoom 4 639 221 bp. 4289
geeni (2657 valke
kodeerivad , 1632 funktsioon teadmata). Neljandik
geenidest organiseeritud 75 operoni. Enamik geene
esindatud ühe
koopiana v.a. rRNA
geenid . Keskmine
distants geenide vahel 118
bp.Valke kodeerivad geenid (87,8% genoomist) paigutatakse 22
funktsionaalsesse gruppi.
Plasmiidid : autonoomselt replitseeruvad,
sümbiontsed või parasiitsed bakterite geneetilised elemendid. Rakus
1-1000. Suurus 1-100 kb. pTP10 on
Corynebacterium
striatum
M82B multiresistentsusplasmiid (51 kb.), mis tagab resistentsuse 16
antibiootikumi vastu. 47 ORF-i.
6.
Eukarüootsete genoomide omadused (C väärtuse paradoks ,
koodikasutus, kompleksus).
Valdavalt paikneb geneetiline info nukleaarselt. Lisaks
plastiidide /mitokondrite genoom (v.a.
Archaeozoa,
kellel puudub organellide DNA). Vähemalt mõnes elutsüklis esineb
diploidsena, DNA hulka haploidses
genoomis nimetatakse C väärtuseks
ja on liigispetsiifiline (ulatub 0,5pg-132pg). Katteseemnetaimedel
varieerub kuni 600x. NB! C väärtus ei korreleeru organismide
keerukuse ja geenide arvuga (C-väärtuse paradoks). Seotud
transposonite arvuga genoomis, Väiksemad genoomid omavad suuremat
aktiivsete transposonite klasside hulka, Genoomide kompleksust
väljendatakse DNA reassotsiatsiooni kiiruse C0t½
kaudu. Sõltub omakorda korduv-DNA hulgast, G+C hulga intragenoomne
varieeruvus väga suur (L ja H isohoorid). Geenid asuvad valdavalt GC
rikastes piirkondades, “Keskkonna” geenid on evolutsioneerunud
palju kiiremini kui “majahoidjad”, Püsisoojaste loomade genoomil
on segmentaarne (blokk ~300 kb) ülesehitus. Nende n.n. isohooride
kompositsioon (G+C hulk) on homogeenne ja erineb teiste omast. L
(light), H (
heavy ). Nukleaarses genoomis esinevad mõned
kõrvalekalded universaalsest koodist (nt.
Stopp –>
selenotsüsteiin).
7.
Eukarüootsete organismide genoomiprojektid (pärmid, eelloomad, hulkraksed ).
Esimesena sekveneeritud eukarüoot
Saccharomyces
cerevisiae - pagaripärm
(1996 a., 14 Mb, 16 kromosoomi, lisaks plasmiidid ja dsRNA
viirused ).
Umbes 6340 geeni, 7%
kodeerib mittetransleeritud RNA-d. Valke
kodeerivaid ORF-e 5773 (25%
nendest iseloomustamata). Geenide pikkus
ca. 1.5 kb. Geenide kaugus ca 2 kb. Genoom väga kompaktne.
Kromosoomides funktsionaalsed elemendid ARS, TEL, CEN. 2002 a.
Schizosaccharomyces
pombe
– käärituspärm, genoom. 13.8 Mb. 4940 valke kodeerivat geeni u.
57% genoomist. Sarnasem kõrgemate eukarüootidega kui
S.
cerevisiae,
Erinevused intronite arvus (
S.
cerevisiae
275 e. 5%,
S.
pombe
43%), transposonite arvus (
S.
cerevisiae
arvukalt,
S.
pombe
vaid mõned). Esimene sekveneeritud eukarüootne
parasiit Plasmodium
falsiparum
2002 a. (samal aastal
P.yoelii
yoelii,
näriliste parasiit). Genoomi suurus 23 Mb, 14 kromosoomi, umbes 5300
geeni. Geenid on
pikemad , kui pärmidel (2.4 kb.).
Intronid moodustavad 54% genoomist. Retroposonid puuduvad,
Aspergillus nidulans,
Neurospora
grassa, Tetrahymena (nukleaarne
dimorfism !) ja mitmete patogeenide projektid. Hulkraksete organismide
genoomiprojektid keskenduvad valdavalt: Arengulistele aspektidele,
Haigustekke põhjuste selgitamisele, On
juhitud kolmest
motivatsioonist: Alusuuringud, Kommertsiaalsed huvid,
Meditsiinikesksed huvid.
Caenorhabditis elegans
genoom: Ülitähtis mudelorganism arengubioloogias. Genoomi
sekveneerimine lõpetatud 1999 a, Genoom ca 100Mb ja 20 000 geeni
(1000 RNA kodeerivad). 9000 kohta
eksperimentaalsed tõestused,
ülejäänud ennustatud
in
silico.
Kodeeriv osa 27%, intronid 26%. 32% kodeerivast osast sarnane inimese
geenidega, 70% inimgeenidest sarnane
C.elegansi
omadega. Geeni keskmine pikkus 5 kb, suur osa koondunud operonidesse,
Otsene HGP eelkäija (metodoloogia).
Drosophila melanogaster
genoom: Lõplikult sekveneeritud aastal 2002, Genoom 165 Mb (6
kromosoomi), 13601 valke kodeerivat geeni s.t. üks iga 9 kb. kohta.
Väga palju retrotransposoneid, Esimene genoom, mis sekveneeriti
whole genome
shotgun
(WGS)
tehnikat kasutades.
Arabidopsis thaliana
genoom (müürlook): Sekveneeritud 2000 a. 5 kromosoomi, genoom 125
Mb. Umbes 25000 geeni. 35% geenidest
unikaalsed , Lisaks nukleaarsele
genoomile ka
mitokondriaalne ja kloroplastide genoom, Geenid
kompaktsed s.t. väikeste intronitega ja paiknevad genoomis
lähestikku (keskmine vahemaa 4.6 kb). Mitmed geeniperekonnad
paiknevad tandeemselt,
Eksonid on palju rohkem G+C rikkad kui
intronid (taimede omapära), Genoomis toimunud arvukalt
duplikatsioone (polüploidiate teke).
Mus musculus
genoom: Lõpetatud aastal 2002. MGSC (
Mouse Genome Sequencing
Consortium) poolt 7x kaetud ja katab 96% genoomist (2,6 Gb),
hiireliinil C57BL/6j. Avalik andmebaas, Celera
hiire genoom 2001 a.
Genoom 6x kaetud.
Liin 129x1/SvJ,DBA/2J. Kommertsiaalne andmebaas,
2004 a. 90%
Rattus
norvegicus
genoomist (2,75 Gb) RGSPC poolt.
8.
Inimese genoomi projekt (ajalugu, eesmärgid, ELSI , strateegiad).
1956 a. esimene inimgenoomi füüsikaline kaart, 1977 a. Sanger:
dideoksü-sekveneerimise metoodika, 1980 a. Botstein: geneetiline
kaart
RFLP -de alusel, 1981 a. Sanger: mitokondriaalse genoomi
järjestus, 1987 a. USA DoE initsiatiiv inimgenoomi uurimiseks, 1988
a. USA NIH loob National
Center of Human Genome Research,
paralleelselt
luuakse HUGO, 1990 a. algab HGP, 1992 a. Weissenbach:
esimene mikrosatelliitidel põhinev geenide aheldatuse kaart, 1995 a.
Lander: esimene STS põhinev aheldatuse kaart, 1999 a. Sanger Center:
esimene inimkromosoomi (22) täielik järjestus, 2001 a. 90%
inimgenoomist sekveneeritud (Celera ja HGSC), 2003 a. inimgenoom on
99% ulatuses sekveneeritud. Esmane eesmärk, saada informatsiooni
inimese geneetilise pärandi kohta, mis omakorda aitab selgitada
erinevate geenide osa ontogeneesis ja patoloogiate
tekkes . Projekt
algselt planeeritud 15 aastaks, lõpetatud 2 aastat varem! Lisaks
suured satelliitprojektid: Uute genoomi uuringutele suunatud
tehnoloogiate ja vahendite loomine, Viie mudelorganismi genoomi
sekveneerimine, HGP eetiliste, õiguslike ja sotsiaalsete tagajärgede
analüüs (Ethical, Legal, and
Social Implications of Human Genetics
Research, ELSI programm). ELSI: Kujunes 5% üldisest HGP maksumusest,
Geneetilise informatsiooni säilitamise
privaatsus ja õige
kasutamine, Geneetika meetodite
integratsioon meditsiini, Ühiskonna
informeerimine ja teadlikkuse tõstmine, Eetilised probleemid,
Geneetika sobitamine religioosse, filosoofilisse, sotsioökonoomilisse
tausta . HGP kasutatud strateegiad:
Kloonid > füüsilised meetodid
(cDNA,
ESTid , STS,
FISH , somaatiliste rakkude ja
radiatsioonihübriidid, füüsiline kaart, sekveneerimine), Haigused
> kromosoomihälbed, geneetilised meetodid (perekonnad
(probleemiks nn must pilv – heterogeensus, ebaregulaarne
pärilikkus), päritavus, polümorfsus, homosügootsus, esialgne
haigusegeeni lokalisatsioon,
geenikaart ), Inimese genoomikaart, geeni
identifitseerimine.
9.
Genoomide kaardistamine ja sekveneerimine.
Geneetilised kaardid: RFLP (Restriction
fragment length polymorphism)
põhised kaardid (vaid kahealleelsed), Mikrosatelliitide põhine (1
iga cM kohta), SNP-de põhine (1 iga kb kohta). Kuigi kasutatakse
erinevaid markereid on kaartide põhimõte sama (uuritakse markerite
koospärandumist põlvkondade vahetumise käigus). Füüsiliste
kaartide alused erinevad. Füüsilise kaardi koostamine kasutades
kloonide kontiinuume: Kattuvad kloonid identifitseeritakse YAC-de
puhul
kloon -kloon hübridiseerimisega, või kloonide
fingerprintinguga.
Tavalisem (kosmiidid, fagemiidid, plasmiidid)
STS-l põhinev. Erinevad genoomide sekveneerimise strateegiad:
Hierarchical shotgun, Whole-genome shotgun. Esimesed geenikaardid
põhinesid EST markeritel. Fenotüüpe põhjustavate geenide
identifitseerimise strateegiad (mittemetüleeritud CpG saared!) NB!
Geenid ise ei põhjusta midagi, vaid nendelt kodeeritavad
polüpeptiidid.
10.
Inimgenoomi ülesehitus ja üldine iseloomustus.
Heterokromatiin on valdavalt läbi sekveneerimata. Nukleaarne genoom:
~45% transposonitel põhinevad järjestused, ~44% muu
mittekonserveerunud, ~6,6% heterokromatiin, ~3% kõrgelt
konserveerunud (muu), 1,5% kõrgelt konserveerunud (kodeeriv).
Mitokondriaalne genoom: ~93% kõrgelt konserveerunud (kodeeriv), ~5%
kõrgelt konserveerunud (muu), 1500 Antisense RNA, ~500 tRNA, ~250 5S rRNA, ~175
5.8S rRNA, ~175 18S rRNA, ~175 28S rRNA, ~200
miRNA , ~100
snRNA ja
~200
snoRNA geeni. rRNA geenid: Inimesel umbes 700-800 rRNA geeni
(16S ja 23S ribosomaalse rRNA ja 28S, 5.8S, 5S ning 18S
tsütoplasmaatilise rRNA geeni), mis on organiseeritud 44 kb pikkuste
tandeemsete klastritena. 28S, 5.8S ja 18S rRNA geenid sünteesitakse
ühe transkriptsiooniühikuna, mis koosneb viiest klastrist. Igas
klastris on 20-30 tandemkordust (kromosoomide 13, 14, 15, 21 ja 22 p
õlgades), 5S rRNA paikneb 1q41-42. Samuti tandeemselt
organiseeritud. Vähemalt 200-300 geeni. Esineb palju seotud
pseudogeene, vähemalt 3000 5S rRNA puhul. tRNA geenid: Umbes 500
tRNA geeni ja arvukalt pseudogeene (324), vähem tsütoplasmaatilisi
tRNA geene (497) kui C. elegans (584), Jaotatakse 49 perekonda
vastavalt
antikoodoni spetsiifikale (kolmanda
aluspaari kõdumine!),
Geenid kõikides kromosoomides v.a. 22 ja Y. Paiknevad klastritena.
Üle poole asub 6. kromosoomi 4Mb sees. Teiste RNA-de geenid: Umbes
100 snRNA geeni. Väga T rikkad. Osalevad splaisosoomide
moodustamisel. Geenid klastritena. Mõned esinevad multikoopiatena
(U6 snRNA jaoks 44 geeni), Umbes 100 snoRNA geeni. Osalevad teiste
RNA molekulide modifitseerimisel. Kaks peamist rühma: C/D box snoRNA
(suunavad 2`O-
riboosi metülatsiooni) ja H/ACA snoRNA (suunavad
pseudouridüülimist). Peamiselt ühe koopiana. MikroRNA-d (miRNA)
osalevad eelkõige
geeniekspressiooni regulatsioonis (98%
transkribeeritavast genoomist on
mittekodeeriv !). Väikesed (~22 bp),
tulenevad pikemast (70 bp) eellasmolekulist. Momendiks teada vähemalt
200 miRNA geeni.
Ekspressioon sageli kas koe- või soospetsiifiline.
Klasterdatud. Osa miRNA-sid katalüütilise aktiivsusega, telomeraasi
RNA-d. Mitmed antisense RNA-d (umbes 500 geeni), mis osalevad
geeniekspressiooni
kontrollis (TSIX). piRNAd koos PIWI valkudega
kontrollivad transposonite ekspressiooni.
14.
Valke kodeerivate geenide omadused ja funktsioonid.
Inimgeenide suurus on väga
varieeruv . Geenide
ekson -
intron struktuur: Vähesed inimgeenid esinevad üheeksonilistena. Keskmine
geeni pikkus 27 kb. Geenide vahe 75 kb, Keskmine eksonite suurus 200
bp. (väikseim 3 bp, pikim 10 kb). Keskmine eksonite arv 9 (suurim
titiin 363), Intronite suurus sõltub osaliselt geenide
suurusest (10
bp–100kb), Geenides (intronites) esineb tihti kordusjärjestusi,
Mõned introniteta.
15.
Geenide grupeerimise alused.
Üksikud samased inimgeenid kodeerivad funktsionaalselt identseid
polüpeptiide ning paiknevad kas klastris (α-globiin) või ka
erinevates kromosoomides (
histoonid - 86 järjestust 10 kromosoomis,
ubikvitiin polü- või bitsistroonsete transkriptsiooniühikutena),
Funktsionaalselt sarnastesse geeniperekondadesse kuuluvad geenid on
lähedalt seotud, kuid mitte identsed! Nad on tihti klasterdatud n.n
HOX geenid (tandeemne duplikatsioon), Funktsionaalselt seotud geenid
paiknevad tavaliselt hajutatult erinevates kromosoomides. Kattuvad
geenid ja polütsistroonsed geenid: Mõned eukarüootsed geenid (DNA
reparatsioon ) on transkribeeritud mõlemalt ahelalt s.t. neil on
bidirektsionaalne
orientatsioon . Mõned geenid on osaliselt kattuvad
(HLA). Mõned geenid (snoRNA) võivad paikneda teiste geenide
(ribosoomivalkude geenid) intronites. Mõned inimgeenid (rRNA,
insuliin ) transkribeeritakse polütsistroonsetena (multigeensetena).
16.
Geeniperekonnad. Klassifikatsioon geeniperekondadesse toimub DNA järjestuse
homoloogia alusel: Paljud polüpeptiidide ja ka mittekodeeriva RNA
geenid koonduvad DNA järjestusel põhinevatesse geeniperekondadesse,
mis omavad suurt perekonnasisest järjestushomoloogiat. Paljud
perekonna liikmed võivad olla
mittefunktsionaalsed s.t.
pseudogeenid ja geenide
fragmendid . Klassikalised geeniperekonnad on järjestuselt
väga sarnased ja tekkinud peamiselt duplikatsioonide tagajärjel
(histoonid,
globiinid ), Mõnedes geeniperekondades esineb homoloogia
vaid teatavate konserveerunud domäänide osas
(transkriptsioonifaktorid), Mõnedes geeniperekondades esineb
homoloogia vaid teatavate konserveerunud lõikude osas (DEAD box, WD
kordus), Mõned evolutsiooniliselt kauged geeniperekonnad
liigitatakse superperekondadesse (
produktid strukturaalselt ja/või
funktsionaalselt
kaudselt seotud, nt. immuunglobuliinide ja
G-valkudega seotud retseptorite superperekond). Mõned
geeniperekonnad
defineeritakse funktsionaalselt sarnaseid lühikesi
motiive
omavate geeniproduktide kaudu (DEAD box ja WD kordus). Ig
superperekonna liikmed on sarnase domäänse struktuuriga
rakumembraaniga seotud
valgud . Geeniperekondade
organisatsioon genoomis: Geeniperekondi jaotatakse ka klasterdumise järgi.
Klastritest väljaspool
asuvaid perekonna liikmeid nimetatakse orb
geenideks (orphan gene), Enamik klasterdatud geene on tekkinud
tandeemsete duplikatsioonide tagajärjel. Eristatakse geeniperekondi,
mis esinevad genoomis: ühe klastrina, esinevad mitmete klastritena,
paiknevad hajutatult. Geeniperekonnad: Ühe klastrina esinevad
geeniperekonnad: Tandeemse organisatsiooni puhul on geenid seotud nii
funktsiooni kui ka järjestuse kaudu (peamiselt RNA geenid),
Klasterdumise puhul ei paikne geenid tandeemsete kordustena vaid on
sageli reguleeritud ühe lookuskontrolli regiooni kaudu (locus
controll region). Geenid on klastris lähedaselt seotud funktsiooni
ja homoloogia kaudu, esineb ka arvuliselt pseudogeene, Liitklastrites
(compound clusters) paiknevad geeniperekonnad on füüsiliselt vähem
seotud ning seal esineb ka eelmistega mitteseotud järjestusi (nt.
HLA kompleksis 6p21.3 asub lisaks HLA ja komplemendi geenidele ka
näiteks steroid 21-hüdroksülaasi geeniperekond). Klasterdatud
geeniperekondade näited, geenid on tihti sarnaste järjestustega ja
transkribeeritud samalt ahelalt. Mitmete klastritena esinevad
geeniperekonnad: Harvadel juhtudel paiknevad klasterdatud
geeniperekonnad hiljutise duplikatsiooni tulemina ühes kromosoomis
(SMN1 ja SMN2). Reeglina on homoloogia kõrgem klastrite sees kui
klastrite vahel.
Hajutatud geeniperekonnad: Eri asukohtades olevad
geenid on tavaliselt divergeerunud järjestustega, Võivad olla pärit
kas erinevatest genoomidest (mitokondriaalses s.t. bakteriaalses
genoomis esinevate geenide ülekanne nukleaarsesse), Vanadest geeni
või genoomi duplitseerumistest (PAX geenid). Homoloogia vaid teatud
domäänide piires. Retrotranspositsiooni tagajärjed (paljud
mittefunktsionaalsed pseudogeenid).
17.
Pseudogeenid ja geenifragmendid.
Geeniperekondadesse kuuluvad sageli defektsed geenikoopiad
(pseudogeenid), sisaldades
tervet kodeerivat järjestust või selle
osi ehk geenifragmente (puuduvad 3` või 5`
otsad ).
Kanal 51, inimesel
19000 pseudogeeni, arvukalt tsentromeersetes piirkondades,
Protsessimata pseudogeenid on tekkinud genoomse DNA tasemel
duplikatsioonide tagajärjel, fragmenteeritud geenide osad aga
ebavõrdse
ristsiirde või õdekromatiidide
vahetuse kaudu,
Protsesseeritud pseudogeenid sisaldavad funktsionaalse geeni eksoneid
ja omavad tavaliselt ühes otsas oligo (dA)/(dT) järjestusi.
Tekkinud retrotranspositsiooni tagajärjel cDNA-dest (üle 2000
ribosomaalse valgu protsesseeritud pseudogeeni). Tavaliselt ei
ekspresseeru, Ekspresseeritud protsesseeritud geenid ehk retrogeenid
on samuti tekkinud retrotranspositsiooni teel, on muutunud valiku
survel funktsionaalseks, Transpositsioonis on edukaimad RNA
polümeraas III
transkriptid . Alu kordusjärjestused on arvatavasti
pärit 7SL RNA protsessitud pseudogeeni koopiatest. Klasterdatud
geeniperekonnad sisaldavad sageli protsessimata pseudogeene või
geenifragmente (HLA I perekond 6p21.3 koosneb 20 geenist).
Protsesseeritud pseudogeenid ja retrogeenid tulenevad RNA
transkriptide pöördtranskriptsioonist (LINE-1 elemendid) ja
integratsioonist genoomi.
18.
Tandeemselt kõrgeltkorduv mittekodeeriv DNA esineb
tandemkorduste blokkidena, mis võivad olla lihtsad (
Kõik kommentaarid