Hoorcollege 1: 30 september
Wat je vooral met een genoom sequentie kan doen is deze met andere vergelijken en dan kijken wat
de functie van deze genen in het genoom zijn.
Een van de belangrijkste dingen die je uit een genoom krijgt is een bak voorspelde eiwitten. Val al
deze voorspelde eiwitten wil je individueel kijken wat deze doen.
Er wordt verschrikkelijk veel gesequenced. Als er een nieuwe soort wordt gevonden, dan isoleer je
materiaal en stuur je dit naar een sequencing lab waarna je een genoom terugkrijgt. Eigenlijk weet je
nu nog niets over het beestje. Je hebt dan alleen maar een genoom.
Er zijn maar een paar plekken waar we een beetje iets weten over genomen.
Genomen worden niet alleen gesequenced voor praktische redenen (zoals landbouw, medicijnen
etc), maar ook om fundamentele evolutionaire redenen.
- Er zijn genomen gevonden die tussen de archaea en de eukaryoten zijn. Eukaryoten zijn zo
dus ver ontwikkelde archaea. Er zijn archaea die nauwer verwant zijn aan eukaryoten dan
aan andere archaea.
Over veel genomen weten we heel weinig. Toch kun je hier iets over zeggen door ze te vergelijken
met genomen waar je wel veel van weet.
Wat kunnen we leren van genomen?
1. Genen voorspellen.
2. Bepalen wat eiwitten doen.
3. Identificeren van regulatoire elementen.
4. Leren over evolutie.
Chromosoom 14 van de mens en de muis is eigenlijk nog heel goed te alignen, dit wordt een co-
lineair genoom genoemd. Bij een korte evolutionaire afstand (iets van 10-50 miljoen jaar) zijn de
chromosomen nog co-lineair. Zo snel veranderen de chromosomen dus niet.
Co-lineariteit houdt in dat genen op een chromosoom van twee soorten nog in dezelfde volgorde
liggen. Het enige verschil is de afstand tussen deze genen (deze kan verkort of verlengd zijn).
Dotplot: alle genen van de ene soort liggen langs de ene as en van de andere soort langs de andere
as. Bij een significante hit krijg je een stip. Bij co-lineairiteit krijg je dan een schuin lijntje langs de
dotplot. Dit betekent dus co-lineariteit. Bij volledige chromosomale colinariteit heb je een
doorlopende lijn. Bij mens en chimpansee is bijvoorbeeld heel chromosoom 3 co-lineair.
- Als er een streepje dwars staat, dan heeft er een inversie plaatsgevonden (wat eerst vooral
lag, ligt nu achteraan).
- Als je twee kleine streepjes ziet dan is er of een chromosoom uit elkaar gevallen of zijn er
twee chromosomen aan elkaar gefuseerd (je weet niet bij welke genomen iets gebeurd is). Je
ziet bij dotplots dus enkel heel grote herorganisaties.
De genen tussen mens en muis zijn grootschalig geschud. Grote stukken van het chromosoom zijn
wel colineair, de volgorde binnen verschillende stukken blijven wel hetzelfde (alsof je een aantal
kaarten onderop plakt in plaats van goed schudt). Deze grote stukken zijn in het hele chromosoom
wel door elkaar geschud. Binnen een blok colineair: blokken wel geschud.
- Bij het x-chromosoom zijn er geen stukken geshuffeld.
,Om genen en regulatoire elementen te herkennen wordt gebruik gemaakt van het feit dat de
evolutie eigenlijk wil dat er niets verandert. Dit wordt ook wel purifying selection (ook wel negative
selection) genoemd.
- Zo kan bijvoorbeeld de derde base veranderen, maar hou je wel hetzelfde aminozuur (of
behoud je vergelijkbare aminozuren).
Als je een genoom alignment maakt aan de hand van co-lineaire gebieden dan kun je zien of er
purifying selection plaatsvindt, en of hier dus een gen ligt. Waar purifying selection is, zit een gen. Dit
scheelt heel veel tijd omdat je niet letterlijk hoeft te zoeken naar een gen.
- Als je bijvoorbeeld een ORF hebt, maar er is weinig co-lineariteit, dan zie je dat er geen
purifying selection is, en dat dit dus waarschijnlijk geen gen is. Evolutie doet namelijk niet zijn
best om de sequentie te bewaren.
- Als je bijvoorbeeld een heel kort ORFje hebt waarvan je niet denkt dat het een gen is, en er is
wel een sterke purifying selection dan weet je dat dit waarschijnlijk wel een gen is.
- Bij purifying selection is vooral een insertie/deletie heel uitzonderlijk: evolutie laat niet
zomaar toe dat het reading frame verandert.
ORF: open reading frame, een stukje DNA met een start en een stop codon.
Genoom alignment stelt je in staat de conservering te zien, en stelt je in staat te voorspellen waar
een gen voor een eiwit zit.
Ook niet-coderende sequenties kunnen geconserveerd zijn. Dit worden conserved non-coding
sequences genoemd. Dit zijn vaak enhancers.
Vooral exonen zijn middels purifying selection sterk geconserveerd. Maar ook intronen kunnen
geconserveerd zijn, bijvoorbeeld als dit bindingssites zijn voor een transcriptiefactor.
Best geconserveerd naar slechtst geconserveerd: eiwit coderend, 5’ UTR, 3’ UTR, core promotor,
extended promotor, RNA genen, intronen.
Purifying selection zit op 5.5% van het genoom.
Samenvatting:
- Voor soorten die dicht bij elkaar zitten geldt co-lineariteit.
- Omdat er co-lineairiteit is kun je een genome alignment maken.
- Met een genome alignment kun je bekijken hoe sterk de purifying selection is.
- Aan de hand van purifying selection kun je een genvoorspelling maken/aanpassen.
o Zo kun je eiwitten, regulatoire gebieden, 5’ UTRs etc vinden.
- Als je op onverwachte plekken purifying selection vindt kunnen dit bijvoorbeeld DNA
bindende sequenties zijn (voor miRNA etc.).
Genvoorspelling door middel van conservering wordt ook toegepast op soorten die veel verder van
elkaar af staan.
Bij Blastx neem je een stukje DNA, wat vertaal je in 6 frames waarna je opzoek gaat naar een eiwit
(op basis van homologie met een eiwit database).
Als je een hit hebt, dan zal hier wel een gen zitten, want waarom zou het DNA anders nog zo sterk op
elkaar lijken. Je gebruikt alle informatie die je kan vinden (RNAseq, de novo gene perdiction en blast)
en zoekt naar evolutionaire conservering om tot genvoorspelling te komen.
, Er zijn maar een paar cellijnen echt heel goed bestudeerd (mens, e. coli en s. cerevisiae). Als je een
vraag hebt over een gen in een koe of iets dergelijks wordt dit dus vergeleken met een van de
bekende cellijnen in plaats van helemaal uitgezocht. Je wilt dus weten in een koe wat een gen doet,
zonder dat je al dit soort dure experimenten op nieuw wilt gaan doen. Genomen sequencen is
makkelijker dan voor alles uitzoeken wat het doet.
Tussen mens en fruitvlieg kan er eigenlijk geen genome alignment gemaakt worden, er is namelijk
veel te weinig co-lineairteit waardoor er bijna geen enkel chromosoom ook maar deels overlapt. Bij
oudere soorten moet je dus eiwitten in plaats van hele chromosomen met elkaar vergelijken.
Als mensen eiwitten gaan vergelijken tussen soorten dan spreek je over homologen. Oorspronkelijk
zijn homologen ‘structuren die van een gemeenschappelijke voorouder afstammen’ op basis van
vergelijkende morfologie. Hiermee wordt niet bedoeld dat deze structuren hetzelfde doen, maar
enkel dat ze dezelfde oorsprong hebben: ze stammen van een gemeenschappelijke voorouder af.
- In origine kan iets niet ‘een beetje’ homoloog zijn. Je hebt een gemeenschappelijke
voorouder of je hebt dit niet.
In de moleculaire biologie is homologie gaan betekenen hoe similair twee stukken sequentie zijn. Dit
gaat dus eerder in de richting van of twee sequenties hetzelfde doen. Als eiwitten een
gemeenschappelijke voorouder delen, dan delen ze ook vaak dezelfde functie. Bij hetzelfde ‘doen’
bedoelen we dat ze dezelfde moleculaire activiteit hebben. Omdat eiwitten voor een bepaalde
functie een bepaalde vorm hebben, willen ze ook een bepaalde sequentie bewaren.
Als je functie wilt voorspellen van een bepaald eiwit, dan wil je vooral voorspellen wat de vorm (en
daarmee de sequentie) is.
Bij homologe searches ben je met moleculaire functie en niet met biologische processen bezig.
Moleculaire functie is veel beter geconserveerd dan de biologische processen waar het molecuul in
functioneert.
- Moleculaire functie van enzymen: er zijn zes typen enzymen. Daarnaast zijn er vele
substraten. Zo krijg je een enzymatische code die de moleculaire functie geeft.
- Ook bij lage similariteiten kunnen eiwitten wel hetzelfde doen.
- Residuen die geconserveerd zijn, zijn belangrijk voor de functie van het eiwit.
Als de kans dat dezelfde sequentie ontstaan is door toeval vrijwel 0 is, dan nemen wij dit aan als
homologie. Homologie zegt alleen iets over de moleculaire functie: de structuur van het eiwit zegt
veel over welke reactie het katalyseert (en weinig over waar die reactie dan nuttig voor is). Bij
enzymen zijn de functies duidelijk vastgelegd. Al deze functies kun je onder elkaar zetten en zo
bepalen wat de enzymen nou precies doen en wat hun eiwit sequentie is.
Als je kan bepalen dat twee eiwitten homoloog zijn, dan kun je ook vrijwel zeker zijn over hun functie
(er is ergens een serine en hij heeft een kinase domein.). Wat vervolgens zijn targets zijn of waarom
het eiwit dit doet, kun je aan de hand van de homologie niet zeggen.
Genen kunnen dupliceren. Elk gen kan dus meerdere homologen hebben in hetzelfde organisme. Om
dit op te lossen is blast niet genoeg en moet je bomen gaan maken. Er is maar één homologie die op
dezelfde plaats in het genoom zit. Je hebt dus meer nodig dan alleen het feit dat ze homoloog zijn.
Homologieën gaan over de vraag ‘zijn genen gerelateerd?’. Bomen gaan over de vraag ‘hoe zijn
genen gerelateerd? En zitten ze in hetzelfde proces?’.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller FFV. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.92. You're not tied to anything after your purchase.