28/10/2019 HC 01: introductiecollege
Tijdens werkgroepen: debat, onderzoek en presentatie.
Genomics > bij genetica alles over moleculaire biologie, verschil is met genomics het hele
genoom tegelijk en daar heb je andere technieken/strategieën voor nodig. En je bestudeerd
niet alleen het humane genoom.
Genetische diversiteit > ontstaat door mutaties die ervoor zorgt dat er soortvorming ontstaat.
Soort > samen na kruising vruchtbare nakomelingen kunnen krijgen, kunstmatige grens
tussen soorten.
Sommige eigenschappen zijn heel erfelijk (nature), zoals oogkleur en andere meer door de
omgeving (nurture), zoals religie.
Complexe trait (ziekte) > bij de overerving komen meerdere genen bij kijken en er is een
kleine bijdrage van de omgeving.
Genetische variaties kunnen we gebruiken > diersoort (muis) verander je het ene gen en kijk
je wat er veranderd. Hiervoor moet je het genoom kunnen manipuleren.
Je kan niet zeggen > hoe meer genen hoe complexer het organisme.
Annotatie > inhoudsopgave die we zelf aan een sequentie vastplakken. We leren elke dag
weer welke genen wel van belang zijn en welke niet.
Knock-out > null allele (functie van het wild type wordt weggehaald en erft recessief over)
en knock-in (mutant allele zorgt voor een andere expressie van eigenschappen van wild
type) en conditional knock-out (floxed allele aan weerszijde zitten loxP sites en waar je
middels een enzym heel snel een null allele gemaakt kan worden).
Forward genetics > kiest een phenotype en je gaat op zoek naar het gen.
Reverse genetics > kiest een gen en je zoekt de functie daarvan uit.
Met al deze technieken en kennis kunnen we een diagnose stellen van een erfelijke ziekte
en middels diermodellen een disease treatment kunnen ontwikkelen.
28/10/2019 HC 02: Fundamentals of molecular genetics
Doelen van genomics:
- Voorspellen biologische functie
- Begrijpen van eiwit functie en disfunctioneren
- Metabolische maps maken voor de cel en zijn fysiologie begrijpen
- Fundamenteel inzicht in de adaptieve responsen van de cellen in relatie tot
veranderingen in hun omgeving
Het genoom is alle biologische informatie nodig om een levend organisme te bouwen. Het
menselijke genoom bevat 23x2 chromosomen en 3 miljard nucleotidenparen. In de DNA
sequentie zit de code voor eiwitten > gen. Er zijn ongeveer 30.000 genen in het eukaryote
genoom en bacteriën hebben 3.000 genen.
Het DNA bevinden zich chromosomen. Chromosomen bestaan uit DNA en eiwitten >
eiwitten zijn nodig voor het opwinden van het DNA (histonen). We kennen 4 basen: adenine,
cytosine, guanine en thymine. De A en de G zijn purines en C en T zijn pyrimidines en ze
vormen de bouwstenen voor het DNA. Ze bevatten een suiker, fosfaatgroep en
nucleotidebasen. Een base zonder een fosfaatgroep, maar met een suikergroep noemen we
een nucleoside. De C en de G kunnen 3 waterstofbruggen vormen en zullen dus moeilijker
zijn om te breken dan de A en de T binding.
RNA heeft een extra hydroxylgroep, een ribose en we kennen geen T, maar een U.
,Nucelotides zijn met elkaar verbonden via fosfodiester bindingen en wordt verlengd van de
5’ naar de 3’ kant. Via een condensatiereactie wordt een nucleotide eraan geplakt aan de 3’
kant. De hydroxylgroep van de eerste fosfaat vormt een binding met de OH-groep. De
energie wordt geleverd door de afsplitsing van de 2 fosfaatgroepen en deze noemen we
pyrofosfaat. Condensatie levert chain-extension op (verlenging van de streng).
De basen vormen basenparen met een andere base, een A met T en C met G. Dat levert
een dubbele helix op met complementaire basenparing met een 3’ en een 5’ kant die in
tegengestelde richting runnen. In 1953 begon de genomics na het achterhalen van de DNA
structuur door Watson en Crick.
Het DNA is opgebouwd uit open reading frames met een start- en een stopcodon.
Regulatoire sequenties liggen upstream die de transcriptie van genen aan- en/of uitzetten.
De shine-dalgarno sequence zorgt voor de herkenning van ribosomen op daar op het DNA
te gaan zitten en deze ligt ook upstream. Ook kennen we een deel dat een stop signaal
geeft voor transcriptie.
Verschil tussen prokaryoten en eukaryoten:
- Prokaryoten bevatten operonen > setje van genen die coderen voor eiwitten die
betrokken zijn bij een vergelijkbare functie.
- Polycistronic mRNA’s bij prokaryoten.
- Little RNA processing > geen splicing van intronen bijvoorbeeld bij prokaryoten.
- DNA ligt in het cytoplasma bij prokaryoten.
- Single genes bij eukaryoten
- Monocistronic mRNA’s bij eukaryoten
- Veel processing van het RNA door splicing bij eukaryoten waar de intronen
verwijderd worden. De exonen worden aan elkaar geplakt en dan pas heb je mRNA.
Bij alternative splicing zijn er verschillende mogelijkheden welke intronen (+exon) je
er wel/niet uithaalt. Hier spreekt dit het centrale dogma (één gen levert één eiwit)
tegen.
- DNA ligt in de kern bij eukaryoten
Via transcriptie krijgen we mRNA en via translatie een eiwit bij eukaryote cellen. RNA
polymerase zorgt voor het aanmaken van mRNA en produceert dit van de 5’ naar 3’ richting
van transcriptie start site naar stop site en gebeurt in de kern.
Translatie vindt plaats in het cytoplasma en tRNA’s brengen de aminozuren naar het
ribosoom toe voor inbouwing. De aminozuren worden ingebouwd aan de hand van de code
afgelezen door mRNA van het DNA en loopt van start- naar stopcodon. Redundancy houdt
in dat we meerdere codons hebben voor hetzelfde aminozuur, we hebben er immers maar
20.
Aminozuren verschillen op basis van structuur en functie, maar kennen enige vorm van
overlap: hydrophobicity, size, charge, secondary structure preference, alcoholicity en
aromaticity. Als je deze kenmerken weet, dan kan je de functie van een eiwit een beetje
voorspellen. Een aminozuren hebben een aminogroep en een carboxylgroep met een
karakteristieke zijketen. Een covalente binding vormt zich middels een condensatiereactie
(hydroxylgroep met een H van de aminogroep) en start bij de amino N kant en stopt bij de
,carboxy C kant. Het ribosoom katalyseert deze condensatiereactie. Een tRNA kan binden
aan een aminoacyl tRNA synthetase met een specifiek aminozuur (sleutel-slot principe). Met
zijn anticodon herkent het tRNA een bepaalde sequentie op het mRNA dat overeenkomt met
het gebonden aminozuur. Het ribosoom geeft een omgeving om de chemie hiervan te
faciliteren. Op de P-site bevindt zich de verlengde eiwitketen aan een tRNA. De A-site is de
accepting site en daar komt een nieuw tRNA binnen. Dit aminozuur wordt covalent
gebonden aan de lange eiwitketen en dan schuift het ribosoom op en via de E-site wordt een
leeg tRNA verwijderd.
Na de translatie heb je een polypeptide die een primaire structuur kent. Vervolgens vormt
zich de secundaire eiwitstructuur > alpha helix en bèta sheets, deze opbouw wordt bepaald
door de intrinsieke eigenschappen van de aminozuren in de primaire structuur. Bij een alpha
helix paart een aminozuur met een aminozuur die 3 plekken verderop ligt middels een
waterstofbrug (1>4). De tertiaire structuur middels cysteïne bruggen (zwavelbruggen) > het
aminozuur bevat als zijketen een zwavel groep. Ook andere covalente bindingen kunnen
ontstaan en levert een werkend eiwit. Een quaternary structuur bestaat uit meerdere eiwitten
met een andere tertiaire structuur. Eiwitten heb je nodig: enzymen, structurele componenten,
regeleiwitten, signal transduction eiwitten, transporteiwitten, membraan transporters,
hormonen en antistoffen.
Recombinante DNA techniek:
1. Je hebt een bacteriële celcultuur nodig en je haalt hier het DNA uit via DNA extractie
waar je enzymen gebruikt (RNAse en protease) die ervoor zorgen dat je alleen DNA
overhoudt.
2. Het DNA knip je in stukjes en wordt gekloond in plasmiden die gehandhaafd kunnen
blijven in het cytoplasma van de bacterie. De plasmide bevat het DNA van interest
waar jij de expressie van wilt onderzoeken. Uiteindelijk krijg je een recombinant
plasmide met het DNA van interest. De hele verzameling plasmiden heet en genomic
library.
3. De hele library wordt overgedragen naar een bacterie (meestal e. coli bacterie). Dit
gebeurt middels een heat shock bijvoorbeeld. Door de bacterie te kweken op een
selectief medium kan je dus checken of het plasmide is opgenomen.
4. Sequentie achterhalen (lees hieronder voor de verschillende technieken).
Sanger approach > ketenpolymeristatie in een reageerbuis met de juiste ingrediënten. Een
nucleotide die een OH-groep mist en een fluorescent label bevat. in de chemie kan de keten
niet meer verder polymeriseren na inbouwing van deze nucleotide. 4 reageerbuizen met
daarin één van de vier dideoxy’s toe met een onbekend stukje DNA. Verder heb je een
primer en DNA polymerase nodig. DE PRIMER LOOPT VAN 5’ NAAR 3’ en deze is
noodzakelijk om DNA polymerase te laten binden omdat die een OH-groep nodig heeft. De
speciale nucleotiden zijn ook toegevoegd en op het moment dat deze ingebouwd wordt,
stopt de keten elongatie en krijg je DNA fragmenten met verschillende lengtes. Dit proces
loopt van primer anneal > polymerisation > chain termination. Deze fragmenten kun je
scheiden door middel van elektroforese. De fragmenten worden geload op een gelen op
basis van de lengte worden de fragmenten van elkaar gescheiden via een spanningsveld en
zichtbaar gemaakt worden via het fluorescente label aan die aparte nucleotide. DNA is
negatief geladen en loopt dus richting de plus pool. Elke nucleotide heeft een andere
fluorescentie, waardoor je precies weet welke nucleotide het is. De laser registreert de kleur.
, Tegenwoordig is dit proces geautomatiseerd en vindt dit plaats ipv in een eppendorf in een
capillair en noemen we dit automated sequencing. In deze techniek zitten alle dideoxy’s in
één buis. Daarna worden ze in één capillair gestopt en gelezen.
Op basis van de specifieke verschillen tussen organismen kunnen we nu zichtbaar maken
via sequencing, bijv. achterhalen welke organismen betrokken zijn bij de afbraak van olie. Je
bepaalt het metagenoom (het genoom van alle organismen binnen een bepaald gebied) en
onderscheid daarin de verschillende organismen. Dit noemen we whole genome
sequencing. De gesequencete stukjes vormen contigs (worden achter elkaar gelegd) en de
gaten worden opgevuld. Overlapping software herkent een overlap tussen 2 fragmenten en
dan weet je dat deze fragmenten bij elkaar liggen. De gaten worden opgevuld middels een
PCR techniek. Als laatste ga je annoteren > bepalen wat de functie/label is. Het humane
genoom project kende de centrale aanpak: 5 mensen hun DNA wordt geÏsoleerd en
gekloneerd via whole genome sequencing. Vervolgens werd er een physical map gemaakt.
De grote gekloneerde stukken worden opgedeeld in kleinere stukjes op deze fragmentjes
kan de Sanger techniek worden toegepast > tijdrovend proces.
Physical markers: restriction enzyme sites, RFLP, SSLP en SNP > allemaal technieken om
inzicht te krijgen hoe de kleine stukjes t.o.v. elkaar lagen.
- Restriction enzyme sites > restrictie-enzymen knippen het DNA op bepaalde plekken
in het DNA (palindromisch) en deze fragmenten worden gescheiden door gel-
elektroforese. Kijk naar vergelijkbare patronen (overlapping fragmenten) >
fingerprinting. Vervolgens bouw je de contig op aan de hand van deze gelijke
overlappende fragmenten. Computers kunnen dit automatisch, alleen fragmenten
van dezelfde lengte kunnen verschillende sequenties bevatten en repetitieve
elementen geven ook dezelfde lengte alleen liggen ze op verschillende locaties op
het chromosoom.
- RFLP > genoom van 2 individuen knippen met hetzelfde restrictie-enzym en
vergelijken qua bandenpatroon. Mutaties in deze cleavage sites zorgen voor het
verschil in restrictiefragmenten.
- SSLP > meeste genomen hebben een repeat van 3 of 4 nucleotiden en de
hoeveelheid hiervan verschilt tussen individuen (microsatellites).
- SNP > Tussen mensen is er één nucleotide verschil > vaak betrokken bij ziektes.
Op basis van het minimum tiling path (start bij de kleinste hoeveelheid DNA fragmenten dat
een contig vormen) en bouw zo het hele genoom op. Soms gaat het mis (gap) en je weet de
sequentie niet, met behulp van PCR kan je dit gat oplossen. Hetzelfde geldt voor de single
stranded stukjes.Uiteindelijk krijg je de hele genoom sequentie + de annotatie op basis van
onze kennis. Hierin kun je herkennen: genen, exonen/intronen, regulatoire sequenties,
repetitieve elementen en links naar de biologische functie. Op basis van deze
eigenschappen kun je het eiwit voorspellen + biologische functie.
1,5% van ons genoom is maar coderend. De rest bestaat uit oa. unknown DNA, regulatoire
sequenties etc.
Craig Venter ontwikkelde de whole-genome shotgun sequencing onafhankelijk van het
humane genoom project. Hij liet het van grote stukken naar kleine stukken en physical maps
achterwege en seguente alles en bekeek de overlap hiertussen. Dit is veel sneller. Venter
heeft ook zijn eigen DNA onder de loep genomen, want in het humane genoom project was
het DNA van 5 verschillende personen gemixt en daar kwamen een paar eigenschappen
naar voren afgeleid van medische en biologische annotaties. Al het whole genome