HOOFDSTUK 2: DNA
2.1. DNA SEQUENTIEBEPALING
Evolutie in methoden:
First-generation sequencing (1977)
• Sanger, (Maxam and Gilbert)
• cloneren (plasmiden - bacteriën)
• elektroforese
• nog steeds “gouden standaard”, voor kleine projecten
Second-generation sequencing
• ‘next-generation sequencing’ (2006-…)
• massief parallel sequencen van clonaal in vitro geamplificeerde DNA moleculen
• miljoenen korte sequenties tegelijk
• bv. Illumina, Ion Torrent
Third-generation sequencing
“next-next generation sequencing” (2010-…)
• sequencing van individuele DNA moleculen (geen amplificatie)
• bv. Nanopore, Pacific Biosciences
Evolutie in capaciteit, snelheid en kosten
Brede toepassingen:
De novo genoom sequentiebepaling = sequentie van een species waar we nog geen DNA sequentie van hebben
• ongekende genomen bv Humaan Genoom project
• nieuwe organismen (bv. Sars-CoV-2)
• gedeeltelijk of volledig
Resequencing
• individuen tov referentiegenoom
• verschillen tussen individuen (SNPs)
• mutaties (ziekten)
• Construct verificatie
• klinische toepassingen: diagnose, farmacogenetica, NIPT (niet invasieve prenatale test), …
,Sequentiebepaling als teller
• aantallen DNA (of RNA) moleculen
• (zie RNAseq, ChIPseq,…)
Whole genome, exome en targeted sequencing
WGS = whole-genome sequencing
WES = whole-exome sequencing
= coderende sequentie
= 1.5% van genoom
Targeted sequencing
= specifieke gewenste regio’s
Transcriptoom: RNA → cDNA
2.1.1. 1 S T E GENERATIE SEQUENTIEBEPALING
SANGER SEQUENCING = NIEUWSYNTHESE MET DIDEOXY -KETEN TERMINATIE
• template/matrijs = clone of PCR amplicon bv van genomisch DNA-fragment
• polymerase + primer + mengsel van 4 dNTPs + ddNTPs (elke ddNTP met verschillende fluorescente
label)
• reactie loopt door na inbouwen dNTP
• reactie (keten) stopt na inbouwen ddNTP
• Normale dNTP: 2’OH groep ontbreekt, bij ddNTP: ook 3’ OH groep ontbreekt, dat is de OH groep die
fosfodiesterverbindingen gaat vormen in een DNA keten
• juiste verhouding dNTPs/ddNTPs
• scheiding strengen op gel of capillair → elektroferogram
• beperkt tot ~500 nt, moeite met herhalingen
• voor betrouwbaarheid: best twee aparte reacties
(FW of RV primer) om beide richtingen af te lezen
ELEKTROFEROGRAM AFLEZEN
Phred score Q = -10*log10(P)
P = probabiliteit van foutieve base call
1ste 30 bp niet afleesbaar
meestal 500-700 bp (max. tot 1000 bp) goede sequentie afleesbaar
Software om af te lezen met kwaliteitsscores per base (Phred-score)
,MUTATIEDETECTIE
- Niet altijd even hoge pieken
- sequentie-fout versus mutatie? → forward en reverse
reacties ter bevestiging
VERWEZENLIJKINGEN MET 1 E GENERATIE SEQUENCING (SANGER)
Human Genome Project (HGP)
= grootste multinationale biologische project ooit
3 billion USD
• gestart 1990, geleid door Francis Collins, NIH
• stalen: meerdere anonieme individuen
• methode: hierarchical shotgun sequencing met Sanger methode
• clones in YACs, BACs, P1s, cosmiden
• mapping en fragmentation (5 jaar)
→ automatische sample bereiding en sequentiebepaling door 20 centers over heel de wereld (100-
den toestellen)
→ elke 24u publieke vrijgave sequenties
→ draft sequentie 2001, finale sequentie 2003
ENORME IMPACT OP:
• technologische ontwikkeling van sequencing
automatisering,…
→ gedaalde kosten/base (van € 10/b → € 0.01 /b)
→ enorme toename in sequentiedata
aanpak: bv sommige delen van chromosoom zoals centromeren bijna onmogelijk te cloneren
• grote ontwikkeling van bioinformatica
• visie op delen van data (open science, open data)
• andere methoden omdat nu de (bijna) volledige sequentie beschikbaar is
• biologische kennis:
▪ sequentie en organisatie van nagenoeg alle humane genen gekend
▪ vergelijkende genomics: inzicht in evolutie, in geconserveerde processen
▪ genetische verschillen tussen mensen
NIEUWE UITDAGINGEN:
• volledige sequentie (telomeer tot telomeer)
• meer genomen sequencen van meerdere species
• meer individuele humane sequenties
• persoonlijke genoomsequentie van iedereen
, Enorme mogelijkheden voor ‘personalizes precision medicine’
• Kennis van DNA volgorde en SNPs → diagnose, prognose, preventie
• Farmacogenomics: verklaart waarom en voorspelt of bepaalde individuen goed/slecht reageren op
geneesmiddelen → enorme impact op industrie
• Inzicht in complexe multifactoriële aandoeningen (diabetes, kanker,..)
• Therapie op maat, bv al bij kanker
• Maar ook ethische aspecten (werkgevers, verzekeringsmaatschappijen
2.1.2. 2 D E GENERATIE SEQUENTIEBEPALING: SHORT -READ NEXT-GENERATION SEQUENCING
doel: veel hogere throughput aan veel lagere kost → massale DNA sequentiebepaling mogelijk
richtdoel: 1 humaan genoom op 1 toestel per dag voor <1000 USD (“thousand-dollar genome”)
Ontwikkeling van nieuwe technologie met 3 pijlers:
• parallelle detectie (Massive parallel sequencing)
o cluster of polony = kopieën van een DNA template
o klonale in vitro amplificatie van template (<> klassieke klonering)
→ duizenden-miljoenen kopieën van DNA template per cluster
o multiplexing: vele clusters tegelijk (<> 1 template/reactie)
• miniaturisatie van reacties => werken in super kleine putjes
• integratie van het proces (pipeline)
o directe detectie (<> scheiding fragmenten via gelelectroforese
Verschillende commerciele platformen:
• 454/Roche, Illumina, SOLID, Ion Torrent,..
• Zeer competitief
• Snelle evolutie
Gebaseerd op 4 stappen:
• Stap1. Aanmaak DNA library
• Stap 2. Klonale in vitro amplificatie
• Stap 3. Sequencing/sequentiebepaling
• Stap 4. Data analyse
STAP 1: AANMAAK NGS DNA LIBRARY
library = fragmentenbank = verzameling te sequencen templates
afhankelijk van doelstelling kunnen we verschillende soorten librarys maken
Types DNA library:
• whole genome sequencing (WGS)
• Mate Pair libraries (zie verder): 2 uiteindes van fragment met gekende afstand ertussen
• whole exome sequencing (WES) of targeted sequencing:
aanrijking door hybridisatie aan probes (in oplossing of op array) (zie panel A) of PCR-gebaseerd (zie
panel B)
o DNA fragmenten met de gewenste sequentie blijven plakken => enkel de gewenste blijven
plakken en de rest dan wegwassen