Inhoudsopgave
3.2 DNA ............................................................................................................................................................ 2
3.2.1. DNA sequentiebepaling ............................................................................................................................ 2
Brede toepassingen ....................................................................................................................................... 2
De novo genoom sequentiebepaling ........................................................................................................ 2
Resequencing ............................................................................................................................................ 3
Sequentiebepaling als teller...................................................................................................................... 3
Begrippen ...................................................................................................................................................... 3
De novo sequencing vs. Resequencing: .................................................................................................... 3
Whole genome, exome en targeted sequencing: ..................................................................................... 3
3.2.1.1. 1ste generatie sequentiebepaling ...................................................................................................... 4
Elektroferogram aflezen ............................................................................................................................ 5
Verwezenlijkingen met Sanger .................................................................................................................. 6
Nieuwe uitdagingen .................................................................................................................................. 7
3.2.1.2. 2de generatie sequentiebepaling: short-read next-generation sequencing ...................................... 8
Stap 1: aanmaak NGS DNA library ............................................................................................................ 9
Types DNA library afhankelijk van de doelstelling en vraagstelling ..................................................... 9
Procedure voor aanmaak library .......................................................................................................... 9
Stap 2: Klonale in vitro amplificatie ........................................................................................................ 12
Emulsie PCR ........................................................................................................................................ 12
Solid-phase bridge amplificatie (bv. Illumina) .................................................................................... 13
Solid-phase template walking ‘wildfire’ (bv. SOLiD) ........................................................................... 13
Rolling-circle amplificatie in oplossing (bv. Complete Genomics) ...................................................... 13
Stap 3: Sequencing/sequentiebepaling .................................................................................................. 14
Sequencing by synthesis met reversible chain terminator ................................................................. 14
Sequencing-by-synthesis met single-nucleotide toevoeging (Pyrosequencing en Ion-semiconductor
sequencing) ........................................................................................................................................ 15
Ion-semiconductor sequencing (bv Ion Torrent) ................................................................................ 15
Sequencing-by-ligation (Bv SOLID, CompleteGenomics) .................................................................... 15
Stap 4: Data-analyse ............................................................................................................................... 16
Voorbeelden van platformen .................................................................................................................. 17
454/Roche Genome Sequencer FLX+ (historisch) .............................................................................. 17
Illumina .............................................................................................................................................. 20
ABI-SOLiD (Life Technologies / Thermo Fisher) (historisch) ............................................................... 24
Ion/proton sequencing....................................................................................................................... 31
Mogelijkheden en beperkingen 2nd generation sequencing ................................................................. 32
3.2.1.3. 3de generatie sequentiebepaling: long-read next-generation sequencing...................................... 33
Helicos tSMS: true Single Molecule Sequencing (Historisch).................................................................. 33
Pacific BioSciences (PacBio) SMRT (Single Molecule Real Time) ............................................................. 34
Nanopore sequencing ............................................................................................................................. 36
3.2.1.4. Epigenetica sequentiebepaling (methylatie sequentiebepaling) .................................................... 37
Bisulfiet sequencing ................................................................................................................................ 38
Methylated DNA immunoprecipitation sequencing ............................................................................... 40
3.2.1.5. Single-cell sequentiebepaling ......................................................................................................... 41
3.2.2. DNA genotyperen ................................................................................................................................... 43
3.2.2.1. Short-tandem repeat genotypering ................................................................................................ 45
3.2.2.2. Taqman genotypering ..................................................................................................................... 48
3.2.2.3. Microarrays (+ genoomwijde associatiestudies) ............................................................................. 49
Illumina ................................................................................................................................................... 49
Affymetrix ............................................................................................................................................... 50
Polygenic risk score ................................................................................................................................. 54
Microarrays voor methylatie-analyse ..................................................................................................... 55
1
, Microarrays voor CNV analyse ................................................................................................................ 56
3.2.3. DNA hybridiseren .................................................................................................................................... 56
3.2.3.1. FISH ................................................................................................................................................. 57
3.2.3.2. CGH ................................................................................................................................................. 58
3.3 RNA .......................................................................................................................................................... 59
3.3.0. Herhaling ................................................................................................................................................ 59
Soorten RNA ................................................................................................................................................ 60
Northern blotting ......................................................................................................................................... 60
Kwantitatieve PCR ........................................................................................................................................ 61
3.3.1. RNA micro-arrays ................................................................................................................................... 62
Spotted arrays .............................................................................................................................................. 62
High-density oligonucleotide microarrays ................................................................................................... 63
Verschillende soorten probes op high density microarray: .................................................................... 64
Detectie: fluorescentie ............................................................................................................................ 64
Typische plots ......................................................................................................................................... 66
Principal component analysis (PCA) ........................................................................................................ 67
Gene ontology......................................................................................................................................... 68
Standaardisatie van array gegevens ........................................................................................................ 68
3.3.2. RNA sequencing (bulk) ............................................................................................................................ 69
3.3.2.1. short-read RNA (cDNA) sequencing ................................................................................................ 71
Library preparation ................................................................................................................................. 71
3.3.2.2. long-read cDNA en direct RNA sequencing .................................................................................... 74
3.3.3. Single-cell RNA sequencing ..................................................................................................................... 75
Drop-seq: Droplet sequencing ..................................................................................................................... 76
CITE-seq: Cellular Indexing of Transcriptomes and Epitopes by Sequencing ............................................... 78
3.3.4. Spatial transcriptomics ........................................................................................................................... 79
In situ hybridisation ..................................................................................................................................... 80
In situ sequencing (ISS) ................................................................................................................................ 82
In situ capturing ........................................................................................................................................... 83
3.2 DNA
3.2.1. DNA sequentiebepaling
Sequentiebepaling = volgorde van letters lezen
OPM.: In second en third generation wordt geen elektroforese gedaan
Brede toepassingen
De novo genoom sequentiebepaling
= voor de allereerste keer sequencen, de sequentie is nog niet gekend!
- ongekende genomen
- bv Humaan Genoom project
- nieuwe organismen (bv. Sars-CoV-2)
- gedeeltelijk of volledig
Principe:
Je kan niet door het hele genoom sequencen, want dat is veel te groot. Daarom ga je in
stukken sequencen, je gaat dan kijken naar overlaps. Al die sequencies kan je dan aan elkaar
gaan plakken, maar je gaat gaten hebben. Het is moeilijk om die gaten op te vullen en al die
fragmenten aan elkaar te krijgen.
2
,Resequencing
= nieuw individu van een species waarvan het genoom gekend is ga je sequencen. Je hebt
een referentiegenoom en dat zit in een databank. Als je nu een nieuw individu gaat
sequencen, heb je ook stukjes DNA maar je weet hoe het in elkaar zit dus die stukjes gaan
veel makkelijk overlappen.
- individuen tov referentiegenoom
- verschillen tussen individuen (SNPs): We gebruiken dit om te kijken naar verschillen
tussen individuen (= SNPs). Ong. 3 miljoen basen zijn verschillend van individu tot
individu.
- mutaties (ziekten): Naast SNPs (= natuurlijke verschillen), heb je ook mutaties (= komt
in een specifieke patiëntenpopulatie voor) die gelinkt zijn aan bepaalde ziektes.
- Construct verificatie
- klinische toepassingen:
diagnose, farmacogenetica, NIPT (niet invasieve prenatale test), …
Sequentiebepaling als teller
= We willen het aantal tanscripten/RNA moleculen gaan meten/tellen. Hoeveel komt een
bepaald gen tot expressie in een bepaald weefsel? Dan wil je die transcripten tellen.
- aantallen DNA (of RNA) moleculen
- (zie RNAseq, ChIPseq,…)
Begrippen
De novo sequencing vs. Resequencing:
- De novo: Je gaat kleine fragmenten random maken en die ga je sequencen => de
computer probeert die aan elkaar te hangen, maar dat is niet evident
- Eens je een referentiesequentie heb kan je makkelijk gaan resequencen omdat je
referentiegenoom hebt.
Whole genome, exome en targeted sequencing:
- WGS = ganse genoom sequencen
- WES ( = whole exome sequencing ) = exoom (= coderend deel van het genoom) => als
je mutaties wil gaan bekijken, dan ben je enkel geïnteresseerd in de coderende
sequenties en dan hoef je niet het hele genoom te sequencen.
3
, - Targeted = bv. Enkel X-chromosoom sequencen => alleen gewenste regio’s sequencen
- Transcriptoom = RNA omzetten in cDNA en dat sequencen => dan lees je niet het
genoom, maar het transcriptoom
3.2.1.1. 1ste generatie sequentiebepaling
– Sanger, (Maxam and Gilbert)
– cloneren (plasmiden - bacteriën)
– elektroforese
– nog steeds “gouden standaard”, voor kleine projecten
Er zijn 2 methodes van 1st generation sequencing:
1. Chemische klieving methode: methode wordt niet meer gebruikt, enkel ter illustratie.
Je moet dit niet uitleggen op het examen!
2. Sanger sequencing = nieuwsynthese met dideoxy-keten terminatie
▪ We starten van een template/matrijs = gefragmenteerd genoom dat
geamplificeerd wordt door cloneren of een specifiek fragment dat
geamplificeerd wordt met PCR
▪ Amplicon = stukje dat we amplificeren
▪ Polymerase + primer + mengsel van 4 dNTPs + ddNTPs: Polymerase (maakt
nieuw DNA), kan alleen vertrekken van een primer (die complementair is aan
de template), dan kom je met dNTPs, maar er zit ook een kleine hoeveelheid
ddNTPs bij => Normale dNTP: 2’OH groep ontbreekt, bij ddNTP: ook 3’OH
groep ontbreekt, dat is de OH groep die fosfodiesterverbindingen gaat vormen
in een DNA keten
▪ Als je nucleotiden aan elkaar hangt, dan gaat de volgende aan de OH groep
hangen, maar dit is afwezig bij ddNTP dus dan kan het volgend nucleotide niet
worden ingebouwd = terminatie!
▪ We gaan een bepaalde verhouding van gewone nucleotiden en ddNTPs
toevoegen, zodanig als je DNA synthese laat doorgaan (nucleotiden in
meerderheid) dan worden die ingebouwd tot er toevallig een ddNTP wordt
ingebouwd. ddNTPs zijn fluorescent gelabeld, die hebben alle 4 een andere
fluorescente kleur. Als je fragment eindigt op een bepaald ddNTP krijg je een
bepaalde kleur.
▪ Capillaire gelektroforese: kleine fragmentjes (paars) komen eerst voorbij de
sensor en worden eerst afgelezen, langste fragmentjes laatst, dus van links
naar rechts is van klein naar groot. Door de capillairen schijnt een laser, je kan
in real time zien welk kleurtje de laser passeert.
4
,Je hebt tegenwoordig polymerasen die thermostabiel zijn (cycli zoals bij PCR) en zowel dNTPs
als ddNTPs kunnen inbouwen zonder onderscheid te maken. Tegenwoordig kan je zo 500-
1000 nucleotiden lezen. Systeem heeft problemen bij herhalingen van nucleotiden.
Elektroferogram aflezen
De kleurt zegt welk nucleotide het is, de hoogte zou in principe hetzelfde moeten zijn. Her en
der zie je overlap en geen duidelijke piek.
Kwaliteitscontrole: de eerste 30 basen laat je gewoonlijk weg, want daar zitte, veel fouten.
meestal 500-700 bp (max. tot 1000 bp) goede sequentie afleesbaar.
Je hebt een software om de sequentie te lezen en er is kwaliteitscontrole, die Phred score Q
noemt: foutieve base call = verkeerde letter. Bv.: Score = 10 = probabiliteit om een foutieve
base af te lezen, dus 1/10 = accuraatheid is 90%, we hebben 90% zekerheid. We willen
gewoonlijk een Thredscore van 20 om een zekerheid van 99% te hebben.
5
, Zowel base call als kwaliteitsscore van die call zitten verwerkt in een FASTQ file, typisch
formaat voor sequencing resultaten.
Ballekjes bovenkant = hoge zekerheid = heel zeker van de sequentie. Computer geeft N = dan
is de betrouwbaarheid zodanig laag dat je computer geen juist nucleotide kan bepalen. Vaak
is dit in GC regio’s (= plakken sterk aan elkaar) die moeilijk worden afgelezen.
Als je 2 pieken tegelijk hebt, die even hoog zijn kan je een mutatie voorspellen of kan dit
gewoon een sequentiefout zijn.
Verwezenlijkingen met Sanger
- Referentiesequentie van de mens in databanken (NCBI/Ensembl/UCSC): Het is geen
genoom van 1 individu, maar wel van meerderen. Dus HGS = geen sequentie van
individu, maar wel van mix van individuen.
- Nog steeds updates (verschillende ‘genome builds’)
- Zie Methoden les over databanken en Bioinformatica
6