Alles Methoden 3 (2022-2023)
3.2 Analyse van DNA & genomics
→ bekijk 1.13 DNA (extraheren, bewaren, kwantificeren, in vitro aanmaak, manipuleren)
DNA sequentiebepaling
Evolutie: sequencen = volgorde DNA aflezen
Fist generation sequencing
→ Sanger, elektroforese (gel), cloneren (plasmiden – bacterie)
→ Humaan Genoom Project: 10jaar voor genoom, veel wetenschappers & machines nodig
+: Gouden standaard kleine projecten
-: traag, veel wetenschappers & machines nodig, duur
Second generation sequencing (= next-generation)
→ Massive parallel sequencen clonaal in vitro geamplificeerde DNA moles (Illumina, Ion Torrent)
+: hele genoom door 1-2 wet.ers & machines, sneller, goedkoper
Third-generation sequencing (=next-next generation)
→ individuele lange DNA moles sequencen ZONDER amplificatie nodig (Nanopore, Pacific Biosciences)
+: lange genomen sequencen
+: hele genoom door 1 wet.er, met 1 machine, heel goedkoop, snel
Toepassingen genoom sequencing:
De novo genoom sequencing
= voor 1e x onbekend genoom sequencen (bv. Humane Genome Project)
Methode: OVERLAPPEN nodig
=> bepalen hoe de stukjes DNA sequentie in elkaar passen
-: moeilijk
Uitdaging: repetitieve sequenties in genoom
=> sequentie past op ≠ plekken
Resequencing
= sequencen genoom van gekend organisme bv. van mens → Humane genoom als referentie
Methode: mappen genoom tov REFERENTIEGENOOM => sequenties genoom aan elkaar plakken
+: eenvoudig
Toepassingen:
- SNPs tussen ≠ individuen bepalen
- Mutaties bij ziekten - Construct verificatie
- Klinische toep.: diagnose, NIPT (= prenataal DNA foetus sequencen)
farmacogenetiga (≠ mensen reageren anders op gnsmddl door ≠ in genoom)
Sequentiebepaling als teller (<>volgorde basen)
= # DNA (of RNA) moles tellen (RNAseq, ChIPseq)
bv. transcriptomics: RNA → cDNA => sequencen => expressie transcript tellen
WGS = Whole genome sequencing = hele genoom sequencen
WES = Whole exome sequencing
= alle exonen genoom = coderende sequenties = 1,5% genoom => sneller, goedkoper
Targeted sequencen = specifiek gen sequencen => goedkoper, sneller
,Transcriptoom sequencing = 1e RNA → cDNA => cDNA sequencen
1ste generatie sequentiebepaling
Methoden: Sanger of Maxam en Gilbert
Maxam en Gilbert (historisch, ter info)
Chemische klievingsmethode
1) Radioactieve merking => visualisatie DNA
→ Fosfaatgroepen ℗ 5’ uiteinde vervangen dr radioactief ℗
2) Restrictie-enzym (RE) => 1 kant label afgooien => dsDNA langs 1 kant gemerkt
=> enkel radioactief gemerkte streng zichtbaar
3) Chemische klieving v. nucleïnezuren in 4 ≠ reacties:
verdeel moles over 4 buisjes + voeg chemische stof toe
=> breuk in DNA na specifieke base
- Buis 1: breuk na G (niet elke G, soms de 1e, soms 4e, …)
- Buis 2: na A OF G - Buis 3: na C OF T - Buis 4: na C
4) Buisje op agarosegel => scheiding DNA frag op grootte
-> boven = groot = 3’ <> onder = klein = 5’ uiteinde
5) Autoradiografie => visualisatie DNA
6) Sequentie aflezen: bv. C en CT reactie positief => C
Nadeel: korte fragmenten, niet heel specifiek (soms dubbele bandjes)
Sanger sequencing
Nieuwsynthese met dideoxy-keten terminatie
Normale dNTP = deoxy = 3’ OH (2’OH weg) => nieuwe base kan koppelen (fosfodiesterbinding)
Dideoxy = 3’OH weg => volgende nt kan niet koppelen => ketenterminatie
1) Template/ matrijs = PCR amplicon of clone van genomisch DNA-fragment
2) Polymerase + primer + mengsel dNTPs + kleine fractie ddNTPs, fluorescent gemerkt
3) Pol vertrekt vanaf primer => °dsDNA complementair aan te sequencen frag
a) meestal: inbouw normale => ketenverlenging
b) soms: inbouw ddNTP => terminatie reactie
°vele: fragmenten met andere lengte
4) Capillaire of gel elektroforese => scheiding frags
=> fluorescent label bepaald sequentie (elke ddNTP ander kleurtje)
=> °elektroferogram (kleine frags 1e)
Nadeel:
- Beperkt tot ~500 nt, moeite met herhalingen
- Soms elektroferogram geeft oververlappende seq.:
scheiding op lengte, maar C & G => lusje: vouwen DNA frag => sneller dr capillair => overlap
Voor betrouwbaarheid: 2 aparte reacties met FW & RV primer => in beide richtingen aflezen
Voordeel: mutatiedetectie mogelijk:
diploid genoom: zie piek C & T tegelijk => heterozygoot/mutatie
→ nadeel: pieken niet altijd even hoog
=> kan ook sequentiefout zijn ipv mutatie => oplossing: FW & RV reactie
,Aflezen elektroferogram dmv software
- 1e 30bp niet afleesbaar -- 500-700bp afleesbaar (max. 1000bp) (kleine fragmenten)
- Kwaliteitsscore per base = Phred-score = acuraatheid v/d basecall
→ score 10 = 1/10 base = fout = slecht = 90% accuraat
→ wil score 20-30 => 99-99,9% accuraatheid
→ slide 11: base calling met Phred-score per base: Hoog balkje = score > 20 vr deze base <> laag balkje = score <20
Verwezenlijkingen Sanger
HumaneGenomeProject (HGP) = de novo sequencing humane genoom
└> duur, vele labo’s, ≠ stalen DNA’s v. ≠ individu’s
└> methode: hiërarchische shutgun sequencing met Sanger = adhv MAPPEN
= 1) kloneren grote stukken DNA in YACs en BACs
2) grote stukken mappen + RANDOM fragmentatie & dan kleine stukken mappen
=> Publicatie: 1e draft seq. (=1e humane seq.)
Later finale seq. (nog kleine stukjes missen, nogsteeds updates)
Nu dit = referentiesequentie v/h Humane genoom in databanken (NCBI, …)
Humane Genome sequencing dr Celera (Venter) = ook de novo sequencing humane genoom
└> genoom van 5 individu’s (<>mengsel genomen), binnen 1 bedrijf
└> methode: whole genome shutgun sequencing = ZONDER mappen (<>HGP: mappen & kloneren)
= 1) ganse genoom fragmenteren in kleine stukken => random clones
2) sanger sequencen => aan elkaar hangen
=> probleem: repetitieve sequenties => moeilijk aan elkaar hangen (niet 1e mappen)
=> Toepassing: vgl dit genoom van 1 individu met referentie (HGP) => 3miljoen verschillen per ind.!
Enorme impact op:
- Technologische ontw. v. sequencing: - automatisering => prijs ↓↓ + sequentiedata ↑
- aanpak (bv. sommige delen chr onmogelijk kloneren)
- Ontwikkeling bio-informatica
- Visie delen data : !Open sience: MOET alle data delen in db => gebruik dr andere OZ’er
→ !belang patenteren (even tot bijhouden, daarna publiceren & patent op pakken)
- °Andere methoden dr gekende sequentie
- Biologische kennis:- sequentie en organisatie ~ alle humane genen gekend
- vergelijkende genomics: inzicht in evolutie, in geconserveerde processen
- genetische verschillen tussen mensen
°Nieuwe uitdagingen: we willen:
- Volledige sequentie (telomeer – telomeer) -- Genomen meer species
- Persoonlijke genoom van iedereen => Personalizied precision medicine !!!:
o Kennis DNA volgorde & SNPs => diagnose, prognose, preventie
→ persoonlijke genoomseq. => zie voorbeschikte vr bep. ziektes bv. longkkr bij roken
=> meer PREVENTIEF werken (aanleg voor ziekte?)
o Therapie op maat bv. elke kkrpatiënt ≠ mutaties in kkrcellen => doelgerichte & gepers. therapie
o Farmacogenomics: reactie op bep. gnsmddl afh. bep. SNP in genoom
=> goede gnsmddl k o/d markt blijven
o Inzicht in complexe multifactoriële aandoeningen
o Ethische aspecten bv. gekend genoom => enkel slimme mensen aannemen
, Probleem Sanger seq.: lage throughput & duur => °2nd generation: hoge capaciteit & goedkoop
2de generatie sequentiebepaling: short-read next-generation sequencing
= Next generation sequencing (NGS)
Hoge throughput (1 genoom per toestel per dag) & lage kost
obv massive parallel sequencing
Nieuwe technologie met 3 pijlers:
1) Massive parallel sequencing (parallelle detectie)
= korte stukjes DNA sequentie , massaal & in parallel (tegelijk) sequencen:
klonale in vitro amplificatie v. template (<> klassieke klonering: geen bact. nodig)
=> ° clusters/ polonys = 103 - 106 kopieën DNA template
+: snel (geen gels, kloneren, …)
+: multiplexing: vele clusters tegelijk (<> 1 template/reactie) => hoge throughput
2) Miniaturisatie reacties
3) Hele proces integreren => directe detectie (<> scheiding frags via elektroforese)
Commerciële platformen voor 2nd generetion
454 (oud), SOLID (vroeger), Illumina (nu)
- Zeer competitief (telkens °nieuwe & andere verdwijnen) + snelle evolutie
4 stappen = basis ALLE platformen
1) Aanmaak DNA libary: genomisch DNA in stukken knippen + adaptoren vasthangen
2) Klonale in vitro amplificatie
3) Sequentiebepaling dmv ≠ nieuwe methodes (<>Sanger)
4) Data analyse
Stap 1: aanmaak NGS DNA library
Library = bank fragmentenbank = verz. te sequencen templates
Types DNA library:
- Whole genome sequencing (WGS)
- Mate Pair librairies = 2 uiteinden, met vaste afstand tss sequenties
- Amplicon sequencing: PCR amplicons (= stuk chr seq.)
- cDNA librarys: RNA → cDNA => info transcriptoom (hfst 2.3)
- Whole exome sequencing (WES) of targeted sequencing:
bv. mutatie in coderend gen => enkel seq. exonen
→ ! METHODE 1: Aanrijking door hybridisatie aan probes (in opl. of op array) (A):
Hybridisatie frag. bank aan micro-array (vaste drager)/beads met oligo’s complementair
aan exonseq. => enkel exonseq. hybridiseren (~1% genoom) + introns weggewassen
=> opgezuiverd exonseq.
→ ! METHODE 2: PCR-methode (B):
PCR primers tgn alle exonseq. => °PCR amplicons: enkel amplificatie exonseq.