Genoomanalyse (sequencing)
Shotgun sequencing
Human genome project, wanneer we het gehele human genome kennen dan kunnen we alle ziektes
gaan oplossen. Bepalen waarom een persoon een ziekte krijgt.
Minstens 25 jaar heeft dit project geduurd
Vele genomen zijn niet compleet gesequenced, dit is vaak door het assembleren. De assemblage van
een genoom is heel moeilijk, daarom is het vaak niet compleet. Kleine stukjes van het genoom zijn
wel bekend.
How to sequence a human genome:
Sanger method
- Sanger sequencing relies on two main principles
o DNA can be separated by size
o DNA (elongation) can be modified chemically
▪ Chain -terminating inhibitors
- Hoe werkt het:
o Sequencing by synthesis (not degradation)
o Radioactive primers hybridize to DNA
o Polymerase + dNTPS + ddNTP terminators at low concentration
o Lane per base, visually interpret ladder
Lee Hood automation
- Sequencing kan je automatiseren door scheiding te laten vinden in een apparaat
o Kleine stukjes kwamen er eerder uit dan grote stukjes
o Werd gedaan in een capillair
- Een gel maken met verschillende stoffen (4x nucleotiden)
o Welk kleur licht er wordt gefluoresceerd, bepaald de soort nucleotide.
Twee grote partijen die in competitie waren met elkaar voor het human genome project
,Hierarchical shotgun
- In kleine stukjes hakken
- per element in een bacterie tot expressie brengen
- per bacterie sequencen
- dit in elkaar zetten in groot DNA
- grote stukken DNA achter elkaar plakken tot één genoom.
Whole genome shotgun
- DNA van meerdere personen
- Allemaal isoleren in één keer
- DNA in één sample en fragmenteren
- elk stukje sequencen
Next generation sequencing (miljoenen sequenties bepalen)
- 454 sequencing
o Eerste waarbij op basis van één instrument heel veel data gegenereerd werd
▪ Beginnen met grote hoeveelheid DNA
▪ Fragmentatie
▪ Beide kanten van het DNA in een adapter gezet
▪ Stukjes DNA met adapter in een oplossing gebracht samen met magnetische
beads
▪ Kleine stukjes beads steken uit → Compatibele adapters met eerste adapter
▪ Één DNA stukje bindt aan een bead en aan deze bead vindt er emulsie PCR
plaats. Één stukje DNA wordt geamplificeerd tot duizenden kopiën → DNA
geeft voldoende signaal dat je het kan zien.
▪ Op die bead zitten nu DNA kopiën, worden op een grote plaat geladen met
putjes die beads bevatten
▪ PCR op die bead vindt plaats
▪ Per nucleotide dat wordt toegevoegd, vindt er een lichtsignaal plaats door
luciferase. Signaal van lichtflitsjes (1000x).
- Illumina (solexa) sequencing
o Grotendeels hetzelfde als 454 sequencing, maar zonder luciferin. (luciferin is heel
duur etc)
▪ DNA fragmenteren, adapters eraan
▪ Adapters binden aan een glasplaat
▪ Op dit glas zitten adapters die matchen met adapters die aan je DNA zitten.
▪ Glasplaat met daarop DNA gebonden
▪ PCR vindt plaats (lokaal) → bridge amplificatie
▪ Er ontstaan clusters, één cluster is een set van 1000 stukjes van hetzelfde
soort DNA die hetzelfde reageren wanneer je gaat aflezen
▪ Je voegt tegelijk 4 nucleotiden toe maar deze hebben een andere kleur.
Afhankelijk van de nucleotiden die binden krijg je een specifieke kleur die
fluoresceert.
▪ Dit bekijk je voor elke cluster. De hoeveelheid cycli is de lengte van het DNA.
, - Ion sequencing on transistor-type chip
o Berust op verschillende principes → Amplificatie etc.
▪ Adapters aan geligeerd, deze interacteren met DNA op de bead
▪ PCR geamplificeerd
▪ Je kijkt naar de verandering in de pH
▪ Elk nucleotide veroorzaakt een verschil in de pH
▪ Het is weer een plaat met putjes voor verschillende beads.
▪ Nucleotiden kunnen de hele tijd aan de beads vastbinden, je meet continu
een pH verschil. pH verschil wordt vermenigvuldigd voor meerdere
nucleotiden, echter neemt dit verschil niet lineair toe.
• Één nucleotide kan je goed meten, maar meerdere nucleotiden geeft
een grote gevoeligheid. Deze manier kan niet goed zien of het 4, 5 of
6 nucleotiden waren.
o Homopolymeren probleem
• Niet goed kunnen onderscheiden van lange stukken met dezelfde
nucleotiden
Base calling algorithems: Proberen te voorspellen in hoeverre de nucleotiden echt goed zijn.
Sequence en quality wordt bepaald voor elke nucleotide.
Dit is het FASTQ format.
Lettercodes worden vertaald naar de nauwkeurigheid van de sequentie.
Genome assembly
Hoe assembleer je de reads tot een groot stuk DNA → Chromosoom lengte.
Kleine stukjes DNA (contigs) en deze dan dus aan elkaar plakken.
Finding overlap between fragments
- Overlap kan random zijn
- Je zoekt unieke overlaps
o Is altijd een kansberekening
- Zo groot mogelijke stukken overlap vinden
- Voor elke sequentie reads heb je weer een mogelijkheid dat
de nucleotide niet goed ingebouwd is.
- Pure kansberekening
- Tandemrepeat: Stuk DNA dat 1000x achter elkaar voorkomt.
o Groot probleem in het sequencen.
- Genome wide repeats: Het komt overal in het genoom meerdere keren voor. Sequenties
kunnen mogelijk op meerdere chromosomen zitten.
o Je kan verkeerde chromosoomgedeeltes aan elkaar assembleren. (chromosoom 1 en
chromosoom 16 bijvoorbeeld aan elkaar fuseren)
, - Paired-end reads: Ontstaan bij illumina sequencing, je kan DNA van beide kanten sequencen.
o Je weet dat bepaalde sequenties bij elkaar horen.
o Paired-end reads zijn erg useful → contig assembly, je kan dit gaan sequencen.
Paired end reads kan je nog meer gebruiken om mutaties, die abnormaal chromosoom gedrag
vertonen, te vinden. Ook kan je hiermee de scaffold bepalen.
Genoom is geassembleerd op basis van paired end reads → Maar redelijk ver weg van één mooi
geassembleerd chromosoom. Hoe kunnen we genoom assembly verbeteren?
- Genetisch mappen → Waar hoort welk stukje DNA, bepaalde marker op chromosoom 1 op
contig aanwezig, kan je je contig op chromosoom 1 plaatsen.
- Optisch mappen: Van een groot stuk DNA ga je kijken hoe het eruit ziet.
- Long-read sequencing
o Synthetic long reads
o ‘Real’ long read sequencing, tot 900kb reads maken
- Reference-guided assembly
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller yvankavanos. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.57. You're not tied to anything after your purchase.