OMICS in de Biomedische Wetenschappen
College 1 – Introductie op OMICS
OMICS zijn high-throughput experimentele technologieën om moleculen in een cel te meten
- "experimenteel" gebruik in het laboratorium (wet-lab)
- "high-throughput" veel samples, genen, eiwitten, enz. worden gelijktijdig gemeten
- "moleculen" DNA, mRNA, eiwitten, metabolieten
Genomics DNA-sequentie
Transcriptomics mRNA en (gen)expressie
Proteomics eiwitten en expressie
Metabolomics metabolieten en expressie
Bij tegenwoordige metingen (high-throughput) worden
gehele genomen en zo gesequenced en niet maar een deel
zoals eerder altijd was nu big data
Veranderingen in het veld:
- Naast de traditionele kleinschalige metingen
voeren we nu grootschalige metingen uit (veel
monsters, veel moleculen; OMICS)
- Bio-informatica, statistiek en wiskunde zijn
onderdeel geworden van het dagelijkse werk
van biomedische wetenschappers
- We analyseren en modelleren biologische
systemen
- Biomedische wetenschappers maken gebruik van geavanceerde ICT-infrastructuur (e-Science; cloud,
computerclusters)
Biomarker groep van genen, eiwitten, metabolieten, etc (of combinaties hiervan) gemeten in bijvoorbeeld een
cel, weefsel, bloed waarvan het (gecombineerde) meetpatroon uniek kenmerkend is voor een biologisch (sub)
fenotype, medische aandoening, behandeling, diagnose of prognose
Personalized medicine de stratificatie en timing van preventieve en therapeutische maatregelen verbeteren
door gebruik te maken van biologische informatie en biomarkers op het niveau van moleculaire ziektepaden,
genetica, proteomica en metabolomica
Als we alle dingen meten met OMICS-technologieën, dan weten we nog
steeds niet de interactie
Als resultaat streeft Systems Medicine naar een meetbare verbetering van
de gezondheid van patiënten door middel van op systemen gebaseerde
benaderingen en oefening
,Systeembiologie: dit is de discipline die door middel van experimenten en computationele methoden complete
systemen probeert te modelleren en te begrijpen. Met systemen bedoelen we hier een complete organisme (bv
een bacterie) of een cel, en organel, of orgaan.
Bioinformatica is een discipline die methoden uit de informatica en statistiek toepast om biologische
vraagstellingen te adresseren. Bioinformatica is nodig om omics data te analyseren en te interpreteren.
Bioinformatica speelt ook een rol bij het goed opzetten van experimenten zodat achteraf de gewenste
informatie uit de data kan worden verkregen.
Informatiemanagement: vanwege de grote hoeveelheden data die worden geproduceerd door omics
technologieen speelt informatiemanagement (als onderdeel van (bio)informatica) een belangrijke rol in
hedendaags biologische onderzoek. Informatiemanagement speelt bijvoorbeeld een rol bij het opzetten van
(publieke)databases, de organisatie van data, de beschrijving van data en de integratie van data.
e-Bioscience (of e-Science): e-Bioscience is de discipline die moderne ICT middelen gebruikt als ‘enabling
technologie’ om het beantwoorden van biomedische vragen mogelijk te maken. Zulke technologieen zijn
bijvoorbeeld GRID en workflow systemen. e-Bioscience ontsluit benodigde rekenkracht en opslagcapaciteit die
vaak nodig is voor de analyse van grote hoeveelheden omics data.
,College 2 – NGS Next Generation Sequencing
Aantal nucleotiden in humane genoom 3.000.000.000
Aantal humane genen ongeveer 20.000
- Gemiddelde humane genlengte 10-15 kb
o Enorme variatie tussen genlengtes
DNA (RNA) sequencing het verkrijgen van de sequentie van nucleotiden van een soort
Van sample naar sequencing:
- Bloed, cellen of weefsel extraheren DNA of RNA prepareren library van DNA-fragmenten
sequencing (Sanger, NGS)
Tegenwoordig kun je voor ongeveer 1000 euro je genoom laten sequencen in een dag door de HiSeq X Ten
NGS maakt het mogelijk om complete genomen van individuelen en populaties in kaart te brengen
Toepassingen van NGS
- Volledig genoom complete DNA-sequentie
- Variant-detectie SNPs, indels, etc (kleine mutaties/variaties)
o Exome sequencing
- Structurele variatie grotere variaties als duplicaties,
amplificaties, grote deleties
- Splice variant-detectie
- RNA-sequentie genexpressie
- ChIP-seq technologie om eiwitinteracties met DNA te
analyseren
o Combinatie van Chromatin ImmunoPrecipitation met NGS
o Mapping van eiwit-DNA interacties in-vivo op een
genomische schaal (waar interactie heeft plaatsgevonden)
- Bisulfite sequencing DNA-methylatie
o Cytosine wordt omgezet in uracil met bisulfite wanneer
cytosine niet-gemethyleerd is
- Metagenomics meerdere samples tegelijkertijd sequencen
Sequencing technologieën
Sanger Sequencing
- Gebruikt ddNTPs voor ketenterminatie
fragmenten van verschillende
lengtes eindigend in ddATP, ddGTP,
ddCTP of ddTTP
, Illumina sequencing
1. Library Preperation
2. Cluster Amplification
3. Sequencing
4. Alignment & Data Analysis
Illumina werkt met fluorescentie, sequencing
gebeurt tegelijkertijd met synthese
Kan bij veel fragmenten tegelijkertijd
Sequencing by synthesis
Paired-end sequencing aan beide
uiteindes sequencen
Verschillen tussen Sanger en NGS
- Parallellisme
o NGS miljoenen
sequentie-uitlezingen
parallel verwerken
o Sanger 96 (capillairen)
tegelijk
- Bibliotheek constructie
o NGS-sequentie-uitlezingen (= nucleotidesequentie) worden
geproduceerd uit fragment ‘bibliotheken’
o Sanger berust op celgebaseerde DNA-klonering die wordt
gebruikt bij capillaire sequentiebepaling
o De werkstroom om NGS-ready bibliotheken te produceren is
eenvoudig: DNA-fragmenten die afkomstig van front-
endprocessen worden voorbereid voor sequentiebepaling
door specifieke adapteroligo's aan beide uiteinden van elk
DNA-fragment te ligeren paired-end sequencing
- Readlengtes
o NGS 35–250 bp (afhankelijk van het platform)
o Sanger 650-800 bp
o Dit kan invloed hebben op het gebruik van de gegevens in verschillende applicaties
- Sequencefouten
o Sanger-nauwkeurigheid 99,999%
o NGS-nauwkeurigheid ~ 85 - 99,9%
- Kosten
o Sanger $ 0,50 per kilobase
o NGS uitgaande van een volledige genoomsequentie voor $ 1000, daarna $ 0,0003 per kilobase
Sequence alignment fragmenten kunnen in de goede volgorde weer worden geplaatst als DNA-sequentie