Dit document bevat alle aantekeningen van de hoorcolleges die werden gegeven voor het vak Bioinformatica aan de Universiteit Utrecht voor de opleiding Biomedische Wetenschappen. In het document zitten veel afbeeldingen en overzichten.
,Hoorcollege 1 – Intro R Herhaling
R en Rstudio - Data
• Strings = Character (staat tussen quotes “..”)
• Logical data = data die waar of niet waar is (TRUE/FALSE)
• Factor = categoriale data die een beperkt aantal mogelijke
waarde aan kan nemen (zoals bloedtype)
• Vector = meest simpele data structuur waarmee er waarden
aan elkaar worden gevoegd ( vector <- c(1,3,4,5) bijvoorbeeld)
• Matrix = vector in de vorm van een 2D tabel
• List = sequentie van verschillende data elementen en structuren
• Data frame = een tabel waarbij elke column een ander type kan hebben
Variabelen
• Variabele = opslag van een stukje data die je vervolgens een naam geeft (restaurant <- “Vegan
Junk Food Bar”)
• Functies = bestaande programma’s of code om een
taak te verrichten. Gebruikt functies door ze aan te
roepen
• Square brackets = hiermee kan je data selecteren
o Logic = specificeer welke elementen wel of niet
geselecteerd worden
Lineair model
• Hiervoor wordt lm() gebruikt:
• Hiervan kan je dan een summary() van nemen die veel belangrijke waarde laat zien
• Abline() = een functie waarbij je een lijn kan toevoegen aan het model
Iteratie
• Apply() = looping-functie omdat het in herhaling valt en het wordt gebriuikt voor het toepassen
van een functie op rows of columns van een tabel:
• 1 is er rij en 2 is per kolom
• Dus gemiddelde wordt berekent van de rijen van “mymatrix”
• Lapply() = dit wordt gedaan voor het toepassen voor een element
in je lijst
• Sapply() = versimpelen van je output, dus je krijgt gewoon een
vector
• For loop = iets voor uitgevoerd voor elk element in de sequentie
o X = iteration variabele die een waarde uit de sequentie is
totdat de sequentie helemaal doorlopen is. deze neemt
steeds een andere waarde aan
• Je begint altijd met een onderzoeksvraag en werkt zo door de onderzoek
• Alle stappen beïnvloeden de interpretatie
o Heeft dus te maken met validatie, relevantie, generalisatie en reproductiviteit
• Toepassingen:
o Gebaseerd op sequentie type: Whole Genome Seq (WGS), Whole exome Seq (WES), Total RNA
seq, Targeted
o Gebaseerd op doel: fundamenteel onderzoek, applied research, remote region research,
diagnostic laboratory, point-of-care
•
Sequentie technieken
1. Sanger sequencing → first generation
o Basis methode: Chain-termination door
dideoxynucleotiden
2. Next Generation Sequencing (NGS) → second generation,
ook wel Illumina
o Illumina bezit veel veel reads
3. Nanopore sequencing
4. PacBio SMRT Sequencing
[2] NGS Technologie
• Reversibele terminatie (SBS)
• Massive Parallel Sequencing (MPS) of tweede generatie sequencing: heel veel korte sequenties
worden tegelijkertijd bepaald
• De reads zijn erg kort (100-300 nt), dus dit is een nadeel
3
, • Accurate: ~0,1% kans op een fout
• De machine werkt erg snel → biljoen bases per run worden gesequenced
• Duur van een run is 1-2 dagen
• Kan Paired-end sequencing doen
Stappen van Ilumina - proces
1. Sample preparation
a. Het voorbereiden van biologische samples en RNA/DNA extracten
b. Filtreren en enrichment
c. Je wilt uitkomen op dsDNA in de juiste concentratie en goede zuiverheid. Dit wordt gedaan
door fluorometics en UV spectrofotometrie
d. Introduceren fouten die niet te onderscheiden zijn van biologische
2. Library preparation
a. Heel veel verschillende manieren
b. dsDNA wordt gefragmenteerd waarna aan
de uiteindes adaptoren worden toegevoegd
en vervolgens wordt het geamplificeerd
c. DNA fragmentatie: fysisch of enzymatisch
d. Size selection: je wilt alleen fragmenten van een bepaalde grootte (350 nt) want is belangrijk
voor bridge amplification in Sequencing
e. End-repair: je zorgt dat de uiteinden gelijk zijn aan elkaar, zonder sticky ends
f. A-Tailing reactie → het toevoegen van een Adenine-base aan het uiteinden om een illumina
adapter ligatie eraan te sluiten. Hierna heb je dus je DNA-fragmenten met je adaptor
sequenties
g. Met electroforese kan dus worden bekeken of het DNA goed gefragmenteerd is
h. Illumina adapter = adapter wat vast zit aan de uiteinden van de DNA fragmenten
i. P5 en P7 binden regio’s aan beide einden voor clustering
ii. Er is een unieke index of barcode sequentie
per library voor mixing samples
iii. Sequencing primer binding regions voor
sequencing
i. Je kunt ervoor kiezen om de DNA fragmenten te vermeerderen met PCR amplificatie, maar dit
is een redelijk biased (korte fragmenten zijn sneller klaar en worden meer geamplificeerd). Ook
kan er recombinatie en crossing-over plaatsvinden. Om het materiaal te kwantificeren worden
fluorescentie methoden gebruikt of PCR en om de grootte te bekijken wordt elektroforese
gebruikt
3. Sequencing → Illumina Sequencing by Synthesis - YouTube
a. De fragmenten worden op een flow cell gezet, bedekt met oligos die complementair zijn met
de adaptoren van de library
b. De forward strand zet je eraan vast,
waarna een reverse strand wordt gemaakt.
Dan wordt de forward strand weggewasd
c. Bridge amplification = het buigen van de
fragmenten aan complementaire stukken
en de hybridisatie
d. Dit proces wordt herhaald waarna clusters
gevormd worden van strand van dezelfde
codes in hetzelfde gebied. In een cluster
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lisaauerbach. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.