Dit document bevat alle aantekeningen van de hoorcolleges die werden gegeven voor het vak Bioinformatica aan de Universiteit Utrecht voor de opleiding Biomedische Wetenschappen. In het document zitten veel afbeeldingen en overzichten.
,Hoorcollege 1 – Intro R Herhaling
R en Rstudio - Data
• Strings = Character (staat tussen quotes “..”)
• Logical data = data die waar of niet waar is (TRUE/FALSE)
• Factor = categoriale data die een beperkt aantal mogelijke
waarde aan kan nemen (zoals bloedtype)
• Vector = meest simpele data structuur waarmee er waarden
aan elkaar worden gevoegd ( vector <- c(1,3,4,5) bijvoorbeeld)
• Matrix = vector in de vorm van een 2D tabel
• List = sequentie van verschillende data elementen en structuren
• Data frame = een tabel waarbij elke column een ander type kan hebben
Variabelen
• Variabele = opslag van een stukje data die je vervolgens een naam geeft (restaurant <- “Vegan
Junk Food Bar”)
• Functies = bestaande programma’s of code om een
taak te verrichten. Gebruikt functies door ze aan te
roepen
• Square brackets = hiermee kan je data selecteren
o Logic = specificeer welke elementen wel of niet
geselecteerd worden
Lineair model
• Hiervoor wordt lm() gebruikt:
• Hiervan kan je dan een summary() van nemen die veel belangrijke waarde laat zien
• Abline() = een functie waarbij je een lijn kan toevoegen aan het model
Iteratie
• Apply() = looping-functie omdat het in herhaling valt en het wordt gebriuikt voor het toepassen
van een functie op rows of columns van een tabel:
• 1 is er rij en 2 is per kolom
• Dus gemiddelde wordt berekent van de rijen van “mymatrix”
• Lapply() = dit wordt gedaan voor het toepassen voor een element
in je lijst
• Sapply() = versimpelen van je output, dus je krijgt gewoon een
vector
• For loop = iets voor uitgevoerd voor elk element in de sequentie
o X = iteration variabele die een waarde uit de sequentie is
totdat de sequentie helemaal doorlopen is. deze neemt
steeds een andere waarde aan
• Je begint altijd met een onderzoeksvraag en werkt zo door de onderzoek
• Alle stappen beïnvloeden de interpretatie
o Heeft dus te maken met validatie, relevantie, generalisatie en reproductiviteit
• Toepassingen:
o Gebaseerd op sequentie type: Whole Genome Seq (WGS), Whole exome Seq (WES), Total RNA
seq, Targeted
o Gebaseerd op doel: fundamenteel onderzoek, applied research, remote region research,
diagnostic laboratory, point-of-care
•
Sequentie technieken
1. Sanger sequencing → first generation
o Basis methode: Chain-termination door
dideoxynucleotiden
2. Next Generation Sequencing (NGS) → second generation,
ook wel Illumina
o Illumina bezit veel veel reads
3. Nanopore sequencing
4. PacBio SMRT Sequencing
[2] NGS Technologie
• Reversibele terminatie (SBS)
• Massive Parallel Sequencing (MPS) of tweede generatie sequencing: heel veel korte sequenties
worden tegelijkertijd bepaald
• De reads zijn erg kort (100-300 nt), dus dit is een nadeel
3
, • Accurate: ~0,1% kans op een fout
• De machine werkt erg snel → biljoen bases per run worden gesequenced
• Duur van een run is 1-2 dagen
• Kan Paired-end sequencing doen
Stappen van Ilumina - proces
1. Sample preparation
a. Het voorbereiden van biologische samples en RNA/DNA extracten
b. Filtreren en enrichment
c. Je wilt uitkomen op dsDNA in de juiste concentratie en goede zuiverheid. Dit wordt gedaan
door fluorometics en UV spectrofotometrie
d. Introduceren fouten die niet te onderscheiden zijn van biologische
2. Library preparation
a. Heel veel verschillende manieren
b. dsDNA wordt gefragmenteerd waarna aan
de uiteindes adaptoren worden toegevoegd
en vervolgens wordt het geamplificeerd
c. DNA fragmentatie: fysisch of enzymatisch
d. Size selection: je wilt alleen fragmenten van een bepaalde grootte (350 nt) want is belangrijk
voor bridge amplification in Sequencing
e. End-repair: je zorgt dat de uiteinden gelijk zijn aan elkaar, zonder sticky ends
f. A-Tailing reactie → het toevoegen van een Adenine-base aan het uiteinden om een illumina
adapter ligatie eraan te sluiten. Hierna heb je dus je DNA-fragmenten met je adaptor
sequenties
g. Met electroforese kan dus worden bekeken of het DNA goed gefragmenteerd is
h. Illumina adapter = adapter wat vast zit aan de uiteinden van de DNA fragmenten
i. P5 en P7 binden regio’s aan beide einden voor clustering
ii. Er is een unieke index of barcode sequentie
per library voor mixing samples
iii. Sequencing primer binding regions voor
sequencing
i. Je kunt ervoor kiezen om de DNA fragmenten te vermeerderen met PCR amplificatie, maar dit
is een redelijk biased (korte fragmenten zijn sneller klaar en worden meer geamplificeerd). Ook
kan er recombinatie en crossing-over plaatsvinden. Om het materiaal te kwantificeren worden
fluorescentie methoden gebruikt of PCR en om de grootte te bekijken wordt elektroforese
gebruikt
3. Sequencing → Illumina Sequencing by Synthesis - YouTube
a. De fragmenten worden op een flow cell gezet, bedekt met oligos die complementair zijn met
de adaptoren van de library
b. De forward strand zet je eraan vast,
waarna een reverse strand wordt gemaakt.
Dan wordt de forward strand weggewasd
c. Bridge amplification = het buigen van de
fragmenten aan complementaire stukken
en de hybridisatie
d. Dit proces wordt herhaald waarna clusters
gevormd worden van strand van dezelfde
codes in hetzelfde gebied. In een cluster
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller lisaauerbach. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.06. You're not tied to anything after your purchase.