Dit document bevat de uitgewerkte leerdoelen van het vak genomica voor deeltoets 2. Hieronder vallen de leerdoelen per hoorcollege en de leerdoelen van de kennisclips.
Hoorcollege 1: Quantifying evolution
• Uitleggen waarom een bioloog kennis moet hebben van bioinformatische gegevensanalyse
Een bioloog moet weten over Bioinformatic Data Analysis omdat bioinformatica de studie is
van informatieprocessen in biologische systemen. Dit omvat het gebruik van computationele
methoden om biologische gegevens te analyseren. Door bioinformaticatechnieken te
beheersen, kan een bioloog complexe datasets analyseren en interpreteren, wat essentieel is
voor moderne biologische onderzoek en ontdekking.
• Beschrijf de 'omics': (meta-)genomics, (meta-)transcriptomics, (meta-)proteomics,
metabolomics, enz.
o Genomics: het sequencen van al het DNA van een organisme.
o Transcriptomics: het sequencen van al het mRNA in een organisme, weefsel of cel.
o Proteomics: het sequencen van alle eiwitten in een organisme, weefsel of cel.
o Metagenomics: het sequencen van het DNA van alle organismen in een monster,
wat helpt bij het onpartijdig bemonsteren van alle microben.
o Metatranscriptomics: het sequencen van het mRNA van alle organismen in een
monster.
o Metaproteomics: het sequencen van de eiwitten van alle organismen in een
monster.
• De biologie achter de 'omics'-revolutie uitleggen: bias verminderen door alles van iets te
meten
De ‘omics revolutie lost een groot probleem op in de wetenschap: vooroordelen/biases.
Traditioneel zijn mensen voornamelijk geïnteresseerd in hun ziekten, hun voedsel en zichzelf,
wat vooroordelen veroorzaakt in ons algemeen begrip van biologie en in onze databases. De
'omics' technieken zoals genomics, transcriptomics en proteomics verminderen
vooroordelen door alles van een specifiek type biomolecuul in een monster te meten. Dit
geeft wetenschappers een breder en eerlijker beeld van biologische systemen.
• De twee manieren vergelijken waarop een bioinformaticus bestaande gegevens gebruikt
om nieuwe ontdekkingen te doen (top-down en bottom-up)
o Top-down aanpak: ‘question first’, met een biologische vraag zal een bioinformaticus
gelijk denken welke datasets kunnen worden gebruikt om de vraag te
beantwoorden.
o Bottom-up aanpak: ‘data first’, met een gegeven dataset kan een bioinformaticus
gelijk bedenken welke biologische hypothesen de dataset kan helpen om te testen.
• Noem de mechanismen van DNA-mutatie
o Nucleotide substitutie: kan het gevolg zijn van replicatiefouten of fysieke/chemische
reacties.
o Inserties of deleties (indels): kunnen optreden door ongelijke crossing-over tijdens
meiose of replicatie slippage.
o Inversies of herschikkingen
o Duplicaties van:
▪ Deel van of heel gen.
▪ Deel (polysomie) of heel chromosoom (aneuploïdie, polysomie).
▪ Heel genoom (polyploïdie).
, o Horizontale genoverdracht (HGT): overdracht tussen individuen van dezelfde
generatie.
• Definieer homologie, gelijkenis en identiteit
o Homologie: eigenschap van twee sequenties die een gedeelde voorouder hebben;
homologie is binair (je bent familie of niet).
o Identiteit: percentage van identieke residuen in een alignment; gebruikt voor
aminozuren en nucleotiden.
o Gelijkenis: percentage van aminozuurresiduen in een alignment met een positieve
substitutie score; vaak weergegeven met een '+' en niet gebruikt voor DNA.
• Noem vier eigenschappen van aminozuren die belangrijk kunnen zijn bij het bepalen van
hun fysisch-chemische gelijkenis
Grootte, lading, hydrofobiciteit en voorkeur van eiwitbinding.
• Geef twee voorbeelden van DNA-substitutiematrices
1. Identiteitsmatrix
2. BLOSUM (Blocks Substitution Matrix)
• Afleiden van BLOSUM-scores uit tellingen van uitgelijnde residuen
BLOSUM-scores worden afgeleid door de waargenomen frequentie van substituties tussen
aminozuren te delen door de verwachte frequentie als deze willekeurig zou zijn.
𝑤𝑒𝑟𝑘𝑒𝑙𝑖𝑗𝑘𝑒 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑡𝑖𝑒
o Log-odds score = 2 ∗ log 2 ( )
𝑣𝑒𝑟𝑤𝑎𝑐h𝑡𝑒 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑡𝑖𝑒
• Interpreteren van BLOSUM-scores en BLOSUM-gebaseerde alignmentscores door
berekeningen met log-odds waarden uit te voeren
o BLOSUM-scores geven de waarschijnlijkheid aan dat twee aminozuren in goed
uitgelijnde homologe sequenties zullen voorkomen.
o Een positieve score betekent een hogere
waarschijnlijkheid dan verwacht, een
negatieve score betekent een lagere
waarschijnlijkheid.
o Door gebruik te maken van log-odds
waarden kunnen we de totale alignment
score van een sequentie berekenen door
de scores van alle uitgelijnde residuen op
te tellen.
• Bereken de alignmentscore tussen twee sequenties
1. Stap 1: zoek de BLOSUM-scores op voor elk paar uitgelijnde residuen.
2. Stap 2: tel de scores van alle paren bij elkaar op om de totale alignmentscore te krijgen
, Kennisclip 1: K-mers, probability and expected frequency
• Een lijst maken van de k-mers in een gegeven reeks voor een gegeven lengte van k
K-mers zijn korte "woorden" die bestaan uit k aminozuren of nucleotiden. Ze kunnen
gemakkelijk uit een sequentie worden gehaald met behulp van een schuifvenster.
o Voor de volgende sequenties:
o Zijn dit de k-mers:
• Bereken het aantal en de waarschijnlijkheid van verschillende k-mers voor een gegeven
alfabetgrootte n
Het totale aantal mogelijke k-mers dat je kunt verwachten te vinden in een oneindig grote
database van lengte k, hangt niet alleen af van de lengte van k, maar ook van de grootte van
het alfabet n dat je gebruikt.
o Algemeen: 𝑛𝑘
o Aminozuren: 20𝑘
o Nucleotiden: 4𝑘
o Dit betekent dat het aantal mogelijke k-mers exponentieel toeneemt. De
1
waarschijnlijkheid om een specifieke k-mer te vinden, is . Bijvoorbeeld, voor 5
𝑛𝑘
1
nucleotiden is dit .
45
• Bereken de verwachte frequentie van een k-mer in een sequentie met lengte L
Hoe vaak verwachten we een gegeven k-mer te vinden in een sequentie, gegeven een
alfabetgrootte n?
o De verwachte frequentie = de waarschijnlijkheid van één trekking vermenigvuldigd
met het aantal posities.
▪ Het aantal mogelijkheden om de k-mer te observeren (aantal posities):
(𝐿 − 𝑘 + 1)
▪ Voor een dubbelstrengs DNA-sequentie: 2 ∗ (𝐿 − 𝑘 + 1)
▪ De verwachte frequentie van een k-mer met lengte k in een sequentie met
1 𝑘
lengte L en een alfabet grootte van n: (𝑛) ∗ (𝐿 − 𝑘 + 1)
• Bereken de kans dat een k-mer minstens één keer voorkomt in een sequentie
1 𝑘
o De waarschijnlijkheid van het observeren van een specifieke k-mer: 𝑃 = (𝑛)
o De waarschijnlijkheid van het niet observeren van een specifieke k-mer: 1 – P
o Het observeren van een specifieke k-mer N keer: 𝑃𝑁 met N = L - k + 1
o et nooit observeren van een specifieke k-mer: (1 − 𝑃)𝑁
o Het minstens één keer observeren van een specifieke k-mer: 1 − (1 − 𝑃)𝑁
• Wissel tussen probability en expected frequency
Je kunt de waarschijnlijkheid plotten tegen de verwachte frequentie en zien dat naarmate de
verwachte frequentie toeneemt tot rond 1, de waarschijnlijkheid ook één nadert.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller yuniper. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.91. You're not tied to anything after your purchase.