Dit document bevat de uitgewerkte leerdoelen van het vak genomica voor deeltoets 2. Hieronder vallen de leerdoelen per hoorcollege en de leerdoelen van de kennisclips.
Hoorcollege 1: Quantifying evolution
• Uitleggen waarom een bioloog kennis moet hebben van bioinformatische gegevensanalyse
Een bioloog moet weten over Bioinformatic Data Analysis omdat bioinformatica de studie is
van informatieprocessen in biologische systemen. Dit omvat het gebruik van computationele
methoden om biologische gegevens te analyseren. Door bioinformaticatechnieken te
beheersen, kan een bioloog complexe datasets analyseren en interpreteren, wat essentieel is
voor moderne biologische onderzoek en ontdekking.
• Beschrijf de 'omics': (meta-)genomics, (meta-)transcriptomics, (meta-)proteomics,
metabolomics, enz.
o Genomics: het sequencen van al het DNA van een organisme.
o Transcriptomics: het sequencen van al het mRNA in een organisme, weefsel of cel.
o Proteomics: het sequencen van alle eiwitten in een organisme, weefsel of cel.
o Metagenomics: het sequencen van het DNA van alle organismen in een monster,
wat helpt bij het onpartijdig bemonsteren van alle microben.
o Metatranscriptomics: het sequencen van het mRNA van alle organismen in een
monster.
o Metaproteomics: het sequencen van de eiwitten van alle organismen in een
monster.
• De biologie achter de 'omics'-revolutie uitleggen: bias verminderen door alles van iets te
meten
De ‘omics revolutie lost een groot probleem op in de wetenschap: vooroordelen/biases.
Traditioneel zijn mensen voornamelijk geïnteresseerd in hun ziekten, hun voedsel en zichzelf,
wat vooroordelen veroorzaakt in ons algemeen begrip van biologie en in onze databases. De
'omics' technieken zoals genomics, transcriptomics en proteomics verminderen
vooroordelen door alles van een specifiek type biomolecuul in een monster te meten. Dit
geeft wetenschappers een breder en eerlijker beeld van biologische systemen.
• De twee manieren vergelijken waarop een bioinformaticus bestaande gegevens gebruikt
om nieuwe ontdekkingen te doen (top-down en bottom-up)
o Top-down aanpak: ‘question first’, met een biologische vraag zal een bioinformaticus
gelijk denken welke datasets kunnen worden gebruikt om de vraag te
beantwoorden.
o Bottom-up aanpak: ‘data first’, met een gegeven dataset kan een bioinformaticus
gelijk bedenken welke biologische hypothesen de dataset kan helpen om te testen.
• Noem de mechanismen van DNA-mutatie
o Nucleotide substitutie: kan het gevolg zijn van replicatiefouten of fysieke/chemische
reacties.
o Inserties of deleties (indels): kunnen optreden door ongelijke crossing-over tijdens
meiose of replicatie slippage.
o Inversies of herschikkingen
o Duplicaties van:
▪ Deel van of heel gen.
▪ Deel (polysomie) of heel chromosoom (aneuploïdie, polysomie).
▪ Heel genoom (polyploïdie).
, o Horizontale genoverdracht (HGT): overdracht tussen individuen van dezelfde
generatie.
• Definieer homologie, gelijkenis en identiteit
o Homologie: eigenschap van twee sequenties die een gedeelde voorouder hebben;
homologie is binair (je bent familie of niet).
o Identiteit: percentage van identieke residuen in een alignment; gebruikt voor
aminozuren en nucleotiden.
o Gelijkenis: percentage van aminozuurresiduen in een alignment met een positieve
substitutie score; vaak weergegeven met een '+' en niet gebruikt voor DNA.
• Noem vier eigenschappen van aminozuren die belangrijk kunnen zijn bij het bepalen van
hun fysisch-chemische gelijkenis
Grootte, lading, hydrofobiciteit en voorkeur van eiwitbinding.
• Geef twee voorbeelden van DNA-substitutiematrices
1. Identiteitsmatrix
2. BLOSUM (Blocks Substitution Matrix)
• Afleiden van BLOSUM-scores uit tellingen van uitgelijnde residuen
BLOSUM-scores worden afgeleid door de waargenomen frequentie van substituties tussen
aminozuren te delen door de verwachte frequentie als deze willekeurig zou zijn.
𝑤𝑒𝑟𝑘𝑒𝑙𝑖𝑗𝑘𝑒 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑡𝑖𝑒
o Log-odds score = 2 ∗ log 2 ( )
𝑣𝑒𝑟𝑤𝑎𝑐h𝑡𝑒 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑡𝑖𝑒
• Interpreteren van BLOSUM-scores en BLOSUM-gebaseerde alignmentscores door
berekeningen met log-odds waarden uit te voeren
o BLOSUM-scores geven de waarschijnlijkheid aan dat twee aminozuren in goed
uitgelijnde homologe sequenties zullen voorkomen.
o Een positieve score betekent een hogere
waarschijnlijkheid dan verwacht, een
negatieve score betekent een lagere
waarschijnlijkheid.
o Door gebruik te maken van log-odds
waarden kunnen we de totale alignment
score van een sequentie berekenen door
de scores van alle uitgelijnde residuen op
te tellen.
• Bereken de alignmentscore tussen twee sequenties
1. Stap 1: zoek de BLOSUM-scores op voor elk paar uitgelijnde residuen.
2. Stap 2: tel de scores van alle paren bij elkaar op om de totale alignmentscore te krijgen
, Kennisclip 1: K-mers, probability and expected frequency
• Een lijst maken van de k-mers in een gegeven reeks voor een gegeven lengte van k
K-mers zijn korte "woorden" die bestaan uit k aminozuren of nucleotiden. Ze kunnen
gemakkelijk uit een sequentie worden gehaald met behulp van een schuifvenster.
o Voor de volgende sequenties:
o Zijn dit de k-mers:
• Bereken het aantal en de waarschijnlijkheid van verschillende k-mers voor een gegeven
alfabetgrootte n
Het totale aantal mogelijke k-mers dat je kunt verwachten te vinden in een oneindig grote
database van lengte k, hangt niet alleen af van de lengte van k, maar ook van de grootte van
het alfabet n dat je gebruikt.
o Algemeen: 𝑛𝑘
o Aminozuren: 20𝑘
o Nucleotiden: 4𝑘
o Dit betekent dat het aantal mogelijke k-mers exponentieel toeneemt. De
1
waarschijnlijkheid om een specifieke k-mer te vinden, is . Bijvoorbeeld, voor 5
𝑛𝑘
1
nucleotiden is dit .
45
• Bereken de verwachte frequentie van een k-mer in een sequentie met lengte L
Hoe vaak verwachten we een gegeven k-mer te vinden in een sequentie, gegeven een
alfabetgrootte n?
o De verwachte frequentie = de waarschijnlijkheid van één trekking vermenigvuldigd
met het aantal posities.
▪ Het aantal mogelijkheden om de k-mer te observeren (aantal posities):
(𝐿 − 𝑘 + 1)
▪ Voor een dubbelstrengs DNA-sequentie: 2 ∗ (𝐿 − 𝑘 + 1)
▪ De verwachte frequentie van een k-mer met lengte k in een sequentie met
1 𝑘
lengte L en een alfabet grootte van n: (𝑛) ∗ (𝐿 − 𝑘 + 1)
• Bereken de kans dat een k-mer minstens één keer voorkomt in een sequentie
1 𝑘
o De waarschijnlijkheid van het observeren van een specifieke k-mer: 𝑃 = (𝑛)
o De waarschijnlijkheid van het niet observeren van een specifieke k-mer: 1 – P
o Het observeren van een specifieke k-mer N keer: 𝑃𝑁 met N = L - k + 1
o et nooit observeren van een specifieke k-mer: (1 − 𝑃)𝑁
o Het minstens één keer observeren van een specifieke k-mer: 1 − (1 − 𝑃)𝑁
• Wissel tussen probability en expected frequency
Je kunt de waarschijnlijkheid plotten tegen de verwachte frequentie en zien dat naarmate de
verwachte frequentie toeneemt tot rond 1, de waarschijnlijkheid ook één nadert.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper yuniper. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,50. Je zit daarna nergens aan vast.