Dit document bevat de uitgewerkte leerdoelen van het vak genomica voor deeltoets 2. Hieronder vallen de leerdoelen per hoorcollege en de leerdoelen van de kennisclips.
Hoorcollege 1: Quantifying evolution
• Uitleggen waarom een bioloog kennis moet hebben van bioinformatische gegevensanalyse
Een bioloog moet weten over Bioinformatic Data Analysis omdat bioinformatica de studie is
van informatieprocessen in biologische systemen. Dit omvat het gebruik van computationele
methoden om biologische gegevens te analyseren. Door bioinformaticatechnieken te
beheersen, kan een bioloog complexe datasets analyseren en interpreteren, wat essentieel is
voor moderne biologische onderzoek en ontdekking.
• Beschrijf de 'omics': (meta-)genomics, (meta-)transcriptomics, (meta-)proteomics,
metabolomics, enz.
o Genomics: het sequencen van al het DNA van een organisme.
o Transcriptomics: het sequencen van al het mRNA in een organisme, weefsel of cel.
o Proteomics: het sequencen van alle eiwitten in een organisme, weefsel of cel.
o Metagenomics: het sequencen van het DNA van alle organismen in een monster,
wat helpt bij het onpartijdig bemonsteren van alle microben.
o Metatranscriptomics: het sequencen van het mRNA van alle organismen in een
monster.
o Metaproteomics: het sequencen van de eiwitten van alle organismen in een
monster.
• De biologie achter de 'omics'-revolutie uitleggen: bias verminderen door alles van iets te
meten
De ‘omics revolutie lost een groot probleem op in de wetenschap: vooroordelen/biases.
Traditioneel zijn mensen voornamelijk geïnteresseerd in hun ziekten, hun voedsel en zichzelf,
wat vooroordelen veroorzaakt in ons algemeen begrip van biologie en in onze databases. De
'omics' technieken zoals genomics, transcriptomics en proteomics verminderen
vooroordelen door alles van een specifiek type biomolecuul in een monster te meten. Dit
geeft wetenschappers een breder en eerlijker beeld van biologische systemen.
• De twee manieren vergelijken waarop een bioinformaticus bestaande gegevens gebruikt
om nieuwe ontdekkingen te doen (top-down en bottom-up)
o Top-down aanpak: ‘question first’, met een biologische vraag zal een bioinformaticus
gelijk denken welke datasets kunnen worden gebruikt om de vraag te
beantwoorden.
o Bottom-up aanpak: ‘data first’, met een gegeven dataset kan een bioinformaticus
gelijk bedenken welke biologische hypothesen de dataset kan helpen om te testen.
• Noem de mechanismen van DNA-mutatie
o Nucleotide substitutie: kan het gevolg zijn van replicatiefouten of fysieke/chemische
reacties.
o Inserties of deleties (indels): kunnen optreden door ongelijke crossing-over tijdens
meiose of replicatie slippage.
o Inversies of herschikkingen
o Duplicaties van:
▪ Deel van of heel gen.
▪ Deel (polysomie) of heel chromosoom (aneuploïdie, polysomie).
▪ Heel genoom (polyploïdie).
, o Horizontale genoverdracht (HGT): overdracht tussen individuen van dezelfde
generatie.
• Definieer homologie, gelijkenis en identiteit
o Homologie: eigenschap van twee sequenties die een gedeelde voorouder hebben;
homologie is binair (je bent familie of niet).
o Identiteit: percentage van identieke residuen in een alignment; gebruikt voor
aminozuren en nucleotiden.
o Gelijkenis: percentage van aminozuurresiduen in een alignment met een positieve
substitutie score; vaak weergegeven met een '+' en niet gebruikt voor DNA.
• Noem vier eigenschappen van aminozuren die belangrijk kunnen zijn bij het bepalen van
hun fysisch-chemische gelijkenis
Grootte, lading, hydrofobiciteit en voorkeur van eiwitbinding.
• Geef twee voorbeelden van DNA-substitutiematrices
1. Identiteitsmatrix
2. BLOSUM (Blocks Substitution Matrix)
• Afleiden van BLOSUM-scores uit tellingen van uitgelijnde residuen
BLOSUM-scores worden afgeleid door de waargenomen frequentie van substituties tussen
aminozuren te delen door de verwachte frequentie als deze willekeurig zou zijn.
𝑤𝑒𝑟𝑘𝑒𝑙𝑖𝑗𝑘𝑒 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑡𝑖𝑒
o Log-odds score = 2 ∗ log 2 ( )
𝑣𝑒𝑟𝑤𝑎𝑐h𝑡𝑒 𝑓𝑟𝑒𝑞𝑢𝑒𝑛𝑡𝑖𝑒
• Interpreteren van BLOSUM-scores en BLOSUM-gebaseerde alignmentscores door
berekeningen met log-odds waarden uit te voeren
o BLOSUM-scores geven de waarschijnlijkheid aan dat twee aminozuren in goed
uitgelijnde homologe sequenties zullen voorkomen.
o Een positieve score betekent een hogere
waarschijnlijkheid dan verwacht, een
negatieve score betekent een lagere
waarschijnlijkheid.
o Door gebruik te maken van log-odds
waarden kunnen we de totale alignment
score van een sequentie berekenen door
de scores van alle uitgelijnde residuen op
te tellen.
• Bereken de alignmentscore tussen twee sequenties
1. Stap 1: zoek de BLOSUM-scores op voor elk paar uitgelijnde residuen.
2. Stap 2: tel de scores van alle paren bij elkaar op om de totale alignmentscore te krijgen
, Kennisclip 1: K-mers, probability and expected frequency
• Een lijst maken van de k-mers in een gegeven reeks voor een gegeven lengte van k
K-mers zijn korte "woorden" die bestaan uit k aminozuren of nucleotiden. Ze kunnen
gemakkelijk uit een sequentie worden gehaald met behulp van een schuifvenster.
o Voor de volgende sequenties:
o Zijn dit de k-mers:
• Bereken het aantal en de waarschijnlijkheid van verschillende k-mers voor een gegeven
alfabetgrootte n
Het totale aantal mogelijke k-mers dat je kunt verwachten te vinden in een oneindig grote
database van lengte k, hangt niet alleen af van de lengte van k, maar ook van de grootte van
het alfabet n dat je gebruikt.
o Algemeen: 𝑛𝑘
o Aminozuren: 20𝑘
o Nucleotiden: 4𝑘
o Dit betekent dat het aantal mogelijke k-mers exponentieel toeneemt. De
1
waarschijnlijkheid om een specifieke k-mer te vinden, is . Bijvoorbeeld, voor 5
𝑛𝑘
1
nucleotiden is dit .
45
• Bereken de verwachte frequentie van een k-mer in een sequentie met lengte L
Hoe vaak verwachten we een gegeven k-mer te vinden in een sequentie, gegeven een
alfabetgrootte n?
o De verwachte frequentie = de waarschijnlijkheid van één trekking vermenigvuldigd
met het aantal posities.
▪ Het aantal mogelijkheden om de k-mer te observeren (aantal posities):
(𝐿 − 𝑘 + 1)
▪ Voor een dubbelstrengs DNA-sequentie: 2 ∗ (𝐿 − 𝑘 + 1)
▪ De verwachte frequentie van een k-mer met lengte k in een sequentie met
1 𝑘
lengte L en een alfabet grootte van n: (𝑛) ∗ (𝐿 − 𝑘 + 1)
• Bereken de kans dat een k-mer minstens één keer voorkomt in een sequentie
1 𝑘
o De waarschijnlijkheid van het observeren van een specifieke k-mer: 𝑃 = (𝑛)
o De waarschijnlijkheid van het niet observeren van een specifieke k-mer: 1 – P
o Het observeren van een specifieke k-mer N keer: 𝑃𝑁 met N = L - k + 1
o et nooit observeren van een specifieke k-mer: (1 − 𝑃)𝑁
o Het minstens één keer observeren van een specifieke k-mer: 1 − (1 − 𝑃)𝑁
• Wissel tussen probability en expected frequency
Je kunt de waarschijnlijkheid plotten tegen de verwachte frequentie en zien dat naarmate de
verwachte frequentie toeneemt tot rond 1, de waarschijnlijkheid ook één nadert.
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur yuniper. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €5,50. Vous n'êtes lié à rien après votre achat.