Samenvatting H1 "Bioinformatic and Functional Genomics"
Samenvatting H2 "Bioinformatic and Functional Genomics"
All for this textbook (6)
Written for
Hanzehogeschool Groningen (Hanze)
Bio-informatica
BIo-informatica2
All documents for this subject (1)
Seller
Follow
bioinformaticastudent
Reviews received
Content preview
H3: Pairwise Sequence Alignment (herhaling)
Protein alignment
Drie reden waarom eiwit alignment beter is dan DNA alignment:
1. Verandering in DNA sequentie zorgt niet altijd voor verandering in eiwit
sequentie
2. Bepaalde aminozuren hebben dezelfde biochemische eigenschappen.
Om deze reden is verandering van aminozuur niet altijd even erg
3. Eiwit sequenties kunnen homologe sequenties identificeren
Definitions: Homology, Similarity, Identity
Homoloog = het delen van een gemeenschappelijke voorouder
Er is geen graad in homologie, iets is wel of niet homoloog
Iets kan homoloog zijn zonder dat het statistische significantie
aminozuur of nucleotide
overeenkomsten deelt
2 type homologie:
1. Ortholoog = verschillende
eiwitten/genen door speciatie
(soortvorming)
2. Paraloog = verschillende
eiwitten/genen in eenzelfde soort door
gen-duplicatie
Pairwise alignment = het naast elkaar houden van twee sequenties, waarbij
het doel is om een zo’n hoog mogelijke overeenkomst te verkrijgen
Met BLASTP (protein) en BLASTN (nucleotiden)
BLAST op NCBI:
1. Kies tussen BLASTP en BLASTN
2. Geef de sequenties
3. Kies de paramters:
- Scoring matrix (PAM/BLOSUM)
- Gap penalties
- Word size, expect value etc.
4. Klik op algin :
De tussenliggende lijn geeft de overeenkomsten weer tussen de twee
sequenties
,Conservatieve substitutie = overeenkomsten in alignments door
vergelijkbare aminzouren (in de alignment weergegeven met een + teken)
Aminozuren die vergelijkbaar zijn: (K R H) – (D E) - (S T) – (W F Y L I V
MA)
Vergelijkbaarheid percentage = identieke aminozuren + vergelijkbare
aminozuren
Gaps
Drie meest voorkomende mutaties
1. Substitutie
2. Insertie
3. Deletie
Substituties kunnen leiden tot de verandering van aminozuur, en dus de
alignment van twee niet identieke aminozuren
Inserties en deleties kunnen zorgen voor gaps bij één van de twee sequenties
tijdens pairwise sequence alignment
Het toevoegen van gaps kan zorgen voor een beter alignment
Het gebruiken van gaps geeft een penalty en dus verlaging van de
scoring
Twee type gap penalties:
1. Gap open
2. Gap verlenging
Gap verlenging penalty is lager dan een gap open penalty, omdat een
insertie/deletie kan zorgen voor gap groter dan 1 aminozuur
Scoring matrices
Dayhoff model = scoringsysteem wat de basis is voor eiwit-alignment scoring
Opgesteld in 7 stappen
Dayhoff stap 1: Accepted Point Mutations (PAM)
De verandering van een aminozuur in een eiwit die geaccepteerd is door de
natuurlijke selectie.
het is pas geaccepteerd als het nieuwe eiwit met de mutatie het
meest voorkomende eiwit is
Dayhoff heeft bepaald wat de frequentie is van alle PAM’s door eiwitten te
vergelijken met een 85% overeenkomst
Dayhoff stap 2: Frequentie van de aminozuren
Bepaalde aminozuren komen vaker voor dan andere, dit moet worden
meegenomen in het scoringsmodel
,Dayhoff stap 3: Relatieve mutabiliteit (veranderlijkheid)
Sommige aminozuren veranderen/muteren sneller dan anderen. Dit is
geanalyseerd door Dayhoff:
bepaalde aminozuren hebben een hele lage mutabiliteit, omdat als deze
muteert het bijvoorbeeld kan leiden tot sterfte van het organisme
Dayhoff stap 4: Mutatie waarschijnlijkheidsmatrix (bij 1 PAM)
Met de data van eerdere verkregen stappen (1 t/m 3) kan er een mutatie
waarschijnlijkheidsmatrix worden opgesteld.
Deze matrix bestaat uit de kan dat aminozuur i vervangen wordt door
, aminozuur j
Bovenstaande figuur is bij PAM1, dit houdt in dat er 1% van de aminozuren is
veranderd tussen de twee eiwit sequenties
Aan de hand van deze matrix kan er rekening worden gehouden met de
scoring, bijvoorbeeld een hogere penalty als een eiwit wordt vervangen door
een substitutie die bijna nooit voorkomt
Dayhoff stap 5: PAM250 en andere PAM matrixen
De matrix die is verkregen uit Dayhoff stap 4 is met een PAM van 1. Andere
PAM matrixen zijn verkregen door deze matrix met zichzelf te
vermenigvuldigen.
Dus een PAM3 is een PAM1 matrix die drie keer met zichzelf is
vermenigvuldigd.
Deze matrixen zijn nodig, omdat er bijna nooit twee sequenties zijn die maar
1% verschil hebben. Dus als er veel afwijking is tussen twee eiwit sequenties
kies je voor een hogere PAM
Een PAM250 is één van de meest gebruikte matrixen tijdens een BLAST.
Een PAM250 is ongeveer bij een 20% verschil tussen twee matrixen
Dayhoff stap 6: Mutatiewaarschijnlijkheidsmatrix naar verwantschap kans
matrix
Met behulp van een formule waarbij de
data/percentage uit de PAM matrix wordt gedeeld door
de kans dat aminozuur i in de tweede sequentie
voorkomt.
Als deze waarde (Rij) positief is dan geeft dit aan dat
een vervanging vaker gebeurt dan bij toeval wordt
verwacht. Een negatieve waarde geeft aan dat vervanging niet de voorkeur
heeft.
Dayhoff stap 7: Log-kans matrix
De formule van stap 6 kan uitgebreid worden om zo een
score te krijgen. Alle score van alle aminozuren en
substituties kunnen dan in een tabel worden ingevuld
De log-kans matrix
Als je veel punten krijg voor een match (W W) krijg je veel
minpunten voor een mismatch
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller bioinformaticastudent. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.93. You're not tied to anything after your purchase.