H3: Pairwise Sequence Alignment (herhaling)
Protein alignment
Drie reden waarom eiwit alignment beter is dan DNA alignment:
1. Verandering in DNA sequentie zorgt niet altijd voor verandering in eiwit
sequentie
2. Bepaalde aminozuren hebben dezelfde biochemische eigenschappen.
Om deze reden is verandering van aminozuur niet altijd even erg
3. Eiwit sequenties kunnen homologe sequenties identificeren
Definitions: Homology, Similarity, Identity
Homoloog = het delen van een gemeenschappelijke voorouder
Er is geen graad in homologie, iets is wel of niet homoloog
Iets kan homoloog zijn zonder dat het statistische significantie
aminozuur of nucleotide
overeenkomsten deelt
2 type homologie:
1. Ortholoog = verschillende
eiwitten/genen door speciatie
(soortvorming)
2. Paraloog = verschillende
eiwitten/genen in eenzelfde soort door
gen-duplicatie
Pairwise alignment = het naast elkaar houden van twee sequenties, waarbij
het doel is om een zo’n hoog mogelijke overeenkomst te verkrijgen
Met BLASTP (protein) en BLASTN (nucleotiden)
BLAST op NCBI:
1. Kies tussen BLASTP en BLASTN
2. Geef de sequenties
3. Kies de paramters:
- Scoring matrix (PAM/BLOSUM)
- Gap penalties
- Word size, expect value etc.
4. Klik op algin :
De tussenliggende lijn geeft de overeenkomsten weer tussen de twee
sequenties
,Conservatieve substitutie = overeenkomsten in alignments door
vergelijkbare aminzouren (in de alignment weergegeven met een + teken)
Aminozuren die vergelijkbaar zijn: (K R H) – (D E) - (S T) – (W F Y L I V
MA)
Vergelijkbaarheid percentage = identieke aminozuren + vergelijkbare
aminozuren
Gaps
Drie meest voorkomende mutaties
1. Substitutie
2. Insertie
3. Deletie
Substituties kunnen leiden tot de verandering van aminozuur, en dus de
alignment van twee niet identieke aminozuren
Inserties en deleties kunnen zorgen voor gaps bij één van de twee sequenties
tijdens pairwise sequence alignment
Het toevoegen van gaps kan zorgen voor een beter alignment
Het gebruiken van gaps geeft een penalty en dus verlaging van de
scoring
Twee type gap penalties:
1. Gap open
2. Gap verlenging
Gap verlenging penalty is lager dan een gap open penalty, omdat een
insertie/deletie kan zorgen voor gap groter dan 1 aminozuur
Scoring matrices
Dayhoff model = scoringsysteem wat de basis is voor eiwit-alignment scoring
Opgesteld in 7 stappen
Dayhoff stap 1: Accepted Point Mutations (PAM)
De verandering van een aminozuur in een eiwit die geaccepteerd is door de
natuurlijke selectie.
het is pas geaccepteerd als het nieuwe eiwit met de mutatie het
meest voorkomende eiwit is
Dayhoff heeft bepaald wat de frequentie is van alle PAM’s door eiwitten te
vergelijken met een 85% overeenkomst
Dayhoff stap 2: Frequentie van de aminozuren
Bepaalde aminozuren komen vaker voor dan andere, dit moet worden
meegenomen in het scoringsmodel
,Dayhoff stap 3: Relatieve mutabiliteit (veranderlijkheid)
Sommige aminozuren veranderen/muteren sneller dan anderen. Dit is
geanalyseerd door Dayhoff:
bepaalde aminozuren hebben een hele lage mutabiliteit, omdat als deze
muteert het bijvoorbeeld kan leiden tot sterfte van het organisme
Dayhoff stap 4: Mutatie waarschijnlijkheidsmatrix (bij 1 PAM)
Met de data van eerdere verkregen stappen (1 t/m 3) kan er een mutatie
waarschijnlijkheidsmatrix worden opgesteld.
Deze matrix bestaat uit de kan dat aminozuur i vervangen wordt door
, aminozuur j
Bovenstaande figuur is bij PAM1, dit houdt in dat er 1% van de aminozuren is
veranderd tussen de twee eiwit sequenties
Aan de hand van deze matrix kan er rekening worden gehouden met de
scoring, bijvoorbeeld een hogere penalty als een eiwit wordt vervangen door
een substitutie die bijna nooit voorkomt
Dayhoff stap 5: PAM250 en andere PAM matrixen
De matrix die is verkregen uit Dayhoff stap 4 is met een PAM van 1. Andere
PAM matrixen zijn verkregen door deze matrix met zichzelf te
vermenigvuldigen.
Dus een PAM3 is een PAM1 matrix die drie keer met zichzelf is
vermenigvuldigd.
Deze matrixen zijn nodig, omdat er bijna nooit twee sequenties zijn die maar
1% verschil hebben. Dus als er veel afwijking is tussen twee eiwit sequenties
kies je voor een hogere PAM
Een PAM250 is één van de meest gebruikte matrixen tijdens een BLAST.
Een PAM250 is ongeveer bij een 20% verschil tussen twee matrixen
Dayhoff stap 6: Mutatiewaarschijnlijkheidsmatrix naar verwantschap kans
matrix
Met behulp van een formule waarbij de
data/percentage uit de PAM matrix wordt gedeeld door
de kans dat aminozuur i in de tweede sequentie
voorkomt.
Als deze waarde (Rij) positief is dan geeft dit aan dat
een vervanging vaker gebeurt dan bij toeval wordt
verwacht. Een negatieve waarde geeft aan dat vervanging niet de voorkeur
heeft.
Dayhoff stap 7: Log-kans matrix
De formule van stap 6 kan uitgebreid worden om zo een
score te krijgen. Alle score van alle aminozuren en
substituties kunnen dan in een tabel worden ingevuld
De log-kans matrix
Als je veel punten krijg voor een match (W W) krijg je veel
minpunten voor een mismatch
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper bioinformaticastudent. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.