Samenvatting H1 "Bioinformatic and Functional Genomics"
Samenvatting H2 "Bioinformatic and Functional Genomics"
All for this textbook (6)
Written for
Hanzehogeschool Groningen (Hanze)
Bio-informatica
Bio-informatica1
All documents for this subject (2)
Seller
Follow
bioinformaticastudent
Reviews received
Content preview
H1: Introduction
Bio-informatica wordt vaak op verschillende manieren gedefinieerd
Het boek: Bio-informatica is het gebruik van computerdatabases en
computeralgoritmen om eiwitten, genen en de volledige verzameling
desoxyribonucleïnezuur (DNA) te analyseren dat een organisme omvat
(het genoom)
National Institutes of Health (NIH): Bio-informatica is het onderzoek, de
ontwikkeling of de toepassing van computationele hulpmiddelen en
benaderingen voor het uitbreiden van het gebruik van biologische,
medische, gedrags- of gezondheidsgegevens, inclusief gegevens om
dergelijke gegevens te verwerven, op te slaan, te organiseren, te
analyseren of te visualiseren'.
Bio-informatics: The Bigger Picture
Bio-informatica kan worden onderverdeeld in drie
perspectieven:
1. De cel
Bio-informatici richt zich op de verzameling
van DNA (genoom), RNA (transcriptosoom) en
eiwit sequenties (proteoom)
Centrale dogma = DNA wordt
getranscribeerd in RNA en vervolgens vertaald
naar eiwit
2. Individuele organismes
Elk organisme verandert over verschillende
stadia van ontwikkeling en (voor meercellige organismen) in verschillende
regio's van het lichaam.
Genen zijn niet statisch (zoals de meest denken), maar dynamisch. Ze
worden gereguleerd afhankelijk van de tijd, gebied en fysiologische staat
(bijvoorbeeld ziekte)
3. ‘Tree of life’
Het groeperen van alle organisme in drie groepen: bacteriën, archaea
en eukaryoten
A Consistent Example: Globins
Gedurende het boek wordt telkens de globine genen als voorbeeld gebruikt.
Globines zijn één van de best gekarakteriseerde genen in de biologie
Waarom zoveel bekend over globines:
1. Hemoglobine één van de eerst onderzochte eiwitten
2. Myoglobine eerste eiwit waarvan de structuur was bepaald
3. Globine gen het globine gen van de mens was één van de eerste
waarvan de sequentie bekend was geanalyseerd werd.
4. Globines komen voor in alle groepen van de ‘tree of life’
,Bioinformatics software
Web-based or Command line (often Linux)
Twee type benadering van bio-informatica: graphical user interface (GUI)
1. Web-based tools (of ‘point-and-click’) Biopython,
Vereisen geen kennis over programmeren Central resources
(NCBI,
Python, BioPerl, R:
manipulate data files
en zijn direct toegankelijk EBI,)
2. Command-line tools
Lastigere/steilere leercurve, maar GUI software
Data analysis
software: sequences,
bieden meer opties voor zowel grote en Genome browsers
(UCSC, Ensembl)
(Partek, MEGA,
RStudio,
proteins, genomes
kleine datasets BioMart,
IGV)
Next generation
Galaxy
sequencing tools
(web access
to NGS tools,
browser data)
Web-based Software
Vier belangrijkste databases/websites:
1. National Center for Biotechnolgy Information (NCBI)
2. European Bioinformatics Institute (EBI)
3. Ensembl
4. University of California at Santa Cruz (UCSC)
Command-line Software
Belangrijkste eigenschappen comand-line software
1. Het operating systeem is vaan Linux
2. Het gebruik van programeer talen
3. Bash (de default shell Linux en Mac)
,H3: Pairwise Sequence Alignment
Protein alignment
Drie reden waarom eiwit alignment beter is dan DNA alignment:
1. Verandering in DNA sequentie zorgt niet altijd voor verandering in eiwit
sequentie
2. Bepaalde aminozuren hebben dezelfde biochemische eigenschappen.
Om deze reden is verandering van aminozuur niet altijd even erg
3. Eiwit sequenties kunnen homologe sequenties identificeren
Definitions: Homology, Similarity, Identity
Homoloog = het delen van een gemeenschappelijke voorouder
Er is geen graad in homologie, iets is wel of niet homoloog
Iets kan homoloog zijn zonder dat het statistische significantie
aminozuur of nucleotide
overeenkomsten deelt
2 type homologie:
1. Ortholoog = verschillende
eiwitten/genen door speciatie
(soortvorming)
2. Paraloog = verschillende
eiwitten/genen in eenzelfde soort door
gen-duplicatie
Pairwise alignment = het naast elkaar houden van twee sequenties, waarbij
het doel is om een zo’n hoog mogelijke overeenkomst te verkrijgen
Met BLASTP (protein) en BLASTN (nucleotiden)
BLAST op NCBI:
1. Kies tussen BLASTP en BLASTN
2. Geef de sequenties
3. Kies de paramters:
- Scoring matrix (PAM/BLOSUM)
- Gap penalties
- Word size, expect value etc.
4. Klik op algin :
, De tussenliggende lijn geeft de overeenkomsten weer tussen de twee
sequenties
Conservatieve substitutie = overeenkomsten in alignments door
vergelijkbare aminzouren (in de alignment weergegeven met een + teken)
Aminozuren die vergelijkbaar zijn: (K R H) – (D E) - (S T) – (W F Y L I V
MA)
Vergelijkbaarheid percentage = identieke aminozuren + vergelijkbare
aminozuren
Gaps
Drie meest voorkomende mutaties
1. Substitutie
2. Insertie
3. Deletie
Substituties kunnen leiden tot de verandering van aminozuur, en dus de
alignment van twee niet identieke aminozuren
Inserties en deleties kunnen zorgen voor gaps bij één van de twee sequenties
tijdens pairwise sequence alignment
Het toevoegen van gaps kan zorgen voor een beter alignment
Het gebruiken van gaps geeft een penalty en dus verlaging van de
scoring
Twee type gap penalties:
1. Gap open
2. Gap verlenging
Gap verlenging penalty is lager dan een gap open penalty, omdat een
insertie/deletie kan zorgen voor gap groter dan 1 aminozuur
Scoring matrices
Dayhoff model = scoringsysteem wat de basis is voor eiwit-alignment scoring
Opgesteld in 7 stappen
Dayhoff stap 1: Accepted Point Mutations (PAM)
De verandering van een aminozuur in een eiwit die geaccepteerd is door de
natuurlijke selectie.
het is pas geaccepteerd als het nieuwe eiwit met de mutatie het
meest voorkomende eiwit is
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller bioinformaticastudent. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.83. You're not tied to anything after your purchase.