PRACTICUM 1
DATABANKS
- NCBI databases
= is a US-based organisation that maintains several reference databases for biological and
molecular data
a. Soorten:
o gene databank (by navigating to Genes & Expression and then Gene)
o DNA sequence (instead of “gene” select nucleotide)
=Nucleotide database is a collection of sequences from several sources, including
GenBank, RefSeq and PDB
Genbank provides you with the most crucial information in a very simple
text format
o All databases
Bevat extra informatie zoals literatuur, gene, proteïne, genomes, chemicaliën,…
o dbSNP
= world’s largest database for nucleotide variations, and is part of the National
Center for Biotechnology Information (NCBI)
bestaat uit:
grote cluster van soortspecifieke databanken die meer dan 12
miljoen niet-redundante sequentievariaties bevatten
enkelvoudige nucleotide
polymorfismen, inserties/deleties, en korte tandem herhalingen
meer dan 1 miljard individuele genotypes
<afkomstig van HapMap en andere grootschalige
genotyperingsactiviteiten
b. Werking:
1. Gene database
i. Find molecular components under “interactions”
ii. Associated problems under “phenotypes” & “associated”
iii. Gene ontology under “general gene information”
has 3 classes:
Cellular component
Molecular function
Biological process
2. Genbank
i. Accession number
=een unieke identificatiecode die aan een databankrecord wordt gegeven.
Het is van cruciaal belang om dit te vermelden wanneer u de
overeenkomstige database-informatie gebruikt.
Bijvoorbeeld,
er kunnen verschillende versies van genen bestaan, of ze kunnen in de loop
van de tijd worden bijgewerkt. Daarom,
als je een artikel schrijft en je vermeldt iets over bijvoorbeeld positie 50 in
een specifiek
, gen, is het van cruciaal belang om ook het toetredingsnummer te vermelden,
anders zou positie 50 kunnen verwijzen
naar een andere plaats in de sequentie dan je bedoelde
ii. Fasta file
= is een eenvoudig tekstbestand met de volgende eigenschappen: De eerste
regel voor elk gen bevat "> NAAM_ VAN DE_ENTITEIT (SPATIE+OPTIONELE
BESCHRIJVING)" en wordt gevolgd door (op een nieuwe regel!) de
nucleotiden voor een gen of transcript, en de aminozuren
aminozuren voor een eiwit (beide in afkortingen van 1 symbool). De
nucleotide-sequentie kan verspreid worden over verschillende (of
honderden) lijnen.
- Uniprot
= protein databank; een van de belangrijkste eiwitdatabanken en is een combinatie van de
vroegere Swiss-Prot en TrEMBL (Translated EMBL Nucleotide Sequence Data Library)
databanken.
HINT : UniProt has a separate section for human diseases in the main uniport search box
under “supporting data”.
o Swiss-Prot = CURATED
Bevatten handmatig gecureerde gegevens van zeer hoge kwaliteit
was het onmogelijk om met de high throughput methodes zoals whole
genome sequencing en proteomics.
o TrEMBL = NON-CURATED
Bevatten geautomatiseerde (lagere kwaliteit) eiwitannotatie
PAIRWISE ALIGNMENT
1. Dot plots
= grafische representatie van sequentie identiteit (i.e. similarity).
o Alle mogelijke vergelijkingen die gemaakt kunnen worden tussen twee reeksen
Door :
i. over elkaar schuiven
ii. controleren of twee tekens (of meerdere tekens voor woordgroottes > 1)
overeenkomen
resultaat:
a. a match (een hit)
b. a dot
o word size
bepaalt: hoe lang een identieke reeks aminozuren of nucleotiden moet zijn
om een punt op het diagram te genereren.
langere perfecte overeenkomsten = zeldzamer dan korte,
MAAR korte overeenkomsten kunnen ook gewoon ruis zijn
Woordgrootte 10 laat duidelijk zien dat de sequenties zeer overeenkomsten
vertonen, omdat er veel overeenkomsten zijn. De meeste gebieden zijn zeer
geconserveerd met enkele zeer lokale uitzonderingen (waar de lijn wordt
onderbroken). Deze worden mismatches genoemd.
Het verkleinen van de woordgrootte maakt de gegevens meer ruisachtig,
omdat sommige aminozuurcombinaties heel vaak lijken voor te komen in de
genen
o Beschrijvingen/lezen dot plot zie practicum 1
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller julieae. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.54. You're not tied to anything after your purchase.