PRACTICUM 1
DATABANKS
- NCBI databases
= is a US-based organisation that maintains several reference databases for biological and
molecular data
a. Soorten:
o gene databank (by navigating to Genes & Expression and then Gene)
o DNA sequence (instead of “gene” select nucleotide)
=Nucleotide database is a collection of sequences from several sources, including
GenBank, RefSeq and PDB
Genbank provides you with the most crucial information in a very simple
text format
o All databases
Bevat extra informatie zoals literatuur, gene, proteïne, genomes, chemicaliën,…
o dbSNP
= world’s largest database for nucleotide variations, and is part of the National
Center for Biotechnology Information (NCBI)
bestaat uit:
grote cluster van soortspecifieke databanken die meer dan 12
miljoen niet-redundante sequentievariaties bevatten
enkelvoudige nucleotide
polymorfismen, inserties/deleties, en korte tandem herhalingen
meer dan 1 miljard individuele genotypes
<afkomstig van HapMap en andere grootschalige
genotyperingsactiviteiten
b. Werking:
1. Gene database
i. Find molecular components under “interactions”
ii. Associated problems under “phenotypes” & “associated”
iii. Gene ontology under “general gene information”
has 3 classes:
Cellular component
Molecular function
Biological process
2. Genbank
i. Accession number
=een unieke identificatiecode die aan een databankrecord wordt gegeven.
Het is van cruciaal belang om dit te vermelden wanneer u de
overeenkomstige database-informatie gebruikt.
Bijvoorbeeld,
er kunnen verschillende versies van genen bestaan, of ze kunnen in de loop
van de tijd worden bijgewerkt. Daarom,
als je een artikel schrijft en je vermeldt iets over bijvoorbeeld positie 50 in
een specifiek
, gen, is het van cruciaal belang om ook het toetredingsnummer te vermelden,
anders zou positie 50 kunnen verwijzen
naar een andere plaats in de sequentie dan je bedoelde
ii. Fasta file
= is een eenvoudig tekstbestand met de volgende eigenschappen: De eerste
regel voor elk gen bevat "> NAAM_ VAN DE_ENTITEIT (SPATIE+OPTIONELE
BESCHRIJVING)" en wordt gevolgd door (op een nieuwe regel!) de
nucleotiden voor een gen of transcript, en de aminozuren
aminozuren voor een eiwit (beide in afkortingen van 1 symbool). De
nucleotide-sequentie kan verspreid worden over verschillende (of
honderden) lijnen.
- Uniprot
= protein databank; een van de belangrijkste eiwitdatabanken en is een combinatie van de
vroegere Swiss-Prot en TrEMBL (Translated EMBL Nucleotide Sequence Data Library)
databanken.
HINT : UniProt has a separate section for human diseases in the main uniport search box
under “supporting data”.
o Swiss-Prot = CURATED
Bevatten handmatig gecureerde gegevens van zeer hoge kwaliteit
was het onmogelijk om met de high throughput methodes zoals whole
genome sequencing en proteomics.
o TrEMBL = NON-CURATED
Bevatten geautomatiseerde (lagere kwaliteit) eiwitannotatie
PAIRWISE ALIGNMENT
1. Dot plots
= grafische representatie van sequentie identiteit (i.e. similarity).
o Alle mogelijke vergelijkingen die gemaakt kunnen worden tussen twee reeksen
Door :
i. over elkaar schuiven
ii. controleren of twee tekens (of meerdere tekens voor woordgroottes > 1)
overeenkomen
resultaat:
a. a match (een hit)
b. a dot
o word size
bepaalt: hoe lang een identieke reeks aminozuren of nucleotiden moet zijn
om een punt op het diagram te genereren.
langere perfecte overeenkomsten = zeldzamer dan korte,
MAAR korte overeenkomsten kunnen ook gewoon ruis zijn
Woordgrootte 10 laat duidelijk zien dat de sequenties zeer overeenkomsten
vertonen, omdat er veel overeenkomsten zijn. De meeste gebieden zijn zeer
geconserveerd met enkele zeer lokale uitzonderingen (waar de lijn wordt
onderbroken). Deze worden mismatches genoemd.
Het verkleinen van de woordgrootte maakt de gegevens meer ruisachtig,
omdat sommige aminozuurcombinaties heel vaak lijken voor te komen in de
genen
o Beschrijvingen/lezen dot plot zie practicum 1
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper julieae. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,99. Je zit daarna nergens aan vast.