PRACTICUM 1
DATABANKS
- NCBI databases
= is a US-based organisation that maintains several reference databases for biological and
molecular data
a. Soorten:
o gene databank (by navigating to Genes & Expression and then Gene)
o DNA sequence (instead of “gene” select nucleotide)
=Nucleotide database is a collection of sequences from several sources, including
GenBank, RefSeq and PDB
Genbank provides you with the most crucial information in a very simple
text format
o All databases
Bevat extra informatie zoals literatuur, gene, proteïne, genomes, chemicaliën,…
o dbSNP
= world’s largest database for nucleotide variations, and is part of the National
Center for Biotechnology Information (NCBI)
bestaat uit:
grote cluster van soortspecifieke databanken die meer dan 12
miljoen niet-redundante sequentievariaties bevatten
enkelvoudige nucleotide
polymorfismen, inserties/deleties, en korte tandem herhalingen
meer dan 1 miljard individuele genotypes
<afkomstig van HapMap en andere grootschalige
genotyperingsactiviteiten
b. Werking:
1. Gene database
i. Find molecular components under “interactions”
ii. Associated problems under “phenotypes” & “associated”
iii. Gene ontology under “general gene information”
has 3 classes:
Cellular component
Molecular function
Biological process
2. Genbank
i. Accession number
=een unieke identificatiecode die aan een databankrecord wordt gegeven.
Het is van cruciaal belang om dit te vermelden wanneer u de
overeenkomstige database-informatie gebruikt.
Bijvoorbeeld,
er kunnen verschillende versies van genen bestaan, of ze kunnen in de loop
van de tijd worden bijgewerkt. Daarom,
als je een artikel schrijft en je vermeldt iets over bijvoorbeeld positie 50 in
een specifiek
, gen, is het van cruciaal belang om ook het toetredingsnummer te vermelden,
anders zou positie 50 kunnen verwijzen
naar een andere plaats in de sequentie dan je bedoelde
ii. Fasta file
= is een eenvoudig tekstbestand met de volgende eigenschappen: De eerste
regel voor elk gen bevat "> NAAM_ VAN DE_ENTITEIT (SPATIE+OPTIONELE
BESCHRIJVING)" en wordt gevolgd door (op een nieuwe regel!) de
nucleotiden voor een gen of transcript, en de aminozuren
aminozuren voor een eiwit (beide in afkortingen van 1 symbool). De
nucleotide-sequentie kan verspreid worden over verschillende (of
honderden) lijnen.
- Uniprot
= protein databank; een van de belangrijkste eiwitdatabanken en is een combinatie van de
vroegere Swiss-Prot en TrEMBL (Translated EMBL Nucleotide Sequence Data Library)
databanken.
HINT : UniProt has a separate section for human diseases in the main uniport search box
under “supporting data”.
o Swiss-Prot = CURATED
Bevatten handmatig gecureerde gegevens van zeer hoge kwaliteit
was het onmogelijk om met de high throughput methodes zoals whole
genome sequencing en proteomics.
o TrEMBL = NON-CURATED
Bevatten geautomatiseerde (lagere kwaliteit) eiwitannotatie
PAIRWISE ALIGNMENT
1. Dot plots
= grafische representatie van sequentie identiteit (i.e. similarity).
o Alle mogelijke vergelijkingen die gemaakt kunnen worden tussen twee reeksen
Door :
i. over elkaar schuiven
ii. controleren of twee tekens (of meerdere tekens voor woordgroottes > 1)
overeenkomen
resultaat:
a. a match (een hit)
b. a dot
o word size
bepaalt: hoe lang een identieke reeks aminozuren of nucleotiden moet zijn
om een punt op het diagram te genereren.
langere perfecte overeenkomsten = zeldzamer dan korte,
MAAR korte overeenkomsten kunnen ook gewoon ruis zijn
Woordgrootte 10 laat duidelijk zien dat de sequenties zeer overeenkomsten
vertonen, omdat er veel overeenkomsten zijn. De meeste gebieden zijn zeer
geconserveerd met enkele zeer lokale uitzonderingen (waar de lijn wordt
onderbroken). Deze worden mismatches genoemd.
Het verkleinen van de woordgrootte maakt de gegevens meer ruisachtig,
omdat sommige aminozuurcombinaties heel vaak lijken voor te komen in de
genen
o Beschrijvingen/lezen dot plot zie practicum 1
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur julieae. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €6,99. Vous n'êtes lié à rien après votre achat.