volledige samenvatting bio-informatica met uitgewerkte oefeningen en per oefening stap per stap vermeld hoe je eraan komt. zowel de oefeningen van de lessen komen aan bod, als de oefeningen van de werkcolleges. de laatste pagina bevat alle gebruikte codes voor in jupyter en python.
Les 1
https://www.ncbi.nlm.nih.gov/gene/7157
NM nr = transcript van een bep gen (NM_xxx.y -> xxx = ID en .y = versie)
NP nr = protein
Gelinkt aan elkaar
Tekst editor: BBEdit 15 (programma op computer)
Van https://www.ncbi.nlm.nih.gov/gene/7157
1. Send to
2. Complete record
3. File
4. Format: gene bank/FASTA/… (afh van wat je nodig hebt)
5. Create new file
1. https://www.ncbi.nlm.nih.gov/gene/7157
2. pubmed + nr ingeven (29764999)
3. related information: gene (E2F)
4. mRNA en Protein(s): hier vind je transcript (NM_005225.3) –> op klikken
5. download and open in tekst editor
6. graphic
7. https://www.ebi.ac.uk/Tools/dbfetch/dbfetch?db=refseqn;id=NM_005225;format=default&style=raw
https://www.uniprot.org/
- geeft alle info over proteinen
- mog om GFF te downloaden = tekst file om features te beschrijven
1. zoek human hemoglobin alfa in uniprot
2. download –> entry + FASTA
3. accession number: P69905
4. download –> entry/features only + GFF
, 1. zoek in ncbi bij pubmed: The DCC gene has a role in cellular differentiation and colorectal tumorigenesis (Hedrick
et al. 1994 Genes Dev)
2. pubmed ID: 7926722
3. pubmed ID zoeken in uniprot
4. PTM/Processing –> features –> signal: AZ 1-25 en seq = MENSLRCVWVPKLAFVLFGASLFSA
3D structuur bekijken: ncbi –> structure + naam gen
swissprot = uniprot
1. SOX2
2. mRNA and Protein(s): 1 mRNA transcript: NM_003106.4
3. transcriptie factor
4. FASTA: zie eerder
5. Structuur is beschikbaar
6. Uniport: human PAX6 zoeken –> ‘family & domains’ –> scroll naar beneden –> ‘view protein in InterPro’ –> alle
sonder ‘domain’ zijn geannoteerde domeinen
Les 2
Ontologies
= formele presentatie van concepten binnen een domein en de relatie binnen die concepten (het helpt computers te
begrijpen welke dingen bestaan en hoe ze met elkaar verbonden zijn).
Gen ontologie (GO): structuur
- Moleculaire functie: wat doet het genproduct?
- Celullaire component: waar en waneer is het actief?
- Biologische processen: in welke processen doet het mee?
, 1. Ga naar uniprot: zoek ‘PAX6’ –> klink aan op mens
2. Go annotation: via deze link naar QuickGO
Onduidelijk waarom gedaan (organisme zou mens moeten zijn)
3. Zoek: cardiac development –> all –> heart development (= correct GO term)
4. Kies bij taxon (links boven) ‘homo sapiens’: 2956 genen
5. Kies bij taxon ‘mus musculus’ (muis): 2827 genen
6. Zoek opnieuw ‘cardiac development’
7. Klinkt op term nr bij ‘heart devolpment’
8. Ga naar ‘child terms’: 28
9. Download association –> export
10. Wijzig bestand van naam: voeg ‘.txt’ toe
11. Open met excel –> gegevens –> tekst naar kolom –> gescheiden –> tab –> voltooien
12. Gen naam selecten (3e kolom) –> kopieren naar niet tabblad –> gegevens –> geavanceerd –> alleen unieke records
13. Links vanonder (naast gereed): 703 unieke gen symbolen
Open biomedical ontologies (OBO)
= opslagplaats voor ontologieën met gedefiniëerde sets van standaarden en regels (GO is deel van OBO)
http://obofoundry.org
https://www.ebi.ac.uk/ols4/ontologies
1. Zoek ‘oligodendrocyte’
2. Ga naar ‘class relations’ –> develops from (RO) oligodendrocyte precursor cell –> klik hier op
3. Develops from glioblast
4. Defenitie = An early neural cell developing from the early ependymal cell of the neural tube
5. Ga naar ‘class relations’ –> ‘related from’: macroglial cell, perineural satellite cell en oligodendrocyte precursor cell
(= other cell types that are derived from this cell type)
, Gene expression
https://www.gtexportal.org/home/index.html
Entrez = ncbi
Expressie in Entrez Expressie in GTEx (betrouwbaarder)
Nee, deze genen komen al
tot expressie in de embryo
en niet in volwassenen.
Gene expression omnibus (GEO)
Zoeken tussen alle datasets
Profile neighbours: zoeken binnen een dataset
https://www.ncbi.nlm.nih.gov/gds/
Human Cell Atlas
= referentie map maken van alle humane cellen die bestaan (kijken hoe cellen zich gedragen in gezonde en zieke
omstandigheden)
https://www.humancellatlas.org
1. Ga naar ‘data’ –> ‘heart’ –> ‘HCA Heart Datasets’ –> ‘Cells of the adult human heart’ en klik hierop
2. Ga naar ‘CZ CELLxGENE’ (we zitten nu in CellXGene, Chan-Zuckerberg Initiative)
3. Zoek rechts vanboven naar ‘MESP1’ –> druppeltje aanzetten: je ziet geen expressie
4. Zoek rechts vanboven naar ‘MYH11’ –> druppeltje aanzetten: je ziet een beetje expressie
5. Links ‘all cell_types’ druppeltje terug aanzetten om te kijken in welk celtype dit gen tot expressie komt: smooth
musle cell
6. Klik op ‘gene expression’ –> filter links bij ‘tissue’ op heart –> klik op ‘smooth muscle cell’
7. Marker genes –> lijst met alle marker genen
8. Klik op ‘+ Add to dot plot’ om de plot te genereren
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper AnetteVDB. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,99. Je zit daarna nergens aan vast.