volledige samenvatting bio-informatica met uitgewerkte oefeningen en per oefening stap per stap vermeld hoe je eraan komt. zowel de oefeningen van de lessen komen aan bod, als de oefeningen van de werkcolleges. de laatste pagina bevat alle gebruikte codes voor in jupyter en python.
Les 1
https://www.ncbi.nlm.nih.gov/gene/7157
NM nr = transcript van een bep gen (NM_xxx.y -> xxx = ID en .y = versie)
NP nr = protein
Gelinkt aan elkaar
Tekst editor: BBEdit 15 (programma op computer)
Van https://www.ncbi.nlm.nih.gov/gene/7157
1. Send to
2. Complete record
3. File
4. Format: gene bank/FASTA/… (afh van wat je nodig hebt)
5. Create new file
1. https://www.ncbi.nlm.nih.gov/gene/7157
2. pubmed + nr ingeven (29764999)
3. related information: gene (E2F)
4. mRNA en Protein(s): hier vind je transcript (NM_005225.3) –> op klikken
5. download and open in tekst editor
6. graphic
7. https://www.ebi.ac.uk/Tools/dbfetch/dbfetch?db=refseqn;id=NM_005225;format=default&style=raw
https://www.uniprot.org/
- geeft alle info over proteinen
- mog om GFF te downloaden = tekst file om features te beschrijven
1. zoek human hemoglobin alfa in uniprot
2. download –> entry + FASTA
3. accession number: P69905
4. download –> entry/features only + GFF
, 1. zoek in ncbi bij pubmed: The DCC gene has a role in cellular differentiation and colorectal tumorigenesis (Hedrick
et al. 1994 Genes Dev)
2. pubmed ID: 7926722
3. pubmed ID zoeken in uniprot
4. PTM/Processing –> features –> signal: AZ 1-25 en seq = MENSLRCVWVPKLAFVLFGASLFSA
3D structuur bekijken: ncbi –> structure + naam gen
swissprot = uniprot
1. SOX2
2. mRNA and Protein(s): 1 mRNA transcript: NM_003106.4
3. transcriptie factor
4. FASTA: zie eerder
5. Structuur is beschikbaar
6. Uniport: human PAX6 zoeken –> ‘family & domains’ –> scroll naar beneden –> ‘view protein in InterPro’ –> alle
sonder ‘domain’ zijn geannoteerde domeinen
Les 2
Ontologies
= formele presentatie van concepten binnen een domein en de relatie binnen die concepten (het helpt computers te
begrijpen welke dingen bestaan en hoe ze met elkaar verbonden zijn).
Gen ontologie (GO): structuur
- Moleculaire functie: wat doet het genproduct?
- Celullaire component: waar en waneer is het actief?
- Biologische processen: in welke processen doet het mee?
, 1. Ga naar uniprot: zoek ‘PAX6’ –> klink aan op mens
2. Go annotation: via deze link naar QuickGO
Onduidelijk waarom gedaan (organisme zou mens moeten zijn)
3. Zoek: cardiac development –> all –> heart development (= correct GO term)
4. Kies bij taxon (links boven) ‘homo sapiens’: 2956 genen
5. Kies bij taxon ‘mus musculus’ (muis): 2827 genen
6. Zoek opnieuw ‘cardiac development’
7. Klinkt op term nr bij ‘heart devolpment’
8. Ga naar ‘child terms’: 28
9. Download association –> export
10. Wijzig bestand van naam: voeg ‘.txt’ toe
11. Open met excel –> gegevens –> tekst naar kolom –> gescheiden –> tab –> voltooien
12. Gen naam selecten (3e kolom) –> kopieren naar niet tabblad –> gegevens –> geavanceerd –> alleen unieke records
13. Links vanonder (naast gereed): 703 unieke gen symbolen
Open biomedical ontologies (OBO)
= opslagplaats voor ontologieën met gedefiniëerde sets van standaarden en regels (GO is deel van OBO)
http://obofoundry.org
https://www.ebi.ac.uk/ols4/ontologies
1. Zoek ‘oligodendrocyte’
2. Ga naar ‘class relations’ –> develops from (RO) oligodendrocyte precursor cell –> klik hier op
3. Develops from glioblast
4. Defenitie = An early neural cell developing from the early ependymal cell of the neural tube
5. Ga naar ‘class relations’ –> ‘related from’: macroglial cell, perineural satellite cell en oligodendrocyte precursor cell
(= other cell types that are derived from this cell type)
, Gene expression
https://www.gtexportal.org/home/index.html
Entrez = ncbi
Expressie in Entrez Expressie in GTEx (betrouwbaarder)
Nee, deze genen komen al
tot expressie in de embryo
en niet in volwassenen.
Gene expression omnibus (GEO)
Zoeken tussen alle datasets
Profile neighbours: zoeken binnen een dataset
https://www.ncbi.nlm.nih.gov/gds/
Human Cell Atlas
= referentie map maken van alle humane cellen die bestaan (kijken hoe cellen zich gedragen in gezonde en zieke
omstandigheden)
https://www.humancellatlas.org
1. Ga naar ‘data’ –> ‘heart’ –> ‘HCA Heart Datasets’ –> ‘Cells of the adult human heart’ en klik hierop
2. Ga naar ‘CZ CELLxGENE’ (we zitten nu in CellXGene, Chan-Zuckerberg Initiative)
3. Zoek rechts vanboven naar ‘MESP1’ –> druppeltje aanzetten: je ziet geen expressie
4. Zoek rechts vanboven naar ‘MYH11’ –> druppeltje aanzetten: je ziet een beetje expressie
5. Links ‘all cell_types’ druppeltje terug aanzetten om te kijken in welk celtype dit gen tot expressie komt: smooth
musle cell
6. Klik op ‘gene expression’ –> filter links bij ‘tissue’ op heart –> klik op ‘smooth muscle cell’
7. Marker genes –> lijst met alle marker genen
8. Klik op ‘+ Add to dot plot’ om de plot te genereren
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller AnetteVDB. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $8.69. You're not tied to anything after your purchase.