Samenvatting Bio-informatica stof Bio-informatica Course 3 HAN Nijmegen
25 views 1 purchase
Course
Bioinformatica
Institution
Hogeschool Arnhem En Nijmegen (HAN)
Samenvatting van de Bio-informatica stof Bio-informatica Course 3 HAN Nijmegen. Samenvatting is van collegejaar 2019/2020. De samenvatting bevat alle kennis die nodig is voor de toets, maar oefenen met opdrachten is wel van belang.
Human Immunodeficiency Virus (HIV) staat centraal dit blok. De theorie is dat het van apen
komt.
Onderzoeksvragen genoomonderzoek:
- Waarom is HIV-1 zo hoog virulent? (hoe schadelijk het is).
- Wat is de fylogenetische oorsprong van HIV-1? (afstamming, waar komt HIV
vandaan).
Het wordt aids wanneer de hoeveelheid witte bloedcellen (de T-helpercellen in dit geval)
onder een bepaald niveau komt.
Apen hebben ook HIV, maar dan wordt het SIV genoemd.
Het genoom is al je erfelijke informatie.
Het HIV genoom bestaat uit:
- 2 identieke RNA strands
- 9 genen (niet 10)
- 9181 nt (HIV1), 10359 nt (HIV2)
- Het is dus erg klein in verhouding tot het humane genoom.
Wat kun je aan een genoom analyseren?
- Grootte
- Coding / non-coding regionen
- Expressie profielen
- GC – content
- En nog veel meer …
En waarom zou je dat willen doen?
- Hoe zit een organisme in elkaar?
- Wat maakt een beestje anders dan alle andere beestjes?
- Hoe is de evolutie verlopen?
- …
Virus bestaat uit:
- Nucleïnezuur (DNA of RNA)
- Capside: omhulsel van eiwitten waarin het nucleïnezuur zit.
- Sommige virussen hebben ook een membraan, maar dus niet allemaal. Vooral
dierlijke virussen. Dierlijke cellen hebben ook een celmembraan, waardoor het virus
met het membraan makkelijk kan versmelten.
Verschillende soorten genomen binnen virussen:
- Enkel strengs RNA (ss RNA)
- Dubbel strengs RNA (ds RNA)
- Enkel strengs DNA (ss DNA)
, - Dubbel strengs DNA (ds DNA)
Het enzym dat zorgt voor het omzetten van RNA naar DNA heet: reverse transcriptase.
Reverse transcriptase is van het virus, nieuwe reverse transcriptase voor de nieuwe virussen
wordt door de host cel geproduceerd.
Glycoproteins (GP) (eiwit met suikers[?] ): de “antennes” aan de buitenkant van het virus,
waarmee het een cel binnendringt.
- Fusion (fuseren): de membranen van het virus en de host cel fuseren met elkaar
- Budding (uitstulpen): het tegenovergestelde van fusion. Het virus verlaat de host cel
en neemt een stuk membraan mee.
Fusion en budding lijken op endocytose en exocytose.
Endocytose: bijvoorbeeld een bacterie wordt door een witte bloedcel opgenomen, maar er
komt een membraan omheen wanneer het in de witte bloedcel zit.
Exocytose: stof in de cel met membraan er om heen. Membraan versmelt met membraan
cel. Stof verlaat de cel, zonder dat er een membraan omheen zit.
Reading frames: je kunt ieder DNA/RNA sequentie in drie verschillende reading frames
aflezen:
,Door de readingframes kan het zijn dat er genen “boven elkaar liggen” (een afbeelding in
ppt1).
Je moet de genen en eiwitten van HIV uit je hoofd kennen.
HIV eiwitten:
- GP: de glycoproteïnen
- Integrase: integratie van viraal DNA in host genoom, met behulp van sticky ends
- Protease: knipt polyprotein
- Reverse transcriptase: maakt van RNA DNA
Verkrijgen van genen/eiwitten van HIV via NCBI taxanomy. Je moet de genoomsequenties,
mRNA en proteïnesequenties van de HIV-1, HIV-2, SIV en SIVmnd2 virussen. mRNA
sequentie kun je niet downloaden, neem de coding sequence (CDS). Download in FASTA.
Je hebt de 4 verschillende virussen. Elk virus heeft een bepaald aantal genen. Elk gen
codeert weer voor een eiwit. Je wil de volledige genoom sequentie hebben van de virussen
(FASTA), het CDS van elk eiwit (sequentie als FASTA downloaden, en ook de locaties), en
de eiwit sequenties (handig te downloaden vanuit NCBI).
We zijn begonnen in de NCBI Taxonomy Browser
(https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi). Je voert bijvoorbeeld als
eerste HIV-1 in. Boven in de bar vink je nucleotide, protein en genome aan (klik op go om te
herhalen). Vervolgens ga je naar de genome van HIV-1, door op het roze getal te klikken. Je
kunt vervolgens doorklikken naar de RefSeq. Je komt dan in de NCBI pagina van het virus.
Rechts bovenin kun je het genoom en het CDS downloaden door op “Send to:” te klikken
(kies voor file en FASTA). Voor het eiwit kun je aan de rechterzijde onder “Related
information” doorklikken naar “Protein”. De eiwitten kun je op dezelfde manier downloaden,
dus door op send to te klikken.
HIV-1 en HIV-2 zijn eenvoudig te vinden. SIV en SIVmnd2 zijn wat moeilijker. Wanneer je
namelijk vanuit de taxonomy browser door klikt op het roze getal, vind je de RefSeq
sequentie niet. Wat je dan moet doen is hierop klikken.
,Je komt dan hier:
Bovenaan staan SIV en SIVmnd2. Bij het onderdeel “Segements” kun je op de accessiecode
klikken om bij de NCBI pagina te komen.
Accessiecodes van de verschillende virussen:
- HIV-1: NC_001802
- HIV-2: NC_001722
- SIV: NC_001549
- SIVmnd2: NC_004455
Metagenomen: ze pakken een sample (uit de grond of plas water of iets) en je gaat
sequencen. Je krijgt een verzameling van sequenties van elk organisme dat daar
bijvoorbeeld in de bodem leeft en dan weet je dus welke organismen daar voorkomen.
Gebeurt ook bij organismen, bijvoorbeeld een sample van darminhoud, om inzicht te krijgen
in wat voor een bacteriën/organismen je hebt (en om ziektes misschien op die manier te
vinden).
Transcriptomics: je gaat kijken naar de RNA sequenties. Van het RNA wordt DNA gemaakt.
Het DNA wordt gesequenced. Je kunt dan achterhalen welke genen actief zijn binnen een
cel. Maar waarom sequence je niet meteen het RNA?: er zit een enzym, vooral op je
handen, wat RNA kapot maakt. Wanneer je dus met RNA werkt, kan het snel kapot gaan.
DNA is stabieler, omdat het ook dubbelstrengs is.
,Waarom heeft een chromosoom op een bepaalde plek meer GC dan op andere plekken?:
GC is stabieler, op belangrijke plekken dus GC. (niet het beste antwoord vgm).
Chromatine: DNA streng om eiwitten (histonen) heen.
o Euchromatine: het DNA ligt los om de eiwitten heen (RNA polymerase kan
erbij)
o Heterochromatine: het DNA ligt strak om de eiwitten heen (RNA polymerase
kan er niet bij)
Definitie gen: een stuk nucleïnezuur sequentie dat codeert voor één of meerdere producten
(RNA of eiwit).
Het humane genoom heeft een lengte van
ongeveer 3000 Mb, met ongeveeer 20.500
eiwit coderende genen.
1.5% van het genoom van mensen bestaat uit
exonen. Waaruit bestaat de rest?: intronen,
promotor regionen, repeats, telomeren, uniek
noncoding DNA (uniek DNA dat maar op één
plek voorkomt, maar niet codeert (waarom?:
niet bekent)).
Alternative splicing moet je kennen.
Genomen van prokaryoten en eukaryoten:
Prokaryoten Eukaryoten
Hoge gen dichtheid Lage gen dichtheid
Kleiner genoom Groter genoom
Verband tussen grootte genoom en aantal Geen verband tussen grootte genoom en
genen aantal genen
Een klein genoom bij prokaryoten betekent een laag aantal genen, een groot genoom
betekent veel genen. Bij eukaryoten is dit verband er niet. Planten kunnen een erg groot
genoom hebben, maar met weinig genen.
,Waarom zijn prokaryotische genomen kleiner:
- Bacteriën hebben geen repeats.
- Gebruiken operons (uitleg komt bij life science theorie)
- Geen intronen (bij de meeste)
- Kleine regulerende regio’s
Het eukaryotisch genoom is onder andere groter doordat:
- We nog veel genen hebben die hun functie hebben verloren (door mutaties
bijvoorbeeld). Die resten zijn nog steeds zichtbaar, en ze worden pseudogenen
genoemd.
- Post transnationale modificaties: eiwitten kunnen nog bewerkt worden naar de
translatie.
- Complexe regulatie
o Complexe promotors
o RNA moleculen
- Door alternative splicing. Genen moeten hiervoor een langere lengte hebben.
Verschil in GC percentages:
- Prokaryoten hebben een grote variëteit in GC percentages (25%-75%)
- Eukaryoten hebben een kleine variëteit in GC percentages (40%-45%)
Nadeel hoog GC percentage: het muteert minder snel, dus minder aanpasbaarheid.
Isochoor: stuk genoom met stabiel GC%. Hoge GC% komen voor op plekken waar genen
liggen die van groot belang zijn van de cel.
Verschillende groepen GC percentages: (L staat voor low, H voor high)
, HIV genen, eiwitten en functie (In Toets!):
Naam gen Codeert voor Functie
eiwit(ten)
gag MA De eiwitten hebben samen een functie:
CA Gag produceert de eiwitten voor het capside (meer hoef je niet te weten)
SP1
NC
SP2
P6
Deze moet je kennen
pol RT (reverse ssRNA dsDNA
transcriptase)
RNase H
Verwijdert RNA streng van de DNA-RNA hybride bij de reverse
transcriptase
IN (integrase) Integreert HIV genoom in hostgenoom, maakt daarbij “sticky ends” (dat
afsplitsen van de nucleotiden aan de 3’).
PR (protease)
Knipt het polyprotein in kleinere polypeptides
env Gp120 Glycoproteïne dat bindt aan de CD4 receptor
(glycoproteïne)
Gp41
Glycoproteïne dat helpt bij het fuseren met de T-helpercel
(glycoproteïne)
tat transator activator transcription viral genes
protein
(P16/P14)
--
Regulatie eiwit; essentieel bij de gen expressie. Regelt aanmaak van RNA
polymerase II uit hyperphosphylatie. Regelt elongatie fase, maakt
volledige-lengte transcriptie mogelijk.
rev p19 reguleert de export van wel- en niet gespliced viraal mRNA
RNA splicing
regulator
, nef negative Degenereert de CD4 en eiwitten en HLA cellen.
regulating
factor(P27)
vpr virus protein R Component of virus partikels
P15 faciliteert virus infectiviteit
maivif P23 kritisch voor infectiviteit van het vir
viral infectivity
protein
vpu P16 controleren van CD-4 regulatie.
virus protein reguleert intern verkeer
unique
degradatie van het viraal CD-4 receptor
zorgt voor het vrij laten van virionen van het cel oppervlak
Huishoudgenen: genen die producten produceren die elke cel nodig heeft (iedere cel doet
transcriptie, translatie, enz., en elke cel heeft dus die eiwitten nodig die daarbij betrokken
zijn). Die genen zijn in elke cel belangrijk. De genen zijn sterk geconserveerd. Wanneer die
genen dus niet werken of muteren, dan zal de cel waarschijnlijk niet kunnen leven. (wanneer
het gen door bijvoorbeeld een mutatie niet meer voor polymerase kan coderen, dan is dat
een ernstige mutatie).
- 80% van de huishoudgenen liggen in de H1, H2, H3 groepen (rond de 50% GC
percentage)
Weefselspecifieke genen: genen die niet zo belangrijk zijn binnen een cel. Bijvoorbeeld:
eiwitten in je oog die alleen in je oog voorkomen, maar niet in een spiercel.
- 85% van de weefselspecifieke genen liggen in de L1 en L2 groepen (rond de 40%
GC percentage)
,Het downloaden van de chromosoom sequenties van weektaak 2 hebben we op de volgende
manier gedaan:
Je gaat naar de NCBI genome pagina: https://www.ncbi.nlm.nih.gov/genome/
Vervolgens klik je onder “Using genome” op “Browse by organism”.
Je komt hier en vervolgens kun je op filters klikken, om te filteren.
Je kunt op een organisme klikken, en vervolgens krijg je informatie over dat organisme zien.
Je kunt doorklikken naar de RefSeq pagina van de chromosomen, om ze te downloaden.
De accessiecodes van de door ons gekozen chromosomen:
- Chromosoom van de mens: NC_000021.9
- Chromosoom van een plant: NC_039915.1
- Chromosomen van de bacteriën: NC_000915.1 & NZ_CP045295.1
, Het bekijken van de GC grafiek in de literatuur hebben we op de volgende manier gedaan:
Je gaat naar Genome data viewer: https://www.ncbi.nlm.nih.gov/genome/gdv/
Bij de mens klik je op “Browse Genome”. Vervolgens klik je op het chromosoom dat je wilt
bekijken. Je komt hier:
Hier klik je op “Tracks”
In dit scherm vink je alles uit behalve “sequence”:
Vervolgens klik je hier op sequence
In dit scherm scroll je naar beneden totdat je “G + C content” ziet. Je vinkt dit aan, en
vervolgens klik je op “Configure”. Je ziet nu het GC percentage per x nucleotiden van het
chromosoom.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller nicksomsen. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.51. You're not tied to anything after your purchase.