In dit document zijn de leerdoelen uitgewerkt voor deeltentamen 2 over bio-informatica. De uitgewerkte leerdoelen geven een heel goed overzicht van de te leren studiestof.
Explain why a biologist should know Bioinformatic Data Analysis
Modern genetisch onderzoek genereert steeds meer en steeds complexere data en is onlosmakelijk
verbonden met bioinformatica. Het analyseren van de grote hoeveelheid data is belangrijk om de
geschikte data te vinden voor een bepaald onderzoek.
Describe the ‘omics: (meta-) genomics, (meta-) transcriptomics, (meta-) proteomics, metabolomics
Omics staat voor “heel veel”. Er worden heel veel metingen gedaan van alle componenten in een cel.
Bijvoorbeeld DNA, hoeveelheid eiwitten of hoeveelheid metabolieten ect.
Metagenomics: Metagenomics is de studie van rechtstreeks uit omgevingsmonsters
gewonnen genetisch materiaal. Je kijkt dus naar alle DNA in een sample. Bij genomics kijk
je naar het genoom van een enkel organisme.
Metatranscriptomics: Metatranscriptomics is de wetenschap die genexpressie van
microben in natuurlijke omgevingen bestudeert, d.w.z. het metatranscriptoom. Het
maakt het ook mogelijk om volledige genexpressieprofielen van complexe microbiële
gemeenschappen te verkrijgen. Je kijkt dus naar de mRNA concentratie om iets over de
genexpressie te kunnen zeggen.
Metaproteomics: Metaproteomics is een overkoepelende term voor experimentele
benaderingen om alle eiwitten in microbiële gemeenschappen en microbiomen uit
omgevingsbronnen te bestuderen. Je kijkt dus naar de eiwit concentratie en sequentie.
Metabolomics: Metabolomics is de wetenschappelijke studie van chemische
processen waarbij metabolieten, de kleine moleculesubstraten, tussenproducten en
producten van het celmetabolisme betrokken zijn. Je kijkt dus naar metabolieten
concentraties.
Bij genomics of transctiptomics kijk je naar een enkel organisme en bij metagenomics of meta-
transcriptomics kijk je naar alle organismen die zich in een sample bevinden.
Explain the biology behind the ‘omics revolution: reduce bias by measuring all of a thing
Mensen zijn voornamelijk geïnteresseerd in dingen die ons wat aan gaan. Bijvoorbeeld het onderzoek
naar bepaalde ziektes of eten. Hierbij vergeten we alleen dat er nog een hele grote groep
organismen is die niet bekeken worden en dit zorgt voor een bias.
Compare the two ways a bioinformatician exploits existing data to make new discoveries
Je hebt twee manieren om nieuwe ontdekkingen te doen.
1. Je hebt de top-down methode, waarbij je kijkt naar een gegeven vraag waar je een
antwoord op wilt vinden. Je zoekt informatie om deze vraag te kunnen beantwoorden.
2. Je hebt de bottum-up methode, waarbij je een dataset hebt en kijkt wat je met de
informatie kan. Je kijkt dus aan de hand van een gegeven dataset welke vraag je ermee
kan beantwoorden.
Explain what a sequence alignment is and the difference between a global and local sequence
alignment
Sequentiealignering is het bij elkaar zetten van twee of meer biologische sequenties op zo'n manier
dat gelijkenissen en verschillen tussen de sequenties duidelijk worden. Dit soort alignering wordt
binnen de biologie meestal aan computers overgelaten en vormt zo een bekend concept binnen de
bio-informatica. Je kunt hierdoor kijken naar welke stukken DNA gelijk zijn en welke similarity
vertonen.
Globale alignment Lokale alignment
In global alignment, an attempt is made to align Finds local regions with the highest level of
the entire sequence (end to end alignment) similarity between two sequences
Aligns two sequences from end to end Finds the optimal sub-alignment within two
sequences
Als twee sequenties volledig homogeen zijn, dan Partial homology
,heeft er een duplicatie opgetreden
Explain the BLAST algorithm
De Basic Local Alignment Search Tool is een algoritme dat gebruikt wordt voor het vergelijken van
een DNA- of eiwit-sequentie in verscheidene databases. Het zoekresultaat laat zien welke
gerelateerde sequenties voorkomen in hetzelfde organisme of gerelateerde organismen.
In de bio-informatica is BLAST ( basic local alignment search tool ) [2] een algoritme en programma
voor het vergelijken van primaire biologische sequentie-informatie, zoals de aminozuursequenties
van eiwitten of de nucleotiden van DNA- en/of RNA- sequenties. Een BLAST-zoekopdracht stelt een
onderzoeker in staat een bepaald eiwit of nucleotidesequentie (een zoekopdracht genoemd) te
vergelijken met een bibliotheek of databasevan reeksen, en identificeer databasereeksen die lijken
op de queryreeks boven een bepaalde drempel. Bijvoorbeeld, na de ontdekking van een voorheen
onbekend gen in de muis , zal een wetenschapper typisch een BLAST-onderzoek van het menselijk
genoom uitvoeren om te zien of mensen een soortgelijk gen dragen; BLAST zal sequenties in het
menselijk genoom identificeren die lijken op het gen van de muis op basis van gelijkenis van
sequentie.
List the factors including heuristics that make BLAST fast
Heuristics houdt in dat je niet echt je query sequentie vergelijkt met alle sequenties in de database,
maar je gebruikt eerst de exacte index search en kijkt naar de sequenties die bijna gelijk zijn. Je kijkt
dus niet naar alle alignments, dus er is een mogelijkheid dat de beste mogelijkheid er niet tussen zit.
Maar deze techniek zorgt er wel voor dat Blast een stuk sneller gaat, omdat je niet een query
sequentie met de hele database hoeft te vergelijken, maar met maar een klein deel.
Evaluate BLAST output/results
De outputs van blast zijn hits/ de alignment output. Wat staat daar allemaal in:
Identities: dit zijn dat je dezelfde aminozuur op dezelfde plek hebt
Positives: altijd hoger aantal dan identities. Ze betekenen posities scorende
aminozuren (=identities+ alle aminozuren in de alignment die niet identical zijn maar
similar, dus =identities + similars). Positives staan niet bij DNA search
Je krijgt ook de locatie van de hits
Bit score
E-waarde: is het belangrijkste ding in de blast htis. De E-waarde betekent hoeveel hits
je verwacht van similar of hogere kwaliteit als het totaal random was, dus als het niet iets
met sequences being related aan elkaar had.
Decide which BLAST flavor to use for your similarity search
nblast (nucleotide blast): Je hebt een nucleotide query en wil deze vergelijken ten
opzichte van een nucleotide database.
pblast (protein blast): Je hebt een eiwit query en wil deze vergelijken ten opzichte
van een eiwit database.
, Blastx: Je hebt een nucleotide query en wil deze vergelijken ten opzichte van een
eiwit database.
tblastn: Je hebt een eiwit query en wil deze vergelijken ten opzichte van een
getransleerde nucleotide database.
tblastx: Je hebt een nucleotide query en wil deze vergelijken ten opzichte van een
getransleerde nucleotide database.
Megablast: Je hebt een nucleotide query en wilt deze vergelijken ten opzichte van
een nucleotide database, waarbij je alleen zeer nauw-verwante hits wilt vinden.
List the mechanisms of DNA mutation
Nucleotide substitutie:
Is kleinst mogelijke mutatie
Kan gebeuren tijdens replicatie door een fout
Of kunnen ontstaan na een fysieke of chemische reactie (vb: UV-licht)
Inserties of deleties (indels):
Kan ontstaan na ongelijke crossing over tijdens meiose
En kan ontstaan na slippage in replicatie
Inversies of rearrangements:
Soms kunnen DNA delen omdraaien
Duplicatie van...
Partiële of hele genoom
Partial (polysomy) of hele chromosoom (aneuploidy, polysomy)
Hele genoom (polyploidy)
Horizontal gene transfer (HGT)
Transfer tussen individuen van dezelfde generatie (vooral in bacterien)
Verticaal is van generatie op generatie
Define homology, similarity, and identity
Homolgy: hebben common ancestor
Er is een evolutionaire relatie
Het betekent dat 2 sequenties een common ancestor hebben
Homology is ofwel waar of niet waar, het kan niet zijn dat 2 sequenties een beetje
homoloog zijn, je bent ofwel familie of niet.
Je kan wel hebben dat 2 sequenties partially homoloog zijn, maar dan zijn ze nog
steeds homoloog.
Identity: match in de alignment
De identiteit van een sequence is het aantal residues die hetzelfde zijn op dezelfde
plek (dus ze matchen op de alignemnt)
Similarity: match + chemische gelijke match
Dat is het percentage van aminozuren die ofwel hetzelfde zijn of chemisch gelijk zijn
(die dus een positieve score hebben in de substitutie matrix)
Is alleen bij aminozuren niet DNA (nucleotiden), identity is wel voor aminozuren en
DNA.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper lennekemelissen. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,29. Je zit daarna nergens aan vast.