Lijst termen Bio-informatica
Algoritmes Matrixen
- Graaf algoritmen - confusion matrix
- Dijkstra’s algorithm - adjacency matrix
- Floyd-Warshall algorithm - Substitutie matrix
- Brutte kracht algortme (Exhaustive) - dot matrix/ dotplot
- Heuristische algoritme - the identity matrix
- Optimalisatiealgoritmen: hill-climbing, iteratief bergbeklimmen, - Afstandsmatrix
stochastisch bergbeklimmen, gesimuleerde annealing, -
evolutionaire
- Needleman-Wunsch (globaal alignment)
- Smith-Waterman (local alignment)
- Lipman MSA algorithm
- Proggresieve alignment: Feng-Doolittle algorithm, CLUSTAL -W
- Iteratieve methode: MAFFT, MUSCLE, SAGA
- Consistency-based methods: probCons, T-coffee
- Smith-Waterman
- FASTA
Viterbi algorithm
-
,Part I- scope
Introductie – hoofdstuk 1
Pairwise sequence Twee sequenties met elkaar vergelijken
alignment
Sequence search we vergelijken een onbekende sequentie met een databank die vele bekende
sequenties bevat, en hopen een overeenkomst te vinden die ons kan vertellen
waar het onbekende monster vandaan komt.
fylogenie De ontdekking van evolutionaire relaties door bio-informatica-analyses van DNA-
sequenties
(Voor deze taak moeten niet slechts twee maar een groot aantal reeksen met
elkaar worden vergeleken.)
multiple sequence de vergelijking van meer dan twee sequenties
alignment
fylogenetische Het afleiden van evolutionaire relaties uit dergelijke meervoudige
sequentieanalyse sequentievergelijkingen
regio die in de hele Onze biologische kennis vertelt ons dat dit 'patroon' zeer waarschijnlijk betrokken
reeks meerdere is bij een cruciale biologische functie. Het vinden van zo'n patroon is vaak een
keren wordt eerste stap in het ontrafelen van de biologische functies van een gen waar we nog
herhaald niets van weten!
Sequencie Deze patronen bestaan uit een reeks opeenvolgende tekens die in de reeks worden
patroon/motieven herhaald, met een frequentie die hoger is dan je door toeval zou verwachten.
taak gebaseerd op - Sequence search
DNA-sequenties - Seq evolutie
- Seq patronen
- Seq functie: het ontrafelen van de moleculaire functie van het actieve
genproduct
Functie sequencie Het oplossen ervan kan vele aanvullende technieken vereisen, gebaseerd op in vivo
of in vitro experimenten, alsmede computationele in silico analyse. Bio-informatica
benaderingen richten zich op het laatste.
database In een dergelijke databank wordt elk chromosoom visueel voorgesteld en kan de
gebruiker inzoomen van het chromosoomniveau tot het niveau van de
afzonderlijke nucleotiden.
Op het meest gedetailleerde niveau stellen bio-informatici de samenstelling van
een DNA-streng meestal voor als een enkele DNA-sequentie
DNA sequencers de volledige sequentie van het genoom kunnen lezen
Workflow 1) DNA wordt aan het organisme onttrokken.
sequencers 2) Ofwel worden meerdere kopieën geëxtraheerd, ofwel wordt een enkele
kopie in vitro vermenigvuldigd.
3) Het resulterende DNA wordt vervolgens in korte fragmenten geknipt en
deze fragmenten worden door de sequencer gelezen.
4) Na een reeks bioinformaticastappen is het resultaat een grote dataset
bestaande uit sequentiefragmenten.
5) Om het oorspronkelijke genoom te reconstrueren, moeten deze weer in
elkaar worden gepuzzeld, een taak die wij sequentie-assemblage noemen.
sequentie Om het oorspronkelijke genoom te reconstrueren, moeten ze weer in elkaar
montage/ gepuzzeld worden.
sequence assembly
,Waarom Genoomsequencing is de basis voor het vinden van mutaties of andere genomische
genoomsequencing variaties die ten grondslag liggen aan diverse ziekten.
whole genome voor het generen van een referentiegenoom , of voor specimens waarvoor een
sequencing dergelijk referentiegenoom al beschikbaar is. In beide gevallen wordt het
workflow geëxtraheerde genomische DNA gebroken in fragmenten die klein genoeg zijn om
te hanteren, en deze fragmenten worden vervolgens gelezen door de
sequencingmachine. Na dit proces moeten de fragmenten worden geassembleerd,
hetzij vanaf nul (in het geval van een referentiegenoom), hetzij door vergelijking
met een reeds bekend referentiegenoom (in het geval van het individuele
genoom).
Sequence = high- de kosten van het sequencen van een volledig genoom zijn de afgelopen twintig
throughput jaar indrukwekkend gedaald
De wet van Moore
De helling van deze grafiek volgt deze wet;
- de rekenkracht van computers verdubbelt elke twee jaar. Moore's law is
oorspronkelijk een economische wet. De kosten per transistor nemen
namelijk af bij elke extra transistor die je toevoegt. Er was volgens Moore
dus een economische stimulans om extra transistors toe te voegen.
- De wet van Moore stelt dat het aantal transistors in een geïntegreerde
schakeling door de technologische vooruitgang elke twee jaar verdubbelt.
maar vanaf 2008 overschreden. Met name zijn in 2008 radicaal nieuwe DNA-
sequencingtechnologieën geïntroduceerd (bekend als next generation sequencing
of NGS), die de trend van de kosten per genoom hebben verstoord!
De bottleneck voor de bottleneck om genoomsequenties nuttig te maken is verschoven naar de
sequencing gegevensanalyse en -opslag, en dat is natuurlijk waar de bioinformatica haar
intrede doet!
annotaties de lijst van door genoomsequenties gegenereerde woorden omzetten in een
woordenboek van woorden met hun toegewezen functie
Systeem biologie is een overkoepelende term in de biowetenschappen, gebaseerd op de visie om
alle kennis en gegevens te integreren om te begrijpen hoe alle fundamentele
biomoleculaire bouwstenen van de verschillende informatielagen van biologische
systemen samenwerken om tot functionele levende systemen te komen.
netwerkbiologie is gebaseerd op geavanceerde netwerkvoorstellingen van alle componenten in de
systemen en hun interacties. Deze specifieke tak van computationele biologie
probeert het biologische systeem te "reverse engineeren" op basis van rijke
genomische en andere -omische datasets.
, Systeem biologie
model
Het systeembiologiemodel integreert biologie, technologie en computationele
vooruitgang om modellen van levende systemen te bouwen, via een iteratief
proces van hypothesevorming, gegevensverwerving en berekening
Definitie bio- onderzoek, ontwikkeling of toepassing van computationele instrumenten en
inforlatica benaderingen voor de uitbreiding van het gebruik van biologische, medische,
gedrags- of gezondheidsgegevens, met inbegrip van die voor het verwerven,
opslaan, ordenen, archiveren, analyseren of visualiseren van dergelijke gegevens
Met andere woorden, deze discipline heeft tot doel alle gegevens die nu op diverse
gebieden van de biowetenschappen worden gegenereerd, met ongekende
snelheid te begrijpen.
Overlappende (bio)statistiek, datamining en machinaal leren, computerwetenschappen
velden
Bio-informatica gegevensverwerking, gegevensvergelijking, gegevenszoeken,
taken gegevensstructurering, datamining, gegevensopslag en gegevensuitwisseling.
Verandering - Groei
context bio- - Centraal dogma (stelt dat informatie overgedragen kan worden van
informatisch veld nucleïnezuren naar eiwitten, maar niet andersom)
- Economische context
- Data revolution
- Artificial intelligence
Groei bio- gedreven door een revolutie in de biotechnologie, die een verschuiving naar high-
informatica throughput analyses van levende systemen teweegbrengt.
centrale dogma die de stroom van genetische informatie binnen een biologisch systeem beschrijft
van de moleculaire en vaak wordt omschreven als "DNA maakt RNA, en RNA maakt eiwitten".
biologie
= is een zeer beperkte weergave geworden van een biologische realiteit die in feite
veel complexer is, bijvoorbeeld door het bestaan van splicingvariatie,
posttranslationele eiwitmodificaties en epigenetische regulering.
economische is in enkele decennia drastisch veranderd. Door de betaalbaarheid van DNA-
context van de bio- analyses zijn nieuwe toepassingen economisch haalbaar geworden. Verschillende
informatica bedrijven bieden nu persoonlijke genoomanalyses aan. DNA-technologieën hebben
hun weg gevonden naar vele maatschappelijke segmenten, van forensisch
onderzoek tot genealogie. In elk van die segmenten speelt de bio-informatica een
centrale rol bij het verbinden van de informatie en het mogelijk maken van de
interpretatie.