De wet van Moore stelt dat het aantal transistors in een geïntegreerde schakeling
door de technologische vooruitgang elke twee jaar verdubbelt.
(dia 9) In a nutshell … Eerst wordt DNA geëxtraheerd. Dan knipt men de DNA in
miljoenen stukjes, waarvan vervolgen de letters worden afgelezen. Bijgevolg heb je
de sequentie van miljoenen stukjes DNA. Deze worden terug aan elkaar geplakt. Ten
slotte gaan ze opzoek naar genen in de DNA sequentie en trachten ze de functie van
de genen te achterhalen. Dit kan door het vergelijken van de DNA-sequentie met
reeds beschreven genen van andere organismen.
(dia 21) RNA en proteïnen zijn bronnen van extra complexiteit
- INTERACTIE:
Moleculen interageren met elkaar en heb invloed op elkaar.
- VARIATIE:
Er zijn een groot aantal genen, maar er is nog meer variatie in RNA en
eiwitten
- SPATIOTEMPORALE DYNAMIEK:
Hoeveelheid van elke molecuul varieert in tijd en ruimte.
(dia 23) Goldsteins definitie over ‘emergence’: Het ontstaan van nieuwe en
samenhangende structuren, patronen en eigenschappen tijdens het proces van
zelforganisatie in complexe systemen.
(dia 24) Systeembiologie is een iteratief proces.
DOEL VAN BIO-INFORMATICA
Alle gegevens die gegenereerd worden begrijpen in verschillende
biowetenschappelijke gebieden, met een ongekende snelheid.
(dia 26) Bio-informatica = Het onderzoeken, ontwikkelen of toepassen van
computationele instrumenten en benaderingen voor het uitbreiden van het gebruik
van biologische, medische, gedrags- of gezondheid data, waaronder deze die men
moet verwerven, opslaan, ordenen, archiveren, analyseren of visualiseren van deze
data.
Computationele biologie = De ontwikkeling en toepassing van data-analytische en
theoretische methoden, wiskundige modulering en computationele simulatie
technieken voor de studie van biologische, gedrags- en sociale systemen.
(dia 27) bioinformatica versus data mining:
- Bio informatica: vraag gestuurd – verwerken en analyseren van moleculair
biologische data
- Datamining: data gestuurd – patroon extractie en kennisopsporing in grote
datasets.
2
,(dia 29-37) Relevante trends in de groei van bio-informatica:
- High-througput revolution
> Stijging van de hoeveelheid van een product of dienst die een bedrijf binnen
een bepaalde periode kan produceren en aan een klant leveren.
- Central dogma outdated
> Het centrale dogma “DNA maakt RNA en RNA maakt proteïne” is een zeer
beperkte weergave geworden van een biologische realiteit die in feite veel
complexer is. (Vb. splitsingsvariatie, posttranslationele eiwitmodificatie …)
- Genome and society
> Met de betaalbaarheid van DNA-analyses zijn nieuwe toepassingen
economisch levensvatbaar geworden.
- The big data wave
> Toegenomen digitalisering van de samenleving heeft bij vele geleid tot een
lawine aan gegevens.
- The AI revolution
> Nieuwe golf van ontwikkeling.
3
, 3. Computer wetenschap achtergrond
4. Basis
(dia 3) De opslag en organisatie van gegevens of informatie is de hoeksteen van
vele wetenschappelijke disciplines en is een essentieel streven geweest in
wetenschap voor zeer lange tijd.
(dia 4) Relationele database = een database opgebouwd volgens een relationeel
model. De gegevens worden opgeslagen in tabellen waarin de rijen (horizontaal) de
soortgelijke groepen informatie, de records vormen, en de kolommen (verticaal) de
informatie die voor elk record moet worden opgeslagen. Verschillende tabellen
kunnen met elkaar worden verbonden door een kolom toe te voegen waarin een
verwijzing naar een record in een andere tabel wordt opgenomen.
4.2 Algoritmes
(dia 7) Een algoritme = een proces of een reeks regels die bij berekeningen moet
worden gevolgd of andere probleemoplossende operaties, vooral door een computer.
(een stappenplan om een gegeven probleem om te lossen/ ~recept)
(dia 9) Traditionele algoritmen: procedures geprogrammeerd door een software
engineer. (Vs. artificial intellegence).
LET OP! Veel algoritmen hebben bepaalde aannames met betrekking tot de
invoergegevens. Als dergelijke aannames ongeldig zijn, worde de resultaten in twijfel
gesteld.
(dia 12) een DNA translatie algoritme.
4.3 Principes of classificatie
Veel problemen in bio-informatica zijn “classificatie problemen”.
(dia 17) Classificatie problemen: probleem van identificeren tot welke set (kat of
hond) van categorieën een nieuw gegeven hoort (kat).
> Algoritmes moeten iets een label toedienen. Dit label is juist of fout. Een goed
algoritme dient veelal correcte labels toe. Kort, de invoer is een object met bepaalde
eigenschappen. De output van de algoritme is een klassenlabel, dat (hopelijk) correct
is.
De kwaliteit kan beoordeeld worden door te kijken naar hoeveel labels correct zijn
toegewezen met behulp van een confusion matrix.
Type I fout (vals-positief), een negatief geval
wordt gelabeld als positief. Type II fout (vals-
negatief) een positief geval wordt gelabeld
als negatief.
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller mvdv3. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.17. You're not tied to anything after your purchase.