DWO opgaven kansberekening
1a. er zijn vier mogelijke nucleotide dus de kans dat op een van de vier
1
nucleotiden is =0,25 .
4
1b. op elke positie is de kans 0,25 op een bepaald nucleotide en als je
een specifieke sequentie wil, zal je daarvoor de kansen met elkaar
moeten vermenigvuldigen:
0,25∗0,25∗0,25∗0,25∗0,25∗0,25=0,256 , maar aangezien een
DNA streng dubbelstrengs is, kan je deze sequentie op beide strengen
tegenkomen en daarom vermenigvuldig je 0,256 met 2.
1c. nu hebben we te maken met een gen van 5000 basenparen en moet
er dus een specifieke sequentie van 5000 nucleotiden aangetroffen
worden. Dan is de kans dus 0,255000 om het gen aan te treffen.
Meestal kijken we bij genen, maar naar één van de DNA strengen en
daarom wordt er hier niet met 2 vermenigvuldigd. In de meeste gevallen
staat dit duidelijker vermeld bij de vraag.
2a. hier ga je ook weer uit van een kans van 0,25 en dan geldt
0,25∗800=200 .
2b. op elke positie heb je een kans van 0,256 dat je de 6-mer
tegenkomt, maar vanaf positie 4996 kom je alleen nog maar sequenties
tegen die minder dan 6 nucleotiden bevatten. Vandaar dat hier
6
4995∗0,25 geldt. Die 4995 is afkomstig van de regel:
totaal aantal nucleotiden−k mer+1 .
2c. dit is eigenlijk dezelfde vraag als 2b, maar dan met grotere getallen. Je
kan het gen namelijk 1015 keer aantreffen. Ze hebben hier de regel van
totaal aantal nucleotiden−k mer+1 niet toegepast, omdat het
maar een heel klein effect heeft. Het zou echter niet fout gerekend
worden als je die regel hier wel toepast.
3a. hier vragen ze dus eigenlijk wat de kans is dat je AAGTGA niet
tegenkomt. De kans dat iets gebeurd kan maximaal 100% zijn en als je
dus de kans berekent dat iets niet gebeurt, zal je
100 −de kans dat het wel gebeurd moeten berekenen. Dat levert
dus 1−0,256 .
3b. hier moet je de kans berekenen dat je de k-mer op elke positie niet
vindt. De kans dat je hem op een plek niet vindt, hebben we bij 3a
berekent. De kans dat je hem op de volgende plek niet vindt is ook weer
1−0,25
6
1−0,25 etc. Dat levert (¿¿ 6)4995 op.
¿
3c. hier moet je op minimaal 1 plek in een gen van 5000 basenparen de
sequentie AAGTGA tegenkomen. Dit is dus eigenlijk
1−de kans dat je hemop elke plek niet vindt . Als je deze vraag in 1
keer zou krijgen, moet je hem dus opsplitsen in de volgende vragen:
- Wat is de kans dat je AAGTGA wel vindt? 0,256
- Wat is de kans dat je AAGTGA niet vindt? 1−0,256
1−0,25
- Wat is de kans dat je AAGTGA niet vindt in een gen van 5000 basenparen? (¿¿ 6)
4995
¿