Lecture 1
Bij het meermaals uitvoeren van een experiment zal de observatie nooit hetzelfde zijn; er
zijn verschillende uitkomsten (🎲 : 1-6) en events (🎲 : even, oneven, 4 of hoger) mogelijk. Na
elke meting kan een waarde verschillen, doordat een gedeelte niet deterministisch is. In
een stochastisch model (kansmodel) wordt daarom een extra variabele toegevoegd (N), die
bij elke meting anders kan zijn. Een stochastisch model houdt ermee rekening dat N random
en onvoorspelbaar is. Maar N is wel zodanig dat alle mogelijke uitkomsten zijn te vatten
in één sample space S (🎲 : S = {1,2,3,4,5,6}).
Men gaat er vaak vanuit dat het experiment oneindig vaak herhaald kan worden. De kans
dat één uitkomst zich voordoet wordt dan als volgt bepaald:
Eigenschappen van een kans P:
• een kans is nooit negatief →
• de kans op alle mogelijkheden samen is 1 →
• kansen die niet tegelijkertijd kunnen voorkomen
(‘mutually exclusive’) mag je optellen →
Conditionele kansen en onafhankelijkheid
Een a priori kans P(A) is vaak minder bruikbaar dan een conditionele
kans P(A|B), de kans op A gegeven B.
De theorie van Bayes stelt hoe je P(A|B) omrekent naar P(B|A):
Hieruit volgt ook: als P(A|B) = P(A), dan P(B|A) = P(B). A en B zijn dan onafhankelijk (let
op: niet hetzelfde als mutually exclusive). Er geldt
Stochastische variabelen
X(s) wordt een stochastische variabele genoemd, die afhankelijk van de uitkomst s een
getal x oplevert dat tussen twee getallen a en b ligt:
De uitkomst is dus een getal: X = x. In een
a 4 discrete getallenwereld kan men een probability
u 4 4
4 4
y y mass function (PMF) gebruiken. Deze kansfunctie
4 legt de kansen vast die de verdeling bepaalt van
44 44 4
4 4 de discrete stochastische variabele X(s).
o
4 41 4 4 4 44
1 4 (🎲 : kansverdeling van het totaal aantal ogen bij
2 s a o o o o o o n n het werpen van twee dobbelstenen)
, In een continue (non-discrete) wereld werkt een PMF
niet, omdat P[X=x] = 0. De cumulatieve distributiefunctie
(CDF) kijkt naar de (cumulatieve) kans op waarden van
X kleiner dan of gelijk aan x. Deze verdelingsfunctie
is monotoon stijgend met bereik [0,1]. Bij een oneindig
grote x is de waarde van P[X ≤ x] immers 1. x
De afgeleide van de CDF laat zien waar de grootste
kansdichtheid zit. Zo komen we aan de probability
density function (PDF). Deze geeft niet een kans aan,
maar een kansverdeling/waarschijnlijkheidsdichtheid. Door
dit over een bepaald interval te integreren, krijg je de
kans. x
Een aantal vaak gebruikte kansfuncties:
discreet p
continu
• Bernoulli (binair) • Uniform
1p
• Gaussisch
Verwachtingswaarde en variantie
De PMF en CDF beschrijven het gedrag van de stochastische variabele. Zonder de functie
te weten, kun je met een aantal eigenschappen ervan ook al veel te weten komen.
• De expected value of verwachtingswaarde E[…] is een soort
gewogen gemiddelde. Hierbij mag je willekeurige functie van
X gebruiken (dus X, X², etc), omdat E een lineaire
operator is. Merk op dat de berekening van E verschilt
voor discrete (sommatie) en continue (integraal) variabelen.
• De variantie var[…] is de spreiding van X rond de ver-
wachtingswaarde. Dit is vergelijkbaar met, maar niet gelijk
aan de standaarddeviatie (σ), namelijk: σ = √var[X].
- de variantie schaalt kwadratisch volgens