STATISTIEK: VAN LOT NAAR KANS
HOOFDSTUK 8: MAYBE YES, MAYBE NO
In dit hoofdstuk leer je…
Wat een kans is…
Wat het verschil is tussen een stochastische en een deterministisch proces
Wat de basisbegrippen zijn van de verzamelingenleer (unie, doorsnede, verschil, partitie, machtsverzameling, …)
Wat de verschillende kansdefinities zijn
Wat de drie axioma’s zijn van een theoretische kans
Wat het verschil is tussen afhankelijke en onafhankelijke kansgebeurens
Wat disjuncte/mutueel exclusieve kansgebeurens zijn
Wat een voorwaardelijke (a posteriori) kans is
Wat de verschillende axiomatische kansregels zijn (complementregel, somregels, productregels, regel van de voorwaardelijke kans, regel
van de totale kans, regel van Bayes)
Hoe je die axiomatische kansregels kan inzetten bij de oplossing van een concreet kansprobleem
Om de onderscheiden kansen te identificeren in een kruistabel met absolute frequenties
Om (voorwaardelijke) kansen af te leiden uit een dendrogram ( niet in de samenvatting maar kijk de studentencursus, heel duidelijk
voorbeeld)
Om de onderscheiden kansen te herkennen in verbale uitdrukkingen
INLEIDING
In semester 1 vertrokken we van empirische waarnemingen, nu vertrekken we van theoretische
kansen!
Kansrekening beperkt zich nu niet meer enkel tot de kansspelen
LOT is geëvolueerd/vervangen in KANS
De mens wil in toenemende mate onzekerheid vatten en inzichten verkrijgen in de kansen op bepaalde
gebeurtenissen
verzekeringsmaatschappijen, beleidsmakers,…
DE TAAL VAN DE KENNIS
Sociale werkelijkheid proberen te beheersen door ze in kansmodellen te gieten, we willen het proces
dat aanleiding geeft tot de veranderlijke uitkomsten begrijpen zodat we uitspraken kunnen doen over
de werkelijkheid los van een specifieke waarnemingsbasis
Deterministisch proces = proces waarbij men op voorhand al weet wat er gaat gebeuren
uitkomsten zijn zeker
Stochastisch proces = toevalsproces, het resulteert in bepaalde uitkomsten waaraan
telkens een bepaalde waarschijnlijkheid is gekoppeld
uitkomsten zijn onzeker
( synoniem = kans experiment)
Toevalsgebeuren = x
xi met i als representatie van een natuurlijk getal (0,1,2,3,…)
1. Elementaire toevalsgebeuren = als men slechts 1 uitkomst kan uitkomen
a. Vb; A = {1}
2. Samengestelde gebeurtenis = als men meerdere uitkomsten kan uitkomen
a. Vb: B = {2, 4, 6}
1
,Uitkomstruimte = S (Sample Space), alle mogelijke uitkomsten die in aanmerking komen
voor een steekproef uit deze verzameling
vb. S={1, 2, 3, 4, 5, 6} of S={k, m}
Verzameling = duidelijk afgebakend geheel van objecten, waarbij de objecten aan bepaalde
voorwaarden moeten voldoen om tot die verzameling te behoren. Men noemt deze objecten
de elementen van de verzameling
Doorsnede = van 2 verzamelingen A en B is de verzameling die uit alle elementen die zowel
in A en B zitten
EN
A∩ B (`A doorsnede B’)
Vb: A = {1, 2} B = {oneven} A ∩B = {1}
Unie = van 2 verzamelingen A en B is de verzameling die bestaat uit alle elementen die
ofwel in A, ofwel in B, ofwel in beide verzamelingen zitten
OF
A ∪ B (`A unie B’)
Vb: A = {1, 2} B = {oneven} A ∪ B = {1, 2, 3, 5}
Disjuncte gebeurtenissen = gebeurtenissen die geen gemeenschappelijke uitkomsten
bevatten
A∩ B = ∅
Vb: A = {1} B = {2, 4, 6}
Complement = een verzameling die het tegenovergestelde representeert dan wat er
effectief in zit
Complement van A Ac of
A= S \ A
Vb: A = {1} A = {2, 3, 4, 5, 6}
2
, Een partitie/ volledig stelsel = het geheel van dat experiment
exhaustief
twee aan twee disjunct (doorsnedes zijn leeg)
Voorbeeld:
G1 ={1}, G2 ={2,4,6} en G3 ={3,5} vormen een partitie/volledig stelsel
- exhaustief (G1 ∪ G2 ∪ G3 = {1,2,3,4,5,6} = S)
- twee aan twee disjunct (doorsnedes zijn leeg)
Machtsverzameling = een grote verzameling waarbij haar elementen opnieuw ook
verzamelingen hebben
M(S)
Als #S = n #M(S) = 2n
Vb. M(S)={Ø,{1},{2},{3},{4},{5},{6},{1,2},{1,3},… {1,2,3},{1,2,4},…,{1,2,3,4,5,6}}
Kans P(G) drukt uit hoe waarschijnlijk of onwaarschijnlijk de gebeurtenis G is
Vb. P({2 gooien met eerlijke dobbelsteen}) = 1/6
P = functie die met elke G uit M(S) een reel getal P(G) tussen 0 en 1 associeert
DE KANSDEFINITIE
Kans geven we weer met P Engels Probability
vb; de kans P is een functie die elk toevalsgebeuren A met een welbepaald getal P(A) verbindt. Waarbij
P(A) een kwantitatieve weergave is van de mogelijkheid dat het gebeuren A plaatsvindt
Subjectieve kansdefinitie (Gokkans) bouwt voort op een intuïtieve inschatting, staat
dicht bij de logica van het LOT
Vaak gebaseerd op ervaring, vaag
Vb. `kans om lotto te winnen is erg klein’
Empirische kansdefinitie ( Zweetkans) wanneer de ervaringsbasis enigszins
geformaliseerd is, relatieve frequentie in de long run
Vb. kans om 2 te gooien bij eerlijke dobbelsteen
dobbelsteen heel vaak opwerpen (n oneindig)
fi
geregeld berekenen (= benadering voor kans)
n
f
kijken waar de waarden i naartoe gaan als n toeneemt de `limietwaarde’ is de gezochte kans
n
f
P ( A ) =lim i
n→∞ n
met fi als de absolute frequentie, het aantal keer een waarde wordt waargenomen
Theoretische kansdefinitie = kansdefinitie van Laplace (weetkans)
het aantal gunstige uitkomsten (successen) delen door het totaal aantal mogelijke uitkomsten
3
,
veronderstelt echter wel dat elke uitkomst plausibel is
Zowel empirische als theoretische kansdefinities houden zich aan de 3 basisregels van de axioma’s:
1. Een kans is nooit negatief en nooit groter dan 1: 0 ≤ P(A) ≤ 1
a. Je kan m.a.w. niet -20% kans hebben dat het morgen gaat regenen. Je zal ook nooit 130% kans hebben dat je de lotto wint. De twee grenzen
kunnen wel. Je hebt bijvoorbeeld 0% kans dat je met één enkele dobbelsteen een 7 gaat rollen.
2. De kans op de volledige uitkomstenruimte S (ook wel kansuniversum genoemd) is 1, ofwel 100%: P(S) = 1.
a. In de praktijk betekent dit dat er geen andere uitkomsten mogelijk zijn dan die uit de uitkomst ruimte
b. S staat namelijk voor àlle mogelijke uitkomsten. Bij een dobbelsteen zagen we dat S={1,2,3,4,5,6}. Hier zou “P(S)” dan willen zeggen: “de kans
dat je met een dobbelsteen een 1,2,3,4,5 of 6 rolt.”… Die kans is uiteraard 100%, je zal ALTIJD één van die uitkomsten rollen, er zijn er gewoon
geen andere.
3. Stel dat A en B twee disjuncte toevalsgebeurens zijn uit eenzelfde uitkomstenruite dan is de kans dat de toevalsgebeuren
A of toevalsgebeuren B optreedt, gelijk aan de som van hun corresponderende elementaire kansen. ‘ éen of ander’ wordt
in de kansrekening gesymboliseerd door de unie (symbool S)
a. P (A ∪ B) = P(A) + P(B). Stel bijvoorbeeld dat A staat voor “een 4 rollen met een dobbelsteen” en B staat voor “een 3 rollen met een
dobbelsteen.” P (A ∪ B) lees je dan als: P= “de kans dat je…” (A ∪ B)= “…een 4 rolt OF een 3 rolt met een dobbelsteen”. De aparte kansen
hierop zijn 0,1667 voor een 4 en ook 0,1667 voor een 3. De kans dat je dan één van de twee rolt is 0,1667 + 0,1667 = 0,3334.
b. Ook vanuit de kansdefinitie van Laplace kunnen we dat afleiden. Aantal gunstige is namelijk 2 (4&3) en aantal mogelijke is nog altijd 6. Die
twee delen door elkaar geeft: 2/6 = 0,3333 (de afwijking komt door afrondingen).
c. Belangrijke opmerking hierbij is dat de twee toevalsgebeurens mekaar niet mogen overlappen op één of andere manier. Wiskundig gezien:
“de doorsnede moet leeg zijn” ofwel in symbolen: A ∩ B = ø, waarbij ∩ staat voor “doorsnede” en ø voor “leeg”. Wat we hiermee bedoelen
wordt verderop duidelijk, wanneer we uitleggen wat er gebeurt als dat niet zo is.
AXIOMATISCHE KANSREGELS
1. Complementregel
kijken niet meer naar de kans dat iets gebeurt, maar de kans dat iets NIET gebeurt
P(Ā) = 1 - P(A)
We kunnen dat op twee manieren noteren: P(Ac), waarbij die ‘c’ staat voor ‘complement’, of P(Ā). Je leest ze op dezelfde
manier.
vb; stel dat A nogmaals staat voor “een 4 rollen met een dobbelsteen”, dan willen P(Ac) of P(Ā) zeggen “de kans dat je GEEN 4
rolt” ofwel “de kans dat je iets anders dan 4 rolt”.
2. Somregel
indien A en B geen disjuncte toevalsgebeurens zijn
P (A ∪ B) = P(A) + P(B) - P(A ∩ B)
ofwel: de kans op A of B is gelijk aan de som van de aparte kansen min de kans op hun doorsnede
!Maar! wanneer de verzamelingen niet disjunct zijn (wel overlappingen), ligt het toch iets moeilijker.
Stel bijvoorbeeld dat we een onderzoek gedaan hebben waarbij we aan 100 mensen (40 mannen en 60 vrouwen) hun stemvoorkeur vroegen. We delen dat
vervolgens op in mannen en vrouwen en krijgen dan volgende tabel:
Stel dat je nu uit je stapel enquêteformulieren er willekeurig eentje uitpikt, wat is dan de
kans dat je het enquêteformulier hebt genomen van iemand die op OpenVLD gestemd
heeft?:
In deze tabel staan aantallen, volgens de kansdefinitie van Laplace weten we dat we daar
kansen van kunnen maken door het aantal gunstige te delen door het aantal mogelijke.
“aantal gunstige” wil bij deze vraag zeggen: “alle enquêteformulieren van mensen die op
OpenVLD gestemd hebben.”
4