Kansrekening en Statistiek
Gegevens kunnen gemeten worden op verschillende types schalen: welke ? Indien je een dataset
opmeet met de persoonlijke gegevens van de inwoners van Brussel, heb je data zoals: naam,
geboortejaar, gewicht, lengte, geslacht, … Geef de schaal van deze gegevens.
- De nominale schaal: elk individu heeft een naam, er is geen overlap in deze namen. Bv.
Zwart of wit. Deze schaal is voor kwalitatieve gegevens.
- Ordinale schaal: er is een rankschikking, ordening. In deze rankschikking is er geen afstand
tussen de gegevens. Bv. Er is de afstand tussen zeer slecht en slecht is niet dezelfde als die
van goed en zeer goed. Deze schaal is voor kwalitatieve gegevens.
- Intervalschaal: bestaat uit numerieke gegevens, heeft een ordinaal + afstand. Bv. Het verschil
tussen 0°C en 10°C is dezelfde als het verschil tussen 10°C en 20°C. Deze schaal is voor
kwantitatieve gegevens.
- Verhoudingsschaal is een intervalschaal + nulpunt. Daarbij speelt de eenheid een belangrijke
rol. De °C en K gaat niet, want het nulpunt is verschillend. Bv. Omzetten van mm naar cm kan
gedaan worden door het vermenigvuldigen van een constante. Deze schaal is voor
kwantitatieve gegevens.
Naam Nominale schaal
Geboortejaar Intervalschaal of verhoudingsschaal
Gewicht Verhoudingsschaal
Lengte Verhoudingsschaal
Geslacht Nominale schaal
Welke kengetallen ken je om de spreiding van de gegevens in een steekproef weer te geven.
Definieer ze. Hoe maak je een boxplot?
Dit zijn de spreidingsmaten, ze geven een idee hoe gespreid de data is.
o Het bereik = range R = hoogste – laagste waarde = xn – x1.
2
∑(𝑥𝑖 −𝑥̅ )2 ∑ 𝑓𝑖𝑥𝑚𝑖 −𝑛𝑥̅ 2
o Variantie: 𝑠𝑛2 = en voor klassen: 𝑠𝑛2 = met 𝑓𝑖 de frequentie van de klasse
𝑛−1 𝑛−1
en 𝑥𝑚𝑖 het klassen midden.
o Standaardafwijking: 𝑠 = √𝑠𝑛2 , is de vierkantswortel van de variantie.
1
o Gemiddelde absolute afwijking: MeanAD = ∑𝑛𝑖=1|𝑥𝑖 − 𝑚𝑒𝑑 | 𝑛
o Mediaan absolute afwijking: 𝑀𝐴𝐷 = 𝑚𝑒𝑑𝑖𝑎𝑎𝑛 {|𝑥𝑖 − 𝑚𝑒𝑑 |}𝑛𝑖=1 → Mediaan van de
verzameling van elke 𝑥𝑖 waarde waarvan de mediaan is afgetrokken.
o Chebyshev’s theorema (Empirische regel): fractie van data dichter dan k keer de
1 2
standaardafwijking ≥ 1 − (𝑘)
Boxplot is het samenvatten van data door gebruik te maken van 5 getallen. Deze wordt vooral
gebruikt voor grote data ’s.
De verbinding tussen de box en het minimum en het maximum heet
de whiskers. Uitschieters worden er niet mee verbonden indien ze
aan volgende voorwaarde voldoen:
< 𝑄1 − 1,5 ∗ 𝐼𝑄𝑅
> 𝑄2 − 1,5 ∗ 𝐼𝑄𝑅
Pagina 1 van 20
,Welke kengetallen ken je om de centrale tendens van de gegevens in een steekproef weer te
geven. Definieer ze.
Kengetallen voor de centrale tendens worden ook de centrummaten genoemd. Dit geeft een idee
waar de date ligt.
1 1
o Gemiddelde: 𝑥̅ = 𝑛 ∑𝑛𝑖=1 𝑥𝑖 en voor klassen: 𝑥̅ = 𝑛 ∑𝑘𝑖=1 𝑓𝑖 𝑥𝑚𝑖 met 𝑓𝑖 de frequentie van de
klasse en 𝑥𝑚𝑖 het klassen midden.
o Mediaan = middelste meting bij het ordenen van de date van klein naar groot. 𝑚𝑒𝑑 =
𝑥𝑛+1
𝑣𝑜𝑜𝑟 𝑛 𝑜𝑛𝑒𝑣𝑒𝑛
2
{ 1 𝑥𝑛+2 𝑣𝑜𝑜𝑟 𝑛 𝑒𝑣𝑒𝑛
2
(𝑥𝑛 +
2
)
2
o Modus = meting met de hoogste frequentie. Dit kunnen ook meerdere metingen zijn = modi.
𝑥1 + 𝑥𝑛
o Midrange = gemiddelde tussen de hoogste en laagste waarde: 2
1
o Gewogen gemiddelde: 𝑥̅ = ∑𝑛 𝜔 𝑥𝑖 met 𝜔𝑖 het gewicht.
𝑛 𝑖=1 𝑖
Welke kengetallen ken je om de positie van een datapunt in een steekproef weer te geven.
Definieer ze.
𝑥𝑖 −𝑥̅
o De standaard score of Z-score. 𝑍 =
𝑠
o Percentielen, kwartielen en interkwartielen:
𝛼
𝛼% − 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑒𝑙 = 𝜉𝛼 = 100
∗ (𝑛 + 1) en 𝜉𝛼 = 𝑥𝑝 + 𝜌(𝑥𝑝+1 − 𝑥𝑝 ). Waarbij p het hele deel is en
ρ het overschot is. Het interkwartiel is de afstand tussen de derde en het eerste kwartiel.
Indien je over een steekproef beschikt, wat is dan de relatieve en de cumulatieve frequentie ? Hoe
kun je ze grafisch voorstellen (eventueel op meerdere manieren) ? Wat is een empirische
verdelingsfunctie?
De relatieve frequentie is de frequentie uitgedrukt in percentages. Hierbij is de verticale as van het
histogram de dichtheidsschaal, uitgedrukt in percentages. En de horizontale as is verdeeld in de
verschillende klassen.
De cumulatieve frequentie wordt uitgedrukt in percentages, maar stelt niet het percentage van een
bepaalde klasse voor. Dit gebeurt door de vorige percentages van de klassen altijd op te tellen.
Deze kunnen grafisch voorgesteld worden door:
o Histogram. Waarbij de date gegroepeerd is in klassen.
o Polygoon. Dit is door op het histogram halverwege elke klassenbreedte de punten met
elkaar te verbinden.
o Cumulatief frequentie histogram. De hoogtes van de klassen met elkaar op te tellen.
o Ogief. De rechterklassepunten van het cumulatieve histogram verbinden.
𝑎𝑎𝑛𝑡𝑎𝑙 𝑚𝑒𝑡𝑖𝑛𝑔𝑒𝑛 ≤ 𝑥
De empirische verdelingsfunctie: 𝑓𝑛 (𝑥) = 𝑛
Het is een trapfunctie, er zijn sprongen in de grafiek. De grafiek start altijd bij 0 en eindigt altijd bij 1.
Pagina 2 van 20
, Geef de definities van universum, gebeurtenis en het begrip kans. Wat is een voorwaardelijke
kans?
Universum Ω is de verzameling van alle mogelijke uitkomsten van een experiment. Een gebeurtenis is
een deelverzameling van het universum. Als deze deelverzameling maar een element bevat, dan is
het een elementaire gebeurtenis.
Mathematische betekenis van kans: een kans is een functie waarbij met elke gebeurtenis A van het
universum Ω een reëel getal P(A) geassocieerd wordt. Dit getal moet aan bepaalde voorwaarden
voldoen:
• 0 ≤ P(A) ≤ 1
• P(φ) = o en P(Ω) = 1
• Als A ∩ B = φ dan is P (A ∪ B) = P(A) + P(B)
De voorwaardelijke kans op het optreden van gebeurtenis V als gebeurtenis B heeft plaatsgevonden
en P(B) ≠ 0.
𝑃(𝑉 ∩ 𝐵)
𝑃 (𝑉|𝐵 ) =
𝑃(𝐵)
Formuleer de wet van de totale kans en de regel van Bayes. Illustreer beiden met de hulp van een
figuur. Bewijs de regel van Bayes.
De wet van de totale kans: Zij E1, E2, …, En een partitie van het
universum Ω, dan geldt voor A een willekeurige gebeurtenis:
𝑛
De wet van de totale kans: Zij E1, E2, …, En een partitie van het universum Ω,
dan geldt voor A een willekeurige gebeurtenis met P(A) > 0:
𝑃(𝐴|𝐸𝑘 )𝑃(𝐸𝐾 )
𝑃 (𝐸𝑘 |𝐴) = 𝑛
∑𝑖=1 𝑃 (𝐴|𝐸𝑖 )𝑃(𝐸𝑖 )
Om de regel van Bayes te bewijzen, moet eerst eens de productregel
uitgevoerd worden en nadien de wet der totale kans.
𝑃(𝐸𝑘 ∩ 𝐴) 𝑃(𝐴|𝐸𝑘 )𝑃(𝐸𝐾 )
𝑃(𝐸𝑘 |𝐴) = = 𝑛
𝑃(𝐴) ∑𝑖=1 𝑃 (𝐴|𝐸𝑖 )𝑃(𝐸𝑖 )
Pagina 3 van 20
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper catherinevanbel. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €10,89. Je zit daarna nergens aan vast.