The usual: deze samenvatting komt niet in de plaats van het maken van huiswerk, maar
is bedoeld om op een efficiënte wijze te kijken of je alles voldoende hebt begrepen. Heb
je morgen je PTA en dit is voor het eerst dat je het boek openslaat (of nog erger: alleen
deze samenvatting leest): ga lekker PS5’en want je bent echt te laat.
STANDAARDDEVIATIE EN GEMIDDELDE
De standaarddeviatie (ook wel: standaardafwijking) is een spreidingsmaat die je inzicht geeft
in hoeverre de waarnemingen verspreid zijn. Heb je een relatieve hoge standaarddeviatie dan
weet je dat de waarnemingen “all over the place” zijn. Stel bijvoorbeeld dat het gemiddelde
cijfer voor een proefwerk een 7,2 is en de standaarddeviatie is 0,6. Dit betekent (grofweg!!) dat
de cijfers gemiddeld genomen maar 0,6 van die 7,2 af lagen. Hieruit kun je dus concluderen
dat de individuele leerlingen vrijwel allemaal zo rond de 7 hebben gescoord. Stel nu dat bij een
ander proefwerk ook het gemiddelde een 7,2 is, maar de standaarddeviatie is 2,7: dan kun je
eigenlijk geen uitspraak doen over de individuele leerlingen. De afwijking is zo groot
(kennelijk zijn er veel hoge en veel lage cijfers gehaald; die zorgen wel voor hetzelfde
gemiddelde, maar de onderlinge spreiding is veel hoger).
Je moet weten hoe je op je GR de standaarddeviatie 𝜎 en gemiddelde 𝑥̅ van een reeks
waarnemingen moet berekenen. LET OP: soms moet je wel lijst L2 gebruiken (als er
frequenties genoemd worden, en soms niet). Let daarop bij het invoeren op je GR. Kijk ook
eens goed naar het verschil tussen opgave 2 en 3 van de voorkennis.
POPULATIEPROPORTIE EN STEEKPROEFPROPORTIE
Een populatieproportie 𝑝 is het deel van de populatie dat voldoet aan een zeker kenmerk,
uitgedrukt als percentage of fractie. Omdat een populatieproportie vaak niet bekend is,
gebruiken we in de statistiek de steekproefproportie 𝑝̂ om de populatieproportie te benaderen.
!!"#!$ &$&'&"#&" '&# (&)!!$* +&"'&,+ -" .#&&+),/&0
𝑝̂ = #/#!!$ !!"#!$ &$&'&"#&" -" .#&&+),/&0
Klinkt heel technisch, daarom even een voorbeeld:
Je wilt onderzoeken hoeveel Nederlanders er gamen. Nou de hele populatie is 17 miljoen
Nederlanders. Dus als je 𝑝 wilt berekenen zul je dus 17 miljoen enquêtes moeten houden. Je
kunt echter ook een steekproef nemen. Als deze groot genoeg is, geeft deze je een goed beeld
van het aantal gamende Nederlanders. Stel je houdt een enquête onder 1000 Nederlanders en
daaruit blijkt dat 435 mensen gamen. Hieruit volgt dan dat de steekproefproportie:
435
𝑝̂ = = 0,435
1000
En stel dat we een steekproef van 1000 representatief vinden, dan zeggen we vaak dat in dit
geval 𝑝̂ = 𝑝 (eigenlijk zeggen we: 𝑝̂ is een hele goede schatter van 𝑝). We werken in de
1
, HAVO 4 WISKUNDE A: THE FINAL CHAPTER BLOK 4
statistiek dus vrijwel altijd met 𝑝̂ . LET OP: als de populatie natuurlijk redelijk klein is, dan
kun je heel makkelijk de “echte” 𝑝 berekenen. Stel we willen weten hoeveel linkshandigen er
in HAVO 4 van het PNC zitten: dat kun je natuurlijk gewoon tellen (en daar heb je dus geen
steekproef voor nodig).
SOORTEN VERDELINGEN
Als je iets onderzocht hebt en dus een aantal waarnemingen hebt gedaan kun je deze in een
histogram weergeven. Als je voldoende waarnemingen hebt gedaan begint het histogram op
een grafiek te lijken. Zo’n grafiek noemen we een verdelingskromme. Zo zal een
verdelingskromme van de inkomensverdeling in Amerika er heel anders uitzien dan de
verdelingskromme van het gewicht van pasgeboren baby’s (we zullen zo zien dat de
eerstgenoemde een rechts-scheve verdeling heeft en de ander een normale verdeling).
Wat algemeen geldt voor de mediaan en de
verdelingskromme is het volgende: de mediaan is op dat
punt waarbij de oppervlakte links van de
verdelingskromme even groot is als rechts (dus de
oppervlakte wordt gelijk verdeeld). Zie bijvoorbeeld
hiernaast (van een rechts-scheve verdeling).
We hebben de volgende verdelingen behandeld:
1. symmetrische verdeling
2. links-scheve verdeling
3. rechts-scheve verdeling
4. tweetoppige verdeling
5. uniforme verdeling
Per verdeling is het volgende van belang:
Symmetrische verdeling
Bij een symmetrische verdeling liggen de modus, mediaan en
het gemiddelde allemaal in het midden. De normale verdeling
is de bekendste symmetrische verdeling (maar er zijn er
meer!!). Zie voor de normale verdeling de volgende paragraaf
in deze samenvatting. Voorbeelden van symmetrische
verdelingen: gewicht van zoogdieren, lengtes van mannen,
intelligentie van 16-jarigen etc etc.
Bij een symmetrische verdeling zal de boxplot ook symmetrisch zijn. De mediaan ligt netjes in
het midden en de afstand tussen Q1 en Q2 is gelijk aan de afstand tussen Q2 en Q3.
LET OP: de box kan heel breed zijn of heel smal, zolang de
mediaan maar in het midden ligt en de afstand tussen Q1 en Q2
gelijk is aan de afstand tussen Q2 en Q3
2
, HAVO 4 WISKUNDE A: THE FINAL CHAPTER BLOK 4
Van de afgebeelde verdelingskromme kun je ook een (relatieve) cumulatieve
verdelingskromme schetsen. Even het verschil: een Cumulatieve verdelingskromme
verdelingskromme vertelt je eigenlijk hoe hetgeen je onderzocht
hebt (bijvoorbeeld het gewicht van olifanten) verdeeld is over
alle onderzochte “objecten” (de olifanten dus). Een (relatieve)
cumulatieve verdelingskromme vertelt je: “Hoeveel olifanten
zijn er tot en met een gewicht van XXX kilo”. Het spreekt
(hopelijk) voor zich dat een cumulatieve verdelingskromme
altijd stijgt.
Onthoud bij het tekenen van (relatieve) cumulatieve
verdelingskromme het volgende:
• Bij een top in de verdelingskromme, loopt de cumulatieve verdelingskromme het
steilst.
• De cumulatieve verdelingskromme vertelt je hoe de oppervlakte onder de
verdelingskromme zich “ontwikkelt” van begin tot eind.
• Als je een relatieve cumulatieve verdelingskromme tekent (dus in procenten) zit bij
50% de mediaan (nogal logisch).
Links-scheve verdeling
Bij een links-scheve verdeling (de “staart” zit aan de
linkerkant) liggen het gemiddelde en de mediaan bijna altijd
links van de top (en de top is natuurlijk de modus). De staart
zorgt ervoor dat het gemiddelde naar links getrokken wordt (en
dus lager). De staart zorgt ook voor een relatief hoge
standaardafwijking.
Een voorbeeld van een links-scheve verdeling is de leeftijd
waarop mensen met pensioen gaan.
Bij een boxplot kun je zien aan de positie van de
mediaan of er sprake is van een links-scheve
verdeling: de mediaan zit dan aan de rechterkant
van de “box”.
Cumulatieve verdelingskromme
De cumulatieve verdelingskromme begint heel “traag” (immers
weinig oppervlakte onder de verdelingskromme bij de staart) en
stijgt dan rap (het steilst op de top) en maakt dan een knik.
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller teubentess. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $6.84. You're not tied to anything after your purchase.