Uitwerkingen van de extra informatie die wordt gegeven in Grasple door de Universiteit Utrecht. Deze uitwerkingen vallen onder het correlationele deel van Basis van Onderzoeksmethoden en Statistiek
Het centrum van je data is het punt waar het grootste deel van je data geconcentreerd is.
Manieren om dat punt te bepalen worden centrummaten genoemd. Soorten centrummaten:
o Het gemiddelde
Alles bij elkaar optellen en dan delen door het aantal dat bij elkaar op is geteld.
o De mediaan
De mediaan is de middelste waarde. Je vindt de mediaan in vier stappen:
- Zet alle waardes op volgorde van klein naar groot;
- Tel hoeveel waardes er totaal zijn;
- Bepaal waar de middelste waarde zou zitten (dit kan je uitrekenen door het aantal
waardes door 2 te delen en naar boven af te ronden).
- Tel vanaf het begin tot aan het getal uit stap 3 om zo de middelste waarde te vinden.
De mediaan is dus altijd de middelste waarde. Bij een oneven aantal waarden is dat de waarde
in het midden. Bij een even aantal waarden is de middelste waarde het gemiddelde van de
middelste twee waarden.
o De modus
De modus is de meest voorkomende waarde in een variabele. Hiervoor tel je eerst hoe vaak
elke waarde voorkomt en kies je degene die het vaakst voorkomt.
Samenvatting
- De mediaan is de middelste waarde
- De mediaan is handig omdat deze minder wordt beïnvloed door uitschieters (Bijv. de
oma van 105 jaar).
- Je vindt de mediaan door de data in de juiste volgorde te zetten en daarvan de
middelste waarde te pakken.
- Bij een even aantal waardes is de mediaan het gemiddelde van de middelste twee
waarden.
C2 – Spreiding; bereik
Tot nu toe hebben we steeds gekeken naar het centrum van de data: om welk punt het grootste
deel van de data geconcentreerd is. Nu wordt er gekeken naar een nieuw concept: variatie of
spreiding. Variatie/spreiding geeft aan hoeveel de data van elkaar verschillen.
Het is vaak niet heel makkelijk om in één oogopslag de variatie te bepalen. Wat als je 10000
getallen hebt? Dat is niet te doen. Daarom is het handig om een manier te hebben om variatie
te berekenen: de maat die aangeeft hoeveel de getallen van elkaar verschillen. Dit worden
spreidingsmaten genoemd.
De eerste maat van spreiding is het verschil tussen de hoogste waarde en de laagste waarde.
Dat noemen we het bereik.
Samenvatting
- Variatie of spreiding is de mate waarin waardes van elkaar verschillen
, - Er zijn meerdere spreidingsmaten, ‘bereik’ is daar een van
- Bereik is de afstand van de grootste tot de kleinste waarde
C3 – Spreiding; kwartielen
Je weet wat variatie (of spreiding) is: de mate waarin waardes van elkaar verschillen. Je weet
ook al dat er verschillende spreidingsmaten zijn om dit te meten en je weet dat het bereik er
een van is.
Een andere manier om de mate van spreiding in een
dataset te meten zijn: kwartielen. Bij kwartielen
verdeel je de data onder in verschillende gelijke
stukken. De getallen waarmee je de data in gelijke
stukken verdeelt, noemen we de kwartielen.
Hoe vinden we de kwartielen?
1) Zet alle getallen op volgorde;
2) Vind de mediaan (ook wel het tweede
kwartiel of Q2 genoemd)
3) Vind nu de mediaan van de eerste helft (de helft met de laagste waarden) dit noemen
we het eerste kwartiel of Q1.
4) Vind nu de mediaan van de tweede helft (de helft met de hoogste waarden). Dit
noemen we het derde kwartiel of Q3.
LET OP: het vinden van de kwartielen hangt weer van het aantal waarden in de dataset af. Dit
gaat een beetje anders voor even of oneven getallen.
, Tot slot: omdat erin redelijk veel datasets uitschieters zitten die het bereik sterk beïnvloeden,
is het bereik niet de beste maat voor spreiding. Een alternatief is om het bereik van de
middelste 50% van de data te meten. De middelste 50% van de data bevindt zich tussen Q1 en
Q3. Het bereik daarvan is de afstand tussen Q1 en Q3. Dit wordt de interkwartielafstand (Inter
Quartile Range; IQR) genoemd. Dus IQR = Q3-Q1.
Samenvatting
- Om beter inzicht te krijgen in je data kun je die opsplitsen in kleinere delen
- Kwartielen zijn de nummers die een dataset opsplitsen in vier gelijke delen. Elk deel
bevat dan 25% van de data.
- Je kunt de kwartielen vinden door je data in twee delen te splitsen met een mediaan.
En van beide delen dan weer een mediaan te zoeken.
C4 – Spreiding; standaarddeviatie
De meest gebruikte spreidingsmaat is de standaarddeviatie, ook wel standaardafwijking
genoemd. De standaarddeviatie kan je zien als: de gemiddelde afstand tot het gemiddelde.
Maar wat betekent dit?
Stel de gemiddelde leeftijd is 31. De gemiddelde afstand tot het gemiddelde betekent dan het
volgende: (bijna) iedereen heeft een leeftijd die anders is dan het gemiddelde. Voor elk
persoon kan je uitrekenen hoe groot dit verschil is: de afstand tot het gemiddelde.
Vervolgens kan je het gemiddelde berekenen van al deze afstanden en heb je de
standaarddeviatie. De reden hiervoor is dat de variatie en standaarddeviatie twee verschillende
functies hebben:
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller VerenaIsmay. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.23. You're not tied to anything after your purchase.