Hoofdstuk 1
1. Tabellen
Systematiek aanbrengen in onderzoeksgegevens → gegevens tabelleren
Ook als de gegevens louter kwalitatief zijn is een tabel ook uitermate geschikt.
1.1 Frequentietabellen
Frequenties
Numerieke volgorde → van hoogste naar laagste
Het aantal keer dat een bepaalde score voorkomt → de frequentie
Dit tellen heet turven
Een frequentietabel geeft een frequentieverdeling.
Je zou scores met nulfrequenties kunnen weglaten omdat het duidelijk is, maar door deze wel in de tabel op te
nemen krijg je wel een beter visueel beeld.
Voordeel frequentietabel: Je kunt bij elke student onmiddellijk aflezen hoeveel studenten evenveel punten
hebben behaald. Je ziet ook wie er meer en wie er minder punten hebben behaald.
Nadeel frequentietabel: Met de numerieke volgorde gaat alle informatie over de namen van de studenten
verloren gaat.
Relatieve, cumulatieve en relatieve cumulatieve frequenties
In een relatieve frequentietabel komen in de plaats van de frequenties de relatieve frequenties.
Relatieve frequentie → Frequenties gedeeld door het totaal aantal observaties
Relatieve frequenties kunnen in percentages worden uitgedrukt.
In een cumulatieve frequentietabel komen in de plaats van de frequenties de cumulatieve frequenties.
Cumulatieve frequentie → Het totaal aantal scores dat lager is of gelijk is aan een bepaalde score.
In een relatieve cumulatieve frequentietabel komen in de plaats van de cumulatieve frequenties de relatieve
cumulatieve frequenties te staan.
Relatieve cumulatieve frequentie → De cumulatieve frequenties gedeeld door het totaal aantal observaties.
Relatieve cumulatieve frequenties kunnen in percentages worden uitgedrukt.
In het algemeen is de notatie f(X = Xi).
1.2 Gegroepeerde frequentietabellen
Bij veel verschillende scores loont het om een gegroepeerde frequentietabel te maken.
Stap 1: Neem het verschil tussen de hoogste en de laagste score
Stap 2: Deel dit verschil door 10 en door 20 om respectievelijk het grootste en het kleinste aanvaardbare
interval vast te stellen.
- 10 en 20 zijn arbitraire getallen. Klasse = Interval
o Afhankelijk van het aantal observaties
Stap 3: Kies een handige afgeronde waarde tussen deze twee uitersten.
- Handig hangt af van de toepassing
Stap 4: Kies de score waar de laagste klasse moet beginnen. Dit is het best een meervoud van de
klassenbreedte.
Stap 5: Noteer de grenzen van alle klassen en plaats de klasse met de hoogste scores bovenaan.
- Ook de klassen waarin eventueel geen observaties vallen
- Alle klassen van dezelfde breedtes!
Stap 6: Tel het aantal observaties dat in elke klasse valt.
Voordeel gegroepeerde tabellen: overzichtelijker
Nadeel gegroepeerde tabellen: minder nauwkeurig
, 1.3 Reële klassengrenzen
Hiervoor werd er vanuit gegaan dat er alleen natuurlijke getallen in de tabellen stonden, maar soms is het
handig om de variabele als continu te beschouwen. Hiervoor werken we met reële klassengrenzen bij
gegroepeerde tabellen.
Reële klassengrenzen → de helft van de kleinste meeteenheid onder de score (de ondergrens) en de helft van
de kleinste meeteenheid boven de score (de bovengrens).
Bv: Reële grenzen van een score van 74 zijn gelijk aan 73,5 en 74,5
De reële ondergrens van een klasse fungeert tegelijkertijd als de reële bovengrens van de klasse die er
onmiddellijk onderligt.
Geen probleem want: het is onmogelijk om exact op een reële grens te vallen → reële grenzen worden immers
gedefinieerd door de helft te nemen van de kleinste meeteenheid.
1.4 Gegroepeerde relatieve, cumulatieve en relatieve cumulatieve frequentietabellen
Bij gegroepeerde frequentietabellen kunnen ook relatieve, cumulatieve en relatieve cumulatieve frequenties
worden berekend.
1.5 Kwalitatieve gegevens
- Kwantitatieve variabelen
o = zaken zijn uit te drukken in ‘een aantal’.
- Kwalitatieve variabelen
o = niet-numerieke waarden
o Onderscheid:
▪ Louter (ongeordende) classificatie
• Bv. Woonplaats
▪ Variabelen waarvan de waarden wel kunnen worden geordend
• Bv. Gedrag
Het typeren als kwantitatief, geordend kwalitatief of ongeordend kwalitatief wordt bepaald door gebruikte
meetinstrumenten en de context van het onderzoek.
Niet door intrinsieke eigenschappen van het kenmerk of de manier waarop het kenmerk gecodeerd
wordt.
Bij kwalitatieve kenmerken is de nood aan een overzichtelijkere weergave veel kleiner omdat de variabelen per
definitie al geclassificeerd zijn en er slechts een beperkt aantal categorieën zijn.
De categorie met de hoogste frequentie komt bovenaan en de categorie met de laagste frequentie komt
onderaan.
2. Figuren
Figuren zijn een zeer efficiënt model om gegevens aan derden te presenteren of om zelf inzicht in de gegevens
te verkrijgen.
Bij ongeëigend gebruik kunnen figuren echter ook ernstig misleiden.
2.1 Histogrammen en varianten
Worden gebruikt bij kwantitatieve variabelen.
Histogrammen
Histogram = frequentiehistogram
Meestal op basis van een gegropeerde frequentietabel met reële klassengrenzen.
X-as → De variabele waarvan we de verdeling willen beschrijven
Hierop kunnen de klassenmiddens of de klassengrenzen worden genoteerd.
Begint deze niet bij 0, dan een zigzag gebruiken om discontinuïteit aan te geven.
Y-as → De frequentie
De hoogte en de breedte van de rechthoeken → Stellen de klassenfrequentie en de klassenbreedte voor
Horizontaal histogram (normaal histogram 90° draaien zodat de Y-as en de rechthoeken horizontaal liggen) is
overzichtelijker en op deze manier passen er meer rechthoeken op één bladzijde.
In een histogram komen geen openingen tussen de rechthoeken voor, alleen bij lege klassen.
Relatieve frequentiehistogram → Histogram op basis van een (gegroepeerde) relatieve frequentietabel
Y-as → de relatieve frequentie
Met een histogram kan zeer concreet worden weergegeven waar de massa van de waarden van de X-variabele
gelegen is.
Cumulatieve frequentiehistogram → Histogram op basis van een (gegroepeerde) cumulatieve frequentietabel
Op analoge wijze kan hieruit ook een relatieve cumulatieve frequentietabel worden geconstrueerd.
, Voordeel histogram: gemakkelijk te begrijpen (daarom populair)
Nadelen histogram: onnauwkeurig en het werken met klassen zorgt er voor dat er geen eenduidig beeld van de
verdeling wordt verkregen.
Door die klassen anders te kiezen, kan er telkens een andere vorm ontstaan, en wordt meteen ook een
andere ‘visie’ op dezelfde gegevens bekomen.
Polygonen FREQUENTIE
6
Als de bovenste zijde van de rechthoeken van een histogram met lijnstukken 5
worden verbonden dan wordt een polygoon verkregen. Afhankelijk van de definitie van
4
de Y-as kunnen zo frequentiepolygonen, relatieve frequentiepolygonen, cumulatieve
frequentiepolygonen en relatieve cumulatieve frequentiepolygonen worden 3
geconstrueerd. 2
Bij (relatieve) frequentiepolygonen lopen de lijnstukken van klassenmidden tot 1
klassenmidden.
0
Bij (relatieve) cumulatieve frequentiepolygonen lopen de lijnstukken van klassengrens 42 47 52 57 62 67 72
PUNTEN
77 82 87 92 97
KLASSEMIDDEN
tot klassengrens.
De totale oppervlakte onder de polygoon is gelijk aan de totale oppervlakte onder het corresponderende
histogram.
Met een polygoon word gesuggereerd dat de overgang van klasse tot klasse geleidelijk verloopt → ≠ zo!
Daarom zijn polygonen meestal niet aan te readen bij kwantitatieve variabelen die slechts een beperkt
aantal waarden kunenn aannemen omdat ze dan een continuïteit suggereren die er in feite niet is.
Bij een cumulatieve polygoon is de oppervlakte niet meer belangrijk maar wel de hoogte bij elke klassengrens.
Stamdiagrammen
Stamdiagram = stam-met-loof diagram/stem-and-leaf display
Als de scores van personen op variabele worden gebruikt in plaats van de rechthoeken bij
histogrammen, dan komen we bij de populaire stamdiagram terecht.
De lengte van de ‘rechthoek’ van de histogram wordt hier naast een bepaalde klasse door
een rij cijfers uitgedrukt.
De legende is heel belangrijk bij de stamdiagrammen; deze geeft namelijk weer hoe je de
scores moet reconstrueren (bijvoorbeeld: vermenigvuldig Stam.Loof met 10). Om de
scores te reconstrueren moet dus telkens de stam en één van de bladeren uit het loof
genomen worden.
Belangrijk: Lees de cijfers van de loof niet als één getal, maar als verschillende cijfers die
elk één observatie voorstellen.
Voordelen stamdiagram: de cijfers kunnen worden gebruikt om de oorspronkelijke gegevens te reconstrueren,
de oorspronkelijke gegevens worden op een overzichtelijke manier gepresenteerd zonder dat er informatie
verloren gaat en hij is eenvoudig met pen en papier op te stellen.
Nadeel stamdiagram: bij grote bestanden met brede klassen gaat het overzicht verloren (→ beter om dan een
horizontaal histogram te gebruiken)
2.2 Staafdiagrammen en varianten
Worden gebruikt bij kwalitatieve variabelen.
Staafdiagrammen
Staafdiagram = een XY-grafiek met een reeks rechthoeken die
de frequentie of relatieve frequentie van de categorieën van
een kwalitatieve variabele weergeven.
Verschil staafdiagram en histogram: Bij een staafdiagram drukt
de X-as geen kwantiteit uit en er zijn geen openingen tussen de
rechthoeken om discontinuïteit aan te geven.
Bij geordende categorieën zou het nog zinvol kunnen zijn om
een staafdiagram op basis van cumulatieve (relatieve)
frequenties te construeren → ZEER ONGEBRUIKELIJK!
Bij ongeordende categorieën wordt er naar frequentie
gerangschikt → De categorie met de hoogste frequentie komt
links en de categorie met de laagste frequentie komt rechts.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller chantalmichels. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.82. You're not tied to anything after your purchase.