KWANTITATIEVE ONDERZOEKSMETHODEN
Introductie
Statistiek = verzamelen, bewerken, interpreteren en presenteren van kwantitatieve (cijfermatige) gegevens.
Nut: instrument om vragen te beantwoorden, gegevens te ordenen, resultaten bruikbaar te maken.
Soorten statistiek:
Beschrijvende statistiek Gegevens ordenen en samenvatten
Kansberekening Kans op bepaalde gebeurtenis bepalen
Verklarende statistiek Bepaalde verwachtingen toetsen
Fasen in onderzoek:
Fase 3 – analyse:
Kwantitatief onderzoek
steekproef: je maakt een samenvatting van verzamelde gegevens
hypothesen: je toetst een aantal verwachtingen over de populatie
meetniveau: keuze van de geschikte statistische methode hangt af
van verschillende factoren
kansen: doel is om je conclusie te verbreden naar de populatie
Zijn de gevonden resultaten toevallig of niet?
Kwalitatief onderzoek
geen cijfermatige gegevens
als aanvulling op kwantitatief onderzoek
Beschrijvende statistiek – één variabele
1. Meetniveaus
Meetniveau bepaalt welke statistische methoden toepasbaar zijn.
Wat is de aard van je metingen (variabelen)?
Nominaal = laagste, kwalitatieve meetschaal vb. haarkleur, woonplaats, postcode, sport,…
- Kenmerk: metingen bestaan uit enkele losse categorieën
- Beperkt aantal waarden: niets ‘ertussenin’, discreet
- Cijfers = codes: je kan er niet mee rekenen
- Tellen: frequenties/percentages berekenen kan wel
Speciale nominale gegevens
Dichotoom: slechts 2 mogelijkheden (vb. succes/faling)
Dummy’s: lijst met antwoordmogelijkheden (vb. hobby’s)
o Dummy = 1 (aangevinkt) / 0 (niet aangevinkt)
o Elke keuze wordt dummy
Ordinaal = tweede kwalitatieve meetschaal vb. opleidingsniveau, waardering, salarisschaal,…
- Logische volgorde: nominaal + rangorde
- Cijfers = codering: je kan er nog steeds niet mee rekenen
- Je kan wel midden bepalen van gerangschikte gegevens
Speciale ordinale gegevens
Likert-items: mening over een bepaald onderwerp
o Keuze van 1 (= helemaal oneens) tot 7 (= helemaal eens)
o In praktijk toch scores optellen, uitmiddelen,…
Interval = laagste, kwantitatieve meetschaal vb. temperatuur in °C, tijd op de klok
1
, - Metrisch: heeft een meeteenheid
- Getalwaarden: je kan er mee rekenen
- ‘Afstanden’: ordinaal + gelijke intervallen tussen waarden
- ‘Oneindig’ veel waarden: discreet of continu
- Geen natuurlijk nulpunt: verhoudingen niet zinvol
Speciale intervalgeschaalde gegevens
Likertschaal: combinatie (optellen, gemiddelde) van Likert-items
o Gecombineerde variabele heeft meer mogelijke waarden
o Betekenisvol? Niet eender wat combineren!
Ratio = hoogste, kwantitatieve meetschaal vb. aantal werkuren/week, inkomen, afstand in meter
- Metrisch: heeft een meeteenheid
- Interval + ‘betekenisvolle verhoudingen’: vb. dubbel zoveel
- Natuurlijk nulpunt aanwezig
! Meetschaal kan veranderen !
Vb. Leeftijd = ratiogeschaald
opdelen respondenten in leeftijdscategorieën (-25, 25-50, 50+)
leeftijd = ordinaal
2. Frequentieverdelingen
Variabele: X = oordeel (zwak tot uitstekend) ordinaal
Frequentie: hoe vaak komt een bepaald oordeel voor? (aantal)
Percentage: hoe vaak komt een oordeel voor t.o.v. totaal? (relatief aantal)
Missing: waarden zonder beoordeling
Geldig percentage: missende waarden worden niet meegerekend (totaal - # missing)
2
, 3. Grafieken van één variabele
In één oogoplsag een overzicht van een kenmerk/variabele
Zeer verhelderend voor een breed publiek
Belangrijk om juiste grafiekkeuze te maken!
- Doel van je grafiek: wat wil je laten zien?
- Wat is het meetniveau van je variabele?
Cirkeldiagram Taartpunten geven idee over verhouding tussen categorieën
grootste punt is voor categorie met grootste frequentie
Geschikt voor laag meetniveau en slechts enkele categorieën
Staafdiagram Per waarde een staafje, hoogste = (relatieve) frequentie
waarde met hoogste staafje komt meeste voor
Geschikt voor laag meetniveau of hoog meetniveau met beperkt
aantal waarden (vb. aantal kinderen per gezin)
Histogram Gebruikt voor continue variabelen (bv. prijs)
in (aaneengesloten even grote) categorieën verdelen
‘aaneengeplakt’ staafdiagram
Geeft een idee van de vorm van de verdeling van een variabele
symmetrisch/scheef, 2 toppen … ?
Boxdiagram Geeft idee van verdeling van minimaal ordinale variabele
middelste waarneming = streepje in de box
in de box zitten middelste 50% van de waarnemingen
‘whiskers’ (snorharen) tot min/max (indien geen uitschieters)
4. Centrummaten
Centrummaten = samenvatting van gegevens/variabele in één getal. (‘midden’ van een set waarnemingen)
keuze hangt af van o.a. het meetniveau
Modus = xmod = waarde/categorie die het meest voorkomt
- Speciaal geval: een bimodale gegevensset heeft 2 modi
- Modus kan ook bepaald worden voor nominale of niet-numerieke variabelen
Mediaan = xmed = middelste waarneming in een set geordende numerieke data
- ! altijd eerst ordenen dus !
- Bij een even aantal waarnemingen gemiddelde nemen van middelste 2
- Mediaan kan bepaald worden vanaf ordinaal meetniveau
Frequentieverdeling met cumulatieve (opgetelde) percentages
Mediane klasse = categorie die middelste waarneming bevat
breuklijn ligt op 50%
= klasse die 50ste percentiel bevat (50% van de waarnemingen is kleiner,
dus de middelste waarneming
Gemiddelde = xgem = (rekenkundig gemiddelde van n waarnemingen x1, …, xn:
- Meest gebruikte en (soms verkeerd) geïnterpreteerd kengetal
- Minimaal interval/rationiveau (metrisch)
- ! Pas op met uitschieters (abnormale gegevens)
o Interpretatie van het gemiddelde is niet altijd zinvol
Gemiddelde (frequentietabel):
3