TAK (202100022)
SAMENVATTING HOORCOLLEGES
TECHNIEKEN VOOR ANALYSE KWALITATIEVE EN KWANTITATIEVE
GEGEVENS (2022-2023)
STEGEMAN, B. (BRITT)
UNIVERSITEIT UTRECHT
,HOORCOLLEGE 1: KWANTITATIEVE ANALYSETECHNIEKEN 2
HOORCOLLEGE 2: SYSTEMATIC REVIEWS EN META-ANALYSE 14
HOORCOLLEGE 3: VRAGENLIJSTCONSTRUCTIE 21
HOORCOLLEGE 4: FACTORANALYSE 28
HOORCOLLEGE 5: MULTIPELE LINEAIRE REGRESSIE 38
HOORCOLLEGE 6: MODERATIE- EN MEDIATIE ANALYSE 49
HOORCOLLEGE 7: LOGISTISCHE REGRESSIEANALYSE 60
,Hoorcollege 1: Kwantitatieve analysetechnieken
Herhaling meetniveaus
Categorische variabelen
Variabelen krijgen getallen die een categorie vertegenwoordigen:
• Nominaal meetniveau = categorisatie zónder duidelijke rangorde (m/v =
dichotoom)
• Ordinaal meetniveau = categorisatie mét rangorde, maar zónder gelijke
intervallen tussen de categorieën. De getallen geven hierbij dus wel aan dat
de ene waarde meer/groter/hoger is dan de andere, maar niet met hoeveel
(XS/S/M/L/XL)
Kwantitatieve/continue variabelen
Variabelen krijgen getallen die een waarde hebben:
• Interval meetniveau = categorisatie mét rangorde én gelijke intervallen
tussen de categorieën, maar zónder betekenisvol nulpunt (de waarde 0 is
geen indicatie van de afwezigheid van de gemeten variabele (IQ)
• Ratio meetniveau = categorisatie mét rangorde én gelijke intervallen
tussen de categorieën, en mét een betekenisvol nulpunt (leeftijd, lengte)
Voorbeeld
Dit zijn 5 onderzoeksvragen over de lichaamslengte van Nederlandse middelbare
scholieren, waarbij de afhankelijke variabele lichaamslengtelengte (ratio) is, en de
verklarende variabelen zijn sekse (dichotoom) en leeftijd (ratio):
1. Is de gemiddelde lengte 170 cm?
2. Wat is het lengteverschil tussen jongens en meisjes?
3. Wat is het groeitempo per maand?
4. Wat is het lengteverschil tussen jongens & meisjes na correctie voor leeftijd?
5. Is het groeitempo hetzelfde voor jongens en meisjes?
Steekproef: 100 scholieren (n = 100)
• 50 jongens, 50 meisjes, & Leeftijd: 12 tot 18 jaar
Variabelen (meetniveau):
• Afhankelijke variabele: lengte in centimeters (ratio)
• Onafhankelijke variabelen:
o Groepsvariabele (F): Geslacht, met 1 = jongen en 2 = meisje
(nominaal/dichotoom)
o Interval variabele X: leeftijd, gemeten in maanden (ratio)
Deze onderzoeksvragen kunnen je binnen het General Linear Model analyseren,
door de onderzoeksvraag, gecombineerd met de analysetechniek, met de
hypotheses, om te zetten in een regressievergelijking. Dan kun je de
regressievergelijking oplossen en de B-coëfficiënten interpreteren, waardoor je je
hypotheses kunt toetsen wat uiteindelijk een antwoord geeft op onderzoeksvraag.
Voor je eigen onderzoeksvraag moet je afhankelijke variabele ook minimaal
van interval meetniveau zijn (dus interval of ratio → continue variabele), en de
onafhankelijke variabele(n) moeten ook minimaal van interval meetniveau zijn (dus
interval of ratio → continue variabele), of het moet een groepsvariabele (→
categorische variabele) zijn. Als je je afhankelijke variabele hebt gedefinieerd,
geoperationaliseerd, en scores hebt verzameld, kun je de variatie aan scores gaan
analyseren, omdat je wil nagaan hoe die variatie op scores tot stand is gekomen.
, General Linear Model
Het General Linear Model (GLM) staat voor een statistisch model dat een
veralgemenisering is van het Regressiemodel (wordt gebruikt voor het toetsen,
vergelijken, en beoordelen van gemiddelden). In dit model schrijf je de betreffende
situatie als een regressievergelijking, en ga je opzoek naar de parameters van zo’n
regressievergelijking. Met het knopje GLM in SPSS kun je veel van de variantie-
technieken uitvoeren, hieronder verder aangeduid:
Hieronder staan de statistische technieken waarmee je de vijf onderzoeksvragen
kunt onderzoeken in SPSS via het General Linear Model:
1. Is de gemiddelde lengte 170 cm?
One‐Sample t‐test voor toetsen van één gemiddelde (Y)
2. Wat is het lengteverschil tussen jongens en meisjes?
Independent‐Samples t‐test voor toetsen verschil gemiddelden van 2
groepen (F)
3. Wat is het groeitempo per maand?
(Enkelvoudige) Regressieanalyse voor het toetsen van invloed van X
(interval) op Y
4. Wat is het lengteverschil tussen jongens & meisjes na correctie voor leeftijd?
ANCOVA voor toetsen verschil gemiddelden van 2 groepen (F)
gecorrigeerd voor covariaat (interval/ratio)
5. Is het groeitempo hetzelfde voor jongens en meisjes?
ANCOVA met interactie voor toetsen van interactie-effect F*X op Y
(homogene regressielijnen)
Nulhypothese toetsing
Voor de toetsing van hypotheses moet je de volgende stappen doorlopen:
1. Formuleer de nulhypothese (= situatie waarbij er geen
verschil/effect/samenhang is) en de onderzoekshypothese (= de
verwachting die je als onderzoeker hebt), en stel het significantieniveau α
vast (vaak 5%/0.05) (= de grenswaarde die je gebruikt om uiteindelijk een
beoordeling te kunnen doen over of je de nulhypothese verwerpt of niet).
2. Toetsing: Bereken de toetsingsgrootheid (t-toets of f-toets, gebaseerd op
wat er gevonden is in de steekproef) en bepaal de overschrijdingskans 𝑝,
en bereken het betrouwbaarheidsinterval (vaak 95%) (geeft een indicatie
van wat in de populatie de werkelijke waarde is/ binnen welke grenzen de
werkelijke waarde ligt van de gemeten kenmerken.
3. Beslissing:
• Als 𝑝 > 𝛼, dan H₀ niet verwerpen, en als 𝑝 ≤ 𝛼, dan H₀ verwerpen.
• Als de testwaarde (test value) binnen het passende
betrouwbaarheidsinterval ligt, dan H₀ niet verwerpen, en als testwaarde
buiten passende betrouwbaarheidsinterval ligt, dan H₀ verwerpen.
Dit zijn dus 2 verschillende opties om een beslissing te maken over het al
dan niet verwerpen van de nulhypothese, waarbij de 2e optie verkozen wordt
boven de 1e aangezien daarbij niet alleen de toetsing wordt uitgevoerd (wel
of niet significant), maar ook wordt er informatie gegeven over de
waarschijnlijkheid van een parameter binnen de populatie.