Statistiek 1 – januari 2023 1
STATISTIEK
= wetenschap van verzamelen, classificeren, samenvatten, organiseren, analyseren en interpreteren van
gegevens
- Gegevens worden verzameld via een steekproef (= selectie) van een populatie (= bestudeerde groep)
- Gegevens worden geanalyseerd via
Beschrijvende statistiek: kenmerken/parameters bepalen van de steekproef, zonder veralgemening
naar de populatie
Inductieve statistiek: kenmerken/parameters bepalen van de populatie, waarvoor een extra vertaalslag
nodig is met kans op fouten – dit is dus een inductieve redenering
ONDERZOEK
Onderzoek leidt tot uitspraken:
- Deterministische uitspraken = wetmatigheden – komen zo goed als nooit voor!
- Probabilistische uitspraken = waarschijnlijkheden/onzekerheden, bv. Frustratie leidt tot meer agressie
Onderzoek binnen de gedragswetenschappen zal hieronder vallen
Onzekerheden zijn afkomstig van…
§ Werken met mensen – onvermijdelijk
§ Slecht onderzoeksopzet – vermijdelijk!
§ (her)interpretatie van gepubliceerde onderzoeken
Kansberekeningen worden gebruikt om de mate van (on)zekerheid uit te drukken
DEDUCEREN (afleiden uit) INDUCEREN (gevolgen trekken uit)
= wat voor iedereen van toepassing is (populatie) is = wat voor een deel van toepassing is (steekproef) is
ook steeds van toepassing op ieder individu uit de mogelijks ook van toepassing op de rest van de
populatie populatie
ð Deterministische uitspraken ð Probabilistische uitspraken
Om tot kwaliteitsvol onderzoek te komen, moet voldaan worden aan deze 4 voorwaarden van Brinkman:
- Objectiviteit: zonder eigen mening of vooroordelen, openstellen voor de werkelijkheid zoals ze is
- Controleerbaarheid: iemand anders zou jouw gegevens moeten kunnen controleren
- Herhaalbaarheid: iemand anders zou in principe jouw onderzoek moeten kunnen nabootsen, dus moet je
alles zorgvuldig bijhouden en opschrijven
- Systematiek: systematisch onderbouwd werken, oa. via een redenering achter elke stap in het onderzoek,
zoals voorgaand onderzoek, theorieën
Twee soorten onderzoeken binnen de gedragswetenschappen:
EXPERIMENT
= doelbewust één of enkele onafhankelijke variabelen manipuleren en de effecten daarvan onderzoeken op de
afhankelijke variabelen, bv. snelheid en juistheid bij een toets meten bij groepen die een ijsje, koud glas water
of geen ontbijt kregen
Een variabele is een (niet constante!) eigenschap/kenmerk van de onderzoekseenheden waar respondenten in
zullen verschillen, bv. geslacht
,Statistiek 1 – januari 2023 2
ONAFHANKELIJKE VARIABELE (OV) AFHANKELIJKE VARIABELE (AV)
= variabelen of condities die jij als onderzoeker = de variabelen waarvoor we de verschillen in
voorafgaand aan de metingen manipuleert en condities willen achterhalen, bv. snelheid
bepaalt, bv. al dan niet ontbijt krijgen
= groepsindelingen
RESULTATEN
= wat is het effect of verband van de condities op de metingen? Merken we patronen die we kunnen linken
aan de OV?
CORRELATIONEEL ONDERZOEK
= verschillende (afhankelijke) variabelen meten en deze dingen met elkaar in verband brengen (=> covariaten) –
geen dingen controleren, bv. in een vragenlijst het ontbijt en de IQ-score nagaan en deze in verband brengen
- Geen OV of AV, enkel metingen van covariaten om de verbanden tussen de variabelen te meten
- Resultaten bepalen of er een verband is tussen de metingen
VERBANDEN
Direct causaal = X veroorzaakt Y, bv. gezondere maaltijden zorgen voor een hogere intelligentie
Invers causaal = Y veroorzaakt X, bv. slimmere mensen eten gezonder
Covariatie = X en Y variëren samen, bv. gezondere maaltijden stimuleren de intelligentie, waardoor er
gezondere ontbijtkeuzes gemaakt worden
Indirect = Z veroorzaakt X en Y; iets dat we eigenlijk nog niet eens hebben gemeten is de oorzaak
van het verband, bv. genen bepalen intelligentie en opvoeding bepalen ontbijtkeuze,
waarbij slimmere ouders vaker kans hebben op slimmere kinderen en vaker een gezondere
opvoedingsstijl hanteren
CRITERIA VAN HUME EN MILL
1. Tijdruimtelijke structuur van oorzaak en gevolg: duidelijke chronologie in onderzoeksopstelling, bv. eerst
groepsbepaling en mensen toegedeeld aan de groepen, dan pas metingen doen
2. Oorzaak vindt plaats voor het gevolg: ik vermoed dat die oorzaak (bv. groepsindeling) een gevolg heeft (bv.
in de oefeningen die ze achteraf maken)
3. Als de vermoedelijke oorzaak niet plaatsvindt, dan is er geen meetbaar gevolg: controleconditie, want je
voegt ook een controlegroep toe waar je niets bij doet
4. Er zijn geen alternatieve verklaringen mogelijk zoals achterliggende processen – als die wel aanwezig zijn,
best ook als factor in je onderzoek steken, bv. ook intelligentieniveau meten
En hoe realistisch is de klinische (laboratorium)setting?
ð Vereisten voor het direct causale verband
ð Hoe meer wordt voldaan aan de criteria, hoe sterker de uitspraak is en hoe meer ze in de buurt komt van
een deterministische uitspraak, aangezien er heel wat onzekerheden en meetfouten gecontroleerd worden
ONDERZOEKSFASEN
1. VRAAGSTELLING
De onderzoeksvraag is de centrale vraag van het onderzoek, die de belangrijkste begrippen bevat
- Verschillende soorten:
Vragen het voorkomen van een fenomeen, bv. Hoe vaak komt een klinische depressie voor in
Vlaanderen?
Vragen naar verschillen tussen groepen, bv. Bestaan er geslachtsverschillen in de beleving van een
depressie?
Vragen naar verbanden tussen variabelen, bv. Bestaat er een verband tussen intelligentie en het
voorkomen van een depressie?
- Gebaseerd op:
Academische vragen en fundamenteel onderzoek (à eerder abstract, theorievorming staat centraal),
bv. Welke mentale processen zijn verantwoordelijk bij het in stand houden van een depressie?
, Statistiek 1 – januari 2023 3
Dienstverlening en toegepast onderzoek (à eerder pragmatisch onderzoek), bv. Welke vormen van
behandeling werken het beste voor het verhelpen van een depressie?
De onderzoekshypothese(n) is een nog niet bewezen stelling die het verwachte resultaat uitdrukt (obv
voorgaand onderzoek of literatuur)
- Statistische hypothesen drukken de hypothesen uit in 2 toetsbare of wiskundige uitspraken
2. LITERATUURONDERZOEK
- Wat is er al geweten over de verbanden/verschillen/voorkomens van het onderwerp of gerelateerde
onderwerpen?
Peer-reviewed kwaliteitsonderzoek
Dit werkt hypothesevormend
- Zijn er al theoretische kaders geschreven? (fundamenteel onderzoek)
- Zijn er al praktijkervaringen/observaties over dit onderwerp? (toegepast onderzoek)
3. OPERATIONALISERING
= abstracte of theoretische (psychologische) begrippen concreet meetbaar of manipuleerbaar maken via OV en
AV of covariaten
- Gemakkelijk voor ‘geslacht’, moeilijk(er) voor ‘gelukkig zijn’
- Hoe abstracter het begrip, hoe moeilijker om er iets meetbaars van te maken en hoe meer voorkennis/
vooronderzoek er nodig is om dit te kunnen doen, bv. persoonlijkheid à theorie van de Big 5 en daarin
bevragen
4. STEEKPROEFOPZET OF STEEKPROEFTREKKING
= de techniek om uit een populatie een steekproef te bekomen
- Kan op verschillende manieren:
Census: iedereen uit de populatie is bevraagbaar (dus populatie = steekproef)
§ Is eigenlijk het ideale scenario, maar ook hier opletten, want de populatie kan wijzigen (mensen
komen erbij, gaan weg, bv. zeldzame ziekte, inwoners van een stad)
Steekproef als representatie van de populatie
- En kan bovendien ook aselect of niet-aselect
N = aantal personen in de populatie
n = aantal deelnemende personen in de steekproef
ASELECTE STEEKPROEVEN
= volledig per toeval – objectiviteit is belangrijk, want iedereen in de populatie moet evenveel kans hebben
om geselecteerd te kunnen worden (hoewel daar wel principes aan vast kunnen zitten)
- Steekproefkader is mogelijk, waarbij alle potentiële deelnemers opsombaar en benummerbaar zijn
ð Kunnen gegeneraliseerd worden
Volledig aselect = computer kiest zonder regelmaat nummers uit de steekproefkader
- Belangrijk dat de lijst dus volledig is en iedereen identificeerbaar is!
- Zonder teruglegging (iedereen doet maar 1 keer mee)
Systematisch aselect = computer kiest eerste deelnemer en andere deelnemers volgen via een regel, bv.
nr at random: #7 en dan steeds +2
- Zonder teruglegging
Gestratificeerd = populatie indelen in subpopulaties of strata obv een gemeenschappelijk kenmerk
en uit elk stratum aselect nummers trekken
- Proportioneel: verhoudingen tussen de subgroepen in de steekproef zijn gelijk
met die in de populatie
- Disproportioneel: verhoudingen tussen de subgroepen zijn niet gelijk met die
in de populatie, bv. voor ieder stratum wordt een vast aantal deelnemers
getrokken