Aantekeningen onderzoekmethoden 3
Hoorcolleges
Hoorcollege 1
Steekproeffout = de fout die we maken bij het voorspellen van de populatie parameter op basis van de
steekproef
Steekproeffout is onvermijdelijk, je doet dus niet iets “fout” als onderzoeker
Wat er mis kan gaan:
1, Selectie bias
Een systematische fout die optreedt wanneer de wijze van steekproeftrekking ervoor zorgt dat
bepaalde groepen in de populatie over- of ondervertegenwoordigd zijn
o bijv. Vrijwilligersbias: deelnemers melden zichzelf aan
Een grote n helpt in zo’n geval niet
2, Response bias (bij surveyonderzoek)
Systematische fout die optreedt wanneer de antwoorden van deelnemers worden beïnvloed door
bepaalde factoren, waardoor de antwoorden niet de werkelijke opvattingen, attitudes, of gedrag van de
deelnemers weerspiegelen.
3, Nonresponse bias (bij surveyonderzoek)
Systematische fout die optreedt wanneer bepaalde individuen die voor een onderzoek zijn
geselecteerd, niet deelnemen of niet reageren. Als de niet-respondenten systematisch verschillen van
de respondenten, kan dit leiden tot een vertekening van de onderzoeksresultaten.
Verschillende meetniveaus:
Nominaal
Categorieën zonder volgende. Je kunt alleen onderscheid maken, niet ordenen
Bijv. Welke religie heb je?
Ordinaal
Categorieën met een volgorde, maar zonder vaste afstanden tussen de categorieën, m.a.w.
verschil tussen 1 en 2 is niet hetzelfde als tussen 2 en 3.
o Bijv. Hoe vaak kijk je televisie per week?
Interval
Numerieke waarden met gelijke afstanden tussen de punten, maar zonder een absoluut nulpunt
Betekenisvolle ordening (17 is meer dan 16), afstanden zijn gelijk, (verschil tussen 15 en 17 is
hetzelfde als tussen 22 en 24).
o Bijv. Temperatuur in graden Celsius op een bepaalde dag
Ratio
Numerieke waarden met gelijke afstanden én een absoluut nulpunt
Bijv. Zelfde eigenschappen als interval (afstanden zijn gelijk, natuurlijke ordering). Absoluut,
betekenisvol nulpunt. Variabele is “afwezig” bij nul
o Bijv. Leeftijd van een persoon, maar ook bijv. gewicht
Hoorcollege 2
Experimenten studie;
1
, Deelnemers worden willekeurig toegewezen aan experimenten en controlegroep (of meerdere
groepen)
Onderzoeker manipuleert zelf 1 of meerdere variabelen om hun effect te onderzoeken.
Experimentele groep wordt blootgesteld aan "stimulus"/ interventie
Bijv. lab of veldexperiment, survey-experimenten
Lijken niet op de ‘echte wereld’
Lage ‘externe validiteit’
Soms ethische uitdagingen. Je kunt niet alles manipuleren als onderzoeker
Observationele studie;
Onderzoeker observeert mensen/ situaties/ omstandigheden zoals ze van nature voorkomen
Bijv. survey, landendata, overheidsdata
Vaak hogere externe validiteit, aangezien de studie
Data presenteren: categoriaal (nominaal/ ordinaal)
Data presenteren: kwantitatief (interval/ ratio)
Voor een interval/ ratio variabele kunnen we ook een frequentieverdeling maken
(Vooral bij continue variabelen is het nodig zelf intervallen te maken)
Populatieverdeling en steekproefverdeling
Zowel voor de populatieverdeling als de steekproefverdeling kunnen we een histogram maken.
Als het aantal respondenten in de steekproef toeneemt (de n), zullen de histogrammen van de
steekproef en de populatie meer op elkaar gaan lijken
Univariate analyse: centrum- en spreidingsmaten
Centrummaten: gemiddelde (interval/ ratio)
Het meetniveau is bepalend voor welke centrummaat we kunnen gebruiken
Y met een dakje staat voor de gemiddelde waarde van Y
Alle afzonderlijke waarden van Y gedeeld door het aantal observaties in de steekproef (n)
De gemiddelde is gevoelig voor outliers
Centrummaten: mediaan (ordinaal& interval/ ratio)
"Middelste waarde"
Om de mediaan te vinden
Alle cases sorteren op waarde
De waarde van de 'middelste case' is de mediaan (zelfde aantal cases "boven" en "beneden")
Als er een even aantal is, dan is de mediaan het gemiddelde tussen de twee middelste cases
--> de mediaan is minder gevoelig voor outliers
Spreidingsmaten: interkwartiel bereik (interquartile range, IQR)
Gebaseerd op "kwarten" die onze data opsplitsen in vier gelijke groepen
IQR is de afstand tussen Q1 en Q3
Spreidingsmaten: Standaardafwijking (interval/ ratio)
De standaardafwijking is een meting die aangeeft hoeveel de cases in de dataset, gemiddeld genomen,
afwijken van het gemiddelde. Hoe groter de standaardafwijking, hoe groter de spreiding van de data
2
, Om de standaardafwijking van een steekproef te bereken:
1. Berekenen we het gemiddelde (Y dakje)
2. Vervolgens berekenen we voor iedere (Yi) de afstand tot het gemiddelde
3. Dit getal kwadrateren we vervolgens (note: dit verwijdert alle negatieve getallen/ maakt deze
getallen) ( 2)
4. Deze gekwadrateerde getallen tellen we bij elkaar op (Sigma)
5. Dit getal delen we door het aantal cases minus 1 (n - 1)
Nu hebben we de variantie (moeilijker te interpreteren)
Hoe kunnen we de waarde van de standaardafwijking interpreteren?
Het is een meting van hoeveel, gemiddeld gesproken, cases afwijken van het gemiddelde ("the typical
distance"). (Het is trikt genomen niet de gemiddelde afwijking van het gemiddelde)
Als we de standaardafwijking vergelijken, kunnen we de vergelijkende statements maken: meer/
minder spreiding rond het gemiddelde
Waarom is de standaardafwijking zo belangrijk in statistiek?
Veel natuurlijke en sociale fenomenen zijn bij benadering normaal verdeeld
Bij een normaalverdeling gebruiken we de standaardafwijking om te bepalen welk percentage
van de waarden binnen een bepaald interval rondom de gemiddelde waarde ligt
Te gebruiken formules:
Steekproefgemiddelde:
Standaardafwijking steekproef:
Bij nominaal kan je alleen de modus
Bij ordinaal
Bijvoorbeeld:
Binair; dood, levend; in SPSS nominaal
Nominaal; groen, geel, blauw; in SPSS nominaal
Ordinaal; laag, midden, hoog; in SPSS ordinaal
Hoorcollege 3
De normale verdeling
Veel natuurlijke en sociale fenomenen zijn bij benadering normaal verdeeld.
Worden beïnvloed door tal van verschillende onderliggen processen en factoren en neigen naar een
soort “natuurlijk evenwicht”, m.a.w. clusteren rond een gemiddelde, en hoe verder van de piek, hoe
minder observaties.
3