ONDERZOEKSPRACTICUM EXPERIMENTEEL ONDERZOEK
Basiskennis statistiek
Populatie: verzameling van alle elementen waarop het onderzoek betrekking heeft
Steekproef:
= deelverzameling van de populatie die onderzocht wordt
Een goede steekproef is:
- Representatief: alle deelverzamelingen van de populatie zijn evenredig
vertegenwoordigd
- Aselect: het toeval beslist welke elementen van de populatie betrokken
worden bij het onderzoek
- Groot genoeg van omvang
Bij een aselecte steekproef zeggen de data uit die steekproef iets over de
populatie en kan de steekproef naar de populatie gegeneraliseerd worden
Soms wordt er ook een selecte steekproef genomen:
- Zo kan er met relatief weinig deelnemers een gebalanceerde
samenstelling verkregen worden nadeel: verstorende factoren en
dus een lagere generaliseerbaarheid en mogelijks een lagere validiteit
Validiteit en betrouwbaarheid:
Betrouwbaarheid:
- Mate waarin een meting bij herhaling hetzelfde resultaat oplevert
- Stabiliteit van een meetinstrument over herhaalde metingen
- Minder betrouwbaar indien er meetfouten (of ruis) zijn
Validiteit:
- Mate waarin een meetinstrument meet wat het moet weten
Soorten variabelen:
Discreet/categorisch:
- alleen bepaalde waarden kunnen voorkomen, tussenliggende waarden
niet
- soorten discrete variabelen:
o nominaal: categorieën zijn alleen te benoemen, maar niet te
ordenen
o ordinaal: categorieën zijn wel te ordenen, maar de afstand
tussen de categorieën is onbekend
o dichotoom/binair: er kunnen maar twee waarden worden
aangenomen
Continu:
- er kunnen oneindig veel waarden worden aangenomen
- meeste variabelen vallen hieronder
- meetniveaus:
o intervalniveau: intervallen tussen opeenvolgende meetwaarden
zijn altijd even groot, maar er is geen absoluut nulpunt
o rationiveau: intervallen tussen opeenvolgende meetwaarden zijn
even groot en er is een absoluut nulpunt
,Afhankelijke en onafhankelijke variabelen:
onafhankelijk:
- onderzoeker manipuleert deze variabele door een bepaalde categorie
mensen bloot te stellen aan een experimentele stimulus of ingreep
- ook wel predictor genoemd
afhankelijk:
- op deze variabele verwacht de onderzoeker een effect te hebben door
de onafhankelijke variabele te manipuleren
Psychologische variabelen of constructen:
er is geen objectief ‘correct antwoord’ wanneer deze variabelen onderzocht
worden
moeten vertaald worden naar een meetinstrument of manipulatie (=
operationalisatie)
Centrummaten:
gemiddelde: alle getallen bij elkaar optellen en delen door het aantal net
opgetelde getallen
modus: meest voorkomende waarde in de datareeks
mediaan: middelste datapunt in de datareeks wanneer ze geordend zijn van
laag naar hoog
Spreidingsmaten:
interkwartielstand: mediaan tweede helft datapunten – mediaan eerste helft
datapunten wanneer de datapunten geordend zijn van laag naar hoog
variatie of ‘sum of squares’:
variantie of ‘mean squares’:
met df: vrijheidsgraden datareeks
standaarddeviatie:
Correlatie/correlatiecoëfficiënt/Pearson’s r:
drukt uit hoe sterk twee continue variabelen met elkaar samenhangen
tussen -1 en 1:
- 0: geen verband
- 1: perfecte positieve samenhang
- -1: perfecte negatieve samenhang
, alleen bij variabelen die lineair met elkaar samenhangen
formule:
maat voor effectgrootte
zegt niets over de vraag of de ene variabele ook invloed heeft op de andere
variabele
om te bepalen hoe sterk een verband in de populatie waarschijnlijk is, moet er
een betrouwbaarheidsinterval worden bepaald
Betrouwbaarheidsintervallen:
geven aan hoe vaak de corresponderende populatiewaarde in het interval zal
liggen als de steekproef oneindig vaak zou worden herhaald
bij symmetrische steekproevenverdelingen is het betrouwbaarheidsinterval
ook symmetrisch om de puntschatting heen
formule:
betrouwbaarheidsinterval =steekproefwaarde ± breedte-index x standaardfout
voor 95% betrouwbaarheidsinterval wordt dit:
betrouwbaarheidsinterval =steekproefwaarde ± 1,96 x standaardfout
p-waarden:
= kans op onze correlatie of een extremere correlatie, als we er vanuit zouden
gaan dat er geen correlatie is in de populatie
Berekening:
Vb. correlatie gevonden van r = 0,2 en de kans dat een correlatie van 0,2 of
hoger wordt gevonden in de steeproef als de populatiecorrelatie gelijk is aan
r=0 is gelijk aan 8,19%.
8,19% ofwel 0,0819 verdubbelen om de p-waarde te vinden, dus p = 0,164
, Nulhypothese-significantietoetsing:
- Bij p-waarde < 0,05 (= α ¿: nulhypothese geldt niet, dus er is wel een
significant verband
- Bij p-waarde > 0,05: nulhypothese klopt
Type 1-fouten:
Wanneer nulhypothese onterecht wordt verworpen, dus als er wordt
geconcludeerd dat er een verband is terwijl dit niet zo is
Als α =25 % is er in 25% van de gevallen sprake van een type 1-fout keuze
voor een lagere alpha, meestal 5% of 0,05
Bij een correlatiematrix, waarbij er meerdere correlaties en dus meerdere p-
waarden ontstaan, is er meer kans op een type 1-fout
Vb. wanneer er zes correlaties ontstaan, is er zes keer kans op een type 1-
fout
Hoe groot is deze kans?
Dus algemeen:
Kans dat er geen type 1-fout wordt gemaakt = 0,95aantal p−waarden
=> kans op een type 1-fout = 1 - 0,95aantal p−waarden
Kans op type 1-fout kan worden gecorrigeerd, maar dan krijg je een grotere
kans op een type 2-fout
Type 2-fouten:
Wanneer de nulhypothese onterecht wordt aangehouden, dus als er wordt
geconcludeerd dat er geen verband is terwijl dit wel zo is
Als alpha daalt, wordt de kans op een type 1-fout kleiner maar de kans op een
type 2-fout wordt groter oplossen door de steekproefomvang te vergroten
Power (kans dat we een verband van een bepaalde omvang kunnen
detecteren, aangenomen dat het echt bestaat) = 100% - percentage kans op
een type 2-fout