Tentamen casus
Een onderzoekster wilde deze klassieke studie repliceren. Omdat de oorspronkelijke studie veel te
weinig power had, heeft ze ditmaal twee keer zoveel deelnemers geworven. In elke conditie wierf ze
ongeveer 50 deelnemers. Bij deze casus hoort een fragment van de dataset die de onderzoekster uit
dit experiment heeft verkregen. In deze gedeeltelijke dataset, die beschikbaar is bij de cursusbronnen,
zijn de volgende variabelen opgenomen:
Variabelenaam Omschrijving Categorieën
condition_adrenaline Experimentele conditie met betrekking tot 1 = Adrenaline-
adrenaline geïnformeerd,
2 = Adrenaline-onwetend,
3 = Adrenaline-
misinformatie,
4 = Placebo
(suikerwaterinjectie)
condition_mood Experimentele conditie met betrekking tot 0 = Euforie,
gedrag medeplichtige 1 = Woede
pulse_pre Hartslag op de voormeting, voorafgaand Numeriek (ratio)
aan de injectie (de voormeting)
pulse_post Hartslag op de nameting, na wachtperiode Numeriek (ratio)
met medeplichtige (de nameting)
palpitation Zelfgerapporteerde hartkloppingen Schaal van 0-3
tremor Zelfgerapporteerde trillingen Schaal van 0-3
numbness Zelfgerapporteerde gevoelloosheid Schaal van 0-3
itching Zelfgerapporteerde jeuk Schaal van 0-3
headache Zelfgerapporteerde hoofdpijn Schaal van 0-3
Er is discussie mogelijk over het meetniveau van de variabelen waarmee mogelijke
bijwerkingen zijn gemeten. Deze zijn immers gemeten op een vierpuntsschaal, en zonder
verdere informatie zou die zowel het ordinale als het intervalniveau kunnen hebben. In deze
casus gaan we ervan uit dat dit is uitgezocht en dat is gebleken dat deze laatste vijf
variabelen het intervalniveau hebben. Het gaat om een aselecte steekproef waarbij iedereen
dezelfde kans heeft om in de steekproef terecht te komen. Gestratificeerd (eerst opdelen wat
betreft kenmerken zoals geslacht), multi-level (school/klassen). Selecte steekproef:
convenience sampling (bekende mensen uit de omgeving) en snowball sampling. Bij deze
casus zou het kunnen gaan om een gestratificeerde steekproef, omdat er alleen mannen zijn
geïncludeerd en daarna aselect is gekozen. Ook kan er gekeken worden naar de
betrouwbaarheid: mate waarin bij herhaling het dezelfde uitkomst oplevert. Dit ten opzichte
van validiteit: mate waarin data wordt verkregen met die operationalisatie corresponderend
met de variabele die de operationalisatie operationaliseert. Meetinstrumenten +
manipulaties= operationalisaties van variabelen. De grafische weergave hiervan wordt het
meetmodel genoemd. Structureel model: verwachting hoe variabelen samenhangen, alleen
constructen (psychologische variabele).
Onderstreept= afhankelijke variabelen (criterium)
Condition_adrenaline: categorische nominale variabele, onafhankelijk
Condition_mood: categorische dichotome variabele, onafhankelijk
Pulse_pre en pulse_post: continue en ratio niveau
Zelfgerapporteerde variabelen: continue en interval niveau
,1. Wat zijn de beschrijvingsmaten en verdelingsvormen van deze variabelen?
De beschrijvingsmaten bevat de centrummaten, geeft aan waar de meeste datapunten zich
in een reeks bevinden (gemiddelde, mediaan en modus) en spreidingsmaten, getal dat de
hoeveelheid spreiding in een reeks aangeeft (standaarddeviatie, variantie, variatie en
interkwartielafstand, range). De standaardfout van het gemiddelde is kleiner dan de
standaarddeviatie.
1. Standaarddeviatie/standaardafwijking: gemiddelde afwijking van het gemiddelde.
2. Variantie: Variatie gedeeld door het aantal vrijheidsgraden (N-1). De variatie wordt altijd groter
naarmate er datapunten aan de reeks toegevoegd worden. Dat is onhandig, omdat de spreiding
niet automatisch meer wordt. Daarom deel je de variatie door het aantal datapunten.
3. Variatie (Sum of squares): dit is de som van alle gekwadrateerde afwijkingen van het gemiddelde.
Deze wordt gekwadrateerd omdat de uitkomst anders altijd 0 zou zijn.
4. Interkwartielafstand: verschil tussen het eerste en derde kwartiel.
De verdelingsmaten zijn: spitsheid, scheefheid en toppigheid (modaliteit). Linksscheve verdeling:
skewness wordt steeds kleiner, ligt verder van 0 af en is negatief. Rechtsscheve verdeling: skewness
wordt steeds groter. Platte verdeling: kurtosis wordt steeds kleiner, ligt verder van 0 af en is negatief.
Spitse verdeling: kurtosis wordt steeds groter.
Wat betreft de meetniveaus kan er onderscheid worden gemaakt tussen categorisch (afstand is
onbekend en er is altijd sprake van categorieën) en continu (onderbroken schaal) meetniveau.
Categorisch wordt verdeeld in nominaal (je benoemt de categorieën, haarkleur) en ordinaal (ordenen
van categorieën, opleidingsniveau). Continu bestaat uit interval (interval tussen opeenvolgende
waarden zijn gelijk) en ratio (is een absoluut nulpunt). Een dichotome variabele is vaak nominaal en
kan twee waardes aannemen zoals geslacht.
Bij het kijken naar continu variabelen kunnen tien beschrijvingsmaten worden berekend:
centrummaten, spreidingsmaten en de verdelingsmaten. Hoewel voor ordinale variabelen alleen de
mediaan en de modus kunnen worden berekend. Nominaal kan alleen een modus laten zien. Bij
continuvariabelen (ratio of interval) kijk je naar histogrammen, boxplots en Q-Q plots, in tegenstelling
tot categorische variabelen (ordinaal, nominaal of dichotoom) waar gekeken wordt naar
frequentietabellen en staafdiagrammen. De centrale limietstelling: gemiddelde van de
steekproevenverdeling is altijd normaal verdeeld.
Diptest: kan niet worden afgelezen uit SPSS, diptest is bij een unimodale verdeling 0, hoe meer er
sprake is van een meertoppige verdeling wordt de score steeds hoger dan 0, ook al kennen we de
scores in deze uitwerking niet, op basis van de histogrammen kan er wel iets over worden gezegd.
Bij bv. pulse_pre, pulse_post, lijkt er sprake van een unimodale verdeling,
Hieronder staan de beschrijvingsmaten en verdelingsvormen van de variabelen weergegeven.
Descriptives
Statistic Std. Error
condition_adrenaline Mean 2,4746 ,06490
95% Confidence Interval for Lower Bound 2,3469
Mean Upper Bound 2,6022
5% Trimmed Mean 2,4718
Median 2,0000
Variance 1,491
Std. Deviation 1,22101
Minimum 1,00
Maximum 4,00
Range 3,00
Interquartile Range 3,00
Skewness ,073 ,130
Kurtosis -1,574 ,259
2
, condition_state Mean ,4294 ,02635
95% Confidence Interval for Lower Bound ,3776
Mean Upper Bound ,4812
5% Trimmed Mean ,4215
Median ,0000
Variance ,246
Std. Deviation ,49569
Minimum ,00
Maximum 1,00
Range 1,00
Interquartile Range 1,00
Skewness ,287 ,130
Kurtosis -1,929 ,259
pulse_pre Mean 83,1086 ,32140
95% Confidence Interval for Lower Bound 82,4765
Mean Upper Bound 83,7407
5% Trimmed Mean 83,1198
Median 83,2347
Variance 36,568
Std. Deviation 6,04712
Minimum 65,11
Maximum 99,50
Range 34,39
Interquartile Range 7,94
Skewness -,036 ,130
Kurtosis ,312 ,259
pulse_post Mean 81,2360 ,42589
95% Confidence Interval for Lower Bound 80,3984
Mean Upper Bound 82,0736
5% Trimmed Mean 81,2738
Median 81,3821
Variance 64,211
Std. Deviation 8,01316
Minimum 57,30
Maximum 102,28
Range 44,98
Interquartile Range 11,91
Skewness -,080 ,130
Kurtosis -,317 ,259
palpitation Mean 1,2542 ,07016
95% Confidence Interval for Lower Bound 1,1163
Mean Upper Bound 1,3922
5% Trimmed Mean 1,2269
Median 1,0000
Variance 1,743
Std. Deviation 1,32006
Minimum ,00
Maximum 3,00
Range 3,00
Interquartile Range 3,00
Skewness ,326 ,130
Kurtosis -1,672 ,259
tremor Mean ,9576 ,06515
95% Confidence Interval for Lower Bound ,8295
Mean Upper Bound 1,0858
3