Samenvatting van hoofdstukken 2, 5, 7, 8, 10 t/m 15 van Field, de colleges, artikelen, oefeningen, assignment artikelen en SPSS-sessies.
Geschreven in studiejaar 2020/2021
Opzich een fijne en beknopte samenvatting, maar misschien iets té beknopt. Ik had meer uitwerkingen verwacht bij de de spss-opdrachten en ik hoop dat de stof in de samenvatting voldoende is.
INHOUDSOPGAVE
(Samenvatting van hoofdstukken van Field 4e editie, artikelen, colleges, oefeningen en SPSS-oefeningen)
Bijeenkomst 1 Herhaling en bias 1
Bijeenkomst 2 Correlaties en regressie 11
Bijeenkomst 3 Meer regressie 22
Bijeenkomst 4 Moderator en mediator 25
Bijeenkomst 5 ANOVA en ANCOVA 29
Bijeenkomst 6 Factor ANOVA 37
Bijeenkomst 7 Repeated measures design 43
Bijeenkomst 8 Mixed design 48
Overzichtstabel 52
Assignment artikelen 55
SPSS-meetings 61
,BIJEENKOMST 1 HERHALING EN BIAS
(Field hoofdstukken 2 & 4, college 1, artikel Simmons et al., 2011)
Hoofdstuk 2 Everything you never wanted to know about statistics
Bouwen van statistische modellen
Het testen van hypotheses bestaat ook uit het opbouwen van statistische modellen. Een statistisch
model moet de verzamelde data zo goed mogelijk representeren. In welke mate dit wordt gedaan
wordt ook wel de fit van het model genoemd. Er kan een onderscheid gemaakt worden tussen good
fit, moderate fit en poor fit.
Populaties en samples
Onderzoekers zijn geïnteresseerd in resultaten die toepasbaar zijn op de hele populatie. Een populatie
kan heel breed zijn (bijvoorbeeld alle mensen) of juist heel smal (bijvoorbeeld alle rode katten die Bob
heten). Vaak is het interessanter om iets te kunnen zeggen over een brede populatie.
Het is bijna onmogelijk om de hele populatie te testen voor resultaten. Om dit op te lossen wordt er
gewerkt met een sample. Het is belangrijk dat deze sample een weerspiegeling is van de populatie en
dus representatief is. Hoe groter de sample, hoe groter de kans hierop.
Statistische modellen
Statistische modellen bestaan uit variabelen en parameters. Variabelen zijn de gemeten constructen
en veranderen tussen samples en onderzoeken. Parameters zijn daarentegen constanter en
representeren relaties tussen de variabelen, voorbeelden zijn de mediaan of correlaties.
Þ Gemiddelde: alles bij elkaar optellen en dan delen door het aantal.
Om de fit van een model te berekenen:
Þ Totale error (sum of errors):
o Dus alle errors bij elkaar optellen
Þ Sum of squared errors (SS):
o Elke error wordt eerst in het kwadraat gezet en vervolgens bij elkaar opgeteld.
o Afhankelijk van de data: hoe meer data hoe groter de SS.
Þ Mean squared error (MSE):
o Hierbij deel je de SS door de degrees of freedom (df).
§ De df kan berekend worden door N – 1.
Het principe van het minimaliseren van de SS wordt ook wel method of least squares genoemd.
Verder dan de data
De standaarddeviatie vertelt ons hoe goed het gemiddelde de sample representeert. Wanneer er
meerdere samples genomen worden, zal het gemiddelde elke keer een beetje veranderen. Dit komt
doordat de samples veranderen en wordt sampling variation genoemd. Wanneer alles bij elkaar
gevoegd wordt (alle gemiddeldes) kan er een symmetrische distributie opgesteld worden wat een
sampling distribution heet. Hierdoor wordt het een betere representatie van de populatie.
De standaarddeviatie van een sample gemiddelde wordt ook wel de standaard error van de mean (SE)
genoemd. Vaak is het onmogelijk om alle samples te verzamelen en wordt er uitgegaan van een
‘ongeveer’ standaard error. De central limit theorem stelt dat wanneer een sample groter dan 30 is,
2
,het om een normale verdeling gaat met een gemiddelde die gelijk is aan de populatie gemiddelde en
een standaarddeviatie van .
Wanneer een sample kleiner is dan 30, is de distributie niet normaal verdeeld. Het heeft een andere
vorm waarbij er gesproken wordt van een t-verdeling.
Om een inschatting te maken binnen welke grenzen de populatie zal vallen, kunnen confidence
intervals (CI) ingezet worden. Bij een 95% CI is de kans 95% dat het populatie gemiddelde binnen deze
grenzen valt.
Þ 95% van de z-waarde valt tussen – 1.96 en + 1.96 bij een normale verdeling.
Þ Confidence interval =
o Je vermenigvuldigt de z-waarde met de SE en doet dan het gemiddelde – en + dit
getal.
Þ Z-scores:
Er kan ook gewerkt worden met een 90% of 99% confidence interval. In dit geval wordt er een andere
z-waarde gebruikt. Dit is terug te vinden in de tabel. Bij 99% hoort een z-waarde van 2.58 en bij 90%
1.64.
Wanneer een distributie niet normaal verdeeld is, wordt de t-waarde gebruikt in plaats van de z-
waarde. De df (N – 1) toont in de tabel aan wat de t-waarde is die gebruikt kan worden.
Gebruik van statistische modellen om onderzoeksvragen te testen
Er zijn verschillende benaderingen om hypotheses te testen. Wat het meest geleerd wordt is de
nulhypothese significantie test (NHST). Dit is ontstaan uit twee verschillende benaderingen:
- Ronald Fisher zijn idee van rekenen met kansen.
Þ Wanneer de uitkomst groter is dan kans.
Þ Fisher’s p-waarde: door een kans van 0.05 te nemen zou het niet op toeval kunnen
berusten.
- Neyman en Pearson hun idee van rekenen met hypotheses.
• Alternatieve hypothese (H1) = experimentele hypothese: het effect is aanwezig.
• Nulhypothese (H0): effect is niet aanwezig.
• Bij het testen van hypotheses kunnen er twee fouten gemaakt worden:
§ Type I-fout: H1 aannemen terwijl H0 correct is.
§ Type II-fout: H0 aannemen terwijl H1 correct is.
Het vermogen van een test om een effect te vinden wordt de power genoemd. Het hangt af van een
aantal dingen:
- Hoe groot het effect daadwerkelijk is, grotere effecten vallen meer op = effectgrootte.
- Hoe strikt een significantie is.
- De samplegrootte.
De NHST bevat verschillende basisassumpties:
1. Er wordt verwacht dat de nulhypothese waar is, dus dat er geen effect is.
2. Er wordt een statistisch model toegepast op de data dat de alternatieve hypothese
representeert en er wordt onderzocht hoe goed de fit is.
3. Om na te gaan hoe goed de fit is, wordt de kans (p-waarde) berekend.
3
, 4. Als de kans erg klein is (< .05) is de fit goed en wordt de nulhypothese verworpen (alternatieve
is dan dus waar).
Er kan een onderscheid gemaakt worden tussen twee vormen van variatie. Systematische variatie is
variatie dat uitgelegd kan worden aan de hand van het model dat bij de data past. Onsystematische
variatie kan niet uitgelegd worden aan de hand van het model. Om te concluderen of de hypothese
een goede verklaring biedt, moeten deze twee variaties vergeleken worden.
Þ De ratio hiervan wordt ook wel test statistic genoemd:
Een statistisch model dat een directionele hypothese (effect gaat een kant op) test, is een one-tailed
test. Het testen van een non-directionele hypothese (onduidelijk welke kant het op gaat) is een two-
tailed test.
De NHST heeft twee valkuilen:
1. Onduidelijk wat er uiteindelijk geconcludeerd kan worden: het is niet vanzelfsprekend dat het
effect belangrijk is. Ook betekenen niet-significante resultaten niet altijd dat de nulhypothese
waar is en significante resultaten dat de nulhypothese niet waar is.
2. Alles of niets denken: p < .05 wordt als exacte criteria gebruikt, wat voor misleiding kan
zorgen.
Moderne benaderingen voor theorie testen
Door de valkuilen wordt er anders gekeken naar het bewijs voor een hypothese. NHST wordt nog
steeds gebruikt, maar daarnaast moeten ook confidence levels en effectgroottes vernoemd worden
om een meer volledig beeld te krijgen.
Hoe groot een effect is, staat bekend als de effectgrootte. Dit wordt aangeduid als bijvoorbeeld de
Cohen’s d, de Pearson’s r of de kans ratio.
Þ Cohen’s d:
o Bij 0.2 wordt er gesproken van een klein effect, bij 0.5 van een gemiddeld effect en bij
0.8 van een groot effect.
Þ Pearson’s r:
o Bij .10 wordt er gesproken van een klein effect, bij .30 van een gemiddeld effect en bij
.50 van een groot effect.
Hoofdstuk 5 The beast of bias
Wat is bias?
Bias houdt in dat iemand het bewijs niet op een objectieve manier beoordeelt en dat andere dingen
hier invloed op hebben. Een bias kan optreden in drie gebieden, namelijk (1) parameters, (2)
standaard errors en betrouwbaarheidsintervallen, en (3) test statistieken en p-waardes. Het kan
invloed hebben op elkaar omdat sommige gebieden gebaseerd zijn op anderen.
Bias kan optreden wanneer er niet aan bepaalde assumpties wordt voldoen. Een outlier kan een
groter invloed hebben op bias. Het geeft namelijk een heel ander gemiddelde dan wanneer deze
outlier er niet geweest zou zijn. Ook geeft het een andere SS wat weer invloed heeft op heel veel
andere statistieken.
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper estherseverins. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €8,49. Je zit daarna nergens aan vast.