T-test: verschil tussen max 2 groepen
Twee verschillende soorten variabelen (nominaal en continu (interval/ratio))
ANOVA: verschil tussen meer dan 2 groepen
Twee verschillende soorten variabelen (nominaal en continu (interval/ratio))
Chi-square: geen verschil, maar relatie tussen groepen. Hierbij zijn de beide variabelen
categorisch (nominaal/ordinaal)
Dezelfde soort variabelen (categorisch (nominaal/ordinaal))
Correlatie: geen verschil, maar relatie tussen groepen. Hierbij zijn beide variabelen continu
(ratio/interval). Vertelt hoe sterk de (2) variabelen geassocieerd zijn dmv een coëfficiënt
Dezelfde soort variabelen (continu (interval/ratio))
Regressie: de relatie tussen groepen, waarbij beide variabelen continu (ratio/interval) zijn.
De waarde van de ene variabele dmv de andere variabele voorspellen (kan ook sterkte van
associatie geven, net zoals correlatie)
Dezelfde soort variabelen (continu (interval/ratio))
Factor: niveau van variabele, overkoepelende woord (factor = onafhankelijke variabele)
-> One-way ANOVA max 1 factor (onafhankelijke variabele), factorial ANOVA méér dan 1
factor
Level: de waardes die een factor kan aannemen
-> T-Test max 2 levels van één factor, ANOVA méér dan 2 levels van één factor
VOLLEDIGE notatie: volgens templates die ik heb uitgetypt per testtype (met 95%CI maakt het beter)
+ reliability analysis, wanneer er variabelen zijn samengevoegd tot één overkoepelende variabele
(ook al heb je deze overkoepelende variabele zelf niet gemaakt!)
,Welke kant gaat een verschil/uitkomst op?
- Kijk hiervoor naar de means, het verschil/de uitkomst gaat de richting op van de variabele met de
hoogste mean
- Geen mean? Bijvoorbeeld bij de expected en observed values, dan kijk je naar de expected values.
Hiervoor geldt wederom dat de uitkomst de richting opgaat van de hoogste expected value/odds.
Zskew: Skew/SE(skew), Zkurt: Kurt/SE(kurt) -> uitkomst tussen [-1.96, 1.96]
S. positief, rechts-scheef: ophoping bij de lage scores waardoor staart wijst naar hoge scores
S. negatief, linksscheef: ophoping bij de hoge scores, waardoor staart wijst naar lage scores
Homogeniteit, VR: grootste variantie/kleinste variantie -> uitkomst onder 2 is prima
Betrouwbaarheid (analysis -> factor -> reliability analysis)
- De score van respondenten op XXX is gemeten met de XXX-schaal, bestaande uit ... items op een ...-
punt Likertschaal. Het gemiddelde van de schaal was ... (SD = ...) en de betrouwbaarheid van de
schaal was goed/niet goed, α = ....
-> Hoger dan .65? Betrouwbaar genoeg! (tussen de 0.7 en 0.8 is het beste)
-> Alleen bij zelf constructvariabele maken (alle items apart en dan pas gemiddelde meten, indien
reliability goed is (omgedraaide item = lage reliability, dus die moet je eerste reverse
transformeren)), bijvoorbeeld bij verschillende items die met een Likert-schaal gemeten zijn
Effectgrootte (Cohen’s d), ALTIJD aangeven! (kun je aanvinken bij uitvoeren test)
Compute (‘’create new transform’’)
- In categorieën van gelijke percentages: ga eerst bij descriptives naar ‘’percentile values’’ -> ‘’cut
points for … different groups’’, transformeer vervolgens de variabele via ‘’variables’’ -> transform ->
In formulebox:
(PU3 opdr 5 en 6)
-> dit kan ook bij transform
-> Dit kan ook zonder gelijke percentages en
gewoon met groepering (bv leeftijdscategorieën,
dan sla je de stap met de percentages over en
transformeer je meteen via de formulebox)
- Gemiddelde van verschillende groepen samen: transformeer de variabele via ‘’variables’’ ->
‘’transform’’ -> In formulebox:
, Hypotheses testen
- Gegeven H0, indien p(Mdiff) kleiner of gelijk aan .05 -> Verwerp H0 (significant)
- Gegeven H0 indien p(Mdiff) groter is dan .05 ((-)1.96) -> Verwerp H0 niet
-> Wanneer je H0 niet verwerpt is er dus geen verschil tussen de verschillende variabelen
-> t(waarde df, dus totaal min aantal groepen) = waarde statistic ofwel de t, p = ……,
U = statistics, r = effectgrootte
Transform
- Wanneer variabelen ‘’reversed transformed’’ zijn gebruik je dit om ze allemaal of de gewenste
variabelen om te draaien
(kijk via ‘’variables’’ description welke waarde welk nummer heeft)
- Je kunt ook < of > tekens etc gebruiken
Confidence interval
- 95%CI: Dit betekent dat als je de studie nog 100 keer doet/uitvoert, 95% van het
vertrouwensinterval het ware populatiegemiddelde omvat
Gegevens noteren volgens APA (NIET t-tests)
- On average, people who use social media spend a little less than 4 hours per day on their phone (M
= 3.87 [3.63, 4.10], SD = 2.71), while people who do not use social media on average spend only a
little more than 2 hours on their phone (M = 2.26 [1.31, 3.20], SD = 1.96).
Mogelijke interpretatie bar charts
- De betrouwbaarheidsintervallen overlappen elkaar – sterker nog: het ene CI lijkt binnen de grenzen
van het andere CI te liggen. De kans is groot dat de werkelijke populatiegemiddelden vergelijkbaar
zijn: de groepen verschillen niet in …………..
- De betrouwbaarheidsintervallen overlappen elkaar niet. Dit betekent dat we de hypothese kunnen
accepteren dat ..... hoger/lager is dan het werkelijke populatiegemiddelde voor .......
Histogram & boxplot
- Histogram: vink altijd aan dat je ook de lijn van normaliteit (normaalcurve) te zien krijgt in het figuur
- Boxplot: als je outliers verwijderd, dan zijn de scores meer normaal verdeeld dan eerst. Echter kan
het nog steeds een beetje skewed zijn of kurtosis bevatten (uitrekenen)
Visualiseert de mediaan, min en max scores en de verdeling van kwartielen