Week 1 - Correlaties en effectgroottes
Correlatie: is er een verband tussen twee variabelen
Pearson r: gestandaardiseerde maat die de lineaire relatie tussen 2 numerieke variabelen
beschrijft (x en y) -> door standaardisatie kunnen we verschillende schalen van variabelen
vergelijken
Variantie: afwijking van scores ten opzichte van het gemiddelde (spreiding van scores)
VariantieX = StandaardafwijkingX^2
Kan ook VariantieX berekenen via: sigma(individuele score - gemiddelde)^2 en dit
uiteindelijk delen door n - 1
Sigma = som van allen (zoals elke (individuele score - gemiddelde)^2 optellen)
Covariantie: relatie tussen spreiding van X en spreiding van Y (in welke mate covariëren
twee variabelen) -> moeilijk te interpreteren want is afhankelijk van schalen, kan dus niet
zeggen of covariantie van 100 veel is -> oplossing = standaardisatie
Berekening stappenplan:
- Bereken het gemiddelde van X en het gemiddelde van Y
- Bereken voor elke individuele score / datapunt (i) de afwijking van gem. X
- Bereken voor elke individuele score / datapunt (i) de afwijking van gem. Y
- Vermenigvuldig elke set waarden X en Y (in dezelfde rij)
- Tel deze vermenigvuldigde waarden op
- Deel dit door n (aantal personen) - 1
Correlatie is de lineaire samenhang tussen twee kwantitatieve variabelen (Pearson r)
Door standaardisatie kan je snel zien of een waarde dichtbij het gemiddelde ligt
Correlatie is de gestandaardiseerde covariantie (r), berekenen via:
r = Covariantie tussen X en Y : (wortel variantie x * variantie y)
Of via gestandaardiseerde scores (z-scores van X en Y):
r = (sigma z-score x * z-score y) : n - 1
Verdeling van z-waardes: gem = 0, sd = 1
Z-score per meting kan berekend worden via:
Zx = ( x - gem. x) : standaardafwijking x
Kenmerken van Pearson r:
- Sterkte van correlatiecoëfficiënt
.10 = zwak, .30 = matig en .50 = sterk
- Richting van correlatiecoëfficiënt: als coëfficiënt positief is, gaat een toename in
X-scores gepaard met een toename in Y-scores. Als coëfficiënt negatief is, gaat een
toename in X-scores gepaard met een afname in Y-scores.
Positief = r > 0, negatief = r < 0
- Vorm: relatie tussen 2 variabelen, lineair of niet-lineair
In tabel: des te meer punten op dezelfde lineaire lijn, des te sterker de relatie tussen
variabelen. + heterogeen = veel punten uit elkaar, homogeen = veel punten dichtbij elkaar.
Andere kenmerken van Pearson r: varieert altijd tussen -1 (perfect negatief) en 1 (perfect
positief), r kan ook gebruikt worden voor twee (on)afhankelijke variabelen zoals niet x en y
maar x1 en x2, geen samenhang = r = 0 en geen variantie = ook r = 0
,Factoren die r beïnvloeden: heterogene subgroepen, te weinig waarnemingen, uitbijters en
beperking van het bereik
Varianten van Pearson r voor verschillende meetniveaus:
Interval + interval = Pearson r (numeriek)
Ordinaal + ordinaal = Spearmans rho (rs) (bij rangscores)
Dichotoom + interval = Punt-biseriële correlatie (rpb)
Dichotoom + dichotoom = phi-coëfficiënt (o/)
Dichotoom: nominale (categorische) variabele met slechts twee categorieën
Ordinaal, interval en ratio = numeriek
Spearmans rho (rs): correlatie op basis van rangscores voor de ordinale variabelen
Berekening stappenplan:
- Scores per X en Y omzetten in rangscores (laagste score = 1, des te hoger des te
verder)
- Scores per X en Y sorteren van laag naar hoog
- Als twee variabelen dezelfde waarde hebben, krijgen ze allebei het gemiddelde van
beide rangscores die gegeven zouden worden (zoals 5 + 6 = 11 : 2 = 5,5)
- Gemiddelde en standaardafwijking van rangscores berekenen
Gem rangscore X = (N + 1) : 2
Sd = wortel van N(N + 1) : 2
N = totaal aantal respondenten
- Rangscores omzetten in z-scores
(Rangscore - gem. rangscore) : sd rangscores
- Elke set rangscores (zelfde rij) vermenigvuldigen
- Al deze producten bij elkaar optellen en dan delen door N - 1
Voorbeeld:
Wanneer spearmans rho gebruiken?
- Als er al rangscores worden gebruikt in tabel
- Als robuuste variant van Pearson r tegen uitbijters en tegen niet-lineairiteit
, Punt-biseriële correlatie (rpb): correlatie tussen numerieke variabele y en dichotome
variabele x
Berekening stappenplan:
- Z-scores berekenen voor x en y
Vvg Formule van pearson r volgen:
- Elke set z-scores (zelfde rij) vermenigvuldigen
- Al deze producten bij elkaar optellen en dan delen door N - 1
Voorbeeld:
Richting van coëfficiënt geeft niet direct informatie, doordat het afhangt van welke score op
dichotome variabele 0 is en welke 1 is.
Phi-coëfficiënt: beschrijft relatie tussen twee dichotome variabelen
Berekening stappenplan (zelfde als rpb) (algemene formule via pearson r)
- Z-scores berekenen voor X en Y
Vvg Formule van pearson r volgen:
- Elke set z-scores (zelfde rij) vermenigvuldigen
- Al deze producten bij elkaar optellen en dan delen door N - 1
Specifieke formule:
Relatie x2 en phi (alleen op 1 vrijheidsgraad)
- Phi = wortel(x2 : n)
- X2 = phi^2 * n
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller MarkDaniël. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.87. You're not tied to anything after your purchase.