Samenvatting bevat literatuurstof inclusief college. Zelf een 7,8 behaald met behulp van deze samenvatting voor iemand die heel slecht is in statistiek.
Er is sprake van een causaal verband als er aan deze criteria wordt voldaan:
1. Covariantie: geeft aan of en in welke richting twee variabelen met elkaar samenhangen. (Kan
ook geval zijn bij correlatie).
2. Directionaliteit: oorzaak gaat vooraf aan gevolg (kan ook bij correlatie).
3. Interne validiteit: alternatieve verklaringen worden uitgesloten
Beste onderzoeksmethoden om causaliteit te ontdekken is experimenteel onderzoek.
Variantie geeft de spreiding aan in een dataset t.o.v. het gemiddelde. Hoe meer data verspreid is, hoe
groter de variantie. Covariantie geeft aan of en in hoeverre twee variabelen samenhangen. Bijv. als X
omhooggaat, gaat Y ook omhoog. Covariantie geeft informatie over de sterkte en richting van de
samenhang. Het nadeel is dat covariantie moeilijk interpreteerbaar is, omdat de waarde niet is
gestandaardiseerd en dus afhankelijk is van de soort meeteenheid. Het is dus moeilijk te zeggen of een
waarde van 100 dan groot of klein is, omdat deze afhankelijk is van X en Y.
Oplossing: gestandaardiseerde covariantie. Andere benamingen hiervoor zijn de bivariate correlatie
en pearson r.
Pearson r berekenen r=
covariantie x en y
OF r =
∑ z x∗z y
√ Var X∗Var Y n−1
z x Betekent de gestandaardiseerde waarden van X.
Stappen correlatie berekenen met tweede formule:
1. Bereken de variantie van X en Y met ∑ ¿¿ ¿
2. Bereken dan weer de standaardfout door van beide antwoorden de wortel te nemen
xi −x
3. Bereken dan de z waarde door .
sx
4. Doe de z wat y en x keer elkaar en tel dit op
5. Deel door n - 1
Kenmerken van Pearson r:
- Waarde ligt altijd tussen -1 en + 1, waarbij +1 een positie verband en -1 negatief
- r kan ook worden gebruikt voor twee (on)afhankelijke variabelen
- r=0 betekend geen samenhang en variantie
- Verschillende factoren kunnen invloed hebben op de correlatie, zoals:
o Heterogene subgroepen
o Uitbijters, vooral van invloed bij kleine n (n<30)
o Niet lineaire verbanden
o Restriction of range, BV als de totale scores op een vragenlijst tussen de 0 en 100 liggen, maar
de onderzoekers kijken alleen naar degene die scoren tussen 30 en 50.
Het doel van standaardiseren is de schaal van een variabelen buiten beschouwing laten en snel te
kunnen zien of een waarde dichtbij of ver van het gemiddelde ligt. Kenmerken voor de verdeling van
de z-waarden:
- Gemiddelde = 0.
N (0,1)
- Standaardafwijking = 1
Kenmerken van een correlatiecoëfficiënt:
- Sterkte (zwak is 0,10, gemiddeld is 0,30, sterk is 0,50)
- Richting (positief bij r > 0 of negatief r < 0). Als er sprake Is van negatieve coëfficiënt zal de
X toenemen en de Y afnemen. Bij positieve coëfficiënt is er sprake als de X toeneemt en de Y
dat ook doet
, - Vorm (lineair vs. Niet lineair en
Homogeen vs. Heterogeen).
Welke soort correlatie je gebruikt hangt af
van het meetniveau van de variabelen.
- Nominaal: de data kennen alleen categorieën, zonder rang
- Ordinaal: de data kennen categorieën met rang
- Interval: sprake van rang en de stappen tussen de waarden zijn gelijk
- Ratio: sprake van rang en de stappen tussen de waarden zijn gelijk en er is een betekenisvol nulpunt
- Kwantitatieve gegevens: numerieke waarden die continu of discreet kunnen zijn en
onderworpen kunnen worden aan wiskundige operaties.
- Ordinale gegevens: gegevens die gerangschikt kunnen worden in een volgorde, maar
waarbij de onderlinge afstand tussen de waarden niet bekend of relevant is.
- Nominaal/dichotoom gegevens: gegevens die in categorieën of klassen zijn verdeeld,
zonder natuurlijke ordening tussen de categorieën (nominale gegevens) of slechts twee
mogelijke categorieën (dichotome gegevens).
Spearman’s rho r s
Als er nog geen rangorde is tussen de scores, dan moeten we de scores omzetten in rangnummers. En
dan pas kunnen we de pearson r gebruiken.
Stappen:
1. Zet de scores in een rangorde. Laagste score krijgt 1.
2. Sorteer de scores van laag naar hoog
n+1
3. Bereken het gemiddelde en standaardafwijking van de rangscores. Dit kan hierbij simpel door x= en
2
❑
standaardafwijking =
√ N ( N +1 )
12
rangnummer−x
4. Bereken de Z door het .
sx
5. Pas de pearson r toe door r =
∑ z x∗z y
n−1
Voordeel: spearman tho is een robuuste variant van pearson r bij uitbijters en zwakke niet lineairiteit
We gebruiken Spearman rho alleen:
- Als er sprake is van nominale interval
- Wanneer alleen een schatting nodig is en geen exacte score
, - Als een robuuste variant van Pearson r, want deze is niet gevoelig tegen uitschiters en niet-
lineairiteit
Punt-biseriële correlatie r pb (gebruiken we om twee groepen te vergelijken)
Wordt vaak gebruikt bij itemanalyse, waarbij goede en foute items van vragenlijsten worden
vergeleken
Stappen:
1. Bereken het gemiddelde van de condities. Dus BV je hebt 6x een 0 en 6x een 1 wordt het
gemiddelde 0,5 van x. En bereken het gemiddelde van Y
individuele conditie−x
2. Bereken de Z score .
sx
3. Bereken de correlatie r door de pearson toe te passen r =
∑ z x∗z y
n−1
De richting zegt hierbij niet direct iets over een positieve of negatieve correlatie, aangezien de richting
afhangt van welke nummer (BV 0 of 1) een groep heeft toegewezen. Dus stel rokers krijgen 0
toegewezen en niet rokers krijgen 1 toegewezen dan zou de correlatie negatief zijn, maar stel rokers
krijgen 1 en niet rokers 0, dan zou de correlatie positief zijn.
√
2
t
De punt-biseriële correlatie is verwant aan de onafhankelijke steekproeven t toets. r pb = 2
t +df
De r pb past bij meer samenhang en de t toets meer bij causale situaties
Phi-coëfficient
Kent zowel een algemene als specifieke formule van de correlatie
Stappen van de algemene formule:
1. Bereken het gemiddelde en standaardafwijking
conditie−x
2. Bereken de Z score . .
sx
3. Pas de pearson toe r =
∑ z x∗z y
n−1
Specifieke formule gebruiken we in situaties waar we te maken hebben met een tabel.
AD −BC
Formule daarbij is =
√( A+ B )( C+ D )( A+ C ) (B+ D)
Met de phi-coefficient kan de chi kwadraat x 2 worden berekend x 2=❑2∗n
√
2
Dus = x . Voor de df geldt wederom c-1 ¿r- 1. Met die chi kwadraat kunnen we testen of de toets
n
significant is.
Alle besproken correlaties die hierboven zijn besproken geven het verband tussen variabelen in een
steekproef weer. Maar resultaten hiervan moet uiteindelijk veralgemeend worden naar de hele
populatie. Daarom gebruiken we ook hierbij sigfnificantietoetsen.
1. Formuleer de hypothesen.
2. Bepaald het alfa niveau.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller yara20. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.51. You're not tied to anything after your purchase.