1) Correlatie of regressie
- Deze gebruiken enkel continue variabelen
- Verschillende vraagstelling! Je kan exact dezelfde variabelen hebben, maar toch ineens
een correlatie moeten doen en in een andere situatie de regressie. Afhankelijk van de
vraag zal je zien welke je moet uitvoeren.
- Er zijn altijd 2 of meer variabele
- Er zal een vraag zijn of er 1 afhankelijke variabele is en 1 of meer onafhankelijke
variabele.
o Als het antwoord ja is, zal je uitkomen bij regressie analyses : de sample en
multiple lineair regression. Er is hier ook geen causaliteit aanwezig.
o Als het antwoorde nee is, zal je uitkomen bij correlatie analyses : de pearson’s of
de spearman rank correlation.
- Voorbeeld: lengte en gewicht
o Bij correlatie:
Is er een verband tussen X en Y, hoe sterk is het verband tussen X en Y
Voorbeeld: is er een verband tussen de lengte en het gewicht?
X en Y gelijkwaardig, deze zijn inwisselbaar. Als je vraagt naar is er een
verband in lengte en gewicht of is er een verband in gewicht en lengte,
dit is op zich dezelfde vraag waarop het antwoord hetzelfde zal zijn
symmetrische analyse
X en Y vertegenwoordigen een aselecte steekproef, dit wil zeggen dat je
ze niet zelf kan kiezen de waarde van X en Y. de tijd is voorbeeld een
slechte variabelen, de tijd kan je zelf kiezen op welke tijdstippen je een
bepaalde meting doet.
o Bij regressie:
Heeft variabele X invloed op Y, hoe verandert Y met X, hoe voorspel je Y
gegeven X, effect van X op Y
Voorbeeld: voorspel de lengte van een persoon op basis van het gewicht
X en Y niet gelijkwaardig, Je kan deze dus niet van plaats wisselen, als je
het verwisseld is de vraag ook anders deze zijn duidelijk niet
gelijkwaardig : duidelijke outcome variabele, er is altijd een variabele die
je wilt weten hoe dat deze verandert. In dit geval is het de lengte, je wilt
weten hoe de lengte verandert afhankelijk van het gewicht.
Voorspel 1 variabele (Y) op basis van de andere (X)
Soms oorzaak en gevolg ( causaliteit) voorzichtig zijn met
interpretatie! Voorbeeld: je meet het aantal neerslag per dag en het
aantal verkeersongelukken, dan kan het zijn dat de verkeersongelukken
het gevolg is van de neerslag, de regen is de oorzaak en het accident is
het gevolg. Maar het wilt niet zeggen dat het perse het gevolg is van een
mogelijke oorzaak.
o Variabelen in de regressie
, X-variabele
Onafhankelijke variabelen
Input variabele
Verklarende (explanatory) variabele
Voorspellend (zal voorspelling doen voor y)
Covariaat
(oorzaak)
Y-variabele
Afhankelijke variabele, hoe is die afhankelijk van de x of aantal
x’en
Outcome variabele
Resultaatsvariabele
Wordt voorspeld, op basis van aantal variabele x of 1 x
(gevolg)
- Voorbeeld:
o Aantal modelprijs per 10 miljoen inwoners gemeten van verschillende landen.
Van dezelfde landen hebben ze ook de chocolade consumptie gemeten. Er
wordt gemeten hoeveel kilogram er per persoon per jaar wordt verbruikt. Er is
een sterke correlatie/verband tussen chocoladeconsumptie en de nobelprijs.
Hoe minder je chocolade consumeert, hoe minder nobelprijs. Je zou dus via een
regressie analyse het aantal nobelprijs kunnen voorspellen op basis van de
chocoladeconsumptie. Je kan een lijn doortrekken, op basis van de lijn kan je
zeggen op basis van de hoeveel chocolade consumptie dat je weet, dat je een
voorspelling kan doen over het aantal nobelprijs. Belangrijk om in te zien dat het
geen oorzaak-gevolg is, het is niet omdat een land veel chocolade eet, dat die
mensen ook slimmer zullen worden.
2) Pearson en spearman correlatie
- Het gaat het verband na tussen 2 continue variabelen
o Is er een verband of niet?
o Sterkte van het verband? Als er een verband is, kan dit ook een zwak verband
zijn. Waar je niet veel mee kunt.
- Parametrische en niet parametrische variant:
o Pearson (parametrisch), indien mogelijk altijd deze gebruiken.
o Spearman (niet-parametrisch)
- Voorwaarden pearson r
o Minstens 1 variabele is normaal verdeeld
o Zeer gevoelig voor outliers
o Lineair verband (geen duidelijk niet-lineair verband)
Wat is ok?
Alle punten min of meer op een rechte lijn
Een vormloze wolk
Wat is niet ok?
Duidelijke niet-lineaire verbanden
o Om te weten welk verband er is zal je een scatterplot moeten maken
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller diergeneeskundestudent2022. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $13.02. You're not tied to anything after your purchase.