1) Correlatie of regressie
- Deze gebruiken enkel continue variabelen
- Verschillende vraagstelling! Je kan exact dezelfde variabelen hebben, maar toch ineens
een correlatie moeten doen en in een andere situatie de regressie. Afhankelijk van de
vraag zal je zien welke je moet uitvoeren.
- Er zijn altijd 2 of meer variabele
- Er zal een vraag zijn of er 1 afhankelijke variabele is en 1 of meer onafhankelijke
variabele.
o Als het antwoord ja is, zal je uitkomen bij regressie analyses : de sample en
multiple lineair regression. Er is hier ook geen causaliteit aanwezig.
o Als het antwoorde nee is, zal je uitkomen bij correlatie analyses : de pearson’s of
de spearman rank correlation.
- Voorbeeld: lengte en gewicht
o Bij correlatie:
Is er een verband tussen X en Y, hoe sterk is het verband tussen X en Y
Voorbeeld: is er een verband tussen de lengte en het gewicht?
X en Y gelijkwaardig, deze zijn inwisselbaar. Als je vraagt naar is er een
verband in lengte en gewicht of is er een verband in gewicht en lengte,
dit is op zich dezelfde vraag waarop het antwoord hetzelfde zal zijn
symmetrische analyse
X en Y vertegenwoordigen een aselecte steekproef, dit wil zeggen dat je
ze niet zelf kan kiezen de waarde van X en Y. de tijd is voorbeeld een
slechte variabelen, de tijd kan je zelf kiezen op welke tijdstippen je een
bepaalde meting doet.
o Bij regressie:
Heeft variabele X invloed op Y, hoe verandert Y met X, hoe voorspel je Y
gegeven X, effect van X op Y
Voorbeeld: voorspel de lengte van een persoon op basis van het gewicht
X en Y niet gelijkwaardig, Je kan deze dus niet van plaats wisselen, als je
het verwisseld is de vraag ook anders deze zijn duidelijk niet
gelijkwaardig : duidelijke outcome variabele, er is altijd een variabele die
je wilt weten hoe dat deze verandert. In dit geval is het de lengte, je wilt
weten hoe de lengte verandert afhankelijk van het gewicht.
Voorspel 1 variabele (Y) op basis van de andere (X)
Soms oorzaak en gevolg ( causaliteit) voorzichtig zijn met
interpretatie! Voorbeeld: je meet het aantal neerslag per dag en het
aantal verkeersongelukken, dan kan het zijn dat de verkeersongelukken
het gevolg is van de neerslag, de regen is de oorzaak en het accident is
het gevolg. Maar het wilt niet zeggen dat het perse het gevolg is van een
mogelijke oorzaak.
o Variabelen in de regressie
, X-variabele
Onafhankelijke variabelen
Input variabele
Verklarende (explanatory) variabele
Voorspellend (zal voorspelling doen voor y)
Covariaat
(oorzaak)
Y-variabele
Afhankelijke variabele, hoe is die afhankelijk van de x of aantal
x’en
Outcome variabele
Resultaatsvariabele
Wordt voorspeld, op basis van aantal variabele x of 1 x
(gevolg)
- Voorbeeld:
o Aantal modelprijs per 10 miljoen inwoners gemeten van verschillende landen.
Van dezelfde landen hebben ze ook de chocolade consumptie gemeten. Er
wordt gemeten hoeveel kilogram er per persoon per jaar wordt verbruikt. Er is
een sterke correlatie/verband tussen chocoladeconsumptie en de nobelprijs.
Hoe minder je chocolade consumeert, hoe minder nobelprijs. Je zou dus via een
regressie analyse het aantal nobelprijs kunnen voorspellen op basis van de
chocoladeconsumptie. Je kan een lijn doortrekken, op basis van de lijn kan je
zeggen op basis van de hoeveel chocolade consumptie dat je weet, dat je een
voorspelling kan doen over het aantal nobelprijs. Belangrijk om in te zien dat het
geen oorzaak-gevolg is, het is niet omdat een land veel chocolade eet, dat die
mensen ook slimmer zullen worden.
2) Pearson en spearman correlatie
- Het gaat het verband na tussen 2 continue variabelen
o Is er een verband of niet?
o Sterkte van het verband? Als er een verband is, kan dit ook een zwak verband
zijn. Waar je niet veel mee kunt.
- Parametrische en niet parametrische variant:
o Pearson (parametrisch), indien mogelijk altijd deze gebruiken.
o Spearman (niet-parametrisch)
- Voorwaarden pearson r
o Minstens 1 variabele is normaal verdeeld
o Zeer gevoelig voor outliers
o Lineair verband (geen duidelijk niet-lineair verband)
Wat is ok?
Alle punten min of meer op een rechte lijn
Een vormloze wolk
Wat is niet ok?
Duidelijke niet-lineaire verbanden
o Om te weten welk verband er is zal je een scatterplot moeten maken
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper diergeneeskundestudent2022. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €11,99. Je zit daarna nergens aan vast.