1) Correlatie of regressie
- Deze gebruiken enkel continue variabelen
- Verschillende vraagstelling! Je kan exact dezelfde variabelen hebben, maar toch ineens
een correlatie moeten doen en in een andere situatie de regressie. Afhankelijk van de
vraag zal je zien welke je moet uitvoeren.
- Er zijn altijd 2 of meer variabele
- Er zal een vraag zijn of er 1 afhankelijke variabele is en 1 of meer onafhankelijke
variabele.
o Als het antwoord ja is, zal je uitkomen bij regressie analyses : de sample en
multiple lineair regression. Er is hier ook geen causaliteit aanwezig.
o Als het antwoorde nee is, zal je uitkomen bij correlatie analyses : de pearson’s of
de spearman rank correlation.
- Voorbeeld: lengte en gewicht
o Bij correlatie:
Is er een verband tussen X en Y, hoe sterk is het verband tussen X en Y
Voorbeeld: is er een verband tussen de lengte en het gewicht?
X en Y gelijkwaardig, deze zijn inwisselbaar. Als je vraagt naar is er een
verband in lengte en gewicht of is er een verband in gewicht en lengte,
dit is op zich dezelfde vraag waarop het antwoord hetzelfde zal zijn
symmetrische analyse
X en Y vertegenwoordigen een aselecte steekproef, dit wil zeggen dat je
ze niet zelf kan kiezen de waarde van X en Y. de tijd is voorbeeld een
slechte variabelen, de tijd kan je zelf kiezen op welke tijdstippen je een
bepaalde meting doet.
o Bij regressie:
Heeft variabele X invloed op Y, hoe verandert Y met X, hoe voorspel je Y
gegeven X, effect van X op Y
Voorbeeld: voorspel de lengte van een persoon op basis van het gewicht
X en Y niet gelijkwaardig, Je kan deze dus niet van plaats wisselen, als je
het verwisseld is de vraag ook anders deze zijn duidelijk niet
gelijkwaardig : duidelijke outcome variabele, er is altijd een variabele die
je wilt weten hoe dat deze verandert. In dit geval is het de lengte, je wilt
weten hoe de lengte verandert afhankelijk van het gewicht.
Voorspel 1 variabele (Y) op basis van de andere (X)
Soms oorzaak en gevolg ( causaliteit) voorzichtig zijn met
interpretatie! Voorbeeld: je meet het aantal neerslag per dag en het
aantal verkeersongelukken, dan kan het zijn dat de verkeersongelukken
het gevolg is van de neerslag, de regen is de oorzaak en het accident is
het gevolg. Maar het wilt niet zeggen dat het perse het gevolg is van een
mogelijke oorzaak.
o Variabelen in de regressie
, X-variabele
Onafhankelijke variabelen
Input variabele
Verklarende (explanatory) variabele
Voorspellend (zal voorspelling doen voor y)
Covariaat
(oorzaak)
Y-variabele
Afhankelijke variabele, hoe is die afhankelijk van de x of aantal
x’en
Outcome variabele
Resultaatsvariabele
Wordt voorspeld, op basis van aantal variabele x of 1 x
(gevolg)
- Voorbeeld:
o Aantal modelprijs per 10 miljoen inwoners gemeten van verschillende landen.
Van dezelfde landen hebben ze ook de chocolade consumptie gemeten. Er
wordt gemeten hoeveel kilogram er per persoon per jaar wordt verbruikt. Er is
een sterke correlatie/verband tussen chocoladeconsumptie en de nobelprijs.
Hoe minder je chocolade consumeert, hoe minder nobelprijs. Je zou dus via een
regressie analyse het aantal nobelprijs kunnen voorspellen op basis van de
chocoladeconsumptie. Je kan een lijn doortrekken, op basis van de lijn kan je
zeggen op basis van de hoeveel chocolade consumptie dat je weet, dat je een
voorspelling kan doen over het aantal nobelprijs. Belangrijk om in te zien dat het
geen oorzaak-gevolg is, het is niet omdat een land veel chocolade eet, dat die
mensen ook slimmer zullen worden.
2) Pearson en spearman correlatie
- Het gaat het verband na tussen 2 continue variabelen
o Is er een verband of niet?
o Sterkte van het verband? Als er een verband is, kan dit ook een zwak verband
zijn. Waar je niet veel mee kunt.
- Parametrische en niet parametrische variant:
o Pearson (parametrisch), indien mogelijk altijd deze gebruiken.
o Spearman (niet-parametrisch)
- Voorwaarden pearson r
o Minstens 1 variabele is normaal verdeeld
o Zeer gevoelig voor outliers
o Lineair verband (geen duidelijk niet-lineair verband)
Wat is ok?
Alle punten min of meer op een rechte lijn
Een vormloze wolk
Wat is niet ok?
Duidelijke niet-lineaire verbanden
o Om te weten welk verband er is zal je een scatterplot moeten maken
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur diergeneeskundestudent2022. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €11,99. Vous n'êtes lié à rien après votre achat.