In een lineair regressiemodel zijn de onafhankelijke variabelen continue variabelen of
codevariabelen. Maar de afhankelijke variabele y moet een continue variabele zijn.
Wat als we een niet-continue variabele willen voorspellen?
Dichotome y:
Voorbeelden:
- Het effect van studietijd op het wel of niet halen van een tentamen
- Het effect van het roken van een aantal sigaretten op het wel of niet krijgen van kanker
- De relatie tussen het aantal rijlessen en het wel of niet halen van het rij-examen
1 = het gebeurt wel, 0 = het gebeurt niet
Dit kan allemaal ook in de context van meerdere onafhankelijke variabelen.
Vraag: als je een codevariabele hebt (met waarde 0 of 1), welke van de onderstaande opties is
correct?
a) Multipele lineaire regressie is niet mogelijk
b) Logistische regressie moet altijd gebruikt worden
c) Multipele lineaire regressie kan gebruikt worden als de DV (y) een codevariabele is
d) Multipele lineaire regressie kan gebruikt worden als de IV (x) een codevariabele is
Voorbeeld: tentamenresultaten
252 psychologiestudenten namen deel aan de eerste tentamenkansen van statistiek 1a en statistiek
1b. Kunnen we het wel/niet halen van stat1B voorspellen met de score op stat1A?
Onafhankelijke variabele = cijfer op stat1A
Afhankelijke variabele = wel/niet stat1B voldoende
,De data:
Dus van de studenten die een 6 hebben gehaald op stat1A, zijn er 22 die stat1B niet halen en 39 die
stat1B wel halen.
Er lijkt een relatie te zijn:
Als we hier een scatterplot van maken:
De onafhankelijke variabele staat op de horizontale as, de afhankelijke variabele staat op de verticale
as. De punten liggen op 0 of 1, want er zijn maar twee mogelijke uitkomsten van de y-variabele.
Punten die dikker zijn komen vaker voor. Maar dit plaatje zegt verder niet zo veel.
Maar hoe moeten we dit modelleren?
Een lineair regressiemodel is niet geschikt.
geeft de volgende resultaten:
, Problemen:
Hoe moeten we dit interpreteren?
Je zou kunnen zeggen dat we de kans voorspellen, dus als iemand een 6 haalt op stat1A is de kans op
het halen van stat1B 66%. Maar zoals je ziet werkt dat niet voor als iemand een 10 heeft gehaald, je
kan geen kans van 111% hebben.
Dus als Y dichotoom is, is het gemiddelde van variabele Y de kans op succes. Want als je kijkt naar
dichotome data en je heb het over gemiddelde, dan heb je het eigenlijk over proporties of kansen.
Dus: de gemiddelde waarde Y is de kans op succes.
Wat we dus eigenlijk doen is kansen voorspellen.
Als je het hebt over kansen moet er een waarde uitkomen tussen 0 en 1. Dus het blijft nog steeds
problematisch.
Zie het spreidingsdiagram:
Er is sprake van ernstige schending van de assumpties. De verdeling is niet-lineair en de residuen zijn
duidelijk niet willekeurig verdeeld (ze zijn niet onafhankelijk van x) en de variantie is niet gelijk
gespreid (geen homoscedasticiteit).
Het lineaire regressiemodel is ongeschikt als Y dichotoom is (0-1 scoring), want er wordt niet voldaan
aan de assumpties van homoscedasticiteit en normaliteit van residuen. De onafhankelijkheid van de
waarnemingen kan kloppen maar de onafhankelijkheid van de residuen is geschonden.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper femkebvanrijn. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €2,99. Je zit daarna nergens aan vast.