100% tevredenheidsgarantie Direct beschikbaar na je betaling Lees online óf als PDF Geen vaste maandelijkse kosten 4.2 TrustPilot
logo-home
College aantekeningen

Statistiek III - College 4

Beoordeling
-
Verkocht
-
Pagina's
16
Geüpload op
18-03-2021
Geschreven in
2020/2021

Aantekeningen College 4 Statistiek 3 (bachelor psychologie Groningen)











Oeps! We kunnen je document nu niet laden. Probeer het nog eens of neem contact op met support.

Documentinformatie

Geüpload op
18 maart 2021
Aantal pagina's
16
Geschreven in
2020/2021
Type
College aantekeningen
Docent(en)
Edith van krimpen
Bevat
College 4

Voorbeeld van de inhoud

College 4

Logistische regressie




In een lineair regressiemodel zijn de onafhankelijke variabelen continue variabelen of
codevariabelen. Maar de afhankelijke variabele y moet een continue variabele zijn.
Wat als we een niet-continue variabele willen voorspellen?

Dichotome y:



Voorbeelden:
- Het effect van studietijd op het wel of niet halen van een tentamen
- Het effect van het roken van een aantal sigaretten op het wel of niet krijgen van kanker
- De relatie tussen het aantal rijlessen en het wel of niet halen van het rij-examen
1 = het gebeurt wel, 0 = het gebeurt niet
Dit kan allemaal ook in de context van meerdere onafhankelijke variabelen.

Vraag: als je een codevariabele hebt (met waarde 0 of 1), welke van de onderstaande opties is
correct?
a) Multipele lineaire regressie is niet mogelijk
b) Logistische regressie moet altijd gebruikt worden
c) Multipele lineaire regressie kan gebruikt worden als de DV (y) een codevariabele is
d) Multipele lineaire regressie kan gebruikt worden als de IV (x) een codevariabele is

Voorbeeld: tentamenresultaten
252 psychologiestudenten namen deel aan de eerste tentamenkansen van statistiek 1a en statistiek
1b. Kunnen we het wel/niet halen van stat1B voorspellen met de score op stat1A?
Onafhankelijke variabele = cijfer op stat1A
Afhankelijke variabele = wel/niet stat1B voldoende

,De data:




Dus van de studenten die een 6 hebben gehaald op stat1A, zijn er 22 die stat1B niet halen en 39 die
stat1B wel halen.
Er lijkt een relatie te zijn:




Als we hier een scatterplot van maken:




De onafhankelijke variabele staat op de horizontale as, de afhankelijke variabele staat op de verticale
as. De punten liggen op 0 of 1, want er zijn maar twee mogelijke uitkomsten van de y-variabele.
Punten die dikker zijn komen vaker voor. Maar dit plaatje zegt verder niet zo veel.

Maar hoe moeten we dit modelleren?
Een lineair regressiemodel is niet geschikt.
geeft de volgende resultaten:

, Problemen:


Hoe moeten we dit interpreteren?
Je zou kunnen zeggen dat we de kans voorspellen, dus als iemand een 6 haalt op stat1A is de kans op
het halen van stat1B 66%. Maar zoals je ziet werkt dat niet voor als iemand een 10 heeft gehaald, je
kan geen kans van 111% hebben.




Dus als Y dichotoom is, is het gemiddelde van variabele Y de kans op succes. Want als je kijkt naar
dichotome data en je heb het over gemiddelde, dan heb je het eigenlijk over proporties of kansen.
Dus: de gemiddelde waarde Y is de kans op succes.
Wat we dus eigenlijk doen is kansen voorspellen.




Als je het hebt over kansen moet er een waarde uitkomen tussen 0 en 1. Dus het blijft nog steeds
problematisch.
Zie het spreidingsdiagram:




Er is sprake van ernstige schending van de assumpties. De verdeling is niet-lineair en de residuen zijn
duidelijk niet willekeurig verdeeld (ze zijn niet onafhankelijk van x) en de variantie is niet gelijk
gespreid (geen homoscedasticiteit).




Het lineaire regressiemodel is ongeschikt als Y dichotoom is (0-1 scoring), want er wordt niet voldaan
aan de assumpties van homoscedasticiteit en normaliteit van residuen. De onafhankelijkheid van de
waarnemingen kan kloppen maar de onafhankelijkheid van de residuen is geschonden.

Maak kennis met de verkoper

Seller avatar
De reputatie van een verkoper is gebaseerd op het aantal documenten dat iemand tegen betaling verkocht heeft en de beoordelingen die voor die items ontvangen zijn. Er zijn drie niveau’s te onderscheiden: brons, zilver en goud. Hoe beter de reputatie, hoe meer de kwaliteit van zijn of haar werk te vertrouwen is.
femkebvanrijn Rijksuniversiteit Groningen
Bekijk profiel
Volgen Je moet ingelogd zijn om studenten of vakken te kunnen volgen
Verkocht
173
Lid sinds
6 jaar
Aantal volgers
127
Documenten
75
Laatst verkocht
2 weken geleden

4,2

22 beoordelingen

5
9
4
11
3
1
2
0
1
1

Recent door jou bekeken

Waarom studenten kiezen voor Stuvia

Gemaakt door medestudenten, geverifieerd door reviews

Kwaliteit die je kunt vertrouwen: geschreven door studenten die slaagden en beoordeeld door anderen die dit document gebruikten.

Niet tevreden? Kies een ander document

Geen zorgen! Je kunt voor hetzelfde geld direct een ander document kiezen dat beter past bij wat je zoekt.

Betaal zoals je wilt, start meteen met leren

Geen abonnement, geen verplichtingen. Betaal zoals je gewend bent via iDeal of creditcard en download je PDF-document meteen.

Student with book image

“Gekocht, gedownload en geslaagd. Zo makkelijk kan het dus zijn.”

Alisha Student

Veelgestelde vragen