Hoorcollege 1 – Regressieanalyse
Opzet hoorcolleges:
Toelichting op cursusstof
- Illustraties van statistische concepten
- Illustraties van de practicumopgaven
- Blokken van 25-30 minuten, met 5 minuten pauze ertussen
- Vragen stellen kan via chat; mag ook via microfoon
- Hoorcollege wordt opgenomen
- Belangrijke mededelingen ook altijd op Nestor
Oefenen met stof aan de hand van opgaven
• Practicum in Bb Collaborate Ultra
• Geen aanwezigheidsplicht
• Opgaven representatief voor tentamen
• Antwoorden woensdag na 17 uur op Nestor
• Iedere student ingedeeld in practicum van 2 uur
Tijdens deze 2 uur gelegenheid vragen te stellen aan practicumbegeleider (Elianne, Ymke, Jochem)
Buiten het practicum, vragen stellen aan Matthijs
Wekelijks practicum van 2 uur
• Bb Collaborate Ultra
• Alleen of samenwerken (2, 3, 4 studenten) aan opgaven
• 20 breakout-groepen (parallelgroepen): in deze groepen kan je afspreken met andere
studenten (geen vaste indeling)
• Je kan je practicumbegeleider (Elianne, Ymke, Jochem) bij jullie groep roepen via chat
• Werken buiten Bb Collaborate Ultra (bijv. Skype, Meet) is ook prima
Kom terug naar Bb Collaborate Ultra als je een vraag hebt
Materiaal
Statistical Methods for the Social Sciences
- 4e druk: Agresti en Finlay (2014)
- 5e druk Agresti (2018)
Collegeslides (via Nestor)
Practicumopgaven (via Nestor)
Wat wordt van jullie wekelijks verwacht?
Stof lezen
• Voor elk hoorcollege literatuur bestuderen
Practicumopgaven maken en begrijpen
Bij vragen (alles m.b.t. cursus)
• m.j.warrens@rug.nl
• Ik blijf ook na ieder hoorcollege hangen voor vragen
• Videobellen kan ook, op afspraak
Toetsing Statistische modellen 2
• 23 maart en 18 juni 2021
• Data-analyseopdracht met statistische modellen
, • 3 uur de tijd
• Iedere student werkt met een uniek SPSS-databestand
• Uitwerkingen in een Word-document met plaatjes en tabellen, en inleveren via Nestor
Eindcijfer = cijfer voor de opdracht
Overzicht Cursus
1. Regressieanalyse
2. Multivariate relaties
3. Variantieanalyse
4. Covariantieanalyse
5. Regressieanalyse met categorische predictoren
6. Logistische regressieanalyse
7. Repeated measures ANOVA
Een van de leerdoelen van de cursus (verschillende modellen en gebruiken bij verschillende
onderzoeksvragen). Afhankelijke van het meetniveau zijn er verschillende modellen die je kunt
gebruiken.
Welk model?
Onafh. Afh.
X1 X2 Y Model
DUM INT t-toets voor onafhankelijke groepen
NOM INT éénwegvariantieanalyse (ANOVA)
NOM NOM INT tweewegvariantieanalyse (ANOVA)
INT INT enkelvoudige regressieanalyse
INT INT INT multipele regressieanalyse
INT NOM INT covariantieanalyse
INT DUM DUM logistische regressieanalyse
Overzicht vandaag
1. Lineaire relaties
2. Statistisch model
3. SPSS analyse
4. Verklaarde variantie
5. Assumpties
6. Voorbeeld met 4 voorspellers (multiple)
7. Afwijkingen in data + mogelijke oplossingen
Waarom een lineaire regressieanalyse?
Relatie tussen intervalvariabelen
In veel onderzoekssituaties zijn er intervalvariabelen (INT) waarbij heel veel verschillende waardes
zijn als je dat gaat meten bij mensen.
Voorbeelden:
• Lengte, gewicht, leeftijd
• Schaalscores voor introversie, depressie, coping, attitude met instrumenten
• Vaardigheidsscores voor taal, rekenen volgen bijvoorbeeld uit een toets als CITO etc.
Vanuit een wetenschappelijke theorie hebben we vaak verwachtingen over hoe variabelen gerelateerd
zijn
,Hoe kan je een relatie uitdrukken? Variabelen op zich bestuderen is leuk maar het wordt pas
interessant als je met elkaar gaat vergelijken
Voorbeeld
Onderzoek naar depressie en coping
Steekproef van N = 84 random geselecteerde RUG-studenten
Twee variabelen
• BDI (Beck Depression Inventory) kun je depressie mee meten 0 − 9 weinig, 10 − 18
mild, 19 − 29 matig, 30 − 63 zware depressie
• Coping score 0 = geen coping, 10 = goed kunnen omgaan met tegenslag
Onderzoeksvraag
Is er een relatie tussen BDI en coping (in de populatie)?
- (Als er een relatievraag gesteld wordt dan bedoelen ze altijd voor een grotere groep dan voor
de steekproef, als ze een wetenschappelijke theorie willen bestuderen)
- Als een steekproef getrokken wordt, over welke groep kun je dan een uitspraak doen?
- Als je alleen maar wil weten wat in de steekproef geldt dan hoef je niet te toetsen want dat kun
je gewoon zien
Spreidingsdiagram
Wat valt op?
- Je ziet een trend van L boven naar R
onder.
Hogere scores op coping, lagere score op BDI
richting
Hoe sterk is de relatie?
Veronderstel relatie is lineair
à Toename in coping is proportioneel
t.o.v. afname BDI
Een lineair model werkt goed in de praktijk
Waarom werken we veel met lineaire regressie
(met lijnen?)
- Het is een simpel model (niet veel
parameters nodig), alleen een richting
en startpunt
- Maar het werkt ook heel goed in de
praktijk (bij veel, niet alles).
Lineaire relatie
Een lineair model werkt goed in de praktijk
, • Het blijkt dat veel relaties tussen twee intervalvariabelen met een lineair verband zijn samen te
vatten
Een lijn wordt beschreven door een helling
Dit getal (= parameter) geeft
• Richting van relatie weer
• Interpretatie aan relatie
Verschillende lijnen mogelijk
Welke? Eentje die ook een maat voor sterkte relatie geeft
Hoe sterk is het?
Kleinste kwadratensom residuen
Welke lijn kiezen we?
• Bereken alle residuen (= afstanden punten tot lijn)
• Kwadrateer alle residuen
• Tel alle gekwadrateerde residuen op
• Lijn kiezen zodat deze som zo klein mogelijk is
Kleinste kwadratensom van residuen is uniek unieke lijn
Voorbeeld
Met kleinste kwadratenlijn kunnen we nu een aantal vragen beantwoorden
Onderzoeksvraag 1
Is er een lineaire relatie tussen BDI en coping in de populatie?
Onderzoeksvraag 2
Hoe sterk is de lineaire relatie tussen BDI en coping?
1 en 2 samen Pearson correlatie
Onderzoeksvraag 3 (1 + 2)
Kan BDI voorspeld worden door coping?
Enkelvoudige regressieanalyse (= regressieanalyse met één voorspeller)
Verderop in HC kijken naar multiple regressie.
Pearson correlatie, wat is de samenhang tussen 2 dingen (maat voor een lineaire lijn)
Onderzoeksvraag 1
Is er een relatie tussen BDI en coping in de populatie?
Pearson correlatie
SPSS:
• Maat voor sterkte lineaire relatie