Colleges Statistiek B
Algemene leerdoelen
Na afloop van het vak kan de student:
Kunnen begrijpen en hanteren van veelgebruikte statistische terminologie;
Kunnen beoordelen welke statistische methode nodig is voor het beantwoorden van
kwantitatieve onderzoeksvragen;
Zelfstandig multivariate statistische analyses kunnen uitvoeren en de uitkomsten kunnen
interpreteren;
Een kritische beoordeling kunnen geven van de in wetenschappelijke publicaties
gehanteerde statistische methoden en de daaruit getrokken conclusies
Verplichte literatuur
Betty R. Kirkwood en Jonathan A.C. Sterne, Essential Medical Statistics, 2 e editie, 2003,
Blackwell Science Ltd. (ISBN: 9780865428713)
Theorie Statistiek A
1 t/m 8 Wordt bekend verondersteld
14 Wordt bekend verondersteld
§15.1; §15.2; §15.7 Wordt bekend verondersteld
§17.1; §17.2; §17.4 Wordt bekend verondersteld
§30.1; §30.2 (behalve het zelf kunnen berekenen van Wordt bekend verondersteld
‘95% confidence interval for median differences’ en het
zelf kunnen berekenen van Kendall’s tau)
§35.6; §35.7 Wordt bekend verondersteld
§36.1; §36.2 Wordt bekend verondersteld
Theorie Statistiek B
Hoofdstuk Te bestuderen
9 §9.1; §9.2; §9.3
10 §10.1; §10.2 behalve
- pg 91: niet met de hand kunnen berekenen van s.e. (β0) en s.e. (β1),
wel via een computerprogramma (SPSS);
- pg 92 punt 4: niet met de hand kunnen berekenen van
betrouwbaarheidsinterval, wel kunnen interpreteren;
- pg 93: de berekening van de standard error of y
- Fisher’s transformatie
§10.3; §10.4; §10.5
11 Geheel
12 §12.1;§12.2 (lezen); §12.3 tot ‘influence’;§12.4 (lezen)
16 §16.2;§16.6 (over odds ratio’s)
18 §18.2; §18.3; §18.5
19 §19.1; §19.2 tot ‘The logistic regression model on a log scale’; §19.3; §19.4
20 §20.2; §20.3; §20.5
29 §29.7; §29.8
38 Geheel
, Redekop, W. K., Koopmanschap, M. A., Rutten, G. E. H. M., Wolffenbuttel, B. H. R., Stolk,
R. P., & Niessen, L. W. (2002). Resource consumption and costs in Dutch patients with
type 2 diabetes mellitus. Results from 29 general practices. Diabetic Medicine, 19(3),
246-253.
Redekop, W. K., Koopmanschap, M. A., Rutten, G. E. H. M., Wolffenbuttel, B. H. R., Stolk,
R. P., & Niessen, L. W. (2002). Health-Related Quality of Life and Treatment Satisfaction
in Dutch patients with type 2 diabetes, Diabetes Care, 25(3), 458-463.
Thrane, C. (2006) Explaining educational-related inequalities in health: Mediation and
Moderator models, Social Science & Medicine 62(2), 467-478.
Carrière, I., D. Villebrun, K. Pérès, R. Stewart, K. Richie and M.L. Ancelin (2009) Modelling
complex pathways between late-life depression and disability: evidence for mediating
and moderating factors, Psychological Medicine 39(10), 1587-1590.
Handout factoranalyse en betrouwbaarheidsanalyse (op Canvas)
SPSS-reader (op Canvas)
Reader met opgaven en opdrachten (op Canvas)
Reader met uitwerkingen opgaven en opdrachten (op Canvas)
Aanbevolen literatuur
Pallant, SPSS Survival Manual. Open University Press. 2016 6e
druk (ISBN: 9780335261543). Een eerdere versie is ook goed bruikbaar.
Of
Field, A Discovering statistics using SPSS. Sage Publications. 2013 4e druk.
(ISBN: 9781446249185). Een eerdere versie is ook goed bruikbaar.
Of
Een ander (Nederlandstalig) SPSS boek is ook goed. Deze boeken kunnen ook worden
gebruikt bij Statistiek B en bij Kwantitatief Leeronderzoek.
,Week 1
HC1: Correlatie en lineaire regressie
Toelichting
In het eerste college staat de lineaire regressieanalyse centraal. In Statistiek A hebben we
gekeken naar de beschrijving en samenhang van twee variabelen. In Statistiek B kijken we
naar de samenhang van meer dan twee variabelen.
Leerdoelen
1. De student kan de Pearson correlatiecoëfficiënt interpreteren;
2. De student kan een (multipele) lineaire regressievergelijking opstellen en interpreteren;
3. De student kan statistische hypotheses over de regressiecoëfficiënten formuleren;
4. De student kan voorwaardelijke en onvoorwaardelijke voorspellingen op basis van
(multipele) regressievergelijkingen doen.
Verplichte literatuur
Hoofdstuk 10, 11 en 12
Deel 1: Correlatie en lineaire regressie
Leerdoelen
Een correlatiecoëfficiënt interpreteren
Een lineaire regressievergelijking opstellen en interpreteren
Voorwaardelijke en onvoorwaardelijke voorspellingen doen
Wat en waarom?
*Samenhang
Spreidingsdiagram (of: scatterplot)
• Grafische weergave samenhang
Correlatiecoëfficiënt en -analyse
• Maat voor sterkte van de samenhang
Regressieanalyse
• Methode om de samenhang tussen twee (of meer) variabelen te beschrijven/ bepalen
met behulp van een functionele relatie
• Schat/tekent lijn die de gegevens in het spreidingsdiagram zo goed mogelijk beschrijft
*Ook: Chi-kwadraat toets (is behandeld in statistiek A)
(We gaan veel uitgebreider kijken naar de samenhang van variabelen die categorisch zijn en
numeriek. Wat zijn de mogelijke verklarende factoren die invloeden hebben op een bepaald
gegeven? Hoeft geen causaal verband te zijn dat loopt van reistijd naar aantal
facebookvrienden. Kunnen allerlei verklaringen voor zijn.)
Wat is het verband tussen de temperatuur en het aantal uren per dag dat iemand het strand
bezoekt?
(Kon deels ook met Chi-kwadraat toets.
, ‘Het aantal uren per dag dat iemand strand bezoekt’ = Variabele die we willen verklaren /
afhankelijke variabele / continue variabele.
‘Temperatuur’ is niet de enige variabele die een rol kan spelen, maar bv ook een vakantiedag
of weekend. Dus we kunnen meerdere variabelen meenemen)
Wat is het verband tussen aantal facebookvrienden, reistijd naar de universiteit, sporten, het
hebben van een smartphone?
(Voornaamste afhankelijke variabele is facebookvrienden. Wat zijn de factoren die het
aantal facebookvrienden beïnvloeden. We nemen meerdere variabele op in onze analyse.)
Spreidingsdiagram
Wat is het verband tussen ‘aantal facebookvrienden’ en ‘reistijd’?
(Een scatterplot geeft een grafische weergave tussen het aantal facebookvrienden en
reistijd.
Y-as= Altijd afhankelijke variabele / te verklaren variabele
X-as= altijd onafhankelijke variabele / verklarende variabele
De punten zijn allemaal verschillende individuele waarden.
Bij regressieanalyse wordt er een zo goed mogelijke rechte lijn door de punten getrokken.
Als ik een lijn zou tekenen, dan zou die van linksboven naar rechtsonder gaan, Dus
Hoe hoger de reistijd, hoe lager het aantal facebookvrienden.)
Correlatiecoëfficiënt – algemeen
Maat voor lineaire samenhang tussen 2 variabelen (zie K&S pg 93)
Kenmerken