TDAT
les
5
(
2015
–
2016
)
Lesnotities
Hoofdstuk
5
:
Mixed
Models
(
deel
2
)
1. Growth
Curve
Models
1.1Is
groei
bij
kinderen
gerelateerd
aan
lengte
moeder?
Slide
3
Deze
onderzoeksvraag
hadden
we
eerst
met
RM
ANOVA
gedaan
:
“is
de
groei
bij
kinderen,
of
dus
het
effect
van
leeftijd,
gerelateerd
aan
de
lengte
van
de
moeder,
of
dus
hetzelfde
in
elke
groep
van
moeders
?”
Keken
toen
naar
interactie-‐effect
“leeftijd
x
groep”
in
RM
ANOVA.
(
Om
bij
deze
onderzoeksvraag
dus
rekening
te
houden
met
het
feit
dat
we
herhaalde
metingen
hebben,
kunnen
we
dus
ofwel
RM
ANOVA
doen
–
en
dan
kijken
naar
de
interactie
tussen
het
effect
van
leeftijd
en
groep
-‐
ofwel
mixed
models
waarbij
we
het
individu
als
random
factor
beschouwen
–
en
dan
kijken
naar
het
effect
van
leeftijd
of
dus
de
groeiparameters
en
of
die
verschillen
tussen
de
verschillende
groepen
).
Slide
4
Zien
een
lineaire
relatie
tussen
lengte
en
leeftijd
(
punten
liggen
nagenoeg
op
een
rechte
–
lineaire
groei
tussen
6
en
10
jaar).
• Zien
veel
variabiliteit
tussen
de
meisjes
(
sterke
variabiliteit
in
de
intercepten)
en
dit
voor
alle
groepen
:
er
zijn
meisjes
die
lager
beginnen,
anderen
beginnen
hoger
…
• Weinig
variabiliteit
binnen
de
meisjes
(
weinig
variabiliteit
in
de
slopes
)
en
dit
voor
alle
groepen.
(de
lijnen
verlopen
vrij
parallel
,
weinig
variabiliteit
rond
de
rechten).
Hadden
hier
ook
een
vast
aantal
metingen
:
bij
elk
meisje
5
metingen
op
vaste
tijdstippen
(
6,7,8,9,10j)
Dus
hadden
gebalanceerde
data.
(
=
voorwaarde
om
mixed
models
te
gaan
gebruiken).
1.2Het
random
intercept
model
Slide
5
Het
random
intercept
model
(
zie
les
4
)
laat
toe
dat
de
intercepten
tussen
verschillende
kinderen
varieert
(
elk
kind
heeft
zijn
eigen
intercept
)
maar
we
veronderstellen
wel
eenzelfde
effect
van
leeftijd
op
de
lengte
(
dus
eenzelfde
groei
)
binnen
eenzelfde
groep.
Zouden
dus
deze
predictoren
kunnen
opnemen
in
een
ANCOVA
model
:
• Leeftijd
(
covariaat
)
=
continue
variabele
(
geen
factor
–
maar
dit
had
hier
wel
gekund
want
we
hebben
metingen
op
5
vaste
tijdstippen
dus
hadden
leeftijd
1,
leeftijd
2,..
ook
kunnen
nemen)
Maar
dat
doen
we
niet
:
we
beschouwen
het
hier
wel
als
continue
variabele.
Dit
betekent
dat
we
echt
een
lineair
effect
veronderstellen
van
leeftijd
!
• Groep
van
lengte
moeder
(
factor
met
3
niveau’s
)
• Interactie
“leeftijd
x
groep”
,Moeten
wel
rekening
houden
met
feit
dat
onze
data
geclusterd
is
:
we
hebben
herhaalde
metingen
binnen
elk
individu.
We
gaan
dus
door
het
random
intercept
op
te
nemen
in
ons
model
,
die
correlatie
van
metingen
binnen
het
individu
in
rekening
gaan
brengen.
Slide
6
We
beschouwen
daarom
het
volgende
model.
Onze
uitkomst
Yij
(
in
het
i-‐de
kind,
de
j-‐de
observatie).
Eerste
index
is
altijd
het
hoogste
niveau
(
hier
level2
=
kind
)
en
j
verwijst
naar
het
laagste
niveau
(
level1
=
tijdstip
of
leeftijd
–
5
tijdstippen
dus).
We
hebben
dan
ons
intercept
Beta1
en
onze
slope
B2tj
(
we
veronderstellen
dus
een
lineair
intercept)
en
dit
veronderstellen
we
als
de
moeder
kort
is.
Dus
als
de
leeftijd
1
eenheid
toenemen,
zou
de
lengte
gemiddeld
met
Beta2
toenemen
in
die
eerste
groep.
In
de
tweede
groep
veronderstellen
we
een
ander
intercept
(
beta3)
en
ook
een
andere
slope
(
beta4)
:
dus
we
laten
toe
dat
het
intercept
verschilt
tussen
de
groepen
(
zoals
dat
in
les
4
tussen
die
klassen
ook
was
)
maar
nu
ook
dat
de
slope/helling
verschilt
tussen
de
groepen
(
wat
niet
zo
was
in
les
4
:
daar
hetzelfde
effect
van
geslacht
over
de
verschillende
klassen
heen
).
Nu
hebben
we
daar
niet
enkel
de
fixed
effecten
(
B1,
B3,
B5
en
B2,
B4,
B6
!
geven
het
effect
weer
van
onze
predictoren
in
ons
model
).
Maar
we
hebben
ook
nog
een
random
effect,
namelijk
die
kleine
bi
(
=
het
random
intercept
)
want
we
laten
toe
(
zie
grafiek
):
dat
we
3
groepen
hebben,
(
Bv.
korte
moeders
=
rood
)
met
een
zeker
intercept
(
B1)
en
een
zekere
helling
(
B2
).
Medium
groep
(
blauw
)
heeft
ook
een
bepaald
intercept
en
een
bepaalde
helling,
en
hetzelfde
voor
de
lange
moeders
(
groen
).
We
laten
dus
toe
dat
er
mogelijks
een
verschillend
intercept
is
en
een
verschillende
helling
over
de
groepen.
• X-‐as
:
tijdstip
• Y-‐as
:
Yij
(
lengte
)
Dit
zou
zijn
wat
we
klassiek
zouden
doen
moesten
we
geen
herhaalde
metingen
hebben
(
of
dus
geclusterde
data)
maar
nu
gaan
we
toelaten
dat
er
een
random
intercept
is
(
bi)
want
dat
zorgt
ervoor
dat
de
profielen
van
de
individuen
binnen
een
groep
nog
kunnen
variëren
rond
die
rechtes.
(
zie
paars).
Bv.
voor
iemand
uit
de
korte
groep
kan
het
zijn
dat
zijn
intercept
wat
lager
of
hoger
ligt.
Maar
de
helling
blijft
binnen
een
bepaalde
groep
wel
dezelfde
(
dezelfde
groei
binnen
groepen
).
Deze
kan
wel
verschillen
tussen
groepen.
Dus
als
er
grote
variabiliteit
is
tussen
de
kinderen,
hebben
we
veel
variatie
in
die
bi’s
(
random
intercepten
)
zien
(
grote
random
intercept
variantie)
en
we
veronderstellen
dat
die
intercepten
normaal
verdeeld
zijn
met
gemiddelde
0
en
een
variantie
sigma-‐kwadraat-‐kind.
Merk
op
:
dit
is
nog
altijd
geen
perfecte
voorspelling,
je
hebt
nog
altijd
punten
die
boven
of
onder
die
rechte
gaan
liggen
(
residuen
=
alles
wat
niet
verklaard
wordt
door
het
model
waarin
predictor
leeftijd
en
het
random
intercept
vervat
zitten).
En
we
veronderstellen
ook
dat
die
normaal
verdeeld
zijn
met
een
zekere
variantie
(
sigma-‐kwadraat-‐res).
Slide
7
Kunnen
dit
mixed
model
gaan
herschrijven
als
volgt
(
zie
slide
)
:
We
hebben
hier
de
intercepten
samengevoegd
(
zowel
van
het
fixed
gedeelte
als
van
het
random
gedeelte).
En
de
hypothese
die
we
wouden
onderzoeken
is
:
“is
de
groei
afhankelijk
van
de
lengte
van
de
moeder”.
,"
Groei
=
(
parameters
die
groei
weergeven-‐
of
dus
het
effect
van
leeftijd
)
• Beta2
(indien
moeders
kort)
• Beta4
(indien
moeders
medium
)
• Beta6
(indien
moeders
lang)
We
willen
testen
hoe
de
groei
gerelateerd
is
aan
de
lengte
van
de
moeder.
Dus
willen
nagaan
of
die
3
regressiecoëfficiënten
gelijk
zijn
aan
elkaar.
Als
we
3
gelijke
hellingen
zouden
zien
(
als
helling
rode
rechte
=
blauwe
rechte
=
groene
rechte
)
dan
hebben
we
inderdaad
dat
de
groei
niet
gerelateerd
is
aan
de
lengte
van
de
moeder
(
want
dan
zou
de
groei
over
alle
groepen
van
moeders
even
groot
zijn
–
ondanks
dat
je
wel
van
op
een
verschillend
niveau
zou
kunnen
vertrekken
want
de
intercepten
zouden
wel
kunnen
verschillen).
Dus
als
we
deze
H0
willen
verwerpen,
mogen
deze
hellingen
(
dus
de
groei-‐parameters
,
of
de
richtingscoëfficiënten)
niet
allemaal
dezelfde
zijn.
Slide
8
Om
die
data
te
analyseren
gaan
we
onze
data
in
SPSS
in
een
ander
formaat
zetten.
Met
RM
ANOVA
stond
deze
data
in
een
wide
format
(
1
lijn
per
kind,
en
kolommen
voor
de
verschillende
leeftijden).
Als
we
onze
data
willen
analyseren
met
mixed
models
moeten
we
de
data
onder
elkaar
zetteen
(long
format).
=
verschillende
lijnen
per
individu.
Je
ziet
hier
de
eerste
21
kinderen
op
leeftijd
6
jaar,
en
dan
zie
je
opnieuw
diezelfde
kinderen
die
terugkomen
op
leeftijd
7
jaar,
….
Slide
9
Random
intercept
model
fitten
in
SPSS
:
ANALYZE
–
MIXED
MODELS
–
LINEAR
• SUBJECTS
:
Wat
is
level2-‐variabele
?
Zitten
met
herhaalde
metingen
binnen
kinderen
dus
variabele
“kind”
=
level2
• REPEATED
:
specifiëren
indien
we
marginale
model
hebben
(
met
afhankelijke
residuen
zitten)
Is
hier
niet
het
geval.
Veronderstellen
hier
dat
residuen
onafhankelijk
zijn
(
gegeven
ons
random
intercept
!
want
veronderstellen
daarom
dat
onze
residuen
uit
univariate
normale
verdeling
komen
en
dus
onafhankelijk
zijn)
• Afhankelijke
variabele
:
hoogte
• Factor
:
groep
• Covariaat
:
leeftijd
(
omdat
we
een
lineair
effect
veronderstellen
)
, • FIXED
:
sleep
“groep”
en
“leeftijd”
naar
het
model
Want
:
zowel
groep
,
leeftijd
,
als
hun
interactie
zijn
vaste
effecten
die
we
willen
nagaan.
(
zijn
niet
random
of
willekeurig
naargelang
de
toevallige
steekproef
die
we
getrokken
hebben
).
• RANDOM
:
sleep
“kind”
naar
het
model
+
aanvinken
“include
random
intercept”
Want
zitten
met
herhaalde
metingen
binnen
een
kind
dus
dat
is
een
random
factor
(
de
intercepten
van
de
verschillende
kinderen
kunnen
dus
random
variëren
).
• Bij
statistics
:
parameter
estimates
aanvinken
Slide
10
en
11
(
OUTPUT
)
We
krijgen
nu
een
model
met
enkele
fixed
effecten.
Je
weet
dat
SPSS
altijd
de
laatste
categorie
als
referentiecategorie
gaat
nemen
(
als
we
met
factoren
werken
)
dus
groep3
is
hier
de
referentiecategorie.
TABEL
:
Estimates
of
fixed
effects
Dus
het
intercept
(
geel
)
betekent
het
intercept
voor
groep3,
wanneer
de
leeftijd
gelijk
is
aan
0.
Dus
dan
bekom
je
hier
eigenlijk
83,12
(
cm).
Bemerking
:
dit
is
niet
de
lengte
die
je
normaal
bent
bij
je
geboorte.
We
hebben
hier
enkel
observaties
tussen
de
leeftijdsrange
van
6
en
10
jaar
dus
we
gaan
als
we
hier
het
intercept
berekenen
(
dus
de
hoogte
horend
bij
leeftijd
0
–
bij
groep3)
dan
gaan
we
eigenlijk
extra-‐poleren
buiten
de
range
waar
we
waarden
geobserveerd
hebben.
We
gingen
het
lineair
verband
tussen
6
en
10
jaar
verder
gaan
doortrekken
tot
0
jaar
maar
dit
mag
eigenlijk
niet
(
je
mag
niet
extra-‐poleren
buiten
de
range
van
waar
je
waarden
hebt
geobserveerd).
Daarom
dat
dit
intercept
zo
weinig
betekenisvol
is.
Daarom
gaan
we
de
intercepten
niet
verder
gaan
interpreteren.
Die
groep
1
en
2
(
groen)
geven
dan
het
verschil
in
intercept
weer
tov
groep
3.
(
want
deze
staan
voor
het
effect
van
groep
op
hoogte
).
!
alweer
niet
betekenisvol
Belangrijkste
is
het
effect
van
leeftijd
(
oranje
)
:
het
effect
van
leeftijd
hier
(
6.2)
is
dus
het
effect
van
leeftijd
in
de
groep3
(
dus
B6
=
6.2).
Effect
van
leeftijd
=
groei.
Dat
betekent
dat
als
je
van
6
naar
7
jaar
gaat
(
of
van
7-‐>8,
of
van
8-‐>9,
…
=
1
eenheidstoename
in
leeftijd)
dat
je
gemiddeld
(
in
groep
3),
6.24
cm
zal
gaan
groeien.
Dit
gaat
dus
over
de
groep3
(
lange
moeders).
, De
interacties
tonen
hoe
het
effect
van
leeftijd
(groei
)
verschilt
over
de
groepen
• Group1
*
age
:
in
groep
1
is
de
groei
(
of
het
effect
van
leeftijd
)
0.97
minder
dan
in
groep
3
Dus
:
B2
–
B6
=
-‐
0.97
"
B2
=
5,2
cm
• Group2
*
age
:
in
groep
2
is
de
groei
(
of
het
effect
van
leeftijd
)
0.68
minder
dan
in
groep
3
Dus
:
B4
–
B6
=
-‐
0.68
"
B4
=
5,5
cm
"
Deze
verschillen
tussen
groep1-‐groep3
,
en
groep2-‐groep3
zijn
significant
(
p<
0.05
)
"
Groei
verschilt
dus
significant
naargelang
de
groep/lengte
van
de
moeders
Slide
12
TABEL:
Type
III
tests
of
fixed
effects
(
nog
van
op
slide
10
)
Om
de
gelijkheid
van
die
3
coëfficiënten
gezamenlijk
te
gaan
testen
(
dus
gewoon
algemeen
:
zijn
de
slopes
alle
3
gelijk
of
niet?
)
kan
je
gewoon
kijken
bij
de
“group*age”
interactie
in
de
ANOVA
compositie
(
kijkt
gewoon
of
er
een
interactie
is
tussen
leeftijdseffect
en
groep
of
niet
-‐
of
dus
algemeen
of
de
groei
gelijk
is
in
de
3
groepen
of
niet
).
Test
of
die
2
coëfficiënten
gelijk
zijn
aan
nul.
Als
die
twee
dummy
variabelen
gelijk
zijn
aan
nul,
dus
of
die
2
vergelijkingen
tov
de
referentiegroep
gelijk
zijn
aan
nul
zal
de
groei
overal
dezelfde
zijn.
Dat
is
dus
wat
daar
gebeurt
met
die
F-‐toets.
We
zien
dus
dat
ze
elk
afzonderlijk
verschillend
zijn
van
nul,
maar
ook
gezamenlijk.
TABEL
:
Covariance
parameters
Dit
was
dus
wat
het
fixed
gedeelte
betrof.
Nu
hebben
we
ook
nog
het
random
gedeelte.
De
random-‐intercept-‐variantie
(
=
8.96
)
=
sigma-‐kwadraat-‐kind
(
geeft
variabiliteit
van
het
intercept
weer
)
en
we
zagen
al
op
de
figuur
dat
die
vrij
groot
was
(
grote
random-‐intercept-‐variantie).
Residuele
variantie
is
dan
de
afwijking
van
de
puntjes
tov
de
individuele
profielen
en
die
is
vrij
klein
(
=
0.76).
Hier
hebben
we
dus
daarom
ook
een
vrij
hoge
intra-‐cluster-‐correlatie
(
=
hoeveel
van
de
variabiliteit
wordt
verklaart
door
het
hoogste
niveau
tov
de
totale
variantie
)
(
hoge
correlatie
van
de
metingen
binnen
eenzelfde
individu).
1.3Het
hiërarchisch
model
,
marginaal
benaderd
Slide
13
Vorige
keer
zagen
we
dat
dit
model
ook
marginaal
kunnen
benaderen.
Zagen
nu
het
model
met
het
random
intercept.
Als
we
dit
hiërarchisch
schrijven
krijgen
we
:
LEVEL1
(
laagste
niveau
)
Yij
,
gegeven
bi
…(
zie
slides).
Als
bi
gekend
is,
dan
weten
we
dat
de
uitkomsten
(Yij
of
dus
onze
groei
)
normaal
verdeeld
zijn
met
dit
(
oranje)
als
gemiddelde
en
dit
(
roze
)
als
variantie.
En
afhankelijk
van
de
groep
waartoe
ze
behoren
heb
je
een
verschillend
intercept
en
helling.
Dat
beschrijft
dus
ons
laagste
niveau
(
effect
van
level1-‐variabele
)
(
wat
is
hier
de
level-‐1
variabele
???
is
dat
dan
tijdstip
of
leeftijd
?
)