TDAT Les 5 : "Mixed Models 2". Volledig uitgetypte les (adhv de slidecast), geordend per slide. Printscreens van alle stappen in SPSS. Ik behaalde voor dit vak 18/20
1.1Is
groei
bij
kinderen
gerelateerd
aan
lengte
moeder?
Slide
3
Deze
onderzoeksvraag
hadden
we
eerst
met
RM
ANOVA
gedaan
:
“is
de
groei
bij
kinderen,
of
dus
het
effect
van
leeftijd,
gerelateerd
aan
de
lengte
van
de
moeder,
of
dus
hetzelfde
in
elke
groep
van
moeders
?”
Keken
toen
naar
interactie-‐effect
“leeftijd
x
groep”
in
RM
ANOVA.
(
Om
bij
deze
onderzoeksvraag
dus
rekening
te
houden
met
het
feit
dat
we
herhaalde
metingen
hebben,
kunnen
we
dus
ofwel
RM
ANOVA
doen
–
en
dan
kijken
naar
de
interactie
tussen
het
effect
van
leeftijd
en
groep
-‐
ofwel
mixed
models
waarbij
we
het
individu
als
random
factor
beschouwen
–
en
dan
kijken
naar
het
effect
van
leeftijd
of
dus
de
groeiparameters
en
of
die
verschillen
tussen
de
verschillende
groepen
).
Slide
4
Zien
een
lineaire
relatie
tussen
lengte
en
leeftijd
(
punten
liggen
nagenoeg
op
een
rechte
–
lineaire
groei
tussen
6
en
10
jaar).
• Zien
veel
variabiliteit
tussen
de
meisjes
(
sterke
variabiliteit
in
de
intercepten)
en
dit
voor
alle
groepen
:
er
zijn
meisjes
die
lager
beginnen,
anderen
beginnen
hoger
…
• Weinig
variabiliteit
binnen
de
meisjes
(
weinig
variabiliteit
in
de
slopes
)
en
dit
voor
alle
groepen.
(de
lijnen
verlopen
vrij
parallel
,
weinig
variabiliteit
rond
de
rechten).
Hadden
hier
ook
een
vast
aantal
metingen
:
bij
elk
meisje
5
metingen
op
vaste
tijdstippen
(
6,7,8,9,10j)
Dus
hadden
gebalanceerde
data.
(
=
voorwaarde
om
mixed
models
te
gaan
gebruiken).
1.2Het
random
intercept
model
Slide
5
Het
random
intercept
model
(
zie
les
4
)
laat
toe
dat
de
intercepten
tussen
verschillende
kinderen
varieert
(
elk
kind
heeft
zijn
eigen
intercept
)
maar
we
veronderstellen
wel
eenzelfde
effect
van
leeftijd
op
de
lengte
(
dus
eenzelfde
groei
)
binnen
eenzelfde
groep.
Zouden
dus
deze
predictoren
kunnen
opnemen
in
een
ANCOVA
model
:
• Leeftijd
(
covariaat
)
=
continue
variabele
(
geen
factor
–
maar
dit
had
hier
wel
gekund
want
we
hebben
metingen
op
5
vaste
tijdstippen
dus
hadden
leeftijd
1,
leeftijd
2,..
ook
kunnen
nemen)
Maar
dat
doen
we
niet
:
we
beschouwen
het
hier
wel
als
continue
variabele.
Dit
betekent
dat
we
echt
een
lineair
effect
veronderstellen
van
leeftijd
!
• Groep
van
lengte
moeder
(
factor
met
3
niveau’s
)
• Interactie
“leeftijd
x
groep”
,Moeten
wel
rekening
houden
met
feit
dat
onze
data
geclusterd
is
:
we
hebben
herhaalde
metingen
binnen
elk
individu.
We
gaan
dus
door
het
random
intercept
op
te
nemen
in
ons
model
,
die
correlatie
van
metingen
binnen
het
individu
in
rekening
gaan
brengen.
Slide
6
We
beschouwen
daarom
het
volgende
model.
Onze
uitkomst
Yij
(
in
het
i-‐de
kind,
de
j-‐de
observatie).
Eerste
index
is
altijd
het
hoogste
niveau
(
hier
level2
=
kind
)
en
j
verwijst
naar
het
laagste
niveau
(
level1
=
tijdstip
of
leeftijd
–
5
tijdstippen
dus).
We
hebben
dan
ons
intercept
Beta1
en
onze
slope
B2tj
(
we
veronderstellen
dus
een
lineair
intercept)
en
dit
veronderstellen
we
als
de
moeder
kort
is.
Dus
als
de
leeftijd
1
eenheid
toenemen,
zou
de
lengte
gemiddeld
met
Beta2
toenemen
in
die
eerste
groep.
In
de
tweede
groep
veronderstellen
we
een
ander
intercept
(
beta3)
en
ook
een
andere
slope
(
beta4)
:
dus
we
laten
toe
dat
het
intercept
verschilt
tussen
de
groepen
(
zoals
dat
in
les
4
tussen
die
klassen
ook
was
)
maar
nu
ook
dat
de
slope/helling
verschilt
tussen
de
groepen
(
wat
niet
zo
was
in
les
4
:
daar
hetzelfde
effect
van
geslacht
over
de
verschillende
klassen
heen
).
Nu
hebben
we
daar
niet
enkel
de
fixed
effecten
(
B1,
B3,
B5
en
B2,
B4,
B6
!
geven
het
effect
weer
van
onze
predictoren
in
ons
model
).
Maar
we
hebben
ook
nog
een
random
effect,
namelijk
die
kleine
bi
(
=
het
random
intercept
)
want
we
laten
toe
(
zie
grafiek
):
dat
we
3
groepen
hebben,
(
Bv.
korte
moeders
=
rood
)
met
een
zeker
intercept
(
B1)
en
een
zekere
helling
(
B2
).
Medium
groep
(
blauw
)
heeft
ook
een
bepaald
intercept
en
een
bepaalde
helling,
en
hetzelfde
voor
de
lange
moeders
(
groen
).
We
laten
dus
toe
dat
er
mogelijks
een
verschillend
intercept
is
en
een
verschillende
helling
over
de
groepen.
• X-‐as
:
tijdstip
• Y-‐as
:
Yij
(
lengte
)
Dit
zou
zijn
wat
we
klassiek
zouden
doen
moesten
we
geen
herhaalde
metingen
hebben
(
of
dus
geclusterde
data)
maar
nu
gaan
we
toelaten
dat
er
een
random
intercept
is
(
bi)
want
dat
zorgt
ervoor
dat
de
profielen
van
de
individuen
binnen
een
groep
nog
kunnen
variëren
rond
die
rechtes.
(
zie
paars).
Bv.
voor
iemand
uit
de
korte
groep
kan
het
zijn
dat
zijn
intercept
wat
lager
of
hoger
ligt.
Maar
de
helling
blijft
binnen
een
bepaalde
groep
wel
dezelfde
(
dezelfde
groei
binnen
groepen
).
Deze
kan
wel
verschillen
tussen
groepen.
Dus
als
er
grote
variabiliteit
is
tussen
de
kinderen,
hebben
we
veel
variatie
in
die
bi’s
(
random
intercepten
)
zien
(
grote
random
intercept
variantie)
en
we
veronderstellen
dat
die
intercepten
normaal
verdeeld
zijn
met
gemiddelde
0
en
een
variantie
sigma-‐kwadraat-‐kind.
Merk
op
:
dit
is
nog
altijd
geen
perfecte
voorspelling,
je
hebt
nog
altijd
punten
die
boven
of
onder
die
rechte
gaan
liggen
(
residuen
=
alles
wat
niet
verklaard
wordt
door
het
model
waarin
predictor
leeftijd
en
het
random
intercept
vervat
zitten).
En
we
veronderstellen
ook
dat
die
normaal
verdeeld
zijn
met
een
zekere
variantie
(
sigma-‐kwadraat-‐res).
Slide
7
Kunnen
dit
mixed
model
gaan
herschrijven
als
volgt
(
zie
slide
)
:
We
hebben
hier
de
intercepten
samengevoegd
(
zowel
van
het
fixed
gedeelte
als
van
het
random
gedeelte).
En
de
hypothese
die
we
wouden
onderzoeken
is
:
“is
de
groei
afhankelijk
van
de
lengte
van
de
moeder”.
,"
Groei
=
(
parameters
die
groei
weergeven-‐
of
dus
het
effect
van
leeftijd
)
• Beta2
(indien
moeders
kort)
• Beta4
(indien
moeders
medium
)
• Beta6
(indien
moeders
lang)
We
willen
testen
hoe
de
groei
gerelateerd
is
aan
de
lengte
van
de
moeder.
Dus
willen
nagaan
of
die
3
regressiecoëfficiënten
gelijk
zijn
aan
elkaar.
Als
we
3
gelijke
hellingen
zouden
zien
(
als
helling
rode
rechte
=
blauwe
rechte
=
groene
rechte
)
dan
hebben
we
inderdaad
dat
de
groei
niet
gerelateerd
is
aan
de
lengte
van
de
moeder
(
want
dan
zou
de
groei
over
alle
groepen
van
moeders
even
groot
zijn
–
ondanks
dat
je
wel
van
op
een
verschillend
niveau
zou
kunnen
vertrekken
want
de
intercepten
zouden
wel
kunnen
verschillen).
Dus
als
we
deze
H0
willen
verwerpen,
mogen
deze
hellingen
(
dus
de
groei-‐parameters
,
of
de
richtingscoëfficiënten)
niet
allemaal
dezelfde
zijn.
Slide
8
Om
die
data
te
analyseren
gaan
we
onze
data
in
SPSS
in
een
ander
formaat
zetten.
Met
RM
ANOVA
stond
deze
data
in
een
wide
format
(
1
lijn
per
kind,
en
kolommen
voor
de
verschillende
leeftijden).
Als
we
onze
data
willen
analyseren
met
mixed
models
moeten
we
de
data
onder
elkaar
zetteen
(long
format).
=
verschillende
lijnen
per
individu.
Je
ziet
hier
de
eerste
21
kinderen
op
leeftijd
6
jaar,
en
dan
zie
je
opnieuw
diezelfde
kinderen
die
terugkomen
op
leeftijd
7
jaar,
….
Slide
9
Random
intercept
model
fitten
in
SPSS
:
ANALYZE
–
MIXED
MODELS
–
LINEAR
• SUBJECTS
:
Wat
is
level2-‐variabele
?
Zitten
met
herhaalde
metingen
binnen
kinderen
dus
variabele
“kind”
=
level2
• REPEATED
:
specifiëren
indien
we
marginale
model
hebben
(
met
afhankelijke
residuen
zitten)
Is
hier
niet
het
geval.
Veronderstellen
hier
dat
residuen
onafhankelijk
zijn
(
gegeven
ons
random
intercept
!
want
veronderstellen
daarom
dat
onze
residuen
uit
univariate
normale
verdeling
komen
en
dus
onafhankelijk
zijn)
• Afhankelijke
variabele
:
hoogte
• Factor
:
groep
• Covariaat
:
leeftijd
(
omdat
we
een
lineair
effect
veronderstellen
)
, • FIXED
:
sleep
“groep”
en
“leeftijd”
naar
het
model
Want
:
zowel
groep
,
leeftijd
,
als
hun
interactie
zijn
vaste
effecten
die
we
willen
nagaan.
(
zijn
niet
random
of
willekeurig
naargelang
de
toevallige
steekproef
die
we
getrokken
hebben
).
• RANDOM
:
sleep
“kind”
naar
het
model
+
aanvinken
“include
random
intercept”
Want
zitten
met
herhaalde
metingen
binnen
een
kind
dus
dat
is
een
random
factor
(
de
intercepten
van
de
verschillende
kinderen
kunnen
dus
random
variëren
).
• Bij
statistics
:
parameter
estimates
aanvinken
Slide
10
en
11
(
OUTPUT
)
We
krijgen
nu
een
model
met
enkele
fixed
effecten.
Je
weet
dat
SPSS
altijd
de
laatste
categorie
als
referentiecategorie
gaat
nemen
(
als
we
met
factoren
werken
)
dus
groep3
is
hier
de
referentiecategorie.
TABEL
:
Estimates
of
fixed
effects
Dus
het
intercept
(
geel
)
betekent
het
intercept
voor
groep3,
wanneer
de
leeftijd
gelijk
is
aan
0.
Dus
dan
bekom
je
hier
eigenlijk
83,12
(
cm).
Bemerking
:
dit
is
niet
de
lengte
die
je
normaal
bent
bij
je
geboorte.
We
hebben
hier
enkel
observaties
tussen
de
leeftijdsrange
van
6
en
10
jaar
dus
we
gaan
als
we
hier
het
intercept
berekenen
(
dus
de
hoogte
horend
bij
leeftijd
0
–
bij
groep3)
dan
gaan
we
eigenlijk
extra-‐poleren
buiten
de
range
waar
we
waarden
geobserveerd
hebben.
We
gingen
het
lineair
verband
tussen
6
en
10
jaar
verder
gaan
doortrekken
tot
0
jaar
maar
dit
mag
eigenlijk
niet
(
je
mag
niet
extra-‐poleren
buiten
de
range
van
waar
je
waarden
hebt
geobserveerd).
Daarom
dat
dit
intercept
zo
weinig
betekenisvol
is.
Daarom
gaan
we
de
intercepten
niet
verder
gaan
interpreteren.
Die
groep
1
en
2
(
groen)
geven
dan
het
verschil
in
intercept
weer
tov
groep
3.
(
want
deze
staan
voor
het
effect
van
groep
op
hoogte
).
!
alweer
niet
betekenisvol
Belangrijkste
is
het
effect
van
leeftijd
(
oranje
)
:
het
effect
van
leeftijd
hier
(
6.2)
is
dus
het
effect
van
leeftijd
in
de
groep3
(
dus
B6
=
6.2).
Effect
van
leeftijd
=
groei.
Dat
betekent
dat
als
je
van
6
naar
7
jaar
gaat
(
of
van
7-‐>8,
of
van
8-‐>9,
…
=
1
eenheidstoename
in
leeftijd)
dat
je
gemiddeld
(
in
groep
3),
6.24
cm
zal
gaan
groeien.
Dit
gaat
dus
over
de
groep3
(
lange
moeders).
, De
interacties
tonen
hoe
het
effect
van
leeftijd
(groei
)
verschilt
over
de
groepen
• Group1
*
age
:
in
groep
1
is
de
groei
(
of
het
effect
van
leeftijd
)
0.97
minder
dan
in
groep
3
Dus
:
B2
–
B6
=
-‐
0.97
"
B2
=
5,2
cm
• Group2
*
age
:
in
groep
2
is
de
groei
(
of
het
effect
van
leeftijd
)
0.68
minder
dan
in
groep
3
Dus
:
B4
–
B6
=
-‐
0.68
"
B4
=
5,5
cm
"
Deze
verschillen
tussen
groep1-‐groep3
,
en
groep2-‐groep3
zijn
significant
(
p<
0.05
)
"
Groei
verschilt
dus
significant
naargelang
de
groep/lengte
van
de
moeders
Slide
12
TABEL:
Type
III
tests
of
fixed
effects
(
nog
van
op
slide
10
)
Om
de
gelijkheid
van
die
3
coëfficiënten
gezamenlijk
te
gaan
testen
(
dus
gewoon
algemeen
:
zijn
de
slopes
alle
3
gelijk
of
niet?
)
kan
je
gewoon
kijken
bij
de
“group*age”
interactie
in
de
ANOVA
compositie
(
kijkt
gewoon
of
er
een
interactie
is
tussen
leeftijdseffect
en
groep
of
niet
-‐
of
dus
algemeen
of
de
groei
gelijk
is
in
de
3
groepen
of
niet
).
Test
of
die
2
coëfficiënten
gelijk
zijn
aan
nul.
Als
die
twee
dummy
variabelen
gelijk
zijn
aan
nul,
dus
of
die
2
vergelijkingen
tov
de
referentiegroep
gelijk
zijn
aan
nul
zal
de
groei
overal
dezelfde
zijn.
Dat
is
dus
wat
daar
gebeurt
met
die
F-‐toets.
We
zien
dus
dat
ze
elk
afzonderlijk
verschillend
zijn
van
nul,
maar
ook
gezamenlijk.
TABEL
:
Covariance
parameters
Dit
was
dus
wat
het
fixed
gedeelte
betrof.
Nu
hebben
we
ook
nog
het
random
gedeelte.
De
random-‐intercept-‐variantie
(
=
8.96
)
=
sigma-‐kwadraat-‐kind
(
geeft
variabiliteit
van
het
intercept
weer
)
en
we
zagen
al
op
de
figuur
dat
die
vrij
groot
was
(
grote
random-‐intercept-‐variantie).
Residuele
variantie
is
dan
de
afwijking
van
de
puntjes
tov
de
individuele
profielen
en
die
is
vrij
klein
(
=
0.76).
Hier
hebben
we
dus
daarom
ook
een
vrij
hoge
intra-‐cluster-‐correlatie
(
=
hoeveel
van
de
variabiliteit
wordt
verklaart
door
het
hoogste
niveau
tov
de
totale
variantie
)
(
hoge
correlatie
van
de
metingen
binnen
eenzelfde
individu).
1.3Het
hiërarchisch
model
,
marginaal
benaderd
Slide
13
Vorige
keer
zagen
we
dat
dit
model
ook
marginaal
kunnen
benaderen.
Zagen
nu
het
model
met
het
random
intercept.
Als
we
dit
hiërarchisch
schrijven
krijgen
we
:
LEVEL1
(
laagste
niveau
)
Yij
,
gegeven
bi
…(
zie
slides).
Als
bi
gekend
is,
dan
weten
we
dat
de
uitkomsten
(Yij
of
dus
onze
groei
)
normaal
verdeeld
zijn
met
dit
(
oranje)
als
gemiddelde
en
dit
(
roze
)
als
variantie.
En
afhankelijk
van
de
groep
waartoe
ze
behoren
heb
je
een
verschillend
intercept
en
helling.
Dat
beschrijft
dus
ons
laagste
niveau
(
effect
van
level1-‐variabele
)
(
wat
is
hier
de
level-‐1
variabele
???
is
dat
dan
tijdstip
of
leeftijd
?
)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller tikoude. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.18. You're not tied to anything after your purchase.