College aantekeningen

Toegepaste Data-analyse (TDAT) LES 4 : Mixed Models 1 ( incl. printscreens SPSS )

Name: Toegepaste Data-analyse (TDAT) LES 4 : Mixed Models 1 ( incl. printscreens SPSS )
SKU: doc_296546
Rating: 4.00 (1 reviews)
Author: tikoude

1 beoordeling

12 keer verkocht

Vak
Toegepaste Data-analyse

Instelling
Universiteit Gent (UGent)

TDAT Les 4 : H4 "Mixed Models 1". Volledig uitgetypte les (adhv de slidecast), geordend per slide. Printscreens van alle stappen in SPSS. Ik behaalde voor dit vak 18/20

[Meer zien]

Voorbeeld 6 van de 19 pagina's

Bekijk voorbeeld

Geupload op 13 februari 2017
Aantal pagina's 19
Geschreven in 2015/2016
Type College aantekeningen
Docent(en) Onbekend
Bevat Alle colleges

tdat
toegepaste data analyse
data analyse
tom loeys
spss
mixed models
hiërarchische data
random intercept model
two way anova
paired t test

1 beoordeling

Door: KimVm1 • 7 jaar geleden

Volgen

tikoude Lid sinds 10 jaar 974 documenten verkocht

€2,99

In winkelwagen

Opslaan

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

TDAT
LES
4

(
2015
–
2016
)

Lesnotities

Hoofdstuk
4
:
Mixed
Models
(
1
)

1. Motivatie

Mixed
models
=
recentere
technieken
(
laatste
20
tot
25
jaar
ontwikkeld
)

1.1Hiërarchische
data

Slide
3
:

Kijken
vandaag
naar
hiërarchische
data
!
kan
op
verschillende
manieren

• Herhaalde
metingen
binnen
personen
(
=
within
subject
factoren
)

Dit
kan
al
dan
niet
onder
verschillende
condities

Bv.
BMI
op
verschillende
tijdstippen
bij
dezelfde
personen

Bv.
accuraatheid
van
verschillende
emoties,
binnen
eenzelfde
persoon
meten

• Werken
met
leden
uit
eenzelfde
familie

Hier
gaan
we
ipv
individuen
in
de
steekproef
opnemen,
families
opnemen
en
dan
binnen
die

families
alle
familieleden
opnemen
(
zo
krijg
je
een
hiërarchie
van
familieleden
binnen
een
familie
)

• Verschillende
scholen
samplen

Bv.
kijken
naar
examenresultaten
van
studenten
uit
een
steekproef
van
verschillende
scholen.
Dus

hier
worden
scholen
gesampeld
en
dan
binnen
de
scholen
aparte
leerlingen.

Slide
4

Krijgen
zo
dus
een
hiërarchische
structuur.
Bovenstaande
voorbeelden
=
allen
2-‐level
data

Het
hoogste
niveau
,
bijvoorbeeld
als
je
herhaalde
metingen
hebt,
dan
ga
je
bijvoorbeeld
binnen
pp
1
drie

herhaalde
metingen
doen
(
op
3
tijdstippen
BMI
gaan
meten).
Ook
bij
pp
2
heb
je
die
3
herhaalde

metingen.

Herhaalde
metingen
(
within
subject
factoren
)

• Het
laagste
niveau
(
level
1
)
=
de
momenten
waarop
je
die
metingen
gaat
doen
(
tijdstip
1,2
en
3
)

De
momenten
“tijstip
1
,
2
en
3”
zijn
dus
de
level
1-‐variabelen.

• Het
hoogste
niveau
(
level
2
)
=
de
proefpersonen
zelf

De
proefpersonen
=
level
2-‐variabelen

Ander
voorbeeld
(
bv.
families
)
!
daar
zal
Level
2
=
families

• Laagste
niveau
(
level
1
)
=
aparte
familieleden

• Hoogste
niveau
(
level
2
)
=
de
families.
(
Daarbinnen
heb
je
dan
telkens
enkele
familieleden
en
die

zijn
dan
het
laagste
niveau.

(
PS
:
dit
aantal
kan
variabel
zijn
–
in
de
ene
familie
zal
je
meer
leden

hebben
dan
in
de
andere
)

,Wij
gaan
ons
in
de
cursus
beperken
tot
level
2
structuren
maar
meer
kan
ook

Bijvoorbeeld
:
kijken
naar
tevredenheid
van
werknemers
in
bedrijven

• Level
1
:
werknemers

• Level
2
:
afdelingen
binnen
bedrijven

• Level
3
:
bedrijven

We
zagen
al
dat
als
je
dergelijke
hiërarchische
data
hebt,
dat
we
rekening
moeten
houden
met
de

correlatie
die
we
hebben
binnen
die
hiërarchische
structuur.

• Bv.
verwachten
dat
metingen
binnen
individuen
gecorreleerd
zijn

• Bv.
tevredenheid
van
werknemers
binnen
eenzelfde
afdeling
>
gecorreleerd
dan
uit
verschillende

afdelingen

Slide
5

Hernemen
voorbeeld
vorige
les
:

Als
je
kijkt
naar
evolutie
van
lengte
van
kinderen
en
je
ging
dat
elk
jaar
gaan
meten,
dan
doen
we
daar

herhaalde
metingen
binnen
eenzelfde
kind
(
dus
level
1
=
tijdstippen/
leeftijden
van
metingen
,
level
2
=

verschillende
individuen).
Merk
op
:
maken
wel
de
veronderstelling
dat
die
individuen
op
zich
dan
wel

onafhankelijk
zijn
(
bv.
broer
en
zus
uit
zelfde
klas
mogen
niet
meedoen).
(
de
metingen
binnen
die

persoon
dus
niet
want
het
gaat
om
een
meting
binnen
dezelfde
persoon
)

Veronderstellen
bij
hiërarchische
structuren
onafhankelijkheid
van
level2-‐variabelen

(
hier
onafhankelijkheid
van
verschillende
deelnemers
)

Maar
als
iemand
al
groot
is
op
leeftijd
6
zal
die
ook
groter
zijn
dan
de
rest
op
tijdstip
7
dus
lengtes
binnen

eenzelfde
individu
zullen
wel
gecorreleerd
zijn
(
typisch
voor
within
subject
)

Dit
is
wat
we
met
multi-‐level
modellen
of
mixed
models
gaan
doen
:

Gaan
die
structuur
expliciet
gaan
modelleren.
Die
verschillende
hiërarchische
niveau’s
die
we
hebben.

Reden
:
gaan
rekening
houden
met
de
correlaties
binnen
hiërarchische
structuren.

Dit
kan
dus
gaan
over
herhaalde
metingen,
clusters,
koppels,
bedrijven…

2. Het
random-‐intercept
model

2.1Populariteisvoorbeeld

Slide
6

Kijken
naar
populariteit
bij
schoolkinderen.

Hoe
zouden
we
dit
aanpakken?
!
willen
testen
of
gemiddelde
populariteit
gelijk
is
bij
jongens/meisjes

"
=
Gelijkheid
van
2
gemiddelden
nagaan

(
bv.
onafhankelijke
T-‐test
of
independent
sample
t-‐test)

Reden
:
hebben
onafhankelijke
groep
van
jongens
en
meisjes
(
gaat
niet
over
broers/zusjes
ofzo
)

Dus
normaal
zouden
we
onafhankelijke
t-‐test
doen.

,Slide
7

Descriptieve
analyse

:
data
eens
grafisch
voorstellen

(
boxplot
)

• Links
:
figuur
van
jongens,

rechts
:
meisjes

• Zwarte
lijn
=
mediaan
(
Jongens
:
6,

meisjes
:
7
)

Merk
op
:
bij
meisjes
!
med
(
P50
)
=
P75
hoe
kan
dat
?

Bovenkant
box
=
75e
percentiel.
stel
100
waarnemingen
dan
is
med
=
50e
meting
(
en
p75
is
dan
de

75e
meting).
Als
we
waarden
dan
ordent
van
klein
naar
groot
dan
kan
het
zijn
dat
50e
of
75e

waarneming
hetzelfde
zijn
(bv.
heel
veel
meisjes
die
een
7
geven).
Dan
kan
de
mediaan
of
het
75e

percentiel
gelijk
zijn.
Dit
is
hier
ook
zo.

• Obv
figuur
leiden
we
af
:
med
hoger
bij
meisjes
(
dus
zullen
hogere
score
hebben
denken
we
)

Kunnen
hier
een
independent
samples
t-‐test
op
loslaten.

• Bij
beschrijvende
statistieken
zien
we
de
gemiddelden
binnen
de
2
groepen
(
zien
we
al
dat
die

groter
is
bij
meisjes
dan
bij
jongens
–
met
een
verschil
van
0.5
).

• Bij
de
t-‐test
zelf
:

-‐ Doen
eerst
test
of
varianties
gelijk
zijn
:
is
zo

!
dus
kijken
naar
eerste
lijn

-‐ Besluit
van
de
t-‐test
(
obv
p-‐waarden
of
BTB
interval
)
!
H0
niet
verwerpen.

-‐ H0
was
:
de
gemiddelden
in
de
twee
groepen
zijn
gelijk.

Slide
8

Detail
:
die
81
kinderen
die
deelnamen
zijn
eigenlijk
niet
allemaal
onafhankelijk
van
elkaar.

Want
:
hebben
enkele
klassen
bekeken
(
4
)
!
dus
mogelijk
klas-‐effect
aanwezig

Bv.
klas
met
betere
sfeer
=
iedereen
ervaart
zichzelf
goed
=
hogere
populariteitsscores
!

Hier
houdt
t-‐test
geen
rekening
mee
!
-‐-‐>
hoe
dit
wel
doen?
(volgende
slides)

,Slide
9

en
10

Grafische
voorstelling
:

• X-‐as
:
verschillende
klassen
(
1
tot
4
)

• Y-‐as
:
gemiddelde
populariteitsscore
bij
jongens
(
blauw
)
en
meisjes
(roze)

Bevindingen
hierbij

• In
elke
klas
is
de
gemiddelde
populariteit
bij
de
meisjes
hoger
dan
bij
de
jongens.

• Hoofdeffect
van
Bij
de
ene
klas
is
dit
iets
meer
dan
in
de
andere
klas
maar
we
zien
het
effect
wel
in

elke
klas.
Wat
we
ook
zien
:
zeer
groot
klas-‐effect
!
gemiddelde
populariteit
(klas
1)
>>>
(
klas
2)

2.2Two-‐way
ANOVA

Slide
11

Moeten
dit
in
rekening
brengen
(
klasseneffect
)
!
Hoe
:
kunnen
eigenlijk
een
two-‐way
anova
doen.

We
kunnen
de
volgende
factoren
beschouwen
:
geslacht
(
J/M
)
en
klas
(
1,
2,
3,
4
).
Kunnen
een
two-‐way

anova
doen
met
deze
2
factoren
(
vandaar
two-‐way)
(
in
plaats
van
een
t-‐test
met
enkel
de
factor

geslacht).

Bij
two-‐way
anova
stellen
we
dat
de
uitkomst
(
populariteit
)
voor
de
k-‐de
leerling
uit
de
i-‐de
klas,
die
van

het
j-‐de
geslacht
is
,
dat
die
gelijk
is
aan
een
soort
globaal
gemiddelde
+
..
(
zie
slides)

Eens
we
de
klas
in
rekening
brengen
(
we
controleren
dus
eigenlijk
voor
geslacht
en
klas
in
ons
model
)

mogen
we
dus
wel

veronderstellen
dat
die
residuen
onafhankelijk
zijn
van
elkaar.
Dus
eens
we
binnen
een

klas
kijken
mogen
we
stellen
dat
de
observaties
onafhankelijk
zijn
van
elkaar.
Want
hebben
klaseffect

weggenomen
en
wat
overschiet

(
het
residu
)
mag
onafhankelijk
van
elkaar
verondersteld
worden.

Slide
12

Hoe
gaan
we
dat
nu
gaan
fitten?
!
2
mogelijkheden
:
effect-‐codering
of
dummy-‐codering

Wij
gebruiken
vaak
dummy.
Bij
effect-‐codering
is
mu
het
globale
gemiddelde
(
over
alle
groepen
en

geslachten
heen).
Bij
dummy
is
mu
=
het
gemiddelde
van
de
referentiegroep.

Dummy
:

• Voor
alle
leerlingen
die
in
klas1
zitten,
zal
D1
=
1

(
en
voor
alle
anderen
is
dit
0
)

• Voor
alle
leerlingen
die
in
klas2
zitten,
zal
D2
=
1

…

D1
geeft
dus
het
effect
weer
van
klas
1
tov
het
referentieniveau
(
klas
4
)

D2
geeft
effect
van
klas
2
tov
referentieniveau
(
klas
4
)

D3
geeft
effect
van
klas
3
tov
referentieniveau
(
klas
4
)

Slide
13

NOTATIE
:

Yij
=
de
j-‐de
meting
in
de
i-‐de
klas.

Dit
is
een
ander
notiatie
dan
bij
2-‐way
anova,
om
het
multi-‐level
model
straks
te
kunnen
introduceren.
Tus

vanaf
nu
als
we
spreken
over
mixed
models
gaan
we
dit
altijd
gebruiken
(
Yij).
Die
eerste
index
(i)
gaat

altijd
slaan
op
het
hoogste
niveau
in
de
hiërarchie
(
level
2-‐variabele
,
dus
in
ons
voorbeeld
:
klas).
Als
je

herhaalde
metingen
hebt
binnen
een
individu
dan
zou
die
eerste
index
slaan
op
het
individu.
De
tweede

,index
(
j)
zal
altijd
slaan
op
het
laagste
niveau
(
level
1-‐variabele,
dus
in
ons
voorbeeld
:
de
leerlingen
!

dus
j
metingen
in
elke
klas).
Merk
op
:
soms
zie
je
ook
het
omgekeerde
in
de
literatuur
maar
wij
gebruiken

het
dus
zo.

We
weten
dat
SPSS
altijd
laatste
groep
als
referentieniveau
gebruikt.

• Voor
klas
:
klas
4

• Voor
geslacht
:
geslacht
1

We
kunenn
dit
dan
ook
invoeren
:
xij
=
0
indien
jongen,
xij
=
1
indien
meisje.

Dan
wordt
het
model
dat
we
daarnet
zagen
herschreven
als
volgt
(
zie
slides
)
met
:

Yij

=
we
kijken
nog
altijd
naar
de
populariteit
van
het
j-‐de
kind,
naar
de
i-‐de
klas).

mu
=
gemiddelde
uit
referentiegroep
(
klas
4
en
geslacht
=
1
)

Alfa1
=
effect
van
klas
1
tov
referentieklas
(
klas
4
)

Alfa
2
=
effect
van
klas
2
tov
referentieklas

Alfa
3
=
effect
van
klas
3
tov
referentieklas

Beta
=
effect
van
jongens
tov
meisjes
in
populariteit
(
referentiegroep
zijn
meisjes
,
dus
als
xij
=0
gaat
het

over
de
jongens
,
dus
als
beta
groter
is
dan
nul,
dan
zou
dat
betekenen
dat
de
gemiddelde
populariteit
bij

jongens
groter
is.
Als
het
kleiner
is
dan
0
dan
zal
de
populariteit
bij
jongens
gemiddeld
kleiner
zijn).

Slide
14

We
kunnen
dit
ook
als
indicatorfunctie
schrijven
(
zie
slide
14).
Dus
wanneer
geslacht
nul
is
(
als
we
het

hebben
over
meisjes)
krijgt
de
indicatorfunctie
de
waarde
‘1’
(
als
de
uitspraak
tussen
haakjes
correct
is

krijgt
indicatorfunctie
de
waarde
1
,
anders
0).

We
kunnen
die
dummy’s
ook
zo
herschrijven
met
indicatorfuncties
(
is
daar
volledig
equivalent
mee).
Als

klas
=
1

(
als
die
uitspraak
waar
is
),
is
die
dummy
of
indicatorfunctie
gelijk
aan
1.

We
kunnen
dit
eigenlijk
ook
korter
gaan
schrijven
,
waarbij
we
restricties
opleggen
voor
alfa1

alfa
2
en
3.

Dan
hebben
we
dit
(
gele
fluo
).

Onderzoeksvraag
:

Hypothese
die
we
willen
testen
:
is
gemiddelde
populariteit
bij
J
en
M
dezelfde
?

Is
beta
=
0
?

!
als
Beta
=
0
dan
is
er
geen
verschil
in
populariteit
tussen
J
en
M.

Maar
in
dit
model
houden
we
nu
wel
rekening
met
de
klassen
(
<>
t-‐test
van
daarnet).

Dus
:
is
gemiddelde
populariteit
gelijk
bij
J
en
M
(
controlerend
voor
een
eventueel
klaseffect).

Slide
15
en
16

H0
gaan
testen
in
SPSS
met
Two-‐way
ANOVA

:

“Analyze
–
general
linear
model
–
univariate”

• Reden
!
Herinner
u
:
we
veronderstelden
de
residuen
onafhankelijk
van
elkaar
want
we
brachten

school
in
rekening
,
dus
daarom
is
het
univariate.

• Afhankelijke
variabelen

=
Populariteit

• Factoren
in
ons
model
=
school
en
geslacht
(
2
factoren
die
we
in
rekening
brengen).

, • Model
specifiëren
:
full
factorial
!
dan
zouden
we
hoofdeffecten
en
interactie
tussen
alle
factoren

in
rekening
brengen.
Maar
ons
model
heeft
eigenlijk
geen
interacties
!
we
kijken
niet
of
er
nog

eens
een
verschillend
effect
is
van
geslacht
per
school.
Wij
kijken
enkel
nr
de
hoofdeffecten.

Dus
:
custom
model
en
dan
de
2
factoren
invoegen

• Options
:
parameter
schatters
willen
we
zien
(
aanvinken
)

OUTPUT
:

TABEL:
test
of
between
subjects
effects

• Vrijheidsgraden

-‐ We
hebben
in
totaal
81
observaties

(
df
=
81
bij
totaal
)

-‐ Df(
school
)
=
3
(
3
parameters
alfa
hiervoor
,
want
3
dummy’s
)

-‐ Df(geslacht)
=
1
(
1
parameter
beta
voor
effect
van
geslacht
)

-‐ Df
(
corrected
model
)
=
3
+
1

=
4

• Beide
(hoofd)effecten
zijn
significant
(
van
geslacht
en
van
klas
)
(
zie
roze
)

TABEL
:
parameter
estimates

• Wat
is
nu
precies
het
effect
van
geslacht
en
klas
?

-‐ Geslacht
:
gemiddeld
populariteit
van
-‐0.48
bij
jongens
ivm
meisjes
(
minder
dus
)

Significant?
JA
want
p<
0.05
en
0
niet
in
BTB
interval
-‐-‐>
(
ps
:
als
we
geen
interactietermen

hebben
gaan
de
p-‐waarden
altijd
hetzelfde
zijn
van
de
anova
tabel
als
van
de
t-‐testen
!
)

Conclusie
:
populariteit
tussen
J/M
verschilt
wel
degelijk

(andere
conclusie
dan
bij
t-‐test
!
dit
is
de
juiste
conclusie
nu
,
want
nu
hebben
we
klaseffect
in

rekening
gebracht
,
en
daarnet
niet
)
.

-‐ Intercept
=
6.6

=
gemiddelde
populariteit
in
referentieniveau
(
met
school
4
en
seks
1
)

dus
voor
meisjes
van
klas
4
is
de
gemiddelde
populariteit
6.6

-‐ Klas
:

# (school1)
:
verschil
van
school
1
tov
referentieniveau
(
meisjes
uit
school
4).

=
Gemiddelde
populariteit
bij
meisjes
is
1.15
HOGER
dan
in
school
4
(
significant)

# (school2):
gemiddelde
populariteit
bij
meisjes
is
2,3
MINDER
dan
in
school
4
(significant
)

# (school3):
gemiddelde
populariteit
bij
meisjes
is
0.35
MEER
dan
in
school
4

(
dit
is
toch
niet
sign
?????
).

Effecten
even
grafisch
voorstellen
:

Bekijken
populariteit
bij
jongens
en
meisjes
in
die
4
scholen.
Dus
kunnen
die
geschatte
effecten
nu
eens

grafisch
voorstellen.
X-‐as
=
meisjes
(
referentiegroep
).
Het
intercept
in
school4
was
6.6.
De
zwarte
lijn

stemt
overeen
met
school
4.
We
hadden
gezien
dat
in
school
1
de
populariteit
1.1
hoger
ligt
dus
in
school
1

Dit zijn jouw voordelen als je samenvattingen koopt bij Stuvia:

Bewezen kwaliteit door reviews

Studenten hebben al meer dan 850.000 samenvattingen beoordeeld. Zo weet jij zeker dat je de beste keuze maakt!

In een paar klikken geregeld

Geen gedoe — betaal gewoon eenmalig met iDeal, Bancontact of creditcard en je bent klaar. Geen abonnement nodig.

Focus op de essentie

Studenten maken samenvattingen voor studenten. Dat betekent: actuele inhoud waar jij écht wat aan hebt. Geen overbodige details!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.