Spiekbriefje tentamen MVDA
Keuze maken voor de juiste test
Stappenplan
1. Wat zijn de variabelen?
2. Zijn er bepaalde variabelen die we als onafhankelijke of afhankelijke variabelen kunnen
aanmerken?
3. Wat zijn de meetniveaus van de variabelen?
4. Wat is de onderzoeksvraag?
Welke techniek hangt af van de meetniveaus van de variabelen
Meetniveau X Meetniveau Y Methode
Enkele set Interval - ANOVA met herhaalde
metingen
Twee reeksen met Interval* Interval Meervoudige
één variabele in Y regressieanalyse
(MRA) / mediatie
Nominaal* Interval ANOVA
Nominaal + Interval* Interval Covariantieanalyse
(ANCOVA)
Interval* Binair Logistische
regressieanalyse (LRA)
Interval* Nominaal Discriminerende
analyse
Twee reeksen met Nominaal Interval Multivariate
meerdere variabelen variantieanalyse
in Y (MANOVA)
Al deze X-variabelen kunnen ook BIN zijn
Verschil dependent en independent sample t test:
Dependent: allebei de variabelen hebben te maken met eenzelfde andere variabele
- Vb. interesse van één kind wordt gemeten door zowel de ouders als de leraar
Independent: allebei de variabelen hebben te maken met verschillende variabelen
- Vb. tien kinderen hun interesse worden gemeten door hun ouders, de interesse van tien
andere kinderen wordt gemeten door hun leraar
Paired samples t-test: als alle condities door dezelfde proefpersonen worden uitgevoerd (within
subjects design)
Rapporteren: t(..) = …, p = …, d = …
d = Cohen’s d, af te lezen op SPSS: Paired Samples Effect Sizes rij van Cohen’s d Point Estimate
Het verschil tussen EFA en CFA
, - Bij CFA heb je al een heel duidelijk idee welke variabelen (items) wat meten en dan ga je
kijken of de structuur die je verondersteld klopt
- Bij EFA ga je kijken welke variabelen (items) wat meten
Meervoudige regressieanalyse (MRA)
Constant = intercept (b0)
Onafhankelijke variabele = slope (b1)
Doel:
- Y voorspellen op basis van X; correlationeel
- Gekwadrateerde residuen zo klein mogelijk zodat voorspelde waarden zo min mogelijk
verschillen van de gemiddelde waarden
Meervoudige regressieanalyse > enkelvoudige regressie = elimineren van mogelijke spurieuze relatie
Ongestandaardiseerde regressievergelijking
- Steekproef: ŷ = b0 + b1x1 + b2x2 + bkxk
- Populatie: μy = β0 + β1x1 + β2x2 + βkxk
b1 = helling/slope (verschil in y als x 1 stijgt)
Gestandaardiseerde regressievergelijking
Gestandaardiseerd: (Y)st = β1(X1)sd + β2(X2)sd + βk(Xk)sd
Hoe groter β hoe belangrijk de predictor
X −µ
z=
σ
Interpretatie van de ongestandaardiseerde en gestandaardiseerde coëfficiënten
Ongestandaardiseerd:
X1 + 1 gemiddelde toename van Y met b1
Gestandaardiseerd:
X1 + 1 st.dev. on average, Y + β1 st.dev.
Deel van de verklaarde variantie in de steekproef
SS model
VAF model =
SS total
, SS error
VAF fout =1−
SS total
2
VAF=r
Meer voorspellers minder foutvariantie betere voorspelling van y
Variantie (VAF) in populatie
2
(1−R )(n−1)
Voor populatie: adj R2=1−
n−p−1
Adj R2: gecorrigeerd voor aantal voorspellers
Meer voorspellers kleinere adj R2
Standaardfout van de schatting: se =√ MSE
F-test
Bekijkt verhouding tussen verklaarde en onverklaarde variantie
Altijd tweezijdig, handig voor meerdere variabelen
Hypothesen regressie model:
H0: b*1 = b*2 = … = b*k = 0 (OF R2 = 0)
Ha: tenminste één b*j ≠ 0 (OF R2 > 0)
MS ŷ
F (df ŷ , df e )= dfŷ = p, dfe = n-p-1
MSE
t-test
Hypothesen voor elke predictor:
H0: b*1 = 0
Ha: b*1 ≠ 0
Formuleren: β = …, t(n-p-1) = …, p = …
Hoe goed is de predictor?
2 2 r 2Y 1 +r 2Y 2−2 r Y 1 r Y 2 r 12
R =R Y .12 = 2
√ ❑1−r 12
2 SS effect
OF R =VAF =
SStotal
Keuze maken voor de juiste test
Stappenplan
1. Wat zijn de variabelen?
2. Zijn er bepaalde variabelen die we als onafhankelijke of afhankelijke variabelen kunnen
aanmerken?
3. Wat zijn de meetniveaus van de variabelen?
4. Wat is de onderzoeksvraag?
Welke techniek hangt af van de meetniveaus van de variabelen
Meetniveau X Meetniveau Y Methode
Enkele set Interval - ANOVA met herhaalde
metingen
Twee reeksen met Interval* Interval Meervoudige
één variabele in Y regressieanalyse
(MRA) / mediatie
Nominaal* Interval ANOVA
Nominaal + Interval* Interval Covariantieanalyse
(ANCOVA)
Interval* Binair Logistische
regressieanalyse (LRA)
Interval* Nominaal Discriminerende
analyse
Twee reeksen met Nominaal Interval Multivariate
meerdere variabelen variantieanalyse
in Y (MANOVA)
Al deze X-variabelen kunnen ook BIN zijn
Verschil dependent en independent sample t test:
Dependent: allebei de variabelen hebben te maken met eenzelfde andere variabele
- Vb. interesse van één kind wordt gemeten door zowel de ouders als de leraar
Independent: allebei de variabelen hebben te maken met verschillende variabelen
- Vb. tien kinderen hun interesse worden gemeten door hun ouders, de interesse van tien
andere kinderen wordt gemeten door hun leraar
Paired samples t-test: als alle condities door dezelfde proefpersonen worden uitgevoerd (within
subjects design)
Rapporteren: t(..) = …, p = …, d = …
d = Cohen’s d, af te lezen op SPSS: Paired Samples Effect Sizes rij van Cohen’s d Point Estimate
Het verschil tussen EFA en CFA
, - Bij CFA heb je al een heel duidelijk idee welke variabelen (items) wat meten en dan ga je
kijken of de structuur die je verondersteld klopt
- Bij EFA ga je kijken welke variabelen (items) wat meten
Meervoudige regressieanalyse (MRA)
Constant = intercept (b0)
Onafhankelijke variabele = slope (b1)
Doel:
- Y voorspellen op basis van X; correlationeel
- Gekwadrateerde residuen zo klein mogelijk zodat voorspelde waarden zo min mogelijk
verschillen van de gemiddelde waarden
Meervoudige regressieanalyse > enkelvoudige regressie = elimineren van mogelijke spurieuze relatie
Ongestandaardiseerde regressievergelijking
- Steekproef: ŷ = b0 + b1x1 + b2x2 + bkxk
- Populatie: μy = β0 + β1x1 + β2x2 + βkxk
b1 = helling/slope (verschil in y als x 1 stijgt)
Gestandaardiseerde regressievergelijking
Gestandaardiseerd: (Y)st = β1(X1)sd + β2(X2)sd + βk(Xk)sd
Hoe groter β hoe belangrijk de predictor
X −µ
z=
σ
Interpretatie van de ongestandaardiseerde en gestandaardiseerde coëfficiënten
Ongestandaardiseerd:
X1 + 1 gemiddelde toename van Y met b1
Gestandaardiseerd:
X1 + 1 st.dev. on average, Y + β1 st.dev.
Deel van de verklaarde variantie in de steekproef
SS model
VAF model =
SS total
, SS error
VAF fout =1−
SS total
2
VAF=r
Meer voorspellers minder foutvariantie betere voorspelling van y
Variantie (VAF) in populatie
2
(1−R )(n−1)
Voor populatie: adj R2=1−
n−p−1
Adj R2: gecorrigeerd voor aantal voorspellers
Meer voorspellers kleinere adj R2
Standaardfout van de schatting: se =√ MSE
F-test
Bekijkt verhouding tussen verklaarde en onverklaarde variantie
Altijd tweezijdig, handig voor meerdere variabelen
Hypothesen regressie model:
H0: b*1 = b*2 = … = b*k = 0 (OF R2 = 0)
Ha: tenminste één b*j ≠ 0 (OF R2 > 0)
MS ŷ
F (df ŷ , df e )= dfŷ = p, dfe = n-p-1
MSE
t-test
Hypothesen voor elke predictor:
H0: b*1 = 0
Ha: b*1 ≠ 0
Formuleren: β = …, t(n-p-1) = …, p = …
Hoe goed is de predictor?
2 2 r 2Y 1 +r 2Y 2−2 r Y 1 r Y 2 r 12
R =R Y .12 = 2
√ ❑1−r 12
2 SS effect
OF R =VAF =
SStotal