Statistiek 2 samenvatting
Inhoud
Symbolenregister .................................................................................................................................... 2
Wiskundige vergelijking register ............................................................................................................. 3
Begrippenregister ................................................................................................................................... 4
SPSS-register ........................................................................................................................................... 7
Stappenplannen .................................................................................................................................... 13
H0 & Ha ................................................................................................................................................. 34
Toetsvragen .......................................................................................................................................... 38
Afbeeldingen ......................................................................................................................................... 40
1
, Symbolenregister
µ = populatiegemiddelde (ook wel ‘mu’ genoemd)
N = steekproefomvang
𝑥̅ / E = steekproefgemiddelde (ook wel ‘x-bar’ genoemd of ‘expectation value’)
X = waarde van de observatie
S = standaardafwijking in steekproef
𝜎𝑥 = standaardfout (standaarddeviatie in steekproevenverdeling)
𝜎 = standaardafwijking van de populatie
P/ Sig = de overschrijdingskans
A = verwerpingsgebied (alpha)
Bi = betrouwbaarheidsinterval
𝐵𝐼95 = interval waarbinnen µ ligt met 95% betrouwbaarheid. Dus: op elke 100 steekproeven, zijn er
95 waarbij betrouwbaarheidsinterval de waarde µ bevat.
MSg = mean square group
MSe = mean square error
F = spreiding tussen groepsgemiddelden/ spreiding die je op basis van toeval zou verwachten
X2 = Chi kwadraat/ Pearson Chi-Square. Vergelijking geobserveerde celfrequentie (O) met verwachte
celfrequentie (E) in kruistabel.
D% = different percentages (tussen twee cellen in kruistabel)
𝜏 = Kendall’s Tau
Z = Kendall’s Tau
P/ Rs = Spearmans rangcorrelatie
r = Pearson’s correlatiecoëfficiënt (maat voor sterkte lineaire samenhang)
R Square = proportie verklaarde variantie. Bijvoorbeeld → Het verschil in inkomen wordt voor .002
verklaard door werkuren in de week. Dus 0.2%
T = storende variabele in multivariate analyse
2
, Wiskundige vergelijking register
Z-score = z=(x -̅ x)/S
Z-score → de precieze positie bepalen ten opzichte van de groep in de
steekproef
𝑥̅ −𝜇
Z-score = 𝑧 = 𝜎𝑥
Z-score → wat zegt jouw steekproefresultaat over het populatieresultaat?
Standaardfout: 𝜎𝑥̅ = 𝜎 ∕ √𝑛 → standaarddeviatie in steekproevenverdeling
Betrouwbaarheidsinterval berekenen:
Zc.v. = foutenmarge. Kritische toetswaarde Z. Bij 95% betrouwbaarheidsinterval is de kritische
toetswaarde bij 5%.
Cramers V → sterkte van een effect bepalen in een kruistabelanalyse. Vergelijken met wat je
maximaal had kunnen vinden in het onderzoek (X2 max).
3
, V=0: geen verband
V=1: statistisch perfect verband
F-toets → in hoeverre zijn verschillen tussen groepen groter dan verschillen binnen groepen?
𝑚𝑠𝐺
𝐹=
𝑚𝑠𝑒
Regressievergelijking/ regressieanalyse → 2 variabelen hangt mogelijke samenhang. Welke impact
heeft de ene variabele op de ander? Zijn we in staat om de y-as te voorspellen aan de hand van x.
a + b * predictor
Zie ook afbeeldingen!
Meerdere predictoren in de regressie →
a + b1 * predictor + b2 * predictor
Zie ook afbeeldingen!
Begrippenregister
Centrale limietstelling: de steekproevenverdeling neemt de vorm van een normaalverdeling aan
indien de steekproefomvang (N) hoger is dan 30.
De overschrijdingskans(P): de kans dat we de gevonden steekproefuitkomst of een nog extremere
uitkomst vinden, als H0 waar is.
Verwerpingsgebied/ signicantieniveau (A/ Alpha): criterium waar P tegen wordt beoordeeld. In de
sociale wetenschap 5% - 0.05.
Eenzijdig toetsen: de Ha is gericht (op basis van literatuur verwacht je bijvoorbeeld afname of
toename). Alleen maar de P door 2en delen als je een eenzijdige toets hebt gedaan!
Tweezijdig toetsen: de Ha is ongericht (er is enkel sprake van een mogelijke verandering). SPSS doet
altijd een tweezijdige toets.
4
Inhoud
Symbolenregister .................................................................................................................................... 2
Wiskundige vergelijking register ............................................................................................................. 3
Begrippenregister ................................................................................................................................... 4
SPSS-register ........................................................................................................................................... 7
Stappenplannen .................................................................................................................................... 13
H0 & Ha ................................................................................................................................................. 34
Toetsvragen .......................................................................................................................................... 38
Afbeeldingen ......................................................................................................................................... 40
1
, Symbolenregister
µ = populatiegemiddelde (ook wel ‘mu’ genoemd)
N = steekproefomvang
𝑥̅ / E = steekproefgemiddelde (ook wel ‘x-bar’ genoemd of ‘expectation value’)
X = waarde van de observatie
S = standaardafwijking in steekproef
𝜎𝑥 = standaardfout (standaarddeviatie in steekproevenverdeling)
𝜎 = standaardafwijking van de populatie
P/ Sig = de overschrijdingskans
A = verwerpingsgebied (alpha)
Bi = betrouwbaarheidsinterval
𝐵𝐼95 = interval waarbinnen µ ligt met 95% betrouwbaarheid. Dus: op elke 100 steekproeven, zijn er
95 waarbij betrouwbaarheidsinterval de waarde µ bevat.
MSg = mean square group
MSe = mean square error
F = spreiding tussen groepsgemiddelden/ spreiding die je op basis van toeval zou verwachten
X2 = Chi kwadraat/ Pearson Chi-Square. Vergelijking geobserveerde celfrequentie (O) met verwachte
celfrequentie (E) in kruistabel.
D% = different percentages (tussen twee cellen in kruistabel)
𝜏 = Kendall’s Tau
Z = Kendall’s Tau
P/ Rs = Spearmans rangcorrelatie
r = Pearson’s correlatiecoëfficiënt (maat voor sterkte lineaire samenhang)
R Square = proportie verklaarde variantie. Bijvoorbeeld → Het verschil in inkomen wordt voor .002
verklaard door werkuren in de week. Dus 0.2%
T = storende variabele in multivariate analyse
2
, Wiskundige vergelijking register
Z-score = z=(x -̅ x)/S
Z-score → de precieze positie bepalen ten opzichte van de groep in de
steekproef
𝑥̅ −𝜇
Z-score = 𝑧 = 𝜎𝑥
Z-score → wat zegt jouw steekproefresultaat over het populatieresultaat?
Standaardfout: 𝜎𝑥̅ = 𝜎 ∕ √𝑛 → standaarddeviatie in steekproevenverdeling
Betrouwbaarheidsinterval berekenen:
Zc.v. = foutenmarge. Kritische toetswaarde Z. Bij 95% betrouwbaarheidsinterval is de kritische
toetswaarde bij 5%.
Cramers V → sterkte van een effect bepalen in een kruistabelanalyse. Vergelijken met wat je
maximaal had kunnen vinden in het onderzoek (X2 max).
3
, V=0: geen verband
V=1: statistisch perfect verband
F-toets → in hoeverre zijn verschillen tussen groepen groter dan verschillen binnen groepen?
𝑚𝑠𝐺
𝐹=
𝑚𝑠𝑒
Regressievergelijking/ regressieanalyse → 2 variabelen hangt mogelijke samenhang. Welke impact
heeft de ene variabele op de ander? Zijn we in staat om de y-as te voorspellen aan de hand van x.
a + b * predictor
Zie ook afbeeldingen!
Meerdere predictoren in de regressie →
a + b1 * predictor + b2 * predictor
Zie ook afbeeldingen!
Begrippenregister
Centrale limietstelling: de steekproevenverdeling neemt de vorm van een normaalverdeling aan
indien de steekproefomvang (N) hoger is dan 30.
De overschrijdingskans(P): de kans dat we de gevonden steekproefuitkomst of een nog extremere
uitkomst vinden, als H0 waar is.
Verwerpingsgebied/ signicantieniveau (A/ Alpha): criterium waar P tegen wordt beoordeeld. In de
sociale wetenschap 5% - 0.05.
Eenzijdig toetsen: de Ha is gericht (op basis van literatuur verwacht je bijvoorbeeld afname of
toename). Alleen maar de P door 2en delen als je een eenzijdige toets hebt gedaan!
Tweezijdig toetsen: de Ha is ongericht (er is enkel sprake van een mogelijke verandering). SPSS doet
altijd een tweezijdige toets.
4