Week 1
Toetsende statistiek:
- Om een algemene uitspraak te doen over het verband tussen twee variabelen;
biavariate analyse
- Steekproef vs. populatie
- Inferentiële statistiek: term inferentie verwijst naar het generaliseren van de
resultaten van een steekproef naar de gehele populatie. We gebruiken de
steekproefdata om conclusies te trekken over de populatie.
- Omgaan met onzekerheid
Statistische toets uitvoeren:
1. Nulhypothese opstellen
2. Toetsstatistiek
3. Kritieke waarde
4. Beslissing → nulhypothese aannemen of verwerpen?
One-sample t-test: steekproefgemiddelde vergelijken met een vaste waarde
Paired-samples t-test (voor- en nameting in één groep)
Independent samples-test = t-toets voor twee onafhankelijke steekproeven: je
vergelijkt 2 aparte groepen op basis van een gemiddelde.
De t-toets voor (twee) onafhankelijke steekproeven
- Gebruiken we als we willen toetsen of het gemiddelde van twee aparte
groepen aan elkaar gelijk zijn.
- De twee steekproeven zijn aselect en onafhankelijk van elkaar getrokken,
alleen dan kunnen we betrouwbare uitspraken doen over de populatie.
Groepen hoeven niet even groot te zijn.
- Significant: verschil is substantieel genoeg om toe te schrijven aan de
verschillende condities.
- Effect behandeling: er is een significant verschil tussen beide groepen op de
uitkomstmaat.
- Twee opties om de independent samples te toetsen: niet-homogene varianties
en homogene (pooled) varianties
Als de varianties niet gelijk zijn, gebruiken we een aangepaste formule.
Als de varianties wel gelijk zijn, gebruiken we bij het bereken van de toetsstatistiek de
gepoolde schatter van de gezamenlijk variantie.
,4 stappen:
1. Opstellen nulhypothese
a. H0 : 𝜇1 = 𝜇2 ofwel H0 : 𝜇1 − 𝜇2 = 0
b. H1 : 𝜇1 ≠ 𝜇2 ofwel H1 : 𝜇1 − 𝜇2 ≠ 0
2. Toetsstatistiek
a. Het verschil tussen de twee gemiddelden omgezet in
gestandaardiseerde t-score
3. Kritieke waarde
a. Is het verschil tussen ‘𝜇1 − 𝜇2 ’ en ‘0’ significant?
b. Hoe groot verschil is genoeg om H0 te verwerpen?
4. Beslissing
a. Overschrijdt de t-score de kritieke waarde? → significant verschil/niet-
toevallig verschil → nulhypothese wordt verworpen →
steekproefgemiddelden zijn verschillend
Independent samples t-toets rekenvoorbeeld
Gemiddelden van twee onafhankelijke steekproeven met elkaar vergelijken.
4 stappen:
1. Nulhypothese
a. Verschil tussen populatiegemiddelden is onbekend, we gaan uit van de
nulhypothese dat 𝜇1 − 𝜇2 = 0
2. Toetsstatistiek
a. Het verschil tussen gemiddelden omgezet in ‘standaard’ toetsstatistiek
t-score
3. Kritieke waarde
a. Is het verschil tussen ‘𝜇1 − 𝜇2 ’ en ‘0’ significant?
b. Hoe groot verschil is genoeg om H0 te verwerpen?
4. Beslissing
a. Bij een significant verschil veronderstellen we dat de gemiddelden uit
verschillende populaties komen
Opstellen nulhypothese
- H0 : 𝜇1 = 𝜇2 ofwel H0 : 𝜇1 − 𝜇2 = 0
- H1 : 𝜇1 ≠ 𝜇2 ofwel H1 : 𝜇1 − 𝜇2 ≠ 0
Independent samples t-toets: toetsstatistiek t
(𝑋̅ −𝑋̅ )−(𝜇1 −𝜇2 )
- 𝑡 = 1 𝑆2 =
̅ 1 −𝑋
𝑋 ̅2
𝑋̅1 −𝑋̅2
- 𝑡=𝑆
̅ 1 −𝑋
𝑋 ̅2
𝑋̅1 − 𝑋̅2= gemeten verschil tussen de steekproefgemiddelden
𝜇1 − 𝜇2 = verwachte verschil tussen de populatiegemiddelden
𝑆𝑋̅1−𝑋̅2 = standaardfout (gemaakt op basis van (gepoolde) steekproefvarianties
- Onder de nulhypothese: H0 : 𝜇1 = 𝜇2 valt (𝜇1 − 𝜇2 = 0) weg, want je verwacht
geen verschil
- Voor de standaardfout gelden twee verschillende procedures:
, o Varianties in beide steekproeven rondom het steekproefgemiddelden
gelijk zijn (equal variances assumed) gebruik maken van de gepoolde
schatter van de variantie.
o Varianties in beide steekproeven rondom het steekproefgemiddelden
zijn niet gelijk/er zijn geen homogene varianties (equal variances not
assumed)
Dus: de pooled variance is een methode om de (gemeenschappelijke)
populatievariantie (op basis van de twee steekproeven) te schatten:
- Gegeven dat 2 onafhankelijke steekproeven zijn getrokken met mogelijk
verschillende gemiddelden, maar met dezelfde variantie.
- Je gebruikt het kleinst aantal vrijheidsgraden (df) → dus of van n1 – 1 of van
n2 – 1
,
Toetsende statistiek:
- Om een algemene uitspraak te doen over het verband tussen twee variabelen;
biavariate analyse
- Steekproef vs. populatie
- Inferentiële statistiek: term inferentie verwijst naar het generaliseren van de
resultaten van een steekproef naar de gehele populatie. We gebruiken de
steekproefdata om conclusies te trekken over de populatie.
- Omgaan met onzekerheid
Statistische toets uitvoeren:
1. Nulhypothese opstellen
2. Toetsstatistiek
3. Kritieke waarde
4. Beslissing → nulhypothese aannemen of verwerpen?
One-sample t-test: steekproefgemiddelde vergelijken met een vaste waarde
Paired-samples t-test (voor- en nameting in één groep)
Independent samples-test = t-toets voor twee onafhankelijke steekproeven: je
vergelijkt 2 aparte groepen op basis van een gemiddelde.
De t-toets voor (twee) onafhankelijke steekproeven
- Gebruiken we als we willen toetsen of het gemiddelde van twee aparte
groepen aan elkaar gelijk zijn.
- De twee steekproeven zijn aselect en onafhankelijk van elkaar getrokken,
alleen dan kunnen we betrouwbare uitspraken doen over de populatie.
Groepen hoeven niet even groot te zijn.
- Significant: verschil is substantieel genoeg om toe te schrijven aan de
verschillende condities.
- Effect behandeling: er is een significant verschil tussen beide groepen op de
uitkomstmaat.
- Twee opties om de independent samples te toetsen: niet-homogene varianties
en homogene (pooled) varianties
Als de varianties niet gelijk zijn, gebruiken we een aangepaste formule.
Als de varianties wel gelijk zijn, gebruiken we bij het bereken van de toetsstatistiek de
gepoolde schatter van de gezamenlijk variantie.
,4 stappen:
1. Opstellen nulhypothese
a. H0 : 𝜇1 = 𝜇2 ofwel H0 : 𝜇1 − 𝜇2 = 0
b. H1 : 𝜇1 ≠ 𝜇2 ofwel H1 : 𝜇1 − 𝜇2 ≠ 0
2. Toetsstatistiek
a. Het verschil tussen de twee gemiddelden omgezet in
gestandaardiseerde t-score
3. Kritieke waarde
a. Is het verschil tussen ‘𝜇1 − 𝜇2 ’ en ‘0’ significant?
b. Hoe groot verschil is genoeg om H0 te verwerpen?
4. Beslissing
a. Overschrijdt de t-score de kritieke waarde? → significant verschil/niet-
toevallig verschil → nulhypothese wordt verworpen →
steekproefgemiddelden zijn verschillend
Independent samples t-toets rekenvoorbeeld
Gemiddelden van twee onafhankelijke steekproeven met elkaar vergelijken.
4 stappen:
1. Nulhypothese
a. Verschil tussen populatiegemiddelden is onbekend, we gaan uit van de
nulhypothese dat 𝜇1 − 𝜇2 = 0
2. Toetsstatistiek
a. Het verschil tussen gemiddelden omgezet in ‘standaard’ toetsstatistiek
t-score
3. Kritieke waarde
a. Is het verschil tussen ‘𝜇1 − 𝜇2 ’ en ‘0’ significant?
b. Hoe groot verschil is genoeg om H0 te verwerpen?
4. Beslissing
a. Bij een significant verschil veronderstellen we dat de gemiddelden uit
verschillende populaties komen
Opstellen nulhypothese
- H0 : 𝜇1 = 𝜇2 ofwel H0 : 𝜇1 − 𝜇2 = 0
- H1 : 𝜇1 ≠ 𝜇2 ofwel H1 : 𝜇1 − 𝜇2 ≠ 0
Independent samples t-toets: toetsstatistiek t
(𝑋̅ −𝑋̅ )−(𝜇1 −𝜇2 )
- 𝑡 = 1 𝑆2 =
̅ 1 −𝑋
𝑋 ̅2
𝑋̅1 −𝑋̅2
- 𝑡=𝑆
̅ 1 −𝑋
𝑋 ̅2
𝑋̅1 − 𝑋̅2= gemeten verschil tussen de steekproefgemiddelden
𝜇1 − 𝜇2 = verwachte verschil tussen de populatiegemiddelden
𝑆𝑋̅1−𝑋̅2 = standaardfout (gemaakt op basis van (gepoolde) steekproefvarianties
- Onder de nulhypothese: H0 : 𝜇1 = 𝜇2 valt (𝜇1 − 𝜇2 = 0) weg, want je verwacht
geen verschil
- Voor de standaardfout gelden twee verschillende procedures:
, o Varianties in beide steekproeven rondom het steekproefgemiddelden
gelijk zijn (equal variances assumed) gebruik maken van de gepoolde
schatter van de variantie.
o Varianties in beide steekproeven rondom het steekproefgemiddelden
zijn niet gelijk/er zijn geen homogene varianties (equal variances not
assumed)
Dus: de pooled variance is een methode om de (gemeenschappelijke)
populatievariantie (op basis van de twee steekproeven) te schatten:
- Gegeven dat 2 onafhankelijke steekproeven zijn getrokken met mogelijk
verschillende gemiddelden, maar met dezelfde variantie.
- Je gebruikt het kleinst aantal vrijheidsgraden (df) → dus of van n1 – 1 of van
n2 – 1
,