Onderwerpen:
• Betrouwbaarheidsinterval
• Correlatie en variantie
• Lineaire enkelvoudige regressie
• Lineaire multiple regressie
• Logistische regressie
• Een-weg ANOVA
• Twee-weg ANOVA
• MSM, MSE en F
• Regressie met dummy variabelen
• ANCOVA
• Contrasten
1 onafhankelijke variabele Meer dan 1
onafhankelijke variabelen
Categorisch Continue Categorisch Continue
Afhankelijke Categorisch Kruistabel Enkelvoudige Multiple Multiple
variabele 𝑋2 logistische logistische Logistische
regressie regressie regressie
Continue Een-weg Enkelvoudige Twee – weg Multiple
ANOVA regressie ANOVA regressie
, Betrouwbaarheid interval
Wanneer: Een BHI is geeft een interval weer, veelal een 95% interval. Met dit interval kan er voor
95% zekerheid gezegd worden dat het populatiegemiddelde hierin valt. Een BHI wordt gebruikt
wanneer men iets wil zeggen over populatiewaarden vanuit steekproefwaarden.
Een BHI kan gebruikt worden voor zowel gemiddelden als proporties.
Stappenplan berekening:
1. Bepaal de parameters of statistic
- Parameter wanneer het gegevens van een steekproef betreft
- Statistic wanneer het gegevens van de populatie betreft
2. Bepaal de z- of t-waarde
- Gebruik de z-verdeling wanneer de populatie standaarddeviatie bekend is
- Gebruik de t-verdeling wanner de populatie standaarddeviatie onbekend is
One sample: z*: ∞ in tabel B
t*: Opzoeken df(n-1) in tabel B
Two sample: z*: ∞ in tabel B
t*: Opzoeken df(n1+n2-2) in tabel b – gepoold
t*: Opzoeken df(n-1) in tabel b – neem kleinste n bij niet gepoolde versie
3. Bepaal de standaarderror
One sample: Voor gemiddelde: Z: 𝑆𝐸𝑦̄ = 𝜎/√𝑛
T: 𝑆𝐸𝑦̄ = 𝑠/√𝑛 → df= n-1
̂ (1−𝜋
𝜋 ̂)
Voor proportie: 𝑆𝐸𝜋̂ = √ 𝑛
𝜎2 𝜎2
Two sample: Voor gemiddelde: Z: 𝑆𝐸𝑦̄ 1 −𝑦̄ 2 = √𝑛1 + 𝑛2
1 2
𝑠2 𝑠2
T: 𝑆𝐸𝑦̄ 1 −𝑦̄ 2 = √1 + 2 → df = kleinste n – 1
𝑛1 𝑛2
𝑠2 𝑠2
T- pooled: 𝑆𝐸𝑦̄ 1 −𝑦̄ 2 = √𝑛𝑝 + 𝑛𝑝
1 2
1 1
df=n1+n2-2 𝑆𝐸𝑦̄ 1 −𝑦̄ 2 = 𝑠𝑝 √ +
𝑛1 𝑛2
̂ 1 (1−𝜋
𝜋 ̂1) ̂ (1−𝜋
𝜋 ̂ )
Voor proportie: 𝑆𝐸𝜋̂1 −𝜋̂2 = √ 𝑛1
+ 2𝑛 2
2
4. Bepaal de foutenmarge
M = z * SE
5. Verwerk m in de schatting voor populatiegemiddelde
𝜇 = 𝑥̅ ± 𝑚
6. Noteren als onder en bovengrens
7. Informatie interpreteren
Z: Valt het populatiegemiddelde binnen of buiten de grenzen
T: in x procent zal het populatiegemiddelde liggen tussen ondergrens en bovengrens
, SPPS output:
__ Gebruik je voor de t-toets
__ Onder en bovengrens
Noteren als onder en bovengrens: -3.9694 < 𝜇
< 2.800
Interpreteren gegevens: We zijn 95% zeker dat de parameter ligt tussen ‘ondergrens’ en
‘bovengrens’.
Voorbeeld:
Gemiddelde:
Vraag: Wat zou het populatiegemiddelde kunnen zijn? Ga uit van
een 90 procent BHI. Er geld een SD van 10
Stap 1: Statistic
Steekproefgemiddelde: 𝑥̅ = 27,95
Stap 2: Kritieke z-waarde
Bij 90% = 1.645
Stap 3: Standaard error
𝑆𝐸𝑦̄ = 𝜎/√𝑛) - 𝑆𝐸𝑦̄ = 10/√41) = 1.56
Stap 4: foutenmarge
M=z * SE = 1.654 * 1.56 = 2.57
Stap 4: interval opstellen
𝑥̅ ± 𝑚 → 27.95 ± 2.57
25.38 < 𝜇 < 30.52
Proportie:
Onderzoek naar populatieproportie voor ja stemmers
Stap 1: Statistic
𝜋 = x/n = 28/40 = 0.70
Stap 2: Kritieke z-waarde
Bij 90% = 1.645
Stap 3: Standaard error
̂ (1−𝜋
𝜋 ̂) ̂ (1−0,7
0,7 ̂)
𝐸𝜋̂ = √ 𝑛
= 𝐸𝜋̂ = √ 40
= 0.072
Stap 4: foutenmarge
M=z * SE = 1.654 * 0.072 = 0.12
Stap 4: interval opstellen
𝑥̅ ± 𝑚 → 0.70 ± 0.12
0.58 < 𝜇 < 0.82