Quantitative (numeral)
- Discrete telbaar: the number of people who protested
- Continuous height, mass, temperature
Qualitative (categorical)
- Nominal gender, blood type
- Ordinal likert scale, low-middle-high income
Dependent outcome variable
Independent not affected by experiment itself but can be manipulated to affect the
dependent variable
Confounding can have an effect on the experiment
A VERY SMALL P-VALUE GIVES VERY STRONG EVIDENCE AGAINST H 0
IF WE HAVE A SET SIGNIFICANCE LEVEL α, REJECT H0 IF P-VALUE IS ≤ α
DISTRIBUTIONS
NORMAL DISTRIBUTION - EMPIRICAL RULE
68% of all data falls within 1 SD on both sides of the mean
95% of all data falls within 2 SD on both sides of the mean
SKEWED DISTRIBUTION
Tail position determines positive or negative skew
HYPOTHESIS TESTING
HYPOTHESIS You need a null hypothesis H0 and an alternative hypothesis H1.
Inferentiële statistiek is gebaseerd op het uitgangspunt dat je niet kan bewijzen dat iets waar
is, maar je wel iets kan weerleggen door een uitzondering te vinden.
H1 = waar je bewijs voor probeert te vinden, bv. er is een effect
H0 = het tegenovergestelde, waar je bewijs tegen probeert te vinden, bv. er is geen effect
1. Hypotheses gaan over populatie parameters
2. De nulhypothese verwijst meestal naar de status quo, hetgeen waar we bewijs tegen
proberen te vinden
3. De nulhypothese moet een statement van gelijkwaardig bevatten en de alternatieve
hypothese NIET
= 𝑜𝑓 ≤ 𝑜𝑓 ≥
SIGNIFICANTIE Bepaal het niveau van significantie. Meestal gewoonα = 0, 05
STEEKPROEF Neem een steekproef, bij voorkeur een simple random sample
P-WAARDE EN BESLIS Gebruik de p-waarde om te besluiten of je de nulhypothese
wel/niet verwerpt. Je verwerpt de nulhypothese als de p-waarde minder is dan het niveau
van significantie. 𝑝 < α (0, 05)
, CONFIDENCE INTERVALS
CI VOOR EEN PROPORTIE
Steekproef van 1000 mensen uit volwassen Amerikanen (populatie) waarvan 440
440
goedkeurende mening hebben. 𝑝̂ = 1000
= 0, 44
- Construct CI for p.
- Steekproevenverdeling van p̂ heeft een gemiddelde van E(p̂) = p.
- De steekproevenverdeling van p̂ heeft een variantie van
𝑝(1−𝑝)
- En een SD van σ = 𝑛
Maar je weet niks over p. Dezelfde regels
𝑝
toepassen als bij vorige voorbeeld. Assume sample distribution is
approximately normal.
*
- Dus je gaat weer 𝑝 ± 𝑧 · 𝑆𝐸 . Proportions never use t!!!! Always z or
𝑝
something else.
𝑝(1−𝑝)
- 𝑆𝐸(𝑝) = 𝑛
- Test hypothesis about the value of p.
𝑝 −𝑝0 𝑝0(1−𝑝0)
𝐻0: 𝑝 = 𝑝0 𝑧 = 𝑆𝐸0(𝑝) = 𝑛
𝑆𝐸0(𝑝)
CI VOOR VERSCHIL TUSSEN TWEE PROPORTIES
2685 158
𝑝1 = 5045
= 0, 532 𝑝2 = 363
= 0, 435
𝑝1 − 𝑝2 𝑒𝑠𝑡𝑖𝑚𝑎𝑡𝑒𝑠 𝑝1 − 𝑝2
- construct CI for 𝑝1 − 𝑝2
- Test 𝐻0: 𝑝1 − 𝑝2 = 0 (𝐻0: 𝑝1 = 𝑝2)
- De steekproevenverdeling van 𝑝1 − 𝑝2
- Heeft het gemiddelde van 𝑝1 − 𝑝2
𝑝1(1−𝑝1) 𝑝2(1−𝑝2)
- Heeft een SD van σ = 𝑛1
+ 𝑛2
𝑝1−𝑝2
- Is ongeveer normaal verdeeld als de steekproefgrootte groot is.
- Check de assumptions!
- Simple random sample? Not specified so assume it was a simple random
sample of all adult americans
- The sample sizes are large enough for the normal approximation to be
reasonable
*
- CI for 𝑝1 − 𝑝2 is given by 𝑝1 − 𝑝2 ± 𝑧 · 𝑆𝐸(𝑝1 − 𝑝2 )
𝑝1(1−𝑝1) 𝑝2(1−𝑝2)
- σ = 𝑛1
+ 𝑛2
Maar je weet nogmaals niks over p.
𝑝1−𝑝2
𝑝1(1−𝑝1) 𝑝2(1−𝑝2)
- 𝑆𝐸(𝑝1 − 𝑝2) = 𝑛1
+ 𝑛2