Samenvatting hoorcolleges toetsende statistiek + bijbehorende hoofdstukken boek
Hoorcollege 1: toetsen, power, effectgrootte
Schatten van populatieparameters op basis van gevonden gegevens in de steekproef
- Statistieken: puntschattingen en betrouwbaarheidsintervallen
Toetsen van hypothesen over populatieparameters op basis van de gegevens steekproef
- Statistieken: toetsingsgegevens en -resultaten (T-waarde, Z-waarde)
Inferentiële statistiek: steekproef populatie
We willen weten: P-vrouwen populatie, we observeren: proportie vrouwen steekproef
De populatieparameter heeft een vaste waarde
- Er is een exact aantal studenten POW
o Waarvan een exact aantal vrouwelijke studenten
o Maar die aantallen zijn onbekend, dus P is onbekend
De steekproefwaarde kan gebruikt worden als een schatting van de populatieparameter
- Deze schatting kent een bepaalde onzekerheid
Gemiddeld over alle mogelijke steekproeven zal de gemiddelde steekproef waarde gelijk zijn
aan de werkelijke waarde in de populatie.
Betrouwbaarheidsinterval
- We gebruiken de gegevens steekproef om een schatting te maken van populatie
De precisie van deze schatting geven we aan met behulp van betrouwbaarheidsinterval
Bij herhaalde steekproeftrekking ligt in 100(1-a)% van de gevallen de populatieparameter
binnen de grenzen van het interval.
Het betrouwbaarheidsinterval geeft plausibele waarden populatieparameter op basis van:
- De puntschatting (gevonden proportie/gemiddelde/verschil)
- Kritieke grenzen (behorend bij de toetsingsgrootheid T of Z)
- Standaardfout van de puntschatting
- Houdbaarheid van de aannamen die je doet (bijv. normaal verdeeld)
,Toetsen
Stap 1: assumpties
Stap 2: hypothese 0-hypothesen en alternatieve hypothesen
Stap 3: toetsingsgrootheid
Stap 4: P-waarde
Stap 5: conclusie
Z-toets 1 proportie
Stap 1: steekproef willekeurig, categorisch & steekproef groot genoeg: np >15 en n(1-p) >15
Stap 2: hypothese opstellen: H0: p = p0 en Ha = p < p0 of p > p0 of een van de twee.
Stap 3: toetsingsgrootheid: Z-waarde en eerst SE0 uitrekenen, via formuleboek
Stap 4: P-waarde zoeken, eerst significantieniveau kiezen, vaak a = 0,05
Stap 5: conclusie, significant?
- Toetsingsgrootheid > kritieke waarde = significant
o Verwerp H0
- Toetsingsgrootheid < kritieke waarde = niet significant
o Verwerp H0 niet
Verband betrouwbaarheidsintervallen:
De proportie valt buiten het betrouwbaarheidsinterval, dus kan de hypothese ook weg.
Met 95% betrouwbaarheid kan gezegd worden dat de proportie vrouwelijke PM studenten
groter is dan 50%.
T-toets 1 gemiddelde
Stap 1: steekproef willekeurig, kwantitatief, normaal verdeeld, variantie populatie onbekend
- Eenzijdig: robuust tegen schending bij n > 30
- Tweezijdig: altijd robuust
Stap 2: nulhypothese en alternatieve hypothesen H0: µ = µ0 of Ha: µ < of > µ0
Stap 3: toetsingsgrootheid, T-waarde
Stap 4: df waarde en overschrijdingskans, welke T-waarde P-waarde
Stap 5: conclusie trekken, significant of niet
,Hoorcollege 2 – power en effectgrootte en
Gemiddelde twee onafhankelijke groepen
Statistisch significant
Een effect kan door toeval zijn ontstaan…
Statistische significantietoetsen beschermen tegen het claimen van effect door toeval.
Een klein en irrelevant effect kan in grote sample makkelijk statistisch significant worden.
Elk klein effect kan in een grote sample statistisch significant worden, dus ook klinische
irrelevante verschillen Significantie is dus afhankelijk van de steekproefgrootte
Type I/type II fout power
Alfa = type I fout (toets verwerpen en werkelijkheid niet false positive)
- Wel verwerpen terwijl het wel waar is en dus niet moet
Power (beta) = type II fout (toets niet verwerpen en werkelijk wel false negative)
- Niet verwerpen terwijl het niet waar is en dus wel moet
Hoe kleiner alfa, hoe groter beta en dus hoe kleiner power wordt (1-beta)
- De bewijslast om H0 te verwerpen gaat omhoog, want moeilijker
- Je ziet effecten als die er wel zijn eerder over het hoofd
Hoe vergroot je power (1-B)?
- Alfa groter kiezen, N groter en ook als SD kleiner wordt
Z-toets voor twee onafhankelijke proporties
Stappen zijn hetzelfde: assumpties, hypothese, toetsingsgrootheid, P-waarde, conclusie
Het zijn allemaal twee groepsvergelijkingen op een variabele die ook twee dingen meet
Voor vrouwen bepalen wie voor beta kiezen, maar ook voor mannen die voor beta kiezen
Maak een tabel, dat is het makkelijkste.
- Eerst bepaal je de proporties mannen en proporties vrouwen
- Daarna kijk je naar het verschil in proporties.
o Wijkt dat verschil significant af van ‘geen verschil tussen M en J’
, Stap 1:
Nominaal, dichotoom en random trekking/toewijzing en onafhankelijke steekproeven.
Tweezijdig toetsen: min 5 N per cel, eenzijdig toetsen: min 10 N per cel
Stap 2:
H0: P1-P2 = 0 -- Ha: P1-P2 < > 0
Stap 3:
Z-score maar dan verschillen tussen de P1 en P2, niet alleen P met dakje.
Wat is de standaardfout van een verschil in 2 proporties? zie formuleboek blz 22
Voor de Z-toets wordt gebruik gemaakt van andere SD dan voor BI, namelijk de SD onder
aanname dat H0 waar is.
Hoe bepalen we die standaardfout?
- Dus als P1 = P2
- Een proportie die we p kunnen noemen, deze p is te schatten
- Deze schatting noteren we als P dakje
o Deze P dakje berekenen we uit de ‘gepoolde proportie’
De totale proportie leerlingen die bèta kozen
Dus: SE0 uitrekenen, gebruik je proportie zonder naar verhouding te kijken:
- Totaal beta : totaal aantal mensen
Stap 4:
P-waarde opzoeken aan de hand van je Z-score
- Gebruik kritieke z-waarde extremer dan 1,96 of zoek P-waarde kleiner dan 0,05
Stap 5:
Conclusie, significant, wat betekent dat?
Het resultaat is dus significant en we verwerpen hem. Vrouwen en mannen kiezen niet even
vaak voor bëta, meisjes kiezen nog steeds minder vaak voor béta dan jongens.