HC 1 Centrale limietstelling (CLS)
Introductie statistiek
De steekproef geeft de beschrijvende statistiek (kengetallen, grafieken), middels inferentie kan
het populatie gemiddelde o.i.d. worden geschat, dit is de verklarende statistiek (toetsen,
modelleren). Er wordt voor een steekproef gekozen omdat de populatie te groot is of er een
beperkte hoeveelheid geld is. De steekproef moet aselect (ieder element uit populatie heeft
dezelfde kans om in de steekproef te komen) en representatief (steekproef heeft zelfde
karakteristieken als populatie) zijn. Toch is er altijd sprake van steekproefvariabiliteit (=
variantie of standaarddeviatie). De gemiddelde standaarddeviatie is weergegeven in het blauwe
kader, de standaarddeviatie van het gemiddelde getal (rode kader) staat weergegeven in het
groene kader. Dit heet ook wel de standaard fout van het gemiddelde (SE).
Het gemiddelde van de populatie is weergegeven in μ en de standaarddeviatie in σ. Voor een
steekproef is dit respectievelijk Y en s. Wanneer een grote steekproef wordt genomen wordt de
spreiding van het gemiddelde kleiner. De standaardfout van het gemiddelde is vervolgens: SE
= 𝜎/√𝑛
Centrale limiet stelling (CLS)
Als een aantal onafhankelijke waardes getrokken worden uit een willekeurige verdeling met
gemiddelde μ en variantie σ2, dan volgt het gemiddelde van deze waarden (Y), ongeveer een
normale verdeling met gemiddelde μ en variantie SE. Hierbij geldt dat ongeveer 67% van de
Y’s vallen tussen μ ± SE en 95% van de Y’s vallen tussen μ ± 2SE.
𝑌−𝜇
Door Y te standaardiseren ( 𝜎 /√𝑛) wordt de normale verdeling van Y een standaard normale
verdeling (altijd gem. 0 en SD 1). Als de σ2 onbekend is, moet de variantie worden geschat met
s2. Dit resulteert in een t-verdeling met n – 1 vrijheidsgraden.
Een 95% betrouwbaarheidsinterval (bhi) dat zegt dat voor 95% van de steekproeven de waarde
de populatie parameter zou bevatten.
(On)afhankelijke toetsen
We kunnen ook de t-toets doen voor twee afhankelijke groepen (gepaarde waarnemingen, IQ
bepaling voor en na een training). Relevante uitkomstmaat: binnen elke unit het verschil tussen
twee metingen berekenen (d). Op deze verschilscore d kan een t-toets worden toegepast (de
nulhypothese is vaak dat er geen verschil is).
Ook kan dit gedaan worden voor twee onafhankelijke groepen (IQ BMW en farmacie
vergelijken). Hierbij horen verschillende gemiddelden. Hierbij moet aangenomen zijn dat de
uitkomst normaal verdeeld is en dat de standaarddeviaties ongeveer gelijk zijn. Hierbij moet
een gepoolde variantieschatting worden gedaan.
1
,HC 2 T-test
T-toetsen
Bij een gepaarde waarneming zijn er meerdere uitkomsten per patiënt. Bij een cross-over trial
zijn er twee uitkomsten per patiënt en is de patiënt zijn eigen controle. Het tegengestelde is een
matched case-control study. Hierbij is iedere uitkomst gematched aan één controle. De kans op
een foute conclusie staat weergegeven in het onderstaande schema (1 – β is het onderscheidings-
vermogen, bij een groot verschil is een kleinere steekproef nodig om het verschil te zien):
H0 waar H0 niet waar
H0 niet verwerpen Juiste beslissing Type II fout (= β)
H0 verwerpen Type I fout (= α) Juiste beslissing
• α: H0 wordt verworpen, H0 is waar.
• β: H0 wordt niet verworpen, H1 is waar.
• 1 – β: H0 wordt verworpen, H1 is waar.
Formele stappen bij statistische toetsen:
1. Keuze toets (wat voor data heb je?)
2. H0 en H1 opstellen (één of tweezijdig toetsen?) en kans op type I fout (α) vaststellen,
ook aannemen dat de resultaten normaal verdeeld zijn.
3. Toetsingsgrootheid en verdeling onder H0.
4. Besluit of je H0 verwerpt
a. Bepaal het 100 × (1 – α)% bhi en kijk of de parameterwaarde onder de H0 is of
buiten dit interval valt.
b. Bepaal de overschrijdingskans (p-waarde) en vergelijk deze met de onbetrouw-
baarheid α.
c. Vergelijk de toetsingsgrootheid met de kritieke waarde (T*) bij een onbetrouw-
baarheid α.
5. Check aannames (kijk aan de boxplot of het ook een normale verdeling is).
6. Conclusie
Een p-waarde is de kans op het gevonden resultaat wanneer de H0 waar is. Door te kijken of de
p-waarde groter is dan α, moet de H0 niet worden verworpen. Dit is erg makkelijk en snel te
zien via SPSS (p-waardes uit SPSS zijn wel altijd tweezijdig). Echter heeft een bhi meer
informatie over de cijfers en wordt ook veel gebruikt.
Statistische significantie: “Het effect dat ik waarneem is geen toeval en zal waarschijnlijk weer
optreden.” Biomedisch relevantie: “Het effect dat ik waarneem is groot genoeg om interessant
en relevant te zijn.”
2
, HC 3 Eén-weg ANOVA
ANOVA staat voor variantie analyse, het wordt gebruikt als je meer dan twee gemiddelden met
elkaar wilt vergelijken. Bij alle toetsen kijk je naar of het absolute verschil groot genoeg is,
wanneer wordt gekeken naar de spreiding, om te zeggen dat twee groepen van elkaar
verschillen. Er wordt voor ANOVA gekozen in plaats van bijvoorbeeld drie of meer losse t-
toetsen omdat:
• De gepoolde variantie schatter is nauwkeuriger want deze wordt berekent over alle
groepen samen en niet apart.
• De totale α (over alle toetsen) zal groter zijn dan de α per toets. Bij drie toetsen met α =
5% zal de totale α maximaal 3 × 5 = 15% zijn. Dit kan worden verholpen door een totale
α van 5% te nemen, het nadeel hiervan is dat je een grotere toetsingsgrootheid nodig
hebt om de H0 te verwerpen. Ook wordt de power van de toets lager omdat β groter
wordt.
F-toets
Bij een F-toets kijk je naar de verhouding van het gemiddelde verschil tussen de groepen met
het gemiddelde verschil binnen de groepen. Met deze toets kan worden gekeken of er een
verschil is tussen de groepen, je ziet echter niet welke groepen verschillen. Hierbij kan alleen
tweezijdig getoetst worden. In de F-tabel kan worden gekeken wanneer de H0 kan worden
verwerpen (in de tabel
zijn alle α waarden
éénzijdig omdat de F-
waarde groter is dan
1). Hierbij worden de
group, error en
corrected total
uitgerekend als de
SSG, SSE en SST. De F
waarde is vervolgens
veel hoger dan 1, In de F-tabel kan worden opgezocht dat dit duidt op dat er een verschil is
tussen de (3) groepen.
Post-hoc toetsen
Hiermee wordt uitgerekend tussen welke groepen het gevonden verschil van de F-toets
daadwerkelijk ligt. Dit zijn gewoon weer t-toetsen met de twee verschillen genoemd in de
voordelen van ANOVA. De gepoolde variantie schatter (=MSE) en de α (=α*, dit heet de
Bonferroni correctie) worden veranderd. Je rekent hiermee uit: hoeveel standaarddeviaties wijkt
mijn verschil af van nul.
De LSD is niet gecorrigeerd, de Bonferroni correctie wordt vervolgens nog met de hand
uitgevoerd. Bij de Bonferroni tabel kan wel worden gerekend met de bhi die staan weergegeven.
Bij de LSD kan dit niet omdat hier geen rekening is gehouden met de α*. De verschillen tussen
meerdere t-toetsen en de post-hoc toetsen worden steeds groter naarmate er meer dan drie
groepen worden getoetst, daarom worden post-hoc toetsen gebruikt.
Eén-weg ANOVA aannames
• Onafhankelijke waarnemingen: kan niet gecheckt worden, hoort bij proefopzet.
• Gelijke varianties: visueel checken (side-by-side boxplots) of toetsen (Levene’s toets).
• Normale verdeling van metingen in de groepen: checken we met meetfout (‘error’),
visueel checken (boxplot) en kan ook getoetst worden.
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper myschakelaar. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €3,98. Je zit daarna nergens aan vast.