HC 1 Centrale limietstelling (CLS)
Introductie statistiek
De steekproef geeft de beschrijvende statistiek (kengetallen, grafieken), middels inferentie kan
het populatie gemiddelde o.i.d. worden geschat, dit is de verklarende statistiek (toetsen,
modelleren). Er wordt voor een steekproef gekozen omdat de populatie te groot is of er een
beperkte hoeveelheid geld is. De steekproef moet aselect (ieder element uit populatie heeft
dezelfde kans om in de steekproef te komen) en representatief (steekproef heeft zelfde
karakteristieken als populatie) zijn. Toch is er altijd sprake van steekproefvariabiliteit (=
variantie of standaarddeviatie). De gemiddelde standaarddeviatie is weergegeven in het blauwe
kader, de standaarddeviatie van het gemiddelde getal (rode kader) staat weergegeven in het
groene kader. Dit heet ook wel de standaard fout van het gemiddelde (SE).
Het gemiddelde van de populatie is weergegeven in μ en de standaarddeviatie in σ. Voor een
steekproef is dit respectievelijk Y en s. Wanneer een grote steekproef wordt genomen wordt de
spreiding van het gemiddelde kleiner. De standaardfout van het gemiddelde is vervolgens: SE
= 𝜎/√𝑛
Centrale limiet stelling (CLS)
Als een aantal onafhankelijke waardes getrokken worden uit een willekeurige verdeling met
gemiddelde μ en variantie σ2, dan volgt het gemiddelde van deze waarden (Y), ongeveer een
normale verdeling met gemiddelde μ en variantie SE. Hierbij geldt dat ongeveer 67% van de
Y’s vallen tussen μ ± SE en 95% van de Y’s vallen tussen μ ± 2SE.
𝑌−𝜇
Door Y te standaardiseren ( 𝜎 /√𝑛) wordt de normale verdeling van Y een standaard normale
verdeling (altijd gem. 0 en SD 1). Als de σ2 onbekend is, moet de variantie worden geschat met
s2. Dit resulteert in een t-verdeling met n – 1 vrijheidsgraden.
Een 95% betrouwbaarheidsinterval (bhi) dat zegt dat voor 95% van de steekproeven de waarde
de populatie parameter zou bevatten.
(On)afhankelijke toetsen
We kunnen ook de t-toets doen voor twee afhankelijke groepen (gepaarde waarnemingen, IQ
bepaling voor en na een training). Relevante uitkomstmaat: binnen elke unit het verschil tussen
twee metingen berekenen (d). Op deze verschilscore d kan een t-toets worden toegepast (de
nulhypothese is vaak dat er geen verschil is).
Ook kan dit gedaan worden voor twee onafhankelijke groepen (IQ BMW en farmacie
vergelijken). Hierbij horen verschillende gemiddelden. Hierbij moet aangenomen zijn dat de
uitkomst normaal verdeeld is en dat de standaarddeviaties ongeveer gelijk zijn. Hierbij moet
een gepoolde variantieschatting worden gedaan.
1
,HC 2 T-test
T-toetsen
Bij een gepaarde waarneming zijn er meerdere uitkomsten per patiënt. Bij een cross-over trial
zijn er twee uitkomsten per patiënt en is de patiënt zijn eigen controle. Het tegengestelde is een
matched case-control study. Hierbij is iedere uitkomst gematched aan één controle. De kans op
een foute conclusie staat weergegeven in het onderstaande schema (1 – β is het onderscheidings-
vermogen, bij een groot verschil is een kleinere steekproef nodig om het verschil te zien):
H0 waar H0 niet waar
H0 niet verwerpen Juiste beslissing Type II fout (= β)
H0 verwerpen Type I fout (= α) Juiste beslissing
• α: H0 wordt verworpen, H0 is waar.
• β: H0 wordt niet verworpen, H1 is waar.
• 1 – β: H0 wordt verworpen, H1 is waar.
Formele stappen bij statistische toetsen:
1. Keuze toets (wat voor data heb je?)
2. H0 en H1 opstellen (één of tweezijdig toetsen?) en kans op type I fout (α) vaststellen,
ook aannemen dat de resultaten normaal verdeeld zijn.
3. Toetsingsgrootheid en verdeling onder H0.
4. Besluit of je H0 verwerpt
a. Bepaal het 100 × (1 – α)% bhi en kijk of de parameterwaarde onder de H0 is of
buiten dit interval valt.
b. Bepaal de overschrijdingskans (p-waarde) en vergelijk deze met de onbetrouw-
baarheid α.
c. Vergelijk de toetsingsgrootheid met de kritieke waarde (T*) bij een onbetrouw-
baarheid α.
5. Check aannames (kijk aan de boxplot of het ook een normale verdeling is).
6. Conclusie
Een p-waarde is de kans op het gevonden resultaat wanneer de H0 waar is. Door te kijken of de
p-waarde groter is dan α, moet de H0 niet worden verworpen. Dit is erg makkelijk en snel te
zien via SPSS (p-waardes uit SPSS zijn wel altijd tweezijdig). Echter heeft een bhi meer
informatie over de cijfers en wordt ook veel gebruikt.
Statistische significantie: “Het effect dat ik waarneem is geen toeval en zal waarschijnlijk weer
optreden.” Biomedisch relevantie: “Het effect dat ik waarneem is groot genoeg om interessant
en relevant te zijn.”
2
, HC 3 Eén-weg ANOVA
ANOVA staat voor variantie analyse, het wordt gebruikt als je meer dan twee gemiddelden met
elkaar wilt vergelijken. Bij alle toetsen kijk je naar of het absolute verschil groot genoeg is,
wanneer wordt gekeken naar de spreiding, om te zeggen dat twee groepen van elkaar
verschillen. Er wordt voor ANOVA gekozen in plaats van bijvoorbeeld drie of meer losse t-
toetsen omdat:
• De gepoolde variantie schatter is nauwkeuriger want deze wordt berekent over alle
groepen samen en niet apart.
• De totale α (over alle toetsen) zal groter zijn dan de α per toets. Bij drie toetsen met α =
5% zal de totale α maximaal 3 × 5 = 15% zijn. Dit kan worden verholpen door een totale
α van 5% te nemen, het nadeel hiervan is dat je een grotere toetsingsgrootheid nodig
hebt om de H0 te verwerpen. Ook wordt de power van de toets lager omdat β groter
wordt.
F-toets
Bij een F-toets kijk je naar de verhouding van het gemiddelde verschil tussen de groepen met
het gemiddelde verschil binnen de groepen. Met deze toets kan worden gekeken of er een
verschil is tussen de groepen, je ziet echter niet welke groepen verschillen. Hierbij kan alleen
tweezijdig getoetst worden. In de F-tabel kan worden gekeken wanneer de H0 kan worden
verwerpen (in de tabel
zijn alle α waarden
éénzijdig omdat de F-
waarde groter is dan
1). Hierbij worden de
group, error en
corrected total
uitgerekend als de
SSG, SSE en SST. De F
waarde is vervolgens
veel hoger dan 1, In de F-tabel kan worden opgezocht dat dit duidt op dat er een verschil is
tussen de (3) groepen.
Post-hoc toetsen
Hiermee wordt uitgerekend tussen welke groepen het gevonden verschil van de F-toets
daadwerkelijk ligt. Dit zijn gewoon weer t-toetsen met de twee verschillen genoemd in de
voordelen van ANOVA. De gepoolde variantie schatter (=MSE) en de α (=α*, dit heet de
Bonferroni correctie) worden veranderd. Je rekent hiermee uit: hoeveel standaarddeviaties wijkt
mijn verschil af van nul.
De LSD is niet gecorrigeerd, de Bonferroni correctie wordt vervolgens nog met de hand
uitgevoerd. Bij de Bonferroni tabel kan wel worden gerekend met de bhi die staan weergegeven.
Bij de LSD kan dit niet omdat hier geen rekening is gehouden met de α*. De verschillen tussen
meerdere t-toetsen en de post-hoc toetsen worden steeds groter naarmate er meer dan drie
groepen worden getoetst, daarom worden post-hoc toetsen gebruikt.
Eén-weg ANOVA aannames
• Onafhankelijke waarnemingen: kan niet gecheckt worden, hoort bij proefopzet.
• Gelijke varianties: visueel checken (side-by-side boxplots) of toetsen (Levene’s toets).
• Normale verdeling van metingen in de groepen: checken we met meetfout (‘error’),
visueel checken (boxplot) en kan ook getoetst worden.
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller myschakelaar. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.33. You're not tied to anything after your purchase.