Samenvatting van de stof van Methodologie en toegepaste biostatistiek II blok van de pre-master Gezondheidswetenschappen aan de Vrije Universiteit Amsterdam (VU)
,College blok 1 – ANOVA en lineaire regressieanalyse
5 november 2021
T-toetsen
- Vergelijking van twee groepsgemiddelden
- Determinant: dichotoom
ANOVA
- Vergelijking van meer dan twee groep gemiddelden
- Determinant: categoriaal
Regressie
- Een universele oplossing voor al onze (toetsings-)problemen
- Determinant: dichotoom, categoriaal, continu
Correlatie
- Verband tussen twee variabelen
- Determinant/Uitkomst: continu
T-toets
Hypothesen gaan over een verschil tussen de gemiddelden: Bestaat dit verschil ook in de
populatie?
Dezelfde hypothese kan met lineaire regressie getoetst worden
Assumpties t-toets
De uitkomstvariabele is normaal verdeeld
- Wat als dit niet het geval is?
- Log transformatie?
- Non-parametrische toetsen
Varianties binnen de twee groepen zijn ongeveer gelijk
- Levene’s test for equality of variance
- Aanpassing van Welch (‘equal variances not assumed’)
ANOVA: ANalysis Of VAriance
Om > 2 groepen (in één analyse) met elkaar te vergelijken
Je kunt dit zien als uitbreiding van een t-toets voor twee onafhankelijke steekproeven
Hypothese gaat (in eerste instantie) over of er verschil zit tussen de groepen
- Dezelfde hypothese kunnen we met lineaire regressie toetsen (voorkeur!)
- Of met meerdere t-toetsen (bezwaar hiertegen!)
2
,Bij drie groepen zijn er ook drie contrasten drie mogelijkheden vergelijkingen
Bezwaren tegen meervoudige t-toetsen
Hoe minder power hoe groter de kans op type II fout
- Kans op Type-I fout verandert
o Aanpassing mogelijk: Bonferroni correctie
o Maar: power voor elke individuele toets nadelig beïnvloed; toename kans op
Type II fout
- Onvolledig gebruik informatie per vergelijking
o Toetsingsgrootheid t-toets gebaseerd op standaardfout, berekend over 2
steekproeven
o Maar: alle steekproeven leveren informatie over toeval spreiding
o Daarom: op deze manier maakt t-toets niet optimaal gebruik van beschikbare
informatie
Als we 'losse' T-toetsen doen, hebben we per T-toets steeds 5% kans op het maken van een
Type-1 fout (ervan uitgaande dat de door ons gekozen alpha 0.05 is). Hoe meer T-toetsen ik
doe, hoe groter de kans dat ik een type-1 fout maak, en dus onterecht verklaar dat er een
verband/associatie/verschil is. Dat loopt best snel op: als je 10 losse toetsen doet is je kans
op een type-1 fout al 40%! Dit noemen we ook wel de 'familywise error rate'.
Het voordeel van de ANOVA is dat deze meerdere populaties in één keer toetst, waardoor je
dus maar één keer de 5% kans op een type-1 fout hebt. Het nadeel is dat we met de basis
van een ANOVA alleen maar een antwoord krijgen op de vraag óf er een verschil bestaat
tussen ten minste 2 van de vergeleken populaties. In de gezondheidswetenschappen zijn we
echter doorgaans geïnteresseerd in wát die verschillen zijn en wáár die verschillen zitten.
De oplossing is om tóch multipele contrasten te maken, maar met een correctie voor die
'familywise error rate'. Er is een legio aan mogelijkheden waarop dit kan, en het voorbeeld
uit het college is de zogeheten 'Bonferroni correctie'. Dit houdt in dat je de gekozen alpha
deelt door het aantal toetsen (contrasten) dat je doet. Dit zorgt er voor dat je kans op een
type-1 fout omlaag gaat, je toets namelijk tegen een strenger criterium. Analoog daar aan
staat echter dat je statistische power verliest, en de kans op een type-2 fout dus omhoog
gaat: het wordt 'lastiger' om de nulhypothese te verwerpen en dus gaat de kans op het
onterecht niet verwerpen van de nulhypothese (type-2 fout) omhoog.
3
, Variantie analyse
Total sum of squares is de totale variantie in de uitkomstmaat
We kennen dit als de Kwadraatsom (berekenen variantie en sd)
TSS willen we verklaren door de variantie op te
splitsen in:
- Between group sum of squares (tussen
groepen)
- Within groep sum of squares (binnen de
groepen)
Total sum of squares is de som van de gekwadrateerde afwijkingen van ieder punt tot het
algemeen (total) gemiddelde, ofwel de totale variantie in de uitkomstmaat Y
ss t = (5−4) +(5−4) +(4−4) +...+(3−4) +(3−4) ) = 22
Between group sum of squares is de som van alle naar groepsgrootte gewogen
gekwadrateerde afwijkingen van elk groepsgemiddelde tot het algemeen (total) gemiddelde
ss b = 6 ∗ (5 − 4) 2 + 6 ∗ (3 − 4)2 + 6 ∗ (4 −
4) 2 = 12
Within group sum of squares is de som van de gekwadrateerde afwijkingen van ieder punt
tot het groepsgemiddelde
SS w = (5−5) 2 +(5−5) 2 +(4−5) 2 +...+(3−4) 2 +(3−4) 2 ) = 10
4
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper nanoukb. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,98. Je zit daarna nergens aan vast.