Samenvatting Methodologie en toegepaste biostatistiek II - Pre-master Gezondheidswetenschappen
37 views 4 purchases
Course
Methodologie en toegepaste biostatistiek II
Institution
Vrije Universiteit Amsterdam (VU)
Samenvatting van de stof van Methodologie en toegepaste biostatistiek II blok van de pre-master Gezondheidswetenschappen aan de Vrije Universiteit Amsterdam (VU)
,College blok 1 – ANOVA en lineaire regressieanalyse
5 november 2021
T-toetsen
- Vergelijking van twee groepsgemiddelden
- Determinant: dichotoom
ANOVA
- Vergelijking van meer dan twee groep gemiddelden
- Determinant: categoriaal
Regressie
- Een universele oplossing voor al onze (toetsings-)problemen
- Determinant: dichotoom, categoriaal, continu
Correlatie
- Verband tussen twee variabelen
- Determinant/Uitkomst: continu
T-toets
Hypothesen gaan over een verschil tussen de gemiddelden: Bestaat dit verschil ook in de
populatie?
Dezelfde hypothese kan met lineaire regressie getoetst worden
Assumpties t-toets
De uitkomstvariabele is normaal verdeeld
- Wat als dit niet het geval is?
- Log transformatie?
- Non-parametrische toetsen
Varianties binnen de twee groepen zijn ongeveer gelijk
- Levene’s test for equality of variance
- Aanpassing van Welch (‘equal variances not assumed’)
ANOVA: ANalysis Of VAriance
Om > 2 groepen (in één analyse) met elkaar te vergelijken
Je kunt dit zien als uitbreiding van een t-toets voor twee onafhankelijke steekproeven
Hypothese gaat (in eerste instantie) over of er verschil zit tussen de groepen
- Dezelfde hypothese kunnen we met lineaire regressie toetsen (voorkeur!)
- Of met meerdere t-toetsen (bezwaar hiertegen!)
2
,Bij drie groepen zijn er ook drie contrasten drie mogelijkheden vergelijkingen
Bezwaren tegen meervoudige t-toetsen
Hoe minder power hoe groter de kans op type II fout
- Kans op Type-I fout verandert
o Aanpassing mogelijk: Bonferroni correctie
o Maar: power voor elke individuele toets nadelig beïnvloed; toename kans op
Type II fout
- Onvolledig gebruik informatie per vergelijking
o Toetsingsgrootheid t-toets gebaseerd op standaardfout, berekend over 2
steekproeven
o Maar: alle steekproeven leveren informatie over toeval spreiding
o Daarom: op deze manier maakt t-toets niet optimaal gebruik van beschikbare
informatie
Als we 'losse' T-toetsen doen, hebben we per T-toets steeds 5% kans op het maken van een
Type-1 fout (ervan uitgaande dat de door ons gekozen alpha 0.05 is). Hoe meer T-toetsen ik
doe, hoe groter de kans dat ik een type-1 fout maak, en dus onterecht verklaar dat er een
verband/associatie/verschil is. Dat loopt best snel op: als je 10 losse toetsen doet is je kans
op een type-1 fout al 40%! Dit noemen we ook wel de 'familywise error rate'.
Het voordeel van de ANOVA is dat deze meerdere populaties in één keer toetst, waardoor je
dus maar één keer de 5% kans op een type-1 fout hebt. Het nadeel is dat we met de basis
van een ANOVA alleen maar een antwoord krijgen op de vraag óf er een verschil bestaat
tussen ten minste 2 van de vergeleken populaties. In de gezondheidswetenschappen zijn we
echter doorgaans geïnteresseerd in wát die verschillen zijn en wáár die verschillen zitten.
De oplossing is om tóch multipele contrasten te maken, maar met een correctie voor die
'familywise error rate'. Er is een legio aan mogelijkheden waarop dit kan, en het voorbeeld
uit het college is de zogeheten 'Bonferroni correctie'. Dit houdt in dat je de gekozen alpha
deelt door het aantal toetsen (contrasten) dat je doet. Dit zorgt er voor dat je kans op een
type-1 fout omlaag gaat, je toets namelijk tegen een strenger criterium. Analoog daar aan
staat echter dat je statistische power verliest, en de kans op een type-2 fout dus omhoog
gaat: het wordt 'lastiger' om de nulhypothese te verwerpen en dus gaat de kans op het
onterecht niet verwerpen van de nulhypothese (type-2 fout) omhoog.
3
, Variantie analyse
Total sum of squares is de totale variantie in de uitkomstmaat
We kennen dit als de Kwadraatsom (berekenen variantie en sd)
TSS willen we verklaren door de variantie op te
splitsen in:
- Between group sum of squares (tussen
groepen)
- Within groep sum of squares (binnen de
groepen)
Total sum of squares is de som van de gekwadrateerde afwijkingen van ieder punt tot het
algemeen (total) gemiddelde, ofwel de totale variantie in de uitkomstmaat Y
ss t = (5−4) +(5−4) +(4−4) +...+(3−4) +(3−4) ) = 22
Between group sum of squares is de som van alle naar groepsgrootte gewogen
gekwadrateerde afwijkingen van elk groepsgemiddelde tot het algemeen (total) gemiddelde
ss b = 6 ∗ (5 − 4) 2 + 6 ∗ (3 − 4)2 + 6 ∗ (4 −
4) 2 = 12
Within group sum of squares is de som van de gekwadrateerde afwijkingen van ieder punt
tot het groepsgemiddelde
SS w = (5−5) 2 +(5−5) 2 +(4−5) 2 +...+(3−4) 2 +(3−4) 2 ) = 10
4
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller nanoukb. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.38. You're not tied to anything after your purchase.