100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Methodologie En Biostatistiek 2 (MTBII) €12,49
In winkelwagen

Samenvatting

Samenvatting Methodologie En Biostatistiek 2 (MTBII)

 35 keer bekeken  4 keer verkocht

Deze samenvatting bevat alle 5 de hoorcolleges van het vak, plus aanvullende informatie uit de kennisclips en tekst. Inclusief veel voorbeelden om de stof beter te begrijpen.

Voorbeeld 5 van de 92  pagina's

  • 4 januari 2022
  • 92
  • 2021/2022
  • Samenvatting
Alle documenten voor dit vak (2)
avatar-seller
stuv19
Hoorcollege 1: Continue uitkomstmaten: t-toets, ANOVA, correlatie
Lineaire Regressie
Continue uitkomstmaat
• T-toetsen
o Vergelijking van twee groepsgemiddelden
o Determinant: dichotoom
• ANOVA
o Vergelijking van meer dan twee groepgemiddelden
o Determinant: categoriaal
• Regressie
o Een universele oplossing voor al onze (toetsings-)problemen
o Determinant: dichotoom, categoriaal, continu
• Correlatie
o Verband tussen twee variabelen
o Determinant/Uitkomst: continu

Voorbeeld: T-toets voor onafhankelijke groepen
Is er een verschil in de gemiddelde BMI van mannen en vrouwen?
H0: Er is geen verschil in de gemiddelde BMI van mannen en vrouwen.
H1: Er is een verschil in de gemiddelde BMI van mannen en vrouwen.
Als p<0,05 mogen we H0 verwerpen.




• Oordeel: H0 kan niet worden afgewezen, want p > α, of p > 0.05
• De gemiddelde BMI van mannen en vrouwen verschilt niet significant van elkaar.
• Of: Het gevonden verschil tussen de gemiddelden van de twee groepen in onze steekproef
bestaat waarschijnlijk niet in de populatie

T-toets voor onafhankelijke steekproeven
Determinant
• Dichotome variabele = de steekproeven/groepen
Uitkomst
• Min. op interval meetniveau gemeten variabele
Hypothesen gaan over een verschil tussen de gemiddelden: Bestaat dit verschil ook in de populatie?
Dezelfde hypothese kan met lineaire regressie getoetst worden (indiv. werkgroepopgave)

Assumpties bij een t-toets:
• De uitkomstvariabele is normaal verdeeld
o Wat als dit niet het geval is?
o Log transformatie?

, o Non-parametrische toetsen
• Varianties binnen de twee groepen zijn ongeveer gelijk
o Levene’s test for equality of variance
o Aanpassing van Welch (‘Equal variances not assumed’)

ANOVA: ANalysis Of VAriance
Wordt gebruikt om >2 groepen (in één analyse) met elkaar te vergelijken. Je kunt dit zien als
uitbreiding van een t-toets voor twee onafhankelijke steekproeven. Hypothese gaat (in eerste
instantie) over of er verschil zit tussen de groepen. Dezelfde hypothese kunnen we met lineaire
regressie toetsen (voorkeur!) of met meerdere t-toetsen (bezwaar hiertegen!)

Vergelijking > 2 groepen met t-toetsen? Bijv. 3 groepen. Dan
ook 3 contrasten. 3 afzonderlijke t-toetsen niet efficiënt. Per
test gebruik je info van slechts twee groepen. Dat kost power.

Bezwaren tegen meervoudige t-toetsen:
• Kans op Type-I fout verandert. Aanpassing mogelijk:
Bonferroni correctie. Maar: power voor elke individuele
toets nadelig beïnvloed; toename kans op Type II fout.
• Onvolledig gebruik informatie per vergelijking.
Toetsingsgrootheid t-toets gebaseerd op standaardfout, berekend over 2 steekproeven.
Maar: alle steekproeven leveren informatie over toevalsspreiding. Daarom: op deze manier
maakt t-toets niet optimaal gebruik van beschikbare informatie.

Vergelijking > 2 groepen met ANOVA? ANOVA maakt gebruik van schattingen van spreiding.
Variantie van de gemiddelden tussen de groepen, afgezet tegen varianties binnen de groepen.




Variantie - sum of squares
Total sum of squares is de totale variantie in de uitkomstmaat.
• We kennen dit als de Kwadraatsom (berekenen variantie en sd).

TSS willen we verklaren door de variantie op te splitsen in:
• Between group sum of squares (tussen groepen).
• Within groep sum of squares (binnen de groepen)

Total sum of squares: is de som van de gekwadrateerde afwijkingen van ieder punt tot het algemeen
(total) gemiddelde, ofwel de totale variantie in de uitkomstmaat Y.

,Between group sum of squares (Tussen groepen): is de som van alle naar groepsgrootte gewogen
gekwadrateerde afwijkingen van elk groepsgemiddelde tot het algemeen (total) gemiddelde.




Within group sum of squares (Binnen groepen): is de som van de gekwadrateerde afwijkingen van
ieder punt tot het groepsgemiddelde.




Variantie analyse – F-test
F-toets:
• Ratio van ssb tussengroepsvariantie en ssw binnengroepsvariantie
• Als ssb veel groter wordt dan ssw dan zullen er daadwerkelijke verschillen zijn tussen
groepen (populatiegemiddelden), i.p.v. dat het toevalsspreiding (ssw) is
Gebruik F-verdeling:
• Wordt gebruikt om te bepalen of een groep variabelen gezamenlijk ‘significant’ zijn
• Vrijheidsgraden voor between groups (hier: 3-1=2) én within groups (hier: 18-3=15)
Interpretatie p-waarde:
• Een van de groepen verschilt significant van minimaal een van de andere

Voorbeeld ANOVA
Verschilt BMI afhankelijk van fysieke activiteit? Fysieke activiteit, 6 categorieën: very low, low, under
average, average, above average, high.




Verschilt BMI afhankelijk van fysieke activiteit?
Ja, (ergens) is er een significant verschil tussen de groepen (p<0,05). Minimaal één van de groepen
verschilt significant van minimaal één van de andere groepen.

Between= k – 1
Within = n – k
Total = n – 1
K= aantal groepen

ANOVA: Post-hoc toets
De tweede stap is een post-hoc toets om te achterhalen waar het verschil zit. Welke groepen
verschillen van elkaar? Hier: 15 vergelijkingen!

, • BMI verschilt significant voor de groepen met zeer lage en bovengemiddelde fysieke
activiteit (Diff = -0.94; p<0.05)
• BMI verschilt significant voor de groepen met zeer lage en hoge fysieke activiteit (Diff = -1.51;
p<0.05)

Assumpties ANOVA
1. Normale verdeling (van residuen)
2. Homogeniteit van varianties (zoals bij t-toets, maar hier niet direct een ‘aanpassing’ bij schending)
3. Waarnemingen onafhankelijk (volgt uit design)




Samenvatting ANOVA
• T-toets niet bruikbaar bij > 2 groepen
• ANOVA als alternatief
• Geeft alleen beperkte informatie (F-toets): één van de gemiddelden is anders dan (één van)
de andere
• Post-hoc analyse (Tukey) om erachter te komen wat van wat verschilt
• Dit kunnen we ook met regressieanalyse doen (volgende week: dummy-regressie)

Lineaire regressie
• Uitkomst (‘afhankelijke variabele’)
o Minimaal interval meetniveau
• Determinant (‘onafhankelijke variabele’):
o Alle meetniveau’s:
▪ dichotoom (t-toets),
▪ categoriaal (‘dummy’; ANOVA),
▪ continu (ook: correlatie)

Zoals de naam al zegt: we schatten een lineair verband. Met bivariate regressie schatten we het
verband tussen twee variabelen (X en Y). We schatten Y als lineaire functie van X. Met de
determinant X proberen we variantie in de uitkomst Y te verklaren.

Lineaire regressie: voorspelling
• Hoeveel neemt een variabele (Y) gemiddeld toe / af als een andere variabele toeneemt (X).

, • We maken op basis van de onafhankelijke X-variabele een voorspelling voor de waarde op de
afhankelijke Y-variabele.

o Vandaag bivariate regressie: het voorspellen van Y op basis van X
o Volgende week multiple (‘multivariabele’) regressie: het voorspellen van Y op basis
van meerdere onafhankelijke variabelen (X1, X2, X3, etc.)

Voorbeeld
We willen de variantie in Y (hier: systolische bloeddruk) verklaren met behulp van X (hier: BMI). Hoe
doe je dat?




De manier waarop een lineaire regressie tot stand komt heet ‘Ordinary Least Squares’. Voor elke
observatie wordt de kleinste gekwadrateerde afstand gezocht tussen geobserveerde en door de
regressie voorspelde waarde. Klinkt bekend? Gekwadrateerde afwijkingen / Sum of Squares... daar
gaan we weer!

De meest eenvoudige voorspelling voor Y is het gemiddelde:
Maar dan maken we een best grote voorspellingsfout, dit noemen we: TSS = Total Sum of Squares:



Betere voorspelling dan
... krijgen we (hopelijk) nadat we determinant(en) toevoegen om de variantie in Y te voorspellen.
D.m.v. voor ieder observatie de kleinste gekwadrateerde afstand tot de regressielijn zoeken (OLS)

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper stuv19. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €12,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 52510 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€12,49  4x  verkocht
  • (0)
In winkelwagen
Toegevoegd