College en kennisclip aantekeningen/samenvatting MTB2. 8,9 behaald
Bronnen:
L.M. Bouter, M.C.I.M van Dongen, G.A. Zielhuis en M.P.A. Zeegers, Leerboek Epidemiologie, zevende herziene druk, 2016, Bohn Stafleu Van Loghum, Houten. ISBN 9789036805612
J.W.R. Twisk. Inleiding in de toegepaste bios...
Blok 0: T-toetsen
Tot dusver hebben we associaties tussen determinant en uitkomst handmatig berekend met odds
ratio (OR) en relatief risico (RR)
- Dichotome determinant (blootstelling ja/nee)
- Dichotome uitkomst (ziek ja/nee)
,Maar vaak hebben we te maken met variabelen van een ander meetniveau
- Categoriaal (2 of meer categorieën) of ordinaal
- Kwantitatief: discreet of continue
3 typen toetsen:
1) One sample t-test
( X̄ – μ)
T=
sd /n
- Kwantitatieve uitkomstvariabelen
- Om een steekproef te vergelijken met een bepaalde verwachtingswaarde.
- Bijvoorbeeld: Volgens het RIVM hebben Nederlandse vrouwen tussen 30-39 jaar een
gemiddeld BMI van 24,4.
Heeft de patientenpopulatie vrouwen 30-39 jaar van huisartsenpraktijk X een gemiddeld
BMI van 24,4?
2) Independent samples t-test = two samples t-test = t-toets voor onafhankelijke
steekproeven
( X̄ 1− X̄ 1−❑1−❑2)
T= waarbij de standaardfout (noemer) berekend wordt m.b.v. de
SD X̄ − X̄
1 2
'pooled variance'.
- Kwantitatieve uitkomstvariabelen
- Om twee groepen (‘samples’) te vergelijken: dichotome determinant.
- Bijvoorbeeld: Is er een verschil in bloeddruk tussen de interventiegroep en controle
groep?
3) Paired (dependent) samples t-test = gepaarde t-toets
(đ – Δ 0)
T=
sd /n
- Kwantitatieve uitkomstvariabelen
- Om herhaalde (of gepaarde) metingen met elkaar te vergelijken
- Bijvoorbeeld: Is er een verschil in rekenvaardigheden bij premasterstudenten
Gezondheidswetenschappen aan het begin en aan het eind van het
premasterprogramma?
- Twee belangrijke punten zijn: 1: de twee groepen zijn onafhankelijk (komen voort uit twee
samples), bijvoorbeeld mannen en vrouwen. 2: Daarnaast wordt er verondersteld dat
de varianties in de twee steekproeven ongeveer even groot zijn (en dat is vaak niet zo,
daarom voert SPSS standaard de Levene's test for equality of variances uit, en maakt
gebruik van de 'Aanpassing van Welch')
One sample t-test beantwoorden we de vraag:
Is het verschil tussen het gemiddelde uit de steekproef en een
verwachte gemiddelde (in de populatie) groter dan we op basis van
kans zouden mogen verwachten?
Heeft de patientenpopulatie vrouwen 30-39 jaar van
huisartsenpraktijk X een gemiddeld BMI van 24,4?
T-waarde (one sample t-toets)
,T-waarde onafhankelijke sample t-test
T-waarde gepaarde t-test
P-P plot
Q-Q plot
+ Kennisclip: t-verdeling (deel 1)
Verwachting en variantie. We weten E(X) = n en VAR(X) = n(1- ). Dit is zo bij een binomiale
verdeling. Maar als we bijvoorbeeld een poissonverdeling hebben gebruiken we eigenlijk dezelfde
verwachtingswaarde en variantie ook voor deze verdeling. Namelijk:
E(X) =
VAR(X) = = E(X)
=
, weet je dus de verwachting? Dan weet je de variantie.
(note: lambda (λ) is het gemiddelde aantal gebeurtenissen binnen een bepaald tijds- of ruimte-
interval. Bijvoorbeeld: λ = 0.748 overstromingen per jaar.
Binnen statistiek staat dit type vragen centraal:
- Hoe waarschijnlijk is gevonden steekproefuitkomst bij hypothetische populatie-
parameterwaarde?
Onwaarschijnlijk? dan verwerpen we die parameterwaarde
Niet onwaarschijnlijk? dan verwerpen we die parameterwaarde niet
Zo trekken we statistische en wetenschappelijke conclusies (al trekken we soms verkeerd, o.b.v.
pech).
Bij Poisson- of binomiaal proces hebben we aan E(X) genoeg om deze vraag te beantwoorden.
, + Kennisclip: t-verdeling (deel 2)
Een van de problemen met de normale kansverdeling is dat deze eigenlijk alleen maar gebruikt kan
worden op het moment dat de standaarddeviatie van de doelpopulatie bekend is. Omdat je
doelpopulatie niet alleen bestaat uit de onderzoekspopulatie, maar ook alle toekomstige patiënten,
kan je concluderen dat de standaarddeviatie van de doelpopulatie nooit bekend is.
Middels de centrale limietstelling kan de normale kansverdeling ook gebruikt worden als de
steekproef groot is. Als de steekproef relatief klein is hebben we een probleem. We gebruiken dan de
T-verdeling, wanneer de onbekend is.
t-verdeling en normale verdeling lijken op elkaar.
- Standaardiseren om verschil tussen uitkomst en verwachting uit te drukken in aantal
standaardafwijkingen
X̄ – μ X̄ – μ
Vergelijk: Z= en T =
σ /n Sd /n
Echter: t-verdeling is ‘onzekerder’
Vergelijk: Z95% = 1.96 en T95% > 1.96 (hoeveel groter >, hangt af van aantal waarnemingen)
Ofwel: de t-verdeling kent meer spreiding dan de z-verdeling, omdat je de niet weet.
Verdeling van t-verdeling, hang af van het aantal
vrijheidsgraden (DF) = n-1
Bij afname van de DF = (K in plaatje hiernaast)
Heb je meer standaardafwijkingen nodig, om zelfde massa
in het midden te vangen
Bij grotere waarnemingen, zie je het verschil niet meer
tussen t-verdeling en normale verdeling, dus kan je de z-
verdeling gebruiken.
DF = het aantal stukjes informatie dat je nodig hebt om
alle relevante informatie te kunnen reconstrueren.
Resumé:
- Bij poisson en binomiale verdeling hangen E(X) en VAR(X) samen. De onzekerheid over
de schatting voor E(X) is hetzelfde als die over de schatting van VAR(X)
- Bij een normale verdeling is dat niet zo. Schattingen voor E(X) als voor VAR(X)
introduceren beide hun eigen onzekerheid, want:
1) Je weet niet of je gemiddelde van je steekproef lijkt op de verwachtingswaarde van
de populatie
2) Je weet niet of de standaardafwijking van je steekproef lijkt op de standaardafwijking
van de gehele populatie.
Om te kunnen weten wat de steekproef over de populatie zegt, is daarom het gebruik van
de t-verdeling vereist naarmate het aantal waarnemingen in je t-verdeling groter wordt,
gaat het meer op de z-verdeling (standaardnormale verdeling) lijken, dus je onzekerheid
over je standaardafwijking steeds kleiner.
+ Canvas: Blok 0 Levene’s test
Levene's test for equality of variances
SPSS voert altijd de Levene's test uit om de assumptie te checken of de varianties in de twee
steekproeven ongeveer even groot zijn. De nulhypothese van de Levene's test is: De varianties van
de twee steekproeven zijn in de populatie gelijk. In SPSS vind je de uitspraak over deze hypothese dit
in de rij 'equal variances assumed'.
Als de uitkomst van de Levene's test een p-waarde geeft van groter dan 0.05, dan wordt
de nulhypothese niet afgewezen en we mogen ervan uitgaan dat de twee varianties ook in de
populatie ongeveer gelijk zijn. Voor de uitkomst van de t-toets houden we dan de rij in de
output aan getiteld 'equal variances assumed'.
Als de uitkomst van de Levene's test een p-waarde geeft van kleiner dan 0.05, dan wordt
de nulhypothese wel afgewezen en gaan we ervan uit dat de twee varianties in de populatie
niet gelijk zijn. Voor de uitkomst van de t-toets houden we dan de rij in de output aan
getiteld 'equal variances not assumed'.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper danielkim. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,27. Je zit daarna nergens aan vast.