Epidemiologie en statistiek jaar 2
Overzicht dingen die je moet weten maar kan vergeten 2
T-Toetsen 3
One sample t-test: 3
T-toets voor onafhankelijke steekproeven/Two sample t-test/Independent sample t-test 5
T-toets 2 onafhankelijke groepen voor homogene variantie: dit is als het normaal
verdeeld is. 5
T-toets 2 onafhankelijke groepen voor heterogene variantie: dit is als het niet
normaal verdeeld is. 6
ANOVA 7
Lineaire Regressie 9
Lineaire regressie met de hand 10
Lineaire regressie in SPSS 14
Multipele Regressie 15
Associatie Model 15
Confounding in een regressiemodel 15
Associatie model multipele regressie confounding in SPSS: 19
Effectmodificator in een regressiemodel 20
Associatie model multipele regressie effectmodificatie in SPSS: 23
Chikwadraattoets 24
Logistische Regressie 27
Voorbeeld met dichotoom determinant: 28
Voorbeeld met Categorische determinant: 30
Voorbeeld met Continue determinant: 31
Predictie modellen 32
Survival Analyse 1
Survival analyse (tijd tot event analyse) 1
Cox-regressie 1
Confounding in Cox-regressie 1
Effectmodificator in Cox-regressie 1
Survival Analyse in SPSS 1
Dummies maken 1
,Overzicht dingen die je moet weten maar kan
vergeten
Hypothese opstellen.
- H0 = het steekproefgemiddelde is gelijk aan het populatiegemiddelde.
- Ha: tweezijdige toets = Het steekproefgemiddelde is niet gelijk aan het
populatiegemiddelde. (geeft geen richting)
Ha: Eenzijdige toets = Het steekproefgemiddelde ligt hoger/lager dan het
populatiegemiddelde. (geeft een specifieke richting)
● Rechtszijdig: Het steekproefgemiddelde ligt hoger dan het
populatiegemiddelde.
● Linkszijdig: Het steekproefgemiddelde ligt lager dan het
populatiegemiddelde.
Verschillende type determinanten
1. Categoriaal
- Nominaal: heeft verschillende categorieën of groepen zonder een specifieke
volgorde. Er is geen logische volgorde of rangorde tussen de categorieën.
● Geslacht (man, vrouw), bloedgroep (A, B, AB, O)
- Ordinaal: hier is er wél een logische volgorde of rangorde tussen de
categorieën. Je kunt de categorieën ordenen, maar de afstanden tussen de
categorieën zijn niet eenduidig gedefinieerd.
● Onderwijsniveau (basis, middelbaar, hoger), Kledingmaat (xs, s, m, l),
Inkomen (laag, middel, hoog).
2. Continue
- Ratio: heeft gelijke afstanden tussen waarden, maar hier is wél een absoluut
nulpunt. Dit betekent dat je naast optellen en aftrekken ook zinnige
verhoudingen kunt berekenen (iets kan bijvoorbeeld echt "twee keer zo veel"
zijn)
● Lengte, gewicht, inkomen, leeftijd.
- Interval: heeft een ordelijke schaal waar de afstanden tussen waarden gelijk
zijn, maar er is geen absoluut nulpunt. Dit betekent dat je wel kunt optellen en
aftrekken, maar verhoudingen zijn niet zinvol (je kunt niet zeggen dat iets
twee keer zo groot is).
● Temperatuur in Celsius of Fahrenheit (0 graden betekent niet "geen
temperatuur"), jaartal in een kalender.
,T-Toetsen
Test voor continue uitkomstmaten, dichotome determinant.
One sample t-test:
Is het verschil tussen het gemiddelde in de steekproef en het verwachte gemiddelde (in de
populatie) groter dan we op basis van kans zouden verwachten?
Voorbeeld vragen:
- Je wilt controleren of de gemiddelde temperatuur van een stad afwijkt van een
historisch gemiddelde.
- Een bedrijf wil weten of hun product een andere gemiddelde levensduur heeft dan
wat is beloofd.
Formule:
● x = het gemiddelde van de steekproef,
● μ0 = het populatiegemiddelde waarmee je vergelijkt,
● sd = de standaardafwijking van de steekproef,
● n = de steekproefgrootte.
Stappen voor het uitrekenen:
1. Hypothese opstellen.
- H0 = het steekproefgemiddelde is gelijk aan het populatiegemiddelde.
- Ha: tweezijdige toets = Het steekproefgemiddelde is niet gelijk aan het
populatiegemiddelde. (geeft geen richting)
Ha: Eenzijdige toets = Het steekproefgemiddelde ligt hoger/lager dan het
populatiegemiddelde. (geeft een specifieke richting)
● Rechtszijdig: Het steekproefgemiddelde ligt hoger dan het
populatiegemiddelde.
● Linkszijdig: Het steekproefgemiddelde ligt lager dan het
populatiegemiddelde.
2. Bereken de t-waarde
3. Vindt de bijbehorende vrijheidsgraden en p waarde bij de t waarde die je in stap 2
hebt berekend. De vrijheidsgraden bereken je door aantal observaties - 1.
Vrijheidsgraden voorbeeld: stel je hebt een gemiddelde van 10, dan kan je het eerste
getal, tweede, derde en vierde vrij invullen maar het 5de getal ligt vast. Dan heb je
een vrijheidsgraden van 4
4. Als je p waarde < 0.05 , dan verwerp je de 0 hypothese.
Conclusie: de t-toets is statistisch significant, het steekproefgemiddelde verschilt
significant van het populatiegemiddelde.
SPSS:
Analyze → Compare Means and Proportions → One sample t-test
, Gepaarde t-toets / Paired (dependent) sample t-test:
De vraag die we willen beantwoorden is: is de gevonden gemiddelde verandering/
het gevonden gemiddelde verschil tussen de twee meetpunten in onze steekproef
toe te schrijven aan kans, of bestaat de verandering/ dit verschil waarschijnlijk ook in
de populatie?
De gepaarde t-toets wordt gebruikt als je steekproeven niet onafhankelijk zijn,
bijvoorbeeld omdat je dezelfde persoon twee keer meet (voor- en nameting, twee
koffiemerken laat beoordelen) of omdat je broers en zussen met elkaar vergelijkt
(kinderen uit een gezin).
Voorbeeld vragen:
- Verbetert een speciale training de prestaties van atleten op een specifieke
vaardigheid?
- Heeft een nieuwe onderwijsmethode een effect op de gemiddelde score van
studenten op een toets?
Formule:
d^ = is het gemiddlede van het verschil. bestaat eerst uit di → X1 - X2 = waarde voor de
eerste meting - waarde voor de tweede meting. Al deze waardes tel je bij elkaar op / aantal
observaties (ookal is het verschil 0) .
sd = standaarddeviatie
Vrijheidsgraden = N - 1