Voor toegepaste biostatistiek in de 1e master Biomedische Wetenschappen.
Alle commando's uit de 6 video's uitgeschreven in een document met extra uitleg & toegepaste voorbeelden uit de video's.
Inhoud
1. Simpele lineaire regressie: dataset met 1x en 1y ....................................................................2
1.1. Regressierechte weergeven ........................................................................................2
1.2. Samenvatting van regressie.........................................................................................2
1.3. F-test voor simpele lineaire regressie ...........................................................................2
2. Simpele lineaire regressie: dataset met meerdere x’en en 1y ..................................................2
2.1. Aanmaken subset ......................................................................................................2
2.2. Simpele lineaire regressie op 2 variabelen ....................................................................2
2.3. Meervoudige lineaire regressie ...................................................................................2
2.4. Berekenen van confidentie-interval voor x-variabele ......................................................2
2.5. Berekenen van predictie-interval voor y van 1 individu...................................................2
2.6. Berekenen van confidentie-interval voor gemiddelde x van een groep personen ...............2
3. Assumpties voor simpele & multipele lineaire regressie .........................................................3
3.1. Normale verdeling residuals voor x1 en y .....................................................................3
3.2. Residual plot .............................................................................................................3
3.3. Cooks afstand............................................................................................................3
3.3.1. Wanneer heeft een observatie een hoge invloed? .....................................................3
3.4. Simpele lineaire regressie op nieuwe dataset zonder outliers .........................................3
4. ANOVA, ANCOVA en correlatie ............................................................................................4
4.1. Kolom als categorische variabele instellen ....................................................................4
4.2. Nieuwe dataset maken zonder bepaalde waarden .........................................................4
4.3. ANOVA .....................................................................................................................4
4.4. T-testen ....................................................................................................................4
4.4.1. Zonder correctie ....................................................................................................4
4.4.2. Met Bonferroni correctie ........................................................................................5
4.5. Assumpties voor ANOVA ............................................................................................5
4.5.1. Normaliteit respons variabele in elke groep ..............................................................5
4.5.2. Homogeniteit van varianties: Bartlett test .................................................................5
4.6. Kruskal-Wallis test: non-parametrische test ..................................................................5
4.7. ANCOVA ...................................................................................................................5
4.8. Berekenen correlatiecoëfficiënt ...................................................................................6
5. Logistische regressie, sensitiviteit en specificiteit ...................................................................6
5.1. Logistische regressie ..................................................................................................6
5.2. Odds ratio, sensitiviteit en specificiteit .........................................................................6
, 5.2.1. Odds ratio .............................................................................................................6
5.2.2. Sensitiviteit & specificiteit.......................................................................................6
1. Simpele lineaire regressie: dataset met 1x en 1y
simple <-lm (NAAM y-variabele ~ NAAM x-variabele)
simple => geeft coëfficiënten rechte weer
1.1. Regressierechte weergeven
abline (simple, col = “pink/red/…”)
1.2. Samenvatting van regressie
summary (simple)
1.3. F-test voor simpele lineaire regressie
anova (simple)
2. Simpele lineaire regressie: dataset met meerdere x’en en 1y
2.1. Aanmaken subset
NAAM SUBSET <- subset(dataset, conditie)
Conditie = aan wat moet een x voldoen om in deze subset te horen?
2.2. Simpele lineaire regressie op 2 variabelen
plot (NAAM DATASET/SUBSET$x1, data=NAAM DATASET/SUBSET)
simple_naam <-lm (y ~x1 , data = NAAM DATASET/SUBSET)
summary (simple_naam)
2.3. Meervoudige lineaire regressie
multiple < -lm (y~ x1 + x2 + … + xk, data = NAAM DATASET/SUBSET)
Geef hierin alle x’en waarmee je meervoudige regressie wilt uitvoeren
2.4. Berekenen van confidentie-interval voor x-variabele
confint (multiple, “NAAM X”, level = 0,…)
2.5. Berekenen van predictie-interval voor y van 1 individu
predict (multiple, data.frame( criteria), interval = “prediction”, level = 0,..)
2.6. Berekenen van confidentie-interval voor gemiddelde x van een groep personen
predict (multiple, data.frame (criteria), interval = “confidence” , level = 0,..)
, 3. Assumpties voor simpele & multipele lineaire regressie
3.1. Normale verdeling residuals voor x1 en y
shapiro. test(residuals(simple_naam))
H0: normale verdeling vs H1: niet-normale verdeling
3.2. Residual plot
par (mfrow = c(GETAL, GETAL))
plot (simple_naam)
3.3. Cooks afstand
cooksd <- cooks.distance(simple_naam)
cooksd
dev.off()
plot(simple_naam, 4)
3.3.1. Wanneer heeft een observatie een hoge invloed?
3.3.1.1. Cooks afstand > 4/(n-p-1)
= cutoff1
cutoff1 <- 4/(654-1-1)
cutoff1
- Je krijgt een getal => kijk naar plot waar alle data ligt
- Vb. dataset 2: cutoff1 = 0,00613
- Outliers verwijderen:
influential <- as.numeric(names(cooksd)[cooksd > cutoff1]) = hoeveel
getallen hebben een Cooks afstand > cutoff1
NAAM_DATASETbis <- DATASET[-influential, ] = data – influential getallen
nrow(NAAM_DATASETbis) = hoeveel rijen
nrow(DATASET)-nrow(NAAM_DATASETbis) = observaties die verwijderd zijn
= alle observaties verwijderen die een Cooks afstand > 4/(n-p-1) hebben
3.3.1.2. Cooks afstand > 1
- Outliers verwijderen:
influential <- as.numeric(names(cooksd)[cooksd > 1])
NAAM_DATASETtre <- data2[-influential, ]
nrow(NAAM_DATASETtre)
nrow(DATASET)-nrow(NAAM_DATASETtre)
Als dit te liberaal is, moet je andere cutoff kiezen
3.4. Simpele lineaire regressie op nieuwe dataset zonder outliers
- Kies eerst een goede cutoff (zie hierboven 2 scenario’s)
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper noavdn. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,16. Je zit daarna nergens aan vast.