Samenvatting van alle hoorcolleges en werkcolleges van het onderdeel statistiek van de cursus Onderzoeksmethoden (BMW21010)
3 keer bekeken 0 keer verkocht
Vak
Onderzoeksmethoden (BMW21010)
Instelling
Universiteit Utrecht (UU)
Boek
Quantitative Chemical Analysis
Deze gedetailleerde samenvatting behandelt alles wat aan bod is gekomen tijdens de hoorcolleges en werkcolleges (COOs) van het onderdeel statistiek van de cursus Onderzoeksmethoden. Hierdoor bevat het alle informatie die nodig is voor de statistiek tentamen(s).
Door Nicole (studente BMW)
Biomedische Wetenschappen | 2020-2021
,Inhoudsopgave
Regressie en kalibratielijnen...................................................................................................................3
Lineaire regressie................................................................................................................................3
Toetsen van de richtingscoëfficiënt....................................................................................................7
Toetsen van de richtingscoëfficiënt in RStudio...............................................................................7
Controleren van aannames................................................................................................................8
Residuen plot..................................................................................................................................9
Fouten in de aannames..................................................................................................................9
Betrouwbaarheidsintervallen en predictie-intervallen.....................................................................12
Betrouwbaarheidsintervallen bij lineaire regressie......................................................................12
Betrouwbaarheidsintervallen en predictie-intervallen in RStudio................................................13
Predictie-intervallen bij lineaire regressie....................................................................................14
Kalibratielijnen (omgekeerde predictie)...........................................................................................15
Betrouwbaarheidsinterval............................................................................................................15
Omgekeerd predictie-interval in RStudio.....................................................................................16
One-way ANOVA..................................................................................................................................17
Essentie............................................................................................................................................17
Toetsen.............................................................................................................................................17
Standaarddeviatie en variantie.........................................................................................................17
Opsplitsen van de variantie..........................................................................................................18
Variantieanalyse...........................................................................................................................19
One-way ANOVA in RStudio.............................................................................................................20
Controleren van aannames..............................................................................................................20
Normaal verdeelde data...............................................................................................................21
Gelijke varianties..........................................................................................................................22
Post-hoc toetsen...............................................................................................................................23
Least significant difference (LSD toets).........................................................................................24
Bonferroni correctie.....................................................................................................................24
Tukey’s Honestly Significant Difference........................................................................................25
Dunnett’s test...............................................................................................................................25
Overzicht verschillende post-hoc toetsen.....................................................................................25
Statistiek in de literatuur......................................................................................................................26
Titel...................................................................................................................................................29
Samenvatting....................................................................................................................................29
Inleiding............................................................................................................................................29
1
,Methoden.........................................................................................................................................29
Resultaten........................................................................................................................................29
Discussie...........................................................................................................................................29
Tips bij het analyseren van artikelen................................................................................................31
Algemeen......................................................................................................................................31
Methoden.....................................................................................................................................31
2
,Regressie en kalibratielijnen
Lineaire regressie
De correlatiecoëfficiënt (Pearson’s correlatiecoëfficiënt) is een maat om de sterkte van een lineair
verband tussen twee numerieke variabelen aan te geven. Hierbij wordt er geen uitspraak gedaan
over een mogelijke afhankelijke relatie tussen de variabelen.
Bij enkelvoudige lineaire regressie wordt er naar één verklarende variabele (X) gekeken. Hierbij
wordt er een vergelijking van de lijn schat en wordt Y voorspelt op basis van lineaire relatie met X.
Deze voorspellingen hebben een bepaalde (on)zekerheid, namelijk het betrouwbaarheidsinterval
(BHI).
Bij het opstellen van zo’n vergelijking is belangrijk om eerst te kijken naar de vorm van het verband
en eventuele uitbijters te identificeren, dit kan met behulp van een spreidingsdiagram. De lineaire
regressielijn wordt vervolgens opgesteld met behulp van de volgende vergelijking:
Y = β0 + β 1∗X +ε
Hierbij geldt:
Y = afhankelijke uitkomstvariabele
X = onafhankelijke of verklarende variabele (predictor)
β 0 en β 1 = regressiecoëfficiënten
ε = afstand tussen de regressielijn en de datapunten (residuen)
De regressie coëfficiënt β 0 wordt ook intercept of as-afsnede genoemd en geeft de waarde van Y als
geldt: X = 0. De regressiecoëfficiënt b weerspiegelt de richtingscoëfficiënt/helling (slope) van de
regressielijn en geeft de gemiddelde toename van Y aan als de X variabele met 1 eenheid toeneemt.
Hieronder is de activiteit van amygdala op de x-as en de geheugenscore op de y-as in een
spreidingsdiagram weergegeven. In de tabel staan de bijbehorende waarden van de punten.
Figuur 1 Tabel en spreidingsdiagram van de relatieve activiteit van de amygdala en de geheugenscore.
De correlatiecoëfficiënt (r) bedraagt in de bovenstaande figuur 0,852 wat duidt op een sterk positief
verband. Daarnaast is het gemiddelde ongeveer 0 en is er geen sprake van grote uitschieters.
3
,Op het moment dat de eenheden van deze waarden aangepast worden, zal de correlatie niet
veranderen, deze is nog steeds 0,852. Hieronder is hier een voorbeeld van weergegeven.
Bij lineaire regressie zijn de eenheden van de waarden echter wel van belang!
Geheugen Relatieve
Score (x10) activiteit
(x100)
310 -10.9
290 -25,8
290 -23,4
300 -24,9
330 -5,6
320 -3,1
310 12
350 24
340 34,2
330 29,3
Figuur 2 Tabel en spreidingsdiagram van de relatieve activiteit van de amygdala en de geheugenscore.
Residuen
Een residu is het verschil tussen een geobserveerde waarde en de corresponderende waarde van een
regressielijn: ε^ i= y i−^y i
4
, Residual standard error:
Schatting van de standaarddeviatie van residuen (spreiding rondom de lijn).
Figuur 3 Schematische weergave van de spreiding van de residuen.
Schatting van de regressielijn
Aan de hand van een door de computer opgestelde regressielijn kan de helling van deze regressielijn
bepaald worden. Hiertoe worden twee punten van de lijn afgelezen en wordt de richtingscoëfficiënt
berekend door:
Δy ^
r= =β1
Δx
Vervolgens kan met behulp van de berekende β 1 de formule van de regressielijn geschat worden:
^y = β^ 0 + β^ 1∗x deze formule kan herschreven worden tot: ^β = ^y − ^β ∗x
0 1
Invullen van een punt op de lijn leidt ertoe dat ^β 0 ook bepaald kan worden en zo is uiteindelijk de
formule van de regressielijn opgesteld/geschat. De ^ (dakjes) boven de parameters geven aan dat het
schattingen zijn.
Regressielijn in RStudio
De regressielijn kan ook bepaald worden aan de hand van bepaalde commando’s in RStudio. Er wordt
dan gebruik gemaakt van de “kleinste kwadraten methode”. Hiermee wordt de best passende lijn bij
de gegevens bepaald. Dit kan met de lm() functie in RStudio, hierdoor worden de
regressiecoëfficiënten (β) bepaald. De lijn kan vervolgens door een plot getrokken worden met de
abline() functie, tussen haakjes komt dat het object te staan, dat aangemaakt is met de lm() functie.
Voorspellingen
Aan de hand van een opgestelde lineaire regressielijn kunnen er voorspellingen gedaan worden.
Daarvan is hieronder een voorbeeld weergegeven. Zo kan in dit geval de gemiddelde geheugenscore
bij een proefpersoon met een relatieve activiteit van 0,10 bepaald worden.
De formule van de regressielijn, luidt in dit geval als volgt:
^y =31,656+ 7,644∗relatieve activiteit
Invullen van deze formule geeft:
^y =31,656+ 7,644∗0,10=32,420
5
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
√ Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper xnicolevdz. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,49. Je zit daarna nergens aan vast.