Samenvatting van alle hoorcolleges en werkcolleges van het onderdeel statistiek van de cursus Onderzoeksmethoden (BMW21010)
3 views 0 purchase
Course
Onderzoeksmethoden (BMW21010)
Institution
Universiteit Utrecht (UU)
Book
Quantitative Chemical Analysis
Deze gedetailleerde samenvatting behandelt alles wat aan bod is gekomen tijdens de hoorcolleges en werkcolleges (COOs) van het onderdeel statistiek van de cursus Onderzoeksmethoden. Hierdoor bevat het alle informatie die nodig is voor de statistiek tentamen(s).
Door Nicole (studente BMW)
Biomedische Wetenschappen | 2020-2021
,Inhoudsopgave
Regressie en kalibratielijnen...................................................................................................................3
Lineaire regressie................................................................................................................................3
Toetsen van de richtingscoëfficiënt....................................................................................................7
Toetsen van de richtingscoëfficiënt in RStudio...............................................................................7
Controleren van aannames................................................................................................................8
Residuen plot..................................................................................................................................9
Fouten in de aannames..................................................................................................................9
Betrouwbaarheidsintervallen en predictie-intervallen.....................................................................12
Betrouwbaarheidsintervallen bij lineaire regressie......................................................................12
Betrouwbaarheidsintervallen en predictie-intervallen in RStudio................................................13
Predictie-intervallen bij lineaire regressie....................................................................................14
Kalibratielijnen (omgekeerde predictie)...........................................................................................15
Betrouwbaarheidsinterval............................................................................................................15
Omgekeerd predictie-interval in RStudio.....................................................................................16
One-way ANOVA..................................................................................................................................17
Essentie............................................................................................................................................17
Toetsen.............................................................................................................................................17
Standaarddeviatie en variantie.........................................................................................................17
Opsplitsen van de variantie..........................................................................................................18
Variantieanalyse...........................................................................................................................19
One-way ANOVA in RStudio.............................................................................................................20
Controleren van aannames..............................................................................................................20
Normaal verdeelde data...............................................................................................................21
Gelijke varianties..........................................................................................................................22
Post-hoc toetsen...............................................................................................................................23
Least significant difference (LSD toets).........................................................................................24
Bonferroni correctie.....................................................................................................................24
Tukey’s Honestly Significant Difference........................................................................................25
Dunnett’s test...............................................................................................................................25
Overzicht verschillende post-hoc toetsen.....................................................................................25
Statistiek in de literatuur......................................................................................................................26
Titel...................................................................................................................................................29
Samenvatting....................................................................................................................................29
Inleiding............................................................................................................................................29
1
,Methoden.........................................................................................................................................29
Resultaten........................................................................................................................................29
Discussie...........................................................................................................................................29
Tips bij het analyseren van artikelen................................................................................................31
Algemeen......................................................................................................................................31
Methoden.....................................................................................................................................31
2
,Regressie en kalibratielijnen
Lineaire regressie
De correlatiecoëfficiënt (Pearson’s correlatiecoëfficiënt) is een maat om de sterkte van een lineair
verband tussen twee numerieke variabelen aan te geven. Hierbij wordt er geen uitspraak gedaan
over een mogelijke afhankelijke relatie tussen de variabelen.
Bij enkelvoudige lineaire regressie wordt er naar één verklarende variabele (X) gekeken. Hierbij
wordt er een vergelijking van de lijn schat en wordt Y voorspelt op basis van lineaire relatie met X.
Deze voorspellingen hebben een bepaalde (on)zekerheid, namelijk het betrouwbaarheidsinterval
(BHI).
Bij het opstellen van zo’n vergelijking is belangrijk om eerst te kijken naar de vorm van het verband
en eventuele uitbijters te identificeren, dit kan met behulp van een spreidingsdiagram. De lineaire
regressielijn wordt vervolgens opgesteld met behulp van de volgende vergelijking:
Y = β0 + β 1∗X +ε
Hierbij geldt:
Y = afhankelijke uitkomstvariabele
X = onafhankelijke of verklarende variabele (predictor)
β 0 en β 1 = regressiecoëfficiënten
ε = afstand tussen de regressielijn en de datapunten (residuen)
De regressie coëfficiënt β 0 wordt ook intercept of as-afsnede genoemd en geeft de waarde van Y als
geldt: X = 0. De regressiecoëfficiënt b weerspiegelt de richtingscoëfficiënt/helling (slope) van de
regressielijn en geeft de gemiddelde toename van Y aan als de X variabele met 1 eenheid toeneemt.
Hieronder is de activiteit van amygdala op de x-as en de geheugenscore op de y-as in een
spreidingsdiagram weergegeven. In de tabel staan de bijbehorende waarden van de punten.
Figuur 1 Tabel en spreidingsdiagram van de relatieve activiteit van de amygdala en de geheugenscore.
De correlatiecoëfficiënt (r) bedraagt in de bovenstaande figuur 0,852 wat duidt op een sterk positief
verband. Daarnaast is het gemiddelde ongeveer 0 en is er geen sprake van grote uitschieters.
3
,Op het moment dat de eenheden van deze waarden aangepast worden, zal de correlatie niet
veranderen, deze is nog steeds 0,852. Hieronder is hier een voorbeeld van weergegeven.
Bij lineaire regressie zijn de eenheden van de waarden echter wel van belang!
Geheugen Relatieve
Score (x10) activiteit
(x100)
310 -10.9
290 -25,8
290 -23,4
300 -24,9
330 -5,6
320 -3,1
310 12
350 24
340 34,2
330 29,3
Figuur 2 Tabel en spreidingsdiagram van de relatieve activiteit van de amygdala en de geheugenscore.
Residuen
Een residu is het verschil tussen een geobserveerde waarde en de corresponderende waarde van een
regressielijn: ε^ i= y i−^y i
4
, Residual standard error:
Schatting van de standaarddeviatie van residuen (spreiding rondom de lijn).
Figuur 3 Schematische weergave van de spreiding van de residuen.
Schatting van de regressielijn
Aan de hand van een door de computer opgestelde regressielijn kan de helling van deze regressielijn
bepaald worden. Hiertoe worden twee punten van de lijn afgelezen en wordt de richtingscoëfficiënt
berekend door:
Δy ^
r= =β1
Δx
Vervolgens kan met behulp van de berekende β 1 de formule van de regressielijn geschat worden:
^y = β^ 0 + β^ 1∗x deze formule kan herschreven worden tot: ^β = ^y − ^β ∗x
0 1
Invullen van een punt op de lijn leidt ertoe dat ^β 0 ook bepaald kan worden en zo is uiteindelijk de
formule van de regressielijn opgesteld/geschat. De ^ (dakjes) boven de parameters geven aan dat het
schattingen zijn.
Regressielijn in RStudio
De regressielijn kan ook bepaald worden aan de hand van bepaalde commando’s in RStudio. Er wordt
dan gebruik gemaakt van de “kleinste kwadraten methode”. Hiermee wordt de best passende lijn bij
de gegevens bepaald. Dit kan met de lm() functie in RStudio, hierdoor worden de
regressiecoëfficiënten (β) bepaald. De lijn kan vervolgens door een plot getrokken worden met de
abline() functie, tussen haakjes komt dat het object te staan, dat aangemaakt is met de lm() functie.
Voorspellingen
Aan de hand van een opgestelde lineaire regressielijn kunnen er voorspellingen gedaan worden.
Daarvan is hieronder een voorbeeld weergegeven. Zo kan in dit geval de gemiddelde geheugenscore
bij een proefpersoon met een relatieve activiteit van 0,10 bepaald worden.
De formule van de regressielijn, luidt in dit geval als volgt:
^y =31,656+ 7,644∗relatieve activiteit
Invullen van deze formule geeft:
^y =31,656+ 7,644∗0,10=32,420
5
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller xnicolevdz. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.82. You're not tied to anything after your purchase.