100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting voorkennis + Lineaire regressie $3.67   Add to cart

Summary

Samenvatting voorkennis + Lineaire regressie

 8 views  0 purchase
  • Course
  • Institution

Dit is een samenvatting aan de hand van lesnotities van 2023 en de theorieslides (lesopname voorkennisclip en les herbekeken). Les gegeven door D. Fierens - Van der Elst (en in lesopname ook N. Struyf).

Last document update: 1 year ago

Preview 8 out of 35  pages

  • April 15, 2023
  • April 17, 2023
  • 35
  • 2022/2023
  • Summary
avatar-seller
Onderzoeksmethodologie en statistiek 3:
Samenvatting: Onderdeel statistiek
2. Lineaire regressie

, Lineaire regressie
Voorkennis opfrissen:

Voorkennis correlatie:
Uitleg aan de hand van observationeel, prospectief cohort onderzoek:


Gegevens:
- populatie: 100 personen
- studie: correlatie tussen cholesterol en een aantal determinanten zoals leeftijd,
geslacht, alcoholgebruik…


Berekening aan de hand van SPSS:
We berekenen de correlatie tussen de variabele ‘leeftijd’ en ‘cholesterolgehalte’.
→ Dit doen we met behulp van een correlatiecoëfficiënt.

Parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Pearson.
- Pearson: geschikt voor normaal verdeelde variabelen op ratio niveau
- gebruikt de meetwaarden

Niet-parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Spearman.
- Spearman: geschikt voor niet-normaal verdeelde variabelen op ratio en ordinaal
niveau
- gebruikt de rangvolgorde (rangnummers)

Input scherm: Databank SPSS:
analyze → correlate → bivariate

2 variabelen selecteren + aanduiden welke
correlatiecoëfficiënt er moet berekend
worden.
- Je kan best zowel Pearson als
Spearman aanduiden.

We gaan tweezijdig testen.

‘Flag significant correlations’ is standaard
aangevinkt. De significante correlaties
Ingevuld:
worden in de output dan aangegeven met
een sterretje.
- 1 sterretje geeft weer dat de waarde
significant is op 5%
significantieniveau
- 2 sterretjes geven weer dat de
waarde significant is op 1%
significantieniveau

, Wanneer je bij het vorige scherm op OK hebt
gedrukt, verkrijg je een outcome.

Je krijgt een uitkomst voor de Pearson en de
Spearman correlatiecoëfficiënt.

H0: correlatiecoëfficiënt r = 0
⇒ Er is geen correlatie (lineair verband)
tussen beide variabelen.

Vermits de p-waarde bij zowel Spearman als
bij Pearson kleiner is dan 0,05.
→ (Indien p > 0,05: r = 0 dus geen
correlatie)
→ (Indien p ≤ 0,05 kan de waarde van r
geïnterpreteerd worden)
- wanneer je dubbelklikt op de dit getal
krijg je de specifieke waarde met 6
decimalen
Merk op dat wanneer SPSS Pearson of
Spearman correlatie uitvoert, de info Pearson correlatiecoëfficiënt interpreteren:
altijd dubbel wordt weergegeven. = 0,372 = zwakke correlatie




Spearman correlatiecoëfficiënt interpreteren:
= 0,395 = zwakke correlatie




Omdat we de optie ‘flag significant
correlations’ hebben aangevinkt krijgen we
onder de outcome-tabellen een opmerking.
Er staan 2 sterretjes bij, wat dus wilt zeggen
dat de p-waarde kleiner is dan 1%.
We gaan ervan uit dat de cholesterolconcentratie normaal verdeeld is, want we hebben
voldoende metingen van 100 proefpersonen. Hierdoor gaan we de pearson
correlatiecoëfficiënt verkiezen.
⇒ verkies altijd de parametrische test over de niet-parametrische test
= testen met meer Power
- (= vermogen van toets om effect op te sporen als het effect ook werkelijk bestaat)
- (= de kans dat het zal leiden tot een terechte verwerping van de nulhypothese)

,Voorkennis spreidingsdiagram en inleiding tot lineaire regressie
Wanneer de Pearson correlatiecoëfficiënt aangeeft dat er een significante correlatie is en we
kunnen spreken over een lineair verband tussen beide variabelen, kunnen we dit verband
voorspellen.

We kunnen het verband voorspellen met een lineaire regressie.
We kunnen de lineaire regressie en eventueel de correlatie visueel weergeven in een
spreidingsdiagram.


Berekening aan de hand van SPSS:

Databank SPSS:
Graphs → chartbuilder → scatter
(spreidingsdiagram) → dubbelklik op
simple scatter

Assen:
- Op de X-as: leeftijd (in jaren) =
onafhankelijke variabele
- Op de Y-as: cholesterol (in
mmol/liter) = afhankelijke variabele




Outcome: grafiek
→ lineair verband is nog niet goed
waarneembaar, want we hebben een
brede puntenwolk

Statistisch gezien (kijk voorkennisclip
hierboven waarbij p-waarde kleiner is dan
1%) hebben we een significant lineair
verband. Dit wel op basis van een zwakke,
positieve correlatie.


→ dubbelklikken op de grafiek en ‘add fit
line at total’

, Je kan een rechte trekken door de punten:
Vervolgens krijg je een rechte die door de
puntenwolk loopt en het bijhorende
functievoorschrift.

Aan de hand van het functievoorschrift kan
je de cholesterolconcentratie voor een
nieuw proefpersoon voorspellen.
→ je geeft 1 ontbrekende waarde (vb:
leeftijd) in in het functievoorschrift en
bekomt vervolgens de andere variabele
(vb: cholesterolconcentratie)
Naast de grafiek wordt een
determinatiecoëfficiënt weergegeven.
- We kunnen dat de
richtingscoëfficiënt 0,02 aflezen
→ positief getal wilt zeggen dat het
een stijgende rechte is en een
positieve correlatie

Interpretatie: voor ieder
leeftijdsverschil van 1 jaar (= per
jaar dat je ouder wordt) verschilt de
cholesterolconcentratie 0,02
mmol/liter.

- De constante 3,86 in het snijpunt
met de Y-as = dit zou de verwachte
cholesterolconcentratie zijn bij een
leeftijd van 0 jaar

- De determinatiecoëfficiënt R² wordt
naast de grafiek weergegeven.
→ dit is in de statistiek een maat
voor het deel van de variabiliteit dat
wordt verklaard door het statistisch
model
→ er bestaan verschillende
definities, maar in het geval van
lineaire regressie is er een
eenduidige definitie: bij
enkelvoudige lineaire regressie is
de determinatiecoëfficiënt R² gelijk
aan het kwadraat van de
correlatiecoëfficiënt, deze
determinatiecoëfficiënt geeft aan
welk gedeelte van de variatie in de
ene variabele door de andere
wordt verklaard = verklaarde
variantie

,Meer informatie omtrent de
determinatiecoëfficiënt:




→ de correlatiecoëfficiënt van Pearson
kan variëren tussen min 1 en 1
→ de determinatiecoëfficiënt kan variëren
tussen 0 en 1
- Hoe groter de
determinatiecoëfficiënt, dus hoe
dichter bij 1, hoe krachtiger het
verband tussen de variabelen

In het voorbeeld is de R² = 0,138 = 13,8%
= zwak verband tussen leeftijd en
cholesterol

,Regressie

Testen
- Correlatie (Herhaling)
→ Bestaat er een verband tussen 2 dingen → onderzoeken (minstens ordinaal)
- vb: heeft studiejaar iets te maken met lengte
→ outcome: er is wel/ geen verband
- Voorbeeld 1: enkelvoudige lineaire regressie
- Voorbeeld 2: meervoudige lineaire regressie
- Voorbeeld 3: meervoudige lineaire regressie met dummy variabelen
- Voorbeeld 4: meervoudige lineaire regressie (method enter)
- Voorbeeld 5: (meervoudige) lineaire regressie (method stepwise)

Correlatie of Regressie?
- Correlatie: lineair verband tussen 2 variabelen
→ Is er een verband?
→ Grootte van verband
- Regressie: voorspelling lineair verband tussen 2 variabelen
→ Voorspelling afhankelijke variabele o.b.v. onafhankelijke variabele(n)
- Correlatieberekening voorafgaand aan regressie-analyse om te bepalen welke
variabelen je meeneemt in het regressiemodel.

, Voorbeeld 1:
Correlatie
- Database ‘Voorbeeld 1 Cholesterol’
- Observationeel prospectief cohortonderzoek bij 100 personen
- Bij honderd personen is de relatie onderzocht tussen cholesterol en een aantal
determinanten zoals de leeftijd

Probleemstelling: Welke lineaire relatie bestaat er tussen 2 variabelen?

Onderzoeksvraag: Wat is de lineaire relatie tussen de uitkomstvariabele cholesterol en de
determinant leeftijd?

Parametrisch testen?
- Aantal metingen = 100 (≥ 30) → Parametrisch testen
- Pearson-correlatiecoëfficiënt bepalen
→ Indien niet-parametrisch: Spearman-correlatiecoëfficiënt

Kleinste kwadratenmethode: de best passende lijn wordt gedefinieerd als de lijn waarvoor
geldt dat de gekwadrateerde (verticale) afstand van de individuele observaties tot de lijn zo
klein mogelijk is

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller mmatth. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $3.67. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

76669 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$3.67
  • (0)
  Add to cart