100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting voorkennis + Lineaire regressie €3,19
In winkelwagen

Samenvatting

Samenvatting voorkennis + Lineaire regressie

 19 keer bekeken  0 keer verkocht

Dit is een samenvatting aan de hand van lesnotities van 2023 en de theorieslides (lesopname voorkennisclip en les herbekeken). Les gegeven door D. Fierens - Van der Elst (en in lesopname ook N. Struyf).

Laatste update van het document: 1 jaar geleden

Voorbeeld 8 van de 35  pagina's

  • 15 april 2023
  • 17 april 2023
  • 35
  • 2022/2023
  • Samenvatting
Alle documenten voor dit vak (37)
avatar-seller
MyrtheMattheeusen
Onderzoeksmethodologie en statistiek 3:
Samenvatting: Onderdeel statistiek
2. Lineaire regressie

, Lineaire regressie
Voorkennis opfrissen:

Voorkennis correlatie:
Uitleg aan de hand van observationeel, prospectief cohort onderzoek:


Gegevens:
- populatie: 100 personen
- studie: correlatie tussen cholesterol en een aantal determinanten zoals leeftijd,
geslacht, alcoholgebruik…


Berekening aan de hand van SPSS:
We berekenen de correlatie tussen de variabele ‘leeftijd’ en ‘cholesterolgehalte’.
→ Dit doen we met behulp van een correlatiecoëfficiënt.

Parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Pearson.
- Pearson: geschikt voor normaal verdeelde variabelen op ratio niveau
- gebruikt de meetwaarden

Niet-parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Spearman.
- Spearman: geschikt voor niet-normaal verdeelde variabelen op ratio en ordinaal
niveau
- gebruikt de rangvolgorde (rangnummers)

Input scherm: Databank SPSS:
analyze → correlate → bivariate

2 variabelen selecteren + aanduiden welke
correlatiecoëfficiënt er moet berekend
worden.
- Je kan best zowel Pearson als
Spearman aanduiden.

We gaan tweezijdig testen.

‘Flag significant correlations’ is standaard
aangevinkt. De significante correlaties
Ingevuld:
worden in de output dan aangegeven met
een sterretje.
- 1 sterretje geeft weer dat de waarde
significant is op 5%
significantieniveau
- 2 sterretjes geven weer dat de
waarde significant is op 1%
significantieniveau

, Wanneer je bij het vorige scherm op OK hebt
gedrukt, verkrijg je een outcome.

Je krijgt een uitkomst voor de Pearson en de
Spearman correlatiecoëfficiënt.

H0: correlatiecoëfficiënt r = 0
⇒ Er is geen correlatie (lineair verband)
tussen beide variabelen.

Vermits de p-waarde bij zowel Spearman als
bij Pearson kleiner is dan 0,05.
→ (Indien p > 0,05: r = 0 dus geen
correlatie)
→ (Indien p ≤ 0,05 kan de waarde van r
geïnterpreteerd worden)
- wanneer je dubbelklikt op de dit getal
krijg je de specifieke waarde met 6
decimalen
Merk op dat wanneer SPSS Pearson of
Spearman correlatie uitvoert, de info Pearson correlatiecoëfficiënt interpreteren:
altijd dubbel wordt weergegeven. = 0,372 = zwakke correlatie




Spearman correlatiecoëfficiënt interpreteren:
= 0,395 = zwakke correlatie




Omdat we de optie ‘flag significant
correlations’ hebben aangevinkt krijgen we
onder de outcome-tabellen een opmerking.
Er staan 2 sterretjes bij, wat dus wilt zeggen
dat de p-waarde kleiner is dan 1%.
We gaan ervan uit dat de cholesterolconcentratie normaal verdeeld is, want we hebben
voldoende metingen van 100 proefpersonen. Hierdoor gaan we de pearson
correlatiecoëfficiënt verkiezen.
⇒ verkies altijd de parametrische test over de niet-parametrische test
= testen met meer Power
- (= vermogen van toets om effect op te sporen als het effect ook werkelijk bestaat)
- (= de kans dat het zal leiden tot een terechte verwerping van de nulhypothese)

,Voorkennis spreidingsdiagram en inleiding tot lineaire regressie
Wanneer de Pearson correlatiecoëfficiënt aangeeft dat er een significante correlatie is en we
kunnen spreken over een lineair verband tussen beide variabelen, kunnen we dit verband
voorspellen.

We kunnen het verband voorspellen met een lineaire regressie.
We kunnen de lineaire regressie en eventueel de correlatie visueel weergeven in een
spreidingsdiagram.


Berekening aan de hand van SPSS:

Databank SPSS:
Graphs → chartbuilder → scatter
(spreidingsdiagram) → dubbelklik op
simple scatter

Assen:
- Op de X-as: leeftijd (in jaren) =
onafhankelijke variabele
- Op de Y-as: cholesterol (in
mmol/liter) = afhankelijke variabele




Outcome: grafiek
→ lineair verband is nog niet goed
waarneembaar, want we hebben een
brede puntenwolk

Statistisch gezien (kijk voorkennisclip
hierboven waarbij p-waarde kleiner is dan
1%) hebben we een significant lineair
verband. Dit wel op basis van een zwakke,
positieve correlatie.


→ dubbelklikken op de grafiek en ‘add fit
line at total’

, Je kan een rechte trekken door de punten:
Vervolgens krijg je een rechte die door de
puntenwolk loopt en het bijhorende
functievoorschrift.

Aan de hand van het functievoorschrift kan
je de cholesterolconcentratie voor een
nieuw proefpersoon voorspellen.
→ je geeft 1 ontbrekende waarde (vb:
leeftijd) in in het functievoorschrift en
bekomt vervolgens de andere variabele
(vb: cholesterolconcentratie)
Naast de grafiek wordt een
determinatiecoëfficiënt weergegeven.
- We kunnen dat de
richtingscoëfficiënt 0,02 aflezen
→ positief getal wilt zeggen dat het
een stijgende rechte is en een
positieve correlatie

Interpretatie: voor ieder
leeftijdsverschil van 1 jaar (= per
jaar dat je ouder wordt) verschilt de
cholesterolconcentratie 0,02
mmol/liter.

- De constante 3,86 in het snijpunt
met de Y-as = dit zou de verwachte
cholesterolconcentratie zijn bij een
leeftijd van 0 jaar

- De determinatiecoëfficiënt R² wordt
naast de grafiek weergegeven.
→ dit is in de statistiek een maat
voor het deel van de variabiliteit dat
wordt verklaard door het statistisch
model
→ er bestaan verschillende
definities, maar in het geval van
lineaire regressie is er een
eenduidige definitie: bij
enkelvoudige lineaire regressie is
de determinatiecoëfficiënt R² gelijk
aan het kwadraat van de
correlatiecoëfficiënt, deze
determinatiecoëfficiënt geeft aan
welk gedeelte van de variatie in de
ene variabele door de andere
wordt verklaard = verklaarde
variantie

,Meer informatie omtrent de
determinatiecoëfficiënt:




→ de correlatiecoëfficiënt van Pearson
kan variëren tussen min 1 en 1
→ de determinatiecoëfficiënt kan variëren
tussen 0 en 1
- Hoe groter de
determinatiecoëfficiënt, dus hoe
dichter bij 1, hoe krachtiger het
verband tussen de variabelen

In het voorbeeld is de R² = 0,138 = 13,8%
= zwak verband tussen leeftijd en
cholesterol

,Regressie

Testen
- Correlatie (Herhaling)
→ Bestaat er een verband tussen 2 dingen → onderzoeken (minstens ordinaal)
- vb: heeft studiejaar iets te maken met lengte
→ outcome: er is wel/ geen verband
- Voorbeeld 1: enkelvoudige lineaire regressie
- Voorbeeld 2: meervoudige lineaire regressie
- Voorbeeld 3: meervoudige lineaire regressie met dummy variabelen
- Voorbeeld 4: meervoudige lineaire regressie (method enter)
- Voorbeeld 5: (meervoudige) lineaire regressie (method stepwise)

Correlatie of Regressie?
- Correlatie: lineair verband tussen 2 variabelen
→ Is er een verband?
→ Grootte van verband
- Regressie: voorspelling lineair verband tussen 2 variabelen
→ Voorspelling afhankelijke variabele o.b.v. onafhankelijke variabele(n)
- Correlatieberekening voorafgaand aan regressie-analyse om te bepalen welke
variabelen je meeneemt in het regressiemodel.

, Voorbeeld 1:
Correlatie
- Database ‘Voorbeeld 1 Cholesterol’
- Observationeel prospectief cohortonderzoek bij 100 personen
- Bij honderd personen is de relatie onderzocht tussen cholesterol en een aantal
determinanten zoals de leeftijd

Probleemstelling: Welke lineaire relatie bestaat er tussen 2 variabelen?

Onderzoeksvraag: Wat is de lineaire relatie tussen de uitkomstvariabele cholesterol en de
determinant leeftijd?

Parametrisch testen?
- Aantal metingen = 100 (≥ 30) → Parametrisch testen
- Pearson-correlatiecoëfficiënt bepalen
→ Indien niet-parametrisch: Spearman-correlatiecoëfficiënt

Kleinste kwadratenmethode: de best passende lijn wordt gedefinieerd als de lijn waarvoor
geldt dat de gekwadrateerde (verticale) afstand van de individuele observaties tot de lijn zo
klein mogelijk is

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper MyrtheMattheeusen. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €3,19. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 59063 samenvattingen verkocht

Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen

Start met verkopen
€3,19
  • (0)
In winkelwagen
Toegevoegd