Dit is een samenvatting aan de hand van lesnotities van 2023 en de theorieslides (lesopname voorkennisclip en les herbekeken).
Les gegeven door D. Fierens - Van der Elst (en in lesopname ook N. Struyf).
Onderzoeksmethodologie en statistiek 3:
Samenvatting: Onderdeel statistiek
2. Lineaire regressie
, Lineaire regressie
Voorkennis opfrissen:
Voorkennis correlatie:
Uitleg aan de hand van observationeel, prospectief cohort onderzoek:
Gegevens:
- populatie: 100 personen
- studie: correlatie tussen cholesterol en een aantal determinanten zoals leeftijd,
geslacht, alcoholgebruik…
Berekening aan de hand van SPSS:
We berekenen de correlatie tussen de variabele ‘leeftijd’ en ‘cholesterolgehalte’.
→ Dit doen we met behulp van een correlatiecoëfficiënt.
Parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Pearson.
- Pearson: geschikt voor normaal verdeelde variabelen op ratio niveau
- gebruikt de meetwaarden
Niet-parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Spearman.
- Spearman: geschikt voor niet-normaal verdeelde variabelen op ratio en ordinaal
niveau
- gebruikt de rangvolgorde (rangnummers)
2 variabelen selecteren + aanduiden welke
correlatiecoëfficiënt er moet berekend
worden.
- Je kan best zowel Pearson als
Spearman aanduiden.
We gaan tweezijdig testen.
‘Flag significant correlations’ is standaard
aangevinkt. De significante correlaties
Ingevuld:
worden in de output dan aangegeven met
een sterretje.
- 1 sterretje geeft weer dat de waarde
significant is op 5%
significantieniveau
- 2 sterretjes geven weer dat de
waarde significant is op 1%
significantieniveau
, Wanneer je bij het vorige scherm op OK hebt
gedrukt, verkrijg je een outcome.
Je krijgt een uitkomst voor de Pearson en de
Spearman correlatiecoëfficiënt.
H0: correlatiecoëfficiënt r = 0
⇒ Er is geen correlatie (lineair verband)
tussen beide variabelen.
Vermits de p-waarde bij zowel Spearman als
bij Pearson kleiner is dan 0,05.
→ (Indien p > 0,05: r = 0 dus geen
correlatie)
→ (Indien p ≤ 0,05 kan de waarde van r
geïnterpreteerd worden)
- wanneer je dubbelklikt op de dit getal
krijg je de specifieke waarde met 6
decimalen
Merk op dat wanneer SPSS Pearson of
Spearman correlatie uitvoert, de info Pearson correlatiecoëfficiënt interpreteren:
altijd dubbel wordt weergegeven. = 0,372 = zwakke correlatie
Omdat we de optie ‘flag significant
correlations’ hebben aangevinkt krijgen we
onder de outcome-tabellen een opmerking.
Er staan 2 sterretjes bij, wat dus wilt zeggen
dat de p-waarde kleiner is dan 1%.
We gaan ervan uit dat de cholesterolconcentratie normaal verdeeld is, want we hebben
voldoende metingen van 100 proefpersonen. Hierdoor gaan we de pearson
correlatiecoëfficiënt verkiezen.
⇒ verkies altijd de parametrische test over de niet-parametrische test
= testen met meer Power
- (= vermogen van toets om effect op te sporen als het effect ook werkelijk bestaat)
- (= de kans dat het zal leiden tot een terechte verwerping van de nulhypothese)
,Voorkennis spreidingsdiagram en inleiding tot lineaire regressie
Wanneer de Pearson correlatiecoëfficiënt aangeeft dat er een significante correlatie is en we
kunnen spreken over een lineair verband tussen beide variabelen, kunnen we dit verband
voorspellen.
We kunnen het verband voorspellen met een lineaire regressie.
We kunnen de lineaire regressie en eventueel de correlatie visueel weergeven in een
spreidingsdiagram.
Assen:
- Op de X-as: leeftijd (in jaren) =
onafhankelijke variabele
- Op de Y-as: cholesterol (in
mmol/liter) = afhankelijke variabele
Outcome: grafiek
→ lineair verband is nog niet goed
waarneembaar, want we hebben een
brede puntenwolk
Statistisch gezien (kijk voorkennisclip
hierboven waarbij p-waarde kleiner is dan
1%) hebben we een significant lineair
verband. Dit wel op basis van een zwakke,
positieve correlatie.
→ dubbelklikken op de grafiek en ‘add fit
line at total’
, Je kan een rechte trekken door de punten:
Vervolgens krijg je een rechte die door de
puntenwolk loopt en het bijhorende
functievoorschrift.
Aan de hand van het functievoorschrift kan
je de cholesterolconcentratie voor een
nieuw proefpersoon voorspellen.
→ je geeft 1 ontbrekende waarde (vb:
leeftijd) in in het functievoorschrift en
bekomt vervolgens de andere variabele
(vb: cholesterolconcentratie)
Naast de grafiek wordt een
determinatiecoëfficiënt weergegeven.
- We kunnen dat de
richtingscoëfficiënt 0,02 aflezen
→ positief getal wilt zeggen dat het
een stijgende rechte is en een
positieve correlatie
Interpretatie: voor ieder
leeftijdsverschil van 1 jaar (= per
jaar dat je ouder wordt) verschilt de
cholesterolconcentratie 0,02
mmol/liter.
- De constante 3,86 in het snijpunt
met de Y-as = dit zou de verwachte
cholesterolconcentratie zijn bij een
leeftijd van 0 jaar
- De determinatiecoëfficiënt R² wordt
naast de grafiek weergegeven.
→ dit is in de statistiek een maat
voor het deel van de variabiliteit dat
wordt verklaard door het statistisch
model
→ er bestaan verschillende
definities, maar in het geval van
lineaire regressie is er een
eenduidige definitie: bij
enkelvoudige lineaire regressie is
de determinatiecoëfficiënt R² gelijk
aan het kwadraat van de
correlatiecoëfficiënt, deze
determinatiecoëfficiënt geeft aan
welk gedeelte van de variatie in de
ene variabele door de andere
wordt verklaard = verklaarde
variantie
,Meer informatie omtrent de
determinatiecoëfficiënt:
→ de correlatiecoëfficiënt van Pearson
kan variëren tussen min 1 en 1
→ de determinatiecoëfficiënt kan variëren
tussen 0 en 1
- Hoe groter de
determinatiecoëfficiënt, dus hoe
dichter bij 1, hoe krachtiger het
verband tussen de variabelen
In het voorbeeld is de R² = 0,138 = 13,8%
= zwak verband tussen leeftijd en
cholesterol
,Regressie
Testen
- Correlatie (Herhaling)
→ Bestaat er een verband tussen 2 dingen → onderzoeken (minstens ordinaal)
- vb: heeft studiejaar iets te maken met lengte
→ outcome: er is wel/ geen verband
- Voorbeeld 1: enkelvoudige lineaire regressie
- Voorbeeld 2: meervoudige lineaire regressie
- Voorbeeld 3: meervoudige lineaire regressie met dummy variabelen
- Voorbeeld 4: meervoudige lineaire regressie (method enter)
- Voorbeeld 5: (meervoudige) lineaire regressie (method stepwise)
Correlatie of Regressie?
- Correlatie: lineair verband tussen 2 variabelen
→ Is er een verband?
→ Grootte van verband
- Regressie: voorspelling lineair verband tussen 2 variabelen
→ Voorspelling afhankelijke variabele o.b.v. onafhankelijke variabele(n)
- Correlatieberekening voorafgaand aan regressie-analyse om te bepalen welke
variabelen je meeneemt in het regressiemodel.
, Voorbeeld 1:
Correlatie
- Database ‘Voorbeeld 1 Cholesterol’
- Observationeel prospectief cohortonderzoek bij 100 personen
- Bij honderd personen is de relatie onderzocht tussen cholesterol en een aantal
determinanten zoals de leeftijd
Probleemstelling: Welke lineaire relatie bestaat er tussen 2 variabelen?
Onderzoeksvraag: Wat is de lineaire relatie tussen de uitkomstvariabele cholesterol en de
determinant leeftijd?
Kleinste kwadratenmethode: de best passende lijn wordt gedefinieerd als de lijn waarvoor
geldt dat de gekwadrateerde (verticale) afstand van de individuele observaties tot de lijn zo
klein mogelijk is
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur mmatth. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €3,19. Vous n'êtes lié à rien après votre achat.