Garantie de satisfaction à 100% Disponible immédiatement après paiement En ligne et en PDF Tu n'es attaché à rien
logo-home
Samenvatting voorkennis + Lineaire regressie €3,19   Ajouter au panier

Resume

Samenvatting voorkennis + Lineaire regressie

 12 vues  0 fois vendu

Dit is een samenvatting aan de hand van lesnotities van 2023 en de theorieslides (lesopname voorkennisclip en les herbekeken). Les gegeven door D. Fierens - Van der Elst (en in lesopname ook N. Struyf).

Dernier document publié: 1 année de cela

Aperçu 8 sur 35  pages

  • 15 avril 2023
  • 17 avril 2023
  • 35
  • 2022/2023
  • Resume
Tous les documents sur ce sujet (35)
avatar-seller
mmatth
Onderzoeksmethodologie en statistiek 3:
Samenvatting: Onderdeel statistiek
2. Lineaire regressie

, Lineaire regressie
Voorkennis opfrissen:

Voorkennis correlatie:
Uitleg aan de hand van observationeel, prospectief cohort onderzoek:


Gegevens:
- populatie: 100 personen
- studie: correlatie tussen cholesterol en een aantal determinanten zoals leeftijd,
geslacht, alcoholgebruik…


Berekening aan de hand van SPSS:
We berekenen de correlatie tussen de variabele ‘leeftijd’ en ‘cholesterolgehalte’.
→ Dit doen we met behulp van een correlatiecoëfficiënt.

Parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Pearson.
- Pearson: geschikt voor normaal verdeelde variabelen op ratio niveau
- gebruikt de meetwaarden

Niet-parametrisch testen? = gebruik maken van de correlatiecoëfficiënt van Spearman.
- Spearman: geschikt voor niet-normaal verdeelde variabelen op ratio en ordinaal
niveau
- gebruikt de rangvolgorde (rangnummers)

Input scherm: Databank SPSS:
analyze → correlate → bivariate

2 variabelen selecteren + aanduiden welke
correlatiecoëfficiënt er moet berekend
worden.
- Je kan best zowel Pearson als
Spearman aanduiden.

We gaan tweezijdig testen.

‘Flag significant correlations’ is standaard
aangevinkt. De significante correlaties
Ingevuld:
worden in de output dan aangegeven met
een sterretje.
- 1 sterretje geeft weer dat de waarde
significant is op 5%
significantieniveau
- 2 sterretjes geven weer dat de
waarde significant is op 1%
significantieniveau

, Wanneer je bij het vorige scherm op OK hebt
gedrukt, verkrijg je een outcome.

Je krijgt een uitkomst voor de Pearson en de
Spearman correlatiecoëfficiënt.

H0: correlatiecoëfficiënt r = 0
⇒ Er is geen correlatie (lineair verband)
tussen beide variabelen.

Vermits de p-waarde bij zowel Spearman als
bij Pearson kleiner is dan 0,05.
→ (Indien p > 0,05: r = 0 dus geen
correlatie)
→ (Indien p ≤ 0,05 kan de waarde van r
geïnterpreteerd worden)
- wanneer je dubbelklikt op de dit getal
krijg je de specifieke waarde met 6
decimalen
Merk op dat wanneer SPSS Pearson of
Spearman correlatie uitvoert, de info Pearson correlatiecoëfficiënt interpreteren:
altijd dubbel wordt weergegeven. = 0,372 = zwakke correlatie




Spearman correlatiecoëfficiënt interpreteren:
= 0,395 = zwakke correlatie




Omdat we de optie ‘flag significant
correlations’ hebben aangevinkt krijgen we
onder de outcome-tabellen een opmerking.
Er staan 2 sterretjes bij, wat dus wilt zeggen
dat de p-waarde kleiner is dan 1%.
We gaan ervan uit dat de cholesterolconcentratie normaal verdeeld is, want we hebben
voldoende metingen van 100 proefpersonen. Hierdoor gaan we de pearson
correlatiecoëfficiënt verkiezen.
⇒ verkies altijd de parametrische test over de niet-parametrische test
= testen met meer Power
- (= vermogen van toets om effect op te sporen als het effect ook werkelijk bestaat)
- (= de kans dat het zal leiden tot een terechte verwerping van de nulhypothese)

,Voorkennis spreidingsdiagram en inleiding tot lineaire regressie
Wanneer de Pearson correlatiecoëfficiënt aangeeft dat er een significante correlatie is en we
kunnen spreken over een lineair verband tussen beide variabelen, kunnen we dit verband
voorspellen.

We kunnen het verband voorspellen met een lineaire regressie.
We kunnen de lineaire regressie en eventueel de correlatie visueel weergeven in een
spreidingsdiagram.


Berekening aan de hand van SPSS:

Databank SPSS:
Graphs → chartbuilder → scatter
(spreidingsdiagram) → dubbelklik op
simple scatter

Assen:
- Op de X-as: leeftijd (in jaren) =
onafhankelijke variabele
- Op de Y-as: cholesterol (in
mmol/liter) = afhankelijke variabele




Outcome: grafiek
→ lineair verband is nog niet goed
waarneembaar, want we hebben een
brede puntenwolk

Statistisch gezien (kijk voorkennisclip
hierboven waarbij p-waarde kleiner is dan
1%) hebben we een significant lineair
verband. Dit wel op basis van een zwakke,
positieve correlatie.


→ dubbelklikken op de grafiek en ‘add fit
line at total’

, Je kan een rechte trekken door de punten:
Vervolgens krijg je een rechte die door de
puntenwolk loopt en het bijhorende
functievoorschrift.

Aan de hand van het functievoorschrift kan
je de cholesterolconcentratie voor een
nieuw proefpersoon voorspellen.
→ je geeft 1 ontbrekende waarde (vb:
leeftijd) in in het functievoorschrift en
bekomt vervolgens de andere variabele
(vb: cholesterolconcentratie)
Naast de grafiek wordt een
determinatiecoëfficiënt weergegeven.
- We kunnen dat de
richtingscoëfficiënt 0,02 aflezen
→ positief getal wilt zeggen dat het
een stijgende rechte is en een
positieve correlatie

Interpretatie: voor ieder
leeftijdsverschil van 1 jaar (= per
jaar dat je ouder wordt) verschilt de
cholesterolconcentratie 0,02
mmol/liter.

- De constante 3,86 in het snijpunt
met de Y-as = dit zou de verwachte
cholesterolconcentratie zijn bij een
leeftijd van 0 jaar

- De determinatiecoëfficiënt R² wordt
naast de grafiek weergegeven.
→ dit is in de statistiek een maat
voor het deel van de variabiliteit dat
wordt verklaard door het statistisch
model
→ er bestaan verschillende
definities, maar in het geval van
lineaire regressie is er een
eenduidige definitie: bij
enkelvoudige lineaire regressie is
de determinatiecoëfficiënt R² gelijk
aan het kwadraat van de
correlatiecoëfficiënt, deze
determinatiecoëfficiënt geeft aan
welk gedeelte van de variatie in de
ene variabele door de andere
wordt verklaard = verklaarde
variantie

,Meer informatie omtrent de
determinatiecoëfficiënt:




→ de correlatiecoëfficiënt van Pearson
kan variëren tussen min 1 en 1
→ de determinatiecoëfficiënt kan variëren
tussen 0 en 1
- Hoe groter de
determinatiecoëfficiënt, dus hoe
dichter bij 1, hoe krachtiger het
verband tussen de variabelen

In het voorbeeld is de R² = 0,138 = 13,8%
= zwak verband tussen leeftijd en
cholesterol

,Regressie

Testen
- Correlatie (Herhaling)
→ Bestaat er een verband tussen 2 dingen → onderzoeken (minstens ordinaal)
- vb: heeft studiejaar iets te maken met lengte
→ outcome: er is wel/ geen verband
- Voorbeeld 1: enkelvoudige lineaire regressie
- Voorbeeld 2: meervoudige lineaire regressie
- Voorbeeld 3: meervoudige lineaire regressie met dummy variabelen
- Voorbeeld 4: meervoudige lineaire regressie (method enter)
- Voorbeeld 5: (meervoudige) lineaire regressie (method stepwise)

Correlatie of Regressie?
- Correlatie: lineair verband tussen 2 variabelen
→ Is er een verband?
→ Grootte van verband
- Regressie: voorspelling lineair verband tussen 2 variabelen
→ Voorspelling afhankelijke variabele o.b.v. onafhankelijke variabele(n)
- Correlatieberekening voorafgaand aan regressie-analyse om te bepalen welke
variabelen je meeneemt in het regressiemodel.

, Voorbeeld 1:
Correlatie
- Database ‘Voorbeeld 1 Cholesterol’
- Observationeel prospectief cohortonderzoek bij 100 personen
- Bij honderd personen is de relatie onderzocht tussen cholesterol en een aantal
determinanten zoals de leeftijd

Probleemstelling: Welke lineaire relatie bestaat er tussen 2 variabelen?

Onderzoeksvraag: Wat is de lineaire relatie tussen de uitkomstvariabele cholesterol en de
determinant leeftijd?

Parametrisch testen?
- Aantal metingen = 100 (≥ 30) → Parametrisch testen
- Pearson-correlatiecoëfficiënt bepalen
→ Indien niet-parametrisch: Spearman-correlatiecoëfficiënt

Kleinste kwadratenmethode: de best passende lijn wordt gedefinieerd als de lijn waarvoor
geldt dat de gekwadrateerde (verticale) afstand van de individuele observaties tot de lijn zo
klein mogelijk is

Les avantages d'acheter des résumés chez Stuvia:

Qualité garantie par les avis des clients

Qualité garantie par les avis des clients

Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.

L’achat facile et rapide

L’achat facile et rapide

Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.

Focus sur l’essentiel

Focus sur l’essentiel

Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.

Foire aux questions

Qu'est-ce que j'obtiens en achetant ce document ?

Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.

Garantie de remboursement : comment ça marche ?

Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.

Auprès de qui est-ce que j'achète ce résumé ?

Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur mmatth. Stuvia facilite les paiements au vendeur.

Est-ce que j'aurai un abonnement?

Non, vous n'achetez ce résumé que pour €3,19. Vous n'êtes lié à rien après votre achat.

Peut-on faire confiance à Stuvia ?

4.6 étoiles sur Google & Trustpilot (+1000 avis)

67096 résumés ont été vendus ces 30 derniers jours

Fondée en 2010, la référence pour acheter des résumés depuis déjà 14 ans

Commencez à vendre!
€3,19
  • (0)
  Ajouter