Onafhankelijke variabele: met behulp van deze variabele gaan we de afhankelijke variabele
voorspellen.
- Vb. met behulp van slapeloosheid gaan we proberen PTSD te voorspellen. PTSD is
dan de afhankelijke variabele en slapeloosheid de onafhankelijke.
Voordat de vergelijking voor de lineaire regressie berekend kan worden, kijken we eerst:
- Of er een lineaire verband is tussen de twee variabelen.
SPSS: Maak een spreidingsdiagram met de onafhankelijke variabele op de X-as en de
afhankelijke variabele op de Y-as.
è Kies in Graphs; Chart builder voor Scatter/dot en daarbinnen de variant Simple
Scatter with Fit Line: door dubbel te klikken op de spreidingsdiagram die je net hebt
gemaakt en dan staat het rechtsboven (als je met de muis over de plaatjes gaat
worden de namen van de varianten getoond).
è ADD Fit Line at Total, klik dan lineaire aan en op OK.
R² is de proportie verklaarde variantie.
Regressie analyse uitvoeren
è Klik op Analyze, Regression en dan op Linear.
Denk goed aan wat de afhankelijke en onafhankelijke variabelen zijn en zet deze in
de goede vakjes.
Homoscedastisiteit, lineairiteit en de afwezigheid van uitschieters controleren:
è Klik op plots
è Plaats de variabele *ZPRED (de gestandaardiseerde voorspelde waarden) op de X-as.
è Plaats de variabele *ZRESID (de gestandaardiseerde residuen) op de Y-as.
è Klik op continue.
è Druk op OK.
,De output bestaat uit 4 tabellen en een grafiek.
1. Bovenste tabel
Hier staan de variabelen die gebruikt zijn om de regressievergelijking op te stellen.
2. Tweede tabel: Model Summaries
Hier vind je:
- De waarde van R, de absolute waarde van de correlatie tussen de twee variabelen.
- De verklaarde variantie R².
- Een aangepaste waarde van R².
- De standaarschattingsfout, de gemiddelde grootte van de schattingsfout die je maakt
wanneer je dit regressiemodel gebruikt om voorspellingen mee te doen. Dit is
hetzelfde als de standaardafwijking van de residuen (het verschil tussen de
voorspelde en geobserveerde waarde).
3. ANOVA tabel
Hierin wordt getoetst of het model dat je gespecificeerd hebt significant is. Wordt er
een significant deel van de spreiding in de afhankelijke variabele verklaard door de
lineaire relatie met de onafhankelijke variabele?
- Hiervoor wordt een F-toets gebruikt.
- In de cel ‘Sig.’ Staat de p-waarde die bij deze F-waarde hoort.
4. Coëfficiënts tabel
Hier wordt informatie gegeven over de predictor:
- Richtingscoëfficiënt b.
- Standaardfout van b: SE(b).
- Gestandaardiseerde richtingscoëfficiënt: beta.
- Toetsingsgrootheid t.
T-toets van de onafhakelijke variabele
- Bijbehorende p-waarde.
Als de p-waarde kleiner is dan .05 (significantieniveau) dan betekent dit dat p < .05 en
kunnen we de nulhypothese dat de richtingscoëfficiënt gelijk is aan 0 verwerpen. We
concluderen dat er wel een relatie is tussen de variabelen. Er is een lineaire relatie.
Als b vóór de variabele x staat dan is dit de richtingscoëfficiënt.
, Meetniveau
Een voorwaarde voor een multipele regressieanalyse is dat de afhankelijke variabele van
minimaal interval meetniveau is.
è Samengestelde schalen behandelen we alsof ze van interval meetniveau zijn.
Wanneer de afhankelijke variabele nominaal of categorisch is, is het niet mogelijk om
lineaire regressie te gebruiken.
De onafhankelijke variabele(n) moet(en) minimaal van interval meetniveau of dichotoom
(normaal met twee categorieën) zijn.
è Sekse is een dichotome variabele, er zijn twee categorieën: man en vrouw.
Lineair verband
Een volgende voorwaarde voor een multipele regressieanalyse is dat er lineaire verbanden
zijn tussen de afhankelijke variabele en de kwantitatieve onafhankelijke variabelen.
Afwezigheid van uitschieters
In een spreidingsdiagram kan je de voorwaarde afwezigheid van uitschieters visueel
beoordelen.
- Het verband tussen de variabelen is sterker wanneer de punten gemiddeld dichter bij
de lijn liggen wanneer je de uitschieter hebt verwijderd.
Kwartet van Anscombe
De invloed van schendingen van deze assumpties wordt inzichtelijk gemaakt door het
Kwartet. Het kwartet beschrijft vier datasets met allemaal dezelfde statistische
eigenschappen. De variabelen X en Y hebben in alle datasets hetzelfde gemiddelde en
dezelfde variantie. Ook is de regressielijn voor alle datasets precies gelijk.
Alleen dataset 1 voldoet aan de assumpties van een lineaire regressieanalyse. Dataset 2
voldoet niet aan de assumptie van lineairiteit, het verband is kromlijnig. Dataset 3 voldoet
niet aan de assumptie van afwezigheid van uitschieters. Dataset 4 voldoet niet aan de
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Roos0421. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €11,49. Je zit daarna nergens aan vast.