Haal makkelijk een voldoende door deze tentamenvoorbereiding van het vak Verdieping in Onderzoeksmethoden En Statistiek. Het bestand bevat een samenvatting van het kwantitatieve deel van VOS. Het bestaat uit aantekeningen van de hoorcolleges, en samenvattingen van de Grasple lessen over SPSS.
Door: lucasdiasdossantos02 • 1 jaar geleden
Door: DrsDrs • 3 jaar geleden
Vier sterren ipv, want ik zou dit zeker aanraden als je dit een moeilijk vak vindt, maar deze samenvatting alleen is niet genoeg. Gebruik er dus nog materiaal bij naast!
VOS Tentamenvoorbereiding
SPSS Tentamen
Multipele Regressie
MR1: Multipele regressieanalyse, tevredenheid voorspellen aan de hand van leeftijd, sekse en
sportparticipatie.
- Welke assumpties kunnen we controleren voorafgaand aan de regressieanalyse
Een voorwaarde van multipele regressie analyse is dat de afhankelijke variabele minimaal van
interval meetniveau is.
De onafhankelijke variabele(n) moet(en) minimaal van interval meetniveau of dichotoom zijn
Dichotoom: nominaal met 2 categorieën
Tweede voorwaarde voor multipele regressie: lineaire verbanden tussen de afhankelijke variabele en
alle kwantitatieve onafhankelijke variabelen.
Derde voorwaarde: afwezigheid van uitschieters
Kwartet van Anscombe: schendingen van de voorwaarden hebben veel invloed op statistische
resultaten
Hoe groter de gestandaardiseerde beta’s, hoe beter de voorspeller. Hoe groter de eta, hoe meer
deze afwijkt van 0 en hoe waarschijnlijker je de nulhypothese zal verwerpen en het resultaat als
significant zal worden bestempeld.
E = Y – Y (met dakje)
Dftotal = n-1
103 = n-1
N=102+1 = 103
MR2: assumpties beoordelen
Regressieanalyse:
1. Analyse regression linear
2. Afhankelijke en onafhankelijke variabele in goede vakjes
3. Assumpties controleren
a. Afwezigheid uitschieters Save Standardized residuals, Mahalanobis, Cook’s
Distances
b. Afwezigheid multicollineariteit statistics Collinearity diagnostics
c. Homoscedasticiteit Plots variabele *ZPRED (gestandaardiseerde voorspelde
waarden) op X-as. Variabele *ZRESID (gestandaardiseerde residuen) op Y-as
d. Normaal verdeelde residuen Plots Histogram
4. Klik op OK
Afwezigheid uitschieters:
- Tabel Residuals Statistics
- Minimum en maximum waardes van standardized residuals, Mahalanobis Distance en Cook’s
Distance
, - Beoordelen of er uitschieters in de Y-ruimte, X-ruimte en XY-ruimte zijn
Standardized residuals
- Uitschieters in de Y-ruimte
- Waardes moeten tussen de -3.3 en +3.3 liggen, anders uitschieter
Mahalanobis distance
- Uitschieters in X-ruimte
- Waarde moet lager zijn dan 10+2(#onafhankelijke variabelen)
o In een onderzoek met 2 onafhankelijke variabelen moeten de waardes lager zijn dan
10+2 x 2 = 14. Waardes hoger duiden op uitschieters
Cook’s Distance
- Uitschieters in de XY-ruimte
- Cook’s distance geeft overall invloed van een respondent op het model
- Waardes moeten lager dan 1 zijn, hoger dan 1 duiden op invloedrijke respondenten
(influential cases)
Je wil geen multicollineariteit
- Perfecte multicollineariteit onafhankelijke variabelen zijn perfect gecorreleerd (lengte in
cm en inches)
- In het geval van (te) sterke samenhang kun je kiezen voor één van de twee variabelen, of
samenvoegen met behulp van factoranalyse
Vaststellen of multicollineariteit een probleem is
- Kolom Coefficients
- Vuistregels
o Waardes voor Tolerance kleiner dan .2 duiden op een mogelijk probleem
o Waardes voor Tolerance kleiner dan .1 duiden op een probleem
o De VIF is gelijk aan 1/Tolerance, dus voor de VIF geldt dat waardes groter dan 10
duiden op een probleem
Voorwaarde homoscedasticiteit spreiding van residuen per X-
waarde zijn ongeveer gelijk
- Beoordelen door gestandaardiseerde residuen te plotten
tegen de gestandaardiseerde voorspelde waardes
- Als er voor elke voorspelde waarde (X-as) ongeveer
evenveel spreiding is op de Y-as, is er voldaan aan de
voorwaarde
Normaal verdeelde residuen
,MR3 uitvoeren en interpreteren
Als er aan de assumpties is voldaan mag het regressiemodel geïnterpreteerd worden. Eerste 4
tabellen van de output:
1. Eerste tabel: wat de onafhankelijke en afhankelijke variabelen zijn
2. Tweede tabel: algemene kwaliteitsgegevens van het regressiemodel
3. Derde tabel: uitkomst van de F-toets voor het model
4. Vierde tabel: informatie over de regressiecoëfficiënten
Het is gebruikelijk om te beoordelen hoeveel van de variantie in Y wordt verklaard door het model
met de gekwadrateerde variant van R: R Square (R 2)
- R Square geeft het percentage verklaarde variantie aan in de steekproef
- Adjusted R Square geeft aan wat het geschatte percentage verklaarde variantie is in de
populatie.
o R Square wordt hiervoor aangepast op basis van steekproefgrootte (n) en het aantal
predictoren in het model (k). Het geschatte percentage verklaarde variantie in de
populatie is altijd iets lager dan het percentage verklaarde variantie in de steekproef
F-toets toetst of het gehele model significant is (tabel 3). (Hier wordt dus gekeken of de drie
onafhankelijke variabelen samen een significant deel van de spreiding in tevredenheid kunnen
verklaren)
Vierde tabel: informatie over regressiecoëfficiënten. Per onafhankelijke variabele kijken of deze een
significante voorspeller is.
Als er nieuwe variabelen worden toegevoegd aan de regressie analyse dienen de assumpties
opnieuw gecontroleerd te worden.
Hiërarchische regressieanalyse
1. Analyze regression linear
2. Plaats onafhankelijke variabelen van jet oorspronkelijke model in Block 1 of 1
3. Klik op Next
a. Hiermee kun je een nieuw blok met variabelen toevoegen. Hier selecteer je alleen de
extra variabelen: niet nodig de drie variabelen uit het eerste blok nogmaals te
selecteren.
4. Vraag onder Statistics om R squared change
5. Klik op OK
Eerste 4 tabellen:
1. Wat de afhankelijke en onafhankelijke variabelen zijn. Specifiek staat er per model welke
onafhankelijke variabelen er in die stap zijn toegevoegd
2. Algemene kwaliteitsgegevens van het regressiemodel
a. In het linkerdeel van de tabel staan de kwaliteitsgegevens per model (in aparte
regels voor model 1 en model 2)
b. In het rechterdeel van de tabel staan de Change statistics. Hierin wordt aangegeven
hoe de kwaliteitsgegevens over de modellen heen veranderen.
3. Uitkomsten van de twee F-toetsen die toetsen of bij model 1 en 2 het gehele model
significant is
a. Het verschil met Sig F change in de vorige stap toen specifiek toetsen of de
toename in verklaarde variantie significant is. In deze ANOVA tabel kijken of
modellen als geheel significant zijn.
, 4. Informatie over regressiecoëfficiënten
a. Per model per onafhankelijke variabele of deze een significante voorspeller is
ANOVA
ANOVA1 – Meerweg ANOVA uitvoeren en interpreteren
Meerweg ANOVA
1. Analyze General Linear Model Univariate
2. Zet de afhankelijke variabele en de groepsvariabelen (Fixed factor) in de goede vakjes
3. Vraag onder Plots om een figuur met de factor met de meeste groepen op de horizontale as
en de factor met de minste groepen als aparte lijnen en klik op Add.
4. Vraag onder Post Hoc om post hoc toetsing voor de factor(en) met meer dan 2 groepen.
Vraag hierbij om de Bonferroni correctie.
5. Vraag onder Options om Descriptive statistics, Estimates of effect size en homogeneity tests.
6. Klik op OK.
Tabellen:
1. In de eerste tabel (Between-Subject Factors) staat per factor uit hoeveel mensen iedere
groep bestaat
2. In de tweede tabel (Descriptive Statistics) staan beschrijvende statistieken voor alle
(sub)groepen
3. In de derde tabel (Levene’s Test of Equality of Error Variances) staat informatie over de
assumptie van homogeniteit van varianties. Hier toetsen we de voorwaarde dat de spreiding
in scores op de afhankelijke variabele in de verschillende groepen (ongeveer) gelijk is.
4. In de vierde tabel (Tests of Between-Subjects Effects) staan de resultaten van de
daadwerkelijke meerweg ANOVA. In aparte regels staan de statistieken voor de toetsing van
de hoofdeffecten en het interactie-effect.
5. In de vijfde tabel (Multiple comparisons) staan de paarsgewijze vergelijkingen van de
gemiddeldes van de verschillende groepen
De grootte van effecten bepalen we bij ANOVA aan de hand van de effectgrootte Partial Eta Squared
(partial N2). Bij deze effectgrootte worden vaak de volgende vuistregels gehanteerd:
- Klein: .01
- Medium: .06
- Groot: .14
Interactie-effect bekijken, twee manieren:
1. Het visualiseren van het effect van (conditie) op de verschilscore van (automatisering 1) voor
de verschillende (types onderwijs)
2. Het uitvoeren van simpele hoofdeffecten toetsing (post hoc toetsing voor één factor
uitgesplitst voor de levels van de andere factor)
Hoofdeffect toetsing
1. Open een SPSS Syntax bestand: File New Syntax
2. Selecteer de volgende tekst en plak deze in de syntax (let op: verwijder de witregels na de
eerste en tweede regel, anders werkt de syntax niet)
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper jetterbraak10. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €7,38. Je zit daarna nergens aan vast.