100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting VOS €7,49   In winkelwagen

Samenvatting

Samenvatting VOS

 24 keer bekeken  1 keer verkocht

Deze samenvatting geeft een heldere en complete beschrijving van het vak VOS voor de pre-master Sociologie (Contemporary Social Problems) maar is ook te gebruiken voor andere opleidingen. Het geeft namelijk een samenvatting van veel methoden binnen de statistiek zoals multipele regressie, AN(C)OVA ...

[Meer zien]

Voorbeeld 4 van de 32  pagina's

  • Ja
  • 26 november 2021
  • 32
  • 2020/2021
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (3)
avatar-seller
elihaafkens
Hoorcollege 1 Multipele regressie

Bij sociale onderzoeken is het vaak het geval dat je meerdere kenmerken moet beoordelen en of
deze een effect hebben op iets (en welke het meeste iets verklaren). De multipele regressie is een
goede manier om zo’n sociaal onderzoek te analyseren.
Kenmerken multipele regressie: zie afbeeldingen rechts.

Bij multipele regressie stel je in je onderzoeksvraag: kunnen we iemands
waarde op een kenmerk voorspellen met kennis over andere kenmerken?
Multipele regressie valt onder correlationeel onderzoek.
(Theorie over multipele regressie uit vorige hoorcolleges: zie Correlationeel
hoorcolleges theorie bestand bij HC4).

Meetniveau variabelen:
Afhankelijke variabele Y:
- Kenmerk gemeten op interval of ratio meetniveau.
Onafhankelijke variabelen X:
- Kenmerk gemeten op interval of ratio meetniveau
- Categorisch kenmerk met twee categorieën: nominaal meetniveau
met twee categorieën noemen we dichotoom
- Categorisch kenmerk met meer dan twee categorieën: nominaal
meetniveau wordt omgezet in dummyvariabelen

Voorwaarden multipele regressie: multicollineariteit, homogeniteit in variantie, lineariteit en geen
uitschieters.

De formule die je bij multipele regressie gebruikt is: Y= B0 + B1 x X1 + B2 x X2 + B3 x X3 + E
Y: afhankelijke variabele
X: onafhankelijke variabele/predictor
B0: constante/intercept (de voorspelde waarde van Y wanneer X gelijk is aan 0)
B1: regressiecoëfficiënt (als X 1 keer groter wordt wat is dan de verandering in Y)
E: residu/voorspellingsfout (de afstand tussen de geobserveerde waarde
en de voorspelde waarde). De error geeft eigenlijk alle andere verklaringen/variabelen aan die niet in
de formule opgenomen zijn.

Regressielijn
De regressielijn is een rechte lijn om de samenhang tussen twee interval/ratio variabelen te
beschrijven.
Je wilt een regressielijn hebben waarbij de voorspellingsfout zo klein mogelijk is (want dan is de
afstand tussen de geobserveerde waarde en de voorspelde waarde het kleinst).
Je gebruikt hierbij het kleinste kwadraten criterium: je zoekt de lijn waarbij de voorspellingsfout
(error) zo klein mogelijk is.

,Wanneer je wilt uitrekenen wat de afhankelijke variabele is (de modelvergelijking) dan gebruik je de
formule Y= B0 + B1 x X1 + B2 x X2 + B3 x X3 + E.
Wanneer je een voorspelling wilt doen over wat de afhankelijke variabele is bij bepaalde groottes
van onafhankelijke variabelen (bijvoorbeeld wat is de voorspelde gemiddelde rekenscore van een
kind met een X1 van …, een X2 van … en een X3 van…) dan reken je Y met een dakje uit (de
regressievergelijking).
Dan gebruik je Ydakje = B0 + B1 x X1 + B2 x X2 + B3 x X3, en dan vul je de hoogtes van de onafhankelijke
variabelen in bij X1, X2 en X3 die in de tekst gegeven worden.

Met de tabel hieronder zou je het dus als volgt moeten berekenen (wanneer de respondent op
begrijpend lezen een 10 heeft gescoord en een vrouw is waarbij een vrouw de dummy van 1 krijgt):
Ydakje = B0 + B1 x X1 + B2 x X2 + B3 x X3 + B4 x X4 + B5 x X5.
Ydakje = 17.50 + (3.94 x 10) + (1.43 x 10) + (-17.57 x 10) + (11.68 x 10) + (5.44 x 1) = 17.74
Wanneer je nu het residu voor deze respondent wilt uitrekenen gebruik je de formule e= y – ydakje.
Dus: 10 – 17.74 = -7.74.




Goodness of fit
Goodness-of-fit: kijken hoe goed een regressielijn past. Je bepaalt de Goodness-of-fit met het
kwadraat van R. Het percentage die er uit komt is de verklaarde variantie (variantie is een maat
waarmee je spreiding weergeeft).
Wanneer je een regressie analyse doet bij SPSS kan je de R2 zien, dat is de Goodness-of-fit.
Een R2 zal tussen de 0 en de 100 liggen, hoe dichter bij de 100 hoe beter je regressielijn en hoe beter
je variantie kan verklaren.




Wanneer je bijvoorbeeld een R2 van 0.072 hebt, dan is er 7.2% kans dat een predictor variantie bij Y
verklaart, dit is dan een klein tot medium effect.

Bij de Goodness of fit vergelijk je eigenlijk het lineaire model (de regressielijn) met een basismodel
(basislijn).
SST = SSM + SSR
SS: Sum of Squares, dit is eigenlijk een optelling van alle voorspellingsfouten.
SST: totale sum of squares
SSM: model sum of squares
SSR: residual sum of squares
Om R2 uit te rekenen doe je SSM gedeeld door SST.

In de onderste afbeelding zie je een illustratie van
hoe een enkele totale, model en residu fout er uit ziet
(dus bij een individu, in dit geval de blauwe ster).

,Als je alle gevonden fouten (dus van alle
personen) kwadrateert en optelt dan kom je uit op je
SST, SSM en SSR.

De Goodness of Fit is dus eigenlijk de kwadratensom van
model gedeeld door de totale kwadratensom (dus SSM
delen door SST).
Let op: een residu kan ook aangegeven worden met
variantie.

Toetsen van R2
Hypothesen:
H0: R2 = 0 (het model verklaart niets)
H1: R2 > 0 (het model verklaart iets)
Hierbij hoort de toetsingsgrootheid F.
Met de F-toets vraag je je eigenlijk af: hoeveel verklaart het model ten opzichte van het deel dat het
model niet kan verklaren?
De toetsingsgrootheid F bereken je door MSM gedeeld door MSR.
(De MS is dus anders dan de SS!). De MS staat voor Mean Sum of Squares, oftewel de gemiddelde
kwadratensom = variantie. De MS reken je uit door SS gedeeld door df.
(voor verdere uitleg hierover zie laatste gedeelte Hoorcollege 2).

Je gaat bij het toetsen van R2 weer kijken naar dezelfde soort SPSS tabel die je gebruikt bij multipele
regressie. Je leest dan de p-waarde af en als deze onder de 0.05 ligt kun je de nulhypothese
verwerpen en stellen dat er een statistisch significant verklaringsmodel is.

Toetsen van B’s
Hierbij ga je de regressiecoëfficiënten toetsen (dus de B1, B2 enzovoort).
Met deze toets ga je dus eigenlijk kijken welke predictoren (gegeven de overige predictoren) een
significante bijdrage leveren aan de verklaring van …
Hypothesen:
H01: B1 = 0 Ha1: B1 > 0
H02: B2 = 0 Ha2: B2 > 0
H03: B3 = 0 Ha3: B3 > 0
Hierbij hoort de toetsingsgrootheid t.
Je gaat weer kijken naar de SPSS uitvoer (zie afbeelding). Dan kijk je weer naar alle p-waardes en ga
je uitspraken doen over bovenstaande hypotheses.

De B die je in de output ziet staan is hetzelfde als de B1, het
is de regressiecoefficient (als X 1 keer groter wordt, wat is
dan de verandering in Y). Wanneer je wilt kijken welke
regressiecoëfficiënt het meeste invloed heeft kijk je naar de
gestandaardiseerde regressiecoëfficiënt (dus de Beta
Standardized Coefficients).




Je kunt modellen met elkaar vergelijken (bijvoorbeeld model 1: Y= B0 + B1 x X1 + B2 x X2 + B3 x X3 + E
en model 2: Y= B0 + B1 x X1 + B2 x X2 + B3 x X3 + B4 x X4 + B5 x X5 + B6 x X6 + E). Je gaat dan kijken of de
toevoeging van (in dit geval) drie variabelen statistisch zinvol is. Als de R2 significant toeneemt dan
kun je zeggen dat het statistisch zinvol is.

, In de afbeelding zie je SPSS output waarin informatie staat voor beide modellen. Je kunt in deze
output dan kijken of je een verschil hebt in de R2.
De Δ (delta) staat voor verandering in R2.
In de afbeelding kun je dus aflezen dat Δ 0.17 is
(want 0.28 – 0.11 = 0.17).




Hoorcollege 2 Meerweg ANOVA

Ter herinnering: bij de enkelvoudige ANOVA heb je 1 onafhankelijke variabele/factor (van
nominaal/ordinaal meetniveau) en 1 afhankelijke variabele (van interval/ratio meetniveau).
Bij de meerweg/meervoudige ANOVA heb je 2 onafhankelijke variabelen/factors (van
nominaal/ordinaal meetniveau) en 1 afhankelijke variabele (van interval/ratio meetniveau).
Daarnaast heb je (zowel bij enkelvoudige als meerweg ANOVA) ook nog 3 groepen (of meer), zoals
een directe instructiegroep, een controlegroep en een eigen inbreng groep. Je gaat dan toetsen of er
een verschil in gemiddelden is, wanneer dit zo is kan je de variabelen zien als een verklaring voor
verschillen in hetgeen wat je onderzoekt.
Daarnaast ga je bij de meerweg ANOVA toetsen of er hoofdeffecten of een interactie effect bestaat
tussen deze groepen. Model die meerweg ANOVA illustreert: zie afbeelding.
(Let op: bij meerweg ANOVA heet een onafhankelijke variabele een
factor, bij multipele regressie heet het een predictor!).

De onderzoeksvraag bij een meerweg ANOVA is: verschillen twee of meer
groepen op het gemiddelde van een afhankelijke variabele Y?
Een meerweg ANOVA wordt ook wel een variantieanalyse genoemd.

Nulhypothesen:
H0: model verklaart geen variantie in Y
H0: geen hoofdeffect van factor 1
H0: geen hoofdeffect van factor 2
H0: geen interactie-effect van factor 1 x factor 2

Eerst ga je bij de beschrijvende statistieken kijken (zie afbeelding).
Om te kijken of er een hoofdeffect is van factor 1 (in dit geval leeftijd) moet je naar de totale
gemiddeldes (Mean) kijken. Hier zie je het verschil in de drie gemiddeldes (14.7, 21.2 & 27.3).
Om te kijken of er een hoofdeffect is van de andere factor (in dit geval sekse) moet je kijken naar de
totale gemiddelden onderaan (21.1 & 20.7).
Om te kijken naar het interactie-effect kijk je naar het verschil in gemiddeldes bij elke factor
(aangegeven met lichtblauw) (verschil van 1.2, 1.3 & 3.4)
Wanneer je dit op deze manier uit de output afleest ben je nog bezig met het beschrijven van de
resultaten vanuit de steekproef. Om te testen of de verschillen die je vindt in de gemiddeldes ook
daadwerkelijk significant zijn of dat ze door toeval ontstaan zijn, ga je met de ANOVA toetsen.

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper elihaafkens. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €7,49. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 83637 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€7,49  1x  verkocht
  • (0)
  Kopen