Summary

Samenvatting VOS

1 purchase

Course
Verdieping in Onderzoeksmethoden en Statistiek voor pedagogen (201900398)

Institution
Universiteit Utrecht (UU)

Book

Deze samenvatting geeft een heldere en complete beschrijving van het vak VOS voor de pre-master Sociologie (Contemporary Social Problems) maar is ook te gebruiken voor andere opleidingen. Het geeft namelijk een samenvatting van veel methoden binnen de statistiek zoals multipele regressie, AN(C)OVA ...

[Show more]

Preview 4 out of 32 pages

View example

Summarized whole book? Yes
Uploaded on November 26, 2021
Number of pages 32
Written in 2020/2021
Type Summary

multipele regressie
onderzoeksmethoden
regressie
anova
ancova
onderzoek
spss
statistiek
sociologie
sociale wetenschappen
meerweg anova
variabelen
hypothesen
pedagogen
verdieping in onderzoeksmethoden

Book Title:

Author(s):Unknown

Edition:Unknown
ISBN:9780393691894
Edition:Unknown

Institution
Universiteit Utrecht (UU)
Education
Premaster Sociology: Contemporary Social Problems
Course
Verdieping in Onderzoeksmethoden en Statistiek voor pedagogen (201900398)

elihaafkens

Member since 3 year 96 documents sold

$8.75

Add to cart

Save

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Hoorcollege 1 Multipele regressie

Bij sociale onderzoeken is het vaak het geval dat je meerdere kenmerken moet beoordelen en of
deze een effect hebben op iets (en welke het meeste iets verklaren). De multipele regressie is een
goede manier om zo’n sociaal onderzoek te analyseren.
Kenmerken multipele regressie: zie afbeeldingen rechts.

Bij multipele regressie stel je in je onderzoeksvraag: kunnen we iemands
waarde op een kenmerk voorspellen met kennis over andere kenmerken?
Multipele regressie valt onder correlationeel onderzoek.
(Theorie over multipele regressie uit vorige hoorcolleges: zie Correlationeel
hoorcolleges theorie bestand bij HC4).

Meetniveau variabelen:
Afhankelijke variabele Y:
- Kenmerk gemeten op interval of ratio meetniveau.
Onafhankelijke variabelen X:
- Kenmerk gemeten op interval of ratio meetniveau
- Categorisch kenmerk met twee categorieën: nominaal meetniveau
met twee categorieën noemen we dichotoom
- Categorisch kenmerk met meer dan twee categorieën: nominaal
meetniveau wordt omgezet in dummyvariabelen

Voorwaarden multipele regressie: multicollineariteit, homogeniteit in variantie, lineariteit en geen
uitschieters.

De formule die je bij multipele regressie gebruikt is: Y= B0 + B1 x X1 + B2 x X2 + B3 x X3 + E
Y: afhankelijke variabele
X: onafhankelijke variabele/predictor
B0: constante/intercept (de voorspelde waarde van Y wanneer X gelijk is aan 0)
B1: regressiecoëfficiënt (als X 1 keer groter wordt wat is dan de verandering in Y)
E: residu/voorspellingsfout (de afstand tussen de geobserveerde waarde
en de voorspelde waarde). De error geeft eigenlijk alle andere verklaringen/variabelen aan die niet in
de formule opgenomen zijn.

Regressielijn
De regressielijn is een rechte lijn om de samenhang tussen twee interval/ratio variabelen te
beschrijven.
Je wilt een regressielijn hebben waarbij de voorspellingsfout zo klein mogelijk is (want dan is de
afstand tussen de geobserveerde waarde en de voorspelde waarde het kleinst).
Je gebruikt hierbij het kleinste kwadraten criterium: je zoekt de lijn waarbij de voorspellingsfout
(error) zo klein mogelijk is.

,Wanneer je wilt uitrekenen wat de afhankelijke variabele is (de modelvergelijking) dan gebruik je de
formule Y= B0 + B1 x X1 + B2 x X2 + B3 x X3 + E.
Wanneer je een voorspelling wilt doen over wat de afhankelijke variabele is bij bepaalde groottes
van onafhankelijke variabelen (bijvoorbeeld wat is de voorspelde gemiddelde rekenscore van een
kind met een X1 van …, een X2 van … en een X3 van…) dan reken je Y met een dakje uit (de
regressievergelijking).
Dan gebruik je Ydakje = B0 + B1 x X1 + B2 x X2 + B3 x X3, en dan vul je de hoogtes van de onafhankelijke
variabelen in bij X1, X2 en X3 die in de tekst gegeven worden.

Met de tabel hieronder zou je het dus als volgt moeten berekenen (wanneer de respondent op
begrijpend lezen een 10 heeft gescoord en een vrouw is waarbij een vrouw de dummy van 1 krijgt):
Ydakje = B0 + B1 x X1 + B2 x X2 + B3 x X3 + B4 x X4 + B5 x X5.
Ydakje = 17.50 + (3.94 x 10) + (1.43 x 10) + (-17.57 x 10) + (11.68 x 10) + (5.44 x 1) = 17.74
Wanneer je nu het residu voor deze respondent wilt uitrekenen gebruik je de formule e= y – ydakje.
Dus: 10 – 17.74 = -7.74.

Goodness of fit
Goodness-of-fit: kijken hoe goed een regressielijn past. Je bepaalt de Goodness-of-fit met het
kwadraat van R. Het percentage die er uit komt is de verklaarde variantie (variantie is een maat
waarmee je spreiding weergeeft).
Wanneer je een regressie analyse doet bij SPSS kan je de R2 zien, dat is de Goodness-of-fit.
Een R2 zal tussen de 0 en de 100 liggen, hoe dichter bij de 100 hoe beter je regressielijn en hoe beter
je variantie kan verklaren.

Wanneer je bijvoorbeeld een R2 van 0.072 hebt, dan is er 7.2% kans dat een predictor variantie bij Y
verklaart, dit is dan een klein tot medium effect.

Bij de Goodness of fit vergelijk je eigenlijk het lineaire model (de regressielijn) met een basismodel
(basislijn).
SST = SSM + SSR
SS: Sum of Squares, dit is eigenlijk een optelling van alle voorspellingsfouten.
SST: totale sum of squares
SSM: model sum of squares
SSR: residual sum of squares
Om R2 uit te rekenen doe je SSM gedeeld door SST.

In de onderste afbeelding zie je een illustratie van
hoe een enkele totale, model en residu fout er uit ziet
(dus bij een individu, in dit geval de blauwe ster).

,Als je alle gevonden fouten (dus van alle
personen) kwadrateert en optelt dan kom je uit op je
SST, SSM en SSR.

De Goodness of Fit is dus eigenlijk de kwadratensom van
model gedeeld door de totale kwadratensom (dus SSM
delen door SST).
Let op: een residu kan ook aangegeven worden met
variantie.

Toetsen van R2
Hypothesen:
H0: R2 = 0 (het model verklaart niets)
H1: R2 > 0 (het model verklaart iets)
Hierbij hoort de toetsingsgrootheid F.
Met de F-toets vraag je je eigenlijk af: hoeveel verklaart het model ten opzichte van het deel dat het
model niet kan verklaren?
De toetsingsgrootheid F bereken je door MSM gedeeld door MSR.
(De MS is dus anders dan de SS!). De MS staat voor Mean Sum of Squares, oftewel de gemiddelde
kwadratensom = variantie. De MS reken je uit door SS gedeeld door df.
(voor verdere uitleg hierover zie laatste gedeelte Hoorcollege 2).

Je gaat bij het toetsen van R2 weer kijken naar dezelfde soort SPSS tabel die je gebruikt bij multipele
regressie. Je leest dan de p-waarde af en als deze onder de 0.05 ligt kun je de nulhypothese
verwerpen en stellen dat er een statistisch significant verklaringsmodel is.

Toetsen van B’s
Hierbij ga je de regressiecoëfficiënten toetsen (dus de B1, B2 enzovoort).
Met deze toets ga je dus eigenlijk kijken welke predictoren (gegeven de overige predictoren) een
significante bijdrage leveren aan de verklaring van …
Hypothesen:
H01: B1 = 0 Ha1: B1 > 0
H02: B2 = 0 Ha2: B2 > 0
H03: B3 = 0 Ha3: B3 > 0
Hierbij hoort de toetsingsgrootheid t.
Je gaat weer kijken naar de SPSS uitvoer (zie afbeelding). Dan kijk je weer naar alle p-waardes en ga
je uitspraken doen over bovenstaande hypotheses.

De B die je in de output ziet staan is hetzelfde als de B1, het
is de regressiecoefficient (als X 1 keer groter wordt, wat is
dan de verandering in Y). Wanneer je wilt kijken welke
regressiecoëfficiënt het meeste invloed heeft kijk je naar de
gestandaardiseerde regressiecoëfficiënt (dus de Beta
Standardized Coefficients).

Je kunt modellen met elkaar vergelijken (bijvoorbeeld model 1: Y= B0 + B1 x X1 + B2 x X2 + B3 x X3 + E
en model 2: Y= B0 + B1 x X1 + B2 x X2 + B3 x X3 + B4 x X4 + B5 x X5 + B6 x X6 + E). Je gaat dan kijken of de
toevoeging van (in dit geval) drie variabelen statistisch zinvol is. Als de R2 significant toeneemt dan
kun je zeggen dat het statistisch zinvol is.

, In de afbeelding zie je SPSS output waarin informatie staat voor beide modellen. Je kunt in deze
output dan kijken of je een verschil hebt in de R2.
De Δ (delta) staat voor verandering in R2.
In de afbeelding kun je dus aflezen dat Δ 0.17 is
(want 0.28 – 0.11 = 0.17).

Hoorcollege 2 Meerweg ANOVA

Ter herinnering: bij de enkelvoudige ANOVA heb je 1 onafhankelijke variabele/factor (van
nominaal/ordinaal meetniveau) en 1 afhankelijke variabele (van interval/ratio meetniveau).
Bij de meerweg/meervoudige ANOVA heb je 2 onafhankelijke variabelen/factors (van
nominaal/ordinaal meetniveau) en 1 afhankelijke variabele (van interval/ratio meetniveau).
Daarnaast heb je (zowel bij enkelvoudige als meerweg ANOVA) ook nog 3 groepen (of meer), zoals
een directe instructiegroep, een controlegroep en een eigen inbreng groep. Je gaat dan toetsen of er
een verschil in gemiddelden is, wanneer dit zo is kan je de variabelen zien als een verklaring voor
verschillen in hetgeen wat je onderzoekt.
Daarnaast ga je bij de meerweg ANOVA toetsen of er hoofdeffecten of een interactie effect bestaat
tussen deze groepen. Model die meerweg ANOVA illustreert: zie afbeelding.
(Let op: bij meerweg ANOVA heet een onafhankelijke variabele een
factor, bij multipele regressie heet het een predictor!).

De onderzoeksvraag bij een meerweg ANOVA is: verschillen twee of meer
groepen op het gemiddelde van een afhankelijke variabele Y?
Een meerweg ANOVA wordt ook wel een variantieanalyse genoemd.

Nulhypothesen:
H0: model verklaart geen variantie in Y
H0: geen hoofdeffect van factor 1
H0: geen hoofdeffect van factor 2
H0: geen interactie-effect van factor 1 x factor 2

Eerst ga je bij de beschrijvende statistieken kijken (zie afbeelding).
Om te kijken of er een hoofdeffect is van factor 1 (in dit geval leeftijd) moet je naar de totale
gemiddeldes (Mean) kijken. Hier zie je het verschil in de drie gemiddeldes (14.7, 21.2 & 27.3).
Om te kijken of er een hoofdeffect is van de andere factor (in dit geval sekse) moet je kijken naar de
totale gemiddelden onderaan (21.1 & 20.7).
Om te kijken naar het interactie-effect kijk je naar het verschil in gemiddeldes bij elke factor
(aangegeven met lichtblauw) (verschil van 1.2, 1.3 & 3.4)
Wanneer je dit op deze manier uit de output afleest ben je nog bezig met het beschrijven van de
resultaten vanuit de steekproef. Om te testen of de verschillen die je vindt in de gemiddeldes ook
daadwerkelijk significant zijn of dat ze door toeval ontstaan zijn, ga je met de ANOVA toetsen.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller elihaafkens. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $8.75. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

72056 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 15 years now

Start selling

Summary

Samenvatting VOS

Document information

Subjects

Connected book

Written for

Seller

Reviews received

Content preview