MAW-NL: technieken voor causale analyse - MTO-C (424520B6)
Summary
Samenvatting MTO-C (424520-B-6) - MAW-NL: technieken voor causale analyse - Applied Statistics I, ISBN: 9781506352817
111 views 13 purchases
Course
MAW-NL: technieken voor causale analyse - MTO-C (424520B6)
Institution
Tilburg University (UVT)
Book
Applied Statistics I
Alle college aantekeningen (extra uitgebreid) + extra uitleg uit het boek + een deel van de uitwerkingen van de werkcolleges.
Ik ben niet goed in statistiek maar door deze samenvatting heb ik een 8.0 gehaald! Alles staat stap voor stap uitgelegd en dit is alle stof die je moet kennen voor het te...
MAW-NL: technieken voor causale analyse - MTO-C (424520B6)
All documents for this subject (1)
Seller
Follow
ilvademeijer
Reviews received
Content preview
MTO-C
Hoorcollege 1
Course intro
Technieken behandelt in deze cursus:
- One-way between-subjects analysis of variance (ANOVA)
o Estimation of Pearson’s (partial) correlation coefficient
- Bivariate regression
- Multiple regression
- Elaboration logic
- Path analysis
- Logistic regression analysis
We gaan een causaal verband of correlatie onderzoeken. X = onafhankelijke variabele en wordt ook
wel verklarende variabele of predictor genoemd. De predictor is de eerste afhankelijke variabele.
Deze zijn belangrijk omdat ze ons helpen om ‘wat’ en ‘waarom’ onderzoeksvragen te beantwoorden. →
beschrijvende en verklarende onderzoeksvragen.
Ze hebben met elkaar gemeenschappelijk: schatten hoeveel van de variantie in een afhankelijke variabele
Y, systematisch samenhangt (co-varieert) met de variantie in andere verklarende variabelen X: We willen
verschillen in scores van respondenten verklaren → waarom hebben bepaalde respondenten een hogere of
lagere score op een variabele dan een andere respondent?
Dit komt door systematische verschillen: variantie. De variantie in een afhankelijke variabele varieert
systematisch (co-varieert) met de variantie in een onafhankelijke variabele. Alle technieken nemen aan dat
de scores op een afhankelijke variabele door drie soorten factoren kunnen worden verklaart:
technieken nemen aan dat scores op een afhankelijke variabele kunnen worden voorspeld door:
1. Variabelen die zijn gemeten: X variabelen. X variabelen die zijn gemeten en die als predictor zijn
opgenomen in een model waarin zij de afhankelijke variabele systematisch beïnvloeden → omdat
we de X hebben gemeten (in bv. een vragenlijst) kunnen we het opnemen als predictor (verklaring)
in een model waarin X de afhankelijke variabele systematisch beïnvloeden.
- Variabelen die niet zijn gemeten. En die niet als predictor zijn opgenomen in een model, maar die
de afhankelijke variabele wel systematisch beïnvloeden (ε → systematische error/residu). ε =
Residu is niet verklaarde variantie (residuele variantie) (hoeveel waarden van elkaar verschillen). →
omdat we ze niet hebben gemeten maar wel invloed hebben kunnen we ze niet in model
opnemen.
- Variabelen die we niet hebben gemeten en die de afhankelijke variabele alleen toevallig
beïnvloeden (ook ε → random error/residu) → toevallige meetfout.
Het meetniveau van de afhankelijke variabele (nominaal, ordinaal, interval en ratio) bepalen vooral welke
techniek toegepast kan worden. → LEREN!!!
- Nominaal: categorisch. Ongeordende categorieën (geslacht, land, huwelijkse status, politieke
partij). Duiden alleen bepaalde categorie aan.
- Ordinaal: nominaal + ranking/ordening in scores van variabelen. Bv. laag, middel en hoog
onderwijs. Hoog is hoger dan laag etc. Je weet niet of de afstanden gelijk zijn.
- Interval: ordinaal + afstanden tussen categorieën zijn gelijk. In sociale wetenschappen wordt vaak
aangenomen dat dit zo is. bv. temperatuur in graden. Verschil tussen 1 en 2 is zelfde als 3 en 4.
, - Ratio: interval + nulpunt. 0 = afwezigheid van de eigenschap. Bij Celsius kan je onder 0 en bij 0
betekent het niet dat er geen temperatuur meer is dus geen ratio. Wat wel ratio is, is bv. inkomen.
Bij 0 inkomen is er geen inkomen.
De technieken verschillen betreft:
a) het meetniveau van de afhankelijke variabelen,
b) het meetniveau van de onafhankelijke (verklarende) variabelen
c) het aantal variabelen die de techniek aankan (complexiteit van de theorie).
We kijken vooral naar afhankelijke variabelen van interval en ratio niveau → continue variabelen. En naar
een techniek met nominaal: de logistische regressie. Maar twee categorieën.
Voorbeelden complexiteit van samenhang
Complexiteit van samenhang I, II, III en IV
ANOVA; eenvoudige conceptueel model. Meetniveau X is categorisch (nominaal) en afhankelijk is continu
(ratio of inteal). Dit moet bij ANOVA want je moet gemiddelden kunnen berekenen en dit kan alleen voor
continue afhankelijke variabelen. → eenweg variantie analyse.
Bivariate regressie: techniek lijkt erg op ANOVA en je kunt er dezelfde hypothese mee toetsen als bij
ANOVA. Je krijgt bij bivariate regressie ook een ANOVA tabel te zien. Ook categorische onafhankelijke
variabele.
Multiple regressie: vaak zijn hypothesen complexer en als je afhankelijke variabele hebt met continu
meetniveau maar wel meerdere onafhankelijke variabelen, gebruik je deze. Er is sprake van meerdere X’en
die Y voorspellen en er zijn conditionele variabelen als salaris: er is een moderator (geslacht). Er zijn ook
variabelen met twee pijlpunten. Er is dan correlatie. Je weet de causaliteit tussen de variabelen niet goed.
Bij mutiple regressie is er één afhankelijke variabele. Je kunt dit weer aanvullen met een padanalyse.
padanalyse: een model met meerdere afhankelijke variabelen. Bv. salaris en
organizational commitment worden verklaart. Een eenzijdige pijl is verklaring. Tweezijdig is correlatie.
Salaris is afhankelijk en verklarend.
,Dit waren allemaal modellen voor continue afhankelijke variabelen (interval of ratio: heel veel categorieën).
Nu kijken naar een afhankelijke variabele met twee categorieen (nominaal: wel of niet).
.
Bivariate logistische regressieanalyse: eenvoudig model. Twee variabelen.
Multiple logistische regressieanalyse: uitbreiden met onafhankelijke variabelen van verschillende
meetniveau’s. Kan ook weer een interactieeffect zijn. Zelfde als bij multiple regressie.
Bivariaat = tussen twee variabelen.
Binaire = een bepaalde uitkomst treed op of niet. Afhankelijke variabele heeft maar twee categorieen. 0 =
niet, 1 = wel. Het is geen schaal, de afhankelijke variabele.
Samenvattende tabel
kwalitatieve variabele is bv geslacht en kleur van ogen. Kwantitatief
is lengte, gewicht, leeftijd etc.
In bivariate regressieanalyse is sterk gerelateerd aan de eenweg variantie analyse (ANOVA). Als je deze in
SPSS invult krijg je ook een eenweg variantie analyse. Een regressie analyse is veel algemener.
- Afhankelijke variabele is Y
- Onafhankelijke variabele is X
- Predictor is eerste onafhankelijke variabele. Het is een variabele die in onderzoeken worden
ingebracht om het effect ervan op een afhankelijk variabele te bepalen.
, Eenweg-variantie analyse (one-way between-subjects analysis of variance, ANOVA)
Met deze techniek kun je alleen hele simpele hypothesen toetsen. Later wordt dit uitgebreid met andere
technieken.
Eenvoudige conceptueel model. Meetniveau X is categorisch (nominaal) en afhankelijk is continu (ratio of
interval). → eenweg variantie analyse. Dus X → Y. *ANOVA heeft maar één onafhankelijke variabele
Warner/Gelissen H6 of H13
We gaan variantie analyseren.
Logica van de een-weg ANOVA
Bv.: team waarin iemand werkt (X) → organizational commitment (Y).
Als de hypothese juist zou zijn moet de gemiddelde commitment van de teams verschillen.
- We moeten voor de afhankelijke variabele eerst een betekenisvol gemiddelde berekenen.
Inhoudelijke hypothese:
De mate van organizational commitment (Y) is afhankelijk van het team waarin iemand werkt (X)
- Vraag: als de hypothese juist is, wat zou je dan moeten vinden m.b.t. gemiddelde commitment
tussen de teams? → we verwachten dat de teams verschillen in de gemiddelde commitment.
- Stel we hebben data verzameld met meting van organizational commitment bij 3 teams
- 2 scenario’s wat betreft de data
beide zelfde gemiddelde maar variantie verschilt sterk.
• Gemiddelde scores tussen beide scenario’s zijn hetzelfde. Individuele scores wel anders.
• Wat verschilt is de variantie van de scores binnen elk team. In het 1e scenario is de spreiding veel
groter dan bij scenario 2. In scenario 2 lijken de team leden dus meer op elkaar wat betreft
organizational commitment.
• X (onafhankelijk) moet normaal op de horizontale as, Y (afhankelijk) op verticale as.
• In scenario 2 zie je dus duidelijke verschillen tussen de teams.
Bij welk van beide data-scenario’s zou je eerder concluderen dat er een verband bestaat tussen het team
waarin men werkt en organizational commitment? → in scenario 2 want er is meer samenhang tussen de
scores. In scenario 2 minder verschil maar tussen teams redelijk veel.
*Als variantie tussen de groepen veel groter is dan de variatie binnen de groepen kan er sprake zijn van een
groepseffect.
De variantie analyse doet niks anders dan kijken naar de verhouding tussen groepen, relatief aan de
verschillen binnen groepen.
➔ Waarom?
Centraal idee achter variantie-analyse is;
Indien er 2 of meer groepen zijn, kunnen we dan een uitspraak doen over mogelijke - significante- verschil
tussen de gemiddelden van de groepen? → of ten minste twee groepen significant van elkaar
verschillen en mogelijk meer.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ilvademeijer. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $11.26. You're not tied to anything after your purchase.