Hoorcollege 1 – 24 oktober
De technieken zijn belangrijk, want ze helpen ons om wat en waarom onderzoeksvragen te
beantwoorden.
Gemeenschappelijk: schatten hoeveel van de variantie in een afhankelijke variabele Y
systematisch samenhangt (co-varieert) met de variantie in andere verklarende variabelen X;
technieken nemen aan dat scores op een afhankelijke variabele kunnen worden voorspeld
door:
a. X variabelen die zijn gemeten en die als predictor zijn opgenomen in een model
waarin zij de afhankelijke variabele systematisch beïnvloeden.
b. Variabelen die niet zijn gemeten en die niet als predictor zijn opgenomen in een
model, maar die de afhankelijke variabele wel systematisch beïnvloeden ( → random
error/residu).
c. Variabelen die we niet hebben gemeten en die de afhankelijke variabele alleen
toevallig beïnvloeden ( → random error/residu).
X → Y , oftewel Y=f(X, )
Ze verschillen betreft: (a) het meetniveau van de afhankelijke variabelen, (b) het meetniveau
van de verklarende variabelen, (c) het aantal variabelen die de techniek aankan
(complexiteit van de theorie).
Meetniveau van de afhankelijke variabele bepaald welke techniek je kunt gebruiken.
Error = systematische, maar niet gemeten invloeden van verklarende factoren.
Kan ook: niet systematische invloeden zijn, louter toevallig. Spelen op tijdens het maken van
de test door bijvoorbeeld persoonlijke omstandigheden.
Complexiteit van samenhang
One-way Between-Subjects Analysis of Variance
Team waarin iemand werkt (X) (nominale/categorische variabele) → organizational
Commitment (Y) (continue schaal: 1 = laag; 10 = hoog).
We gebruiken de termen ‘X variabele’, ‘onafhankelijke variabele’, ‘verklarende variabele’ en
‘predictor’ door elkaar.
Bivariate regressieanalyse
Team waarin iemand werkt (X1) → Organizational Commitment (Y)
Multipele regressieanalyse
Correlatie is samenhang en zegt niks over een richting van het effect. Continue gemeten.
,Padanalyse
Afhankelijke variabele zijn continu gemeten. Meerdere afhankelijke variabelen.
Bivariate (binaire) logistische regressieanalyse
Team waarin iemand werkt (X1) → Al dan niet werkloos worden (0 = nee, 1 = ja; Y)
Afhankelijke variabele is niet continu gemeten, want heeft maar 2 categorieën (nominaal).
Multipele (binaire) logistische regressieanalyse
Samenvattende tabel
One-way Between-Subjects Analysis of Variance
Hoofdstuk 6
Logica van de een-weg ANOVA
One-Way Between-Subjects Analysis of Variance
Team waarin iemand werkt (X) → organizational Commitment (Y)
Inhoudelijke hypothese:
,De mate van organizational commitment (Y) is afhankelijk van het team waarin iemand
werkt (X).
Vraag: als hypothese juist is, wat zou je dan moeten vinden met betrekking tot gemiddeld
commitment tussen de teams?
Centraal idee achter variatie-analyse: indien er 2 of meer groepen zijn, kunnen we dan een
uitspraak doen over mogelijke significante verschil tussen de gemiddelden van de groepen?
Fundamenteel principe van ANOVA: ANOVA analyseert verhouding van de twee
componenten van totale varia(n)tie in de data – tussengroepvariantie en
binnengroepvariantie:
Hoe groter dit verschil, hoe groter de kans dat de groepen verschillende gemiddeldes
hebben.
Wanneer de meeste variantie van tussen de groepen komt is er waarschijnlijk een significant
effect. Als de meeste variantie binnen de groepen komt is er waarschijnlijk geen significant
effect.
Waarbij tussengroep-variantie systematische verschillen meet tussen groepen en alle
andere variabelen die zowel systematisch als toevallig van invloed zijn op Y (‘residual
variance’ of ‘error’)
Binnengroep-variantie invloed meet van alle andere variabelen die zowel systematisch als
toevallig van invloed zijn op Y (‘residual variance’ of ‘error’) meet. Wordt niet beïnvloed door
de groep.
Belangrijke punten om in te zien:
1. Alle verschillen binnen een groep kunnen niet worden verklaard door verschillen
tussen groepen, want iedereen die behoort tot een bepaalde groep heeft dezelfde
groepsscore; verschillen binnen groepen moeten daarom worden toegeschreven aan
systematische niet-gemeten factoren binnen groepen (bijv. verschillen tussen
personen) of toevallige factoren.
2. Geobserveerde verschillen tussen groepen zijn waarschijnlijk niet alleen pure tussen-
groep verschillen, maar ook verschillen tussen systematische niet-gemeten factoren
of toevallige factoren.
Kortom: we vergelijken eigenlijk variantie tussen groepen (=systematisch groeps-effect +
error) met variantie binnen groepen (=error) om iets te leren over de omvang van het
systematische groepseffect.
Statistische nulhypothese voor One-Way Between-Subjects ANOVA:
Alfa vaststellen (meestal .05)
Gemiddelden van k populaties waarmee groepen in de studie corresponderen zijn allemaal
aan elkaar gelijk:
H0 : 1 = 2 = … = k
Nulhypothese verwerpen betekend dat twee groepen significant van elkaar verschillen en
wellicht meer.
, Intermezzo
Waarom liever Oneway Between-S ANOVA en niet allemaal losse t-toetsjes voor
gemiddelden?
Probleem van deze aanpak: hoe groter het aantal toetsen dat wordt uitgevoerd op een
dataset, des te groter de kans dat we de nulhypothese verwerpen terwijl deze juist is (Type I
fout)
Waarom? Volgt uit logica van hypothesetoetsing: we verwerpen de hulhypothese als een
resultaat uitzonderlijk is, maar hoe meer toetsen we uitvoeren, des te eenvoudiger is het om
uitzonderlijke resultaten te vinden.
Men maakt dus makkelijker de fout om te concluderen dat er een effect is terwijl het er niet
is.
Dit heet ‘inflated risk of Type I error’.
Formule voor berekening op kans op 1 of meer Type I fouten bij een reeks van C toetsen met
significatieniveau alfa:
1 – (1 – alfa)c
Dus bij 3 afzonderlijke toetsen met steeds alfa = .05 is de kans om onterecht de
hulhypothese te verwerpen:
1 – (1 – 0.05)3 = .143
Oplossing: One-Way ANOVA → één enkele omnibus toets voor de nulhypothese dat de
gemiddeldes van K populaties aan elkaar gelijk zijn, waarbij kans op Type I fout = .05
Rekenen: Sums of Squares
Als we met een ANOVA de statistische nulhypothese willen toetsen, dan wordt daarvoor de
F-verdeling gebruikt → hypothese over variantie.
Om te bepalen of een bepaald steekproefresultaat uitzonderlijk (‘significant’) is (onder de
aanname dat de statistische nulhypothese juist is), moet een test-statistiek F
(toetsingsgrootheid F) worden berekend.
Strategie: opsplitsen van scores in componenten:
- Component van score wel geassocieerd met ‘groep’
- Component van score niet geassocieerd met ‘groep’
Deviatiescores berekenen
1. Deviatie van score van individu t.o.v. algemene gemiddelde
Yij - My
2. Deviatie van score van individu t.o.v. groepsgemiddelde
(Yij – Mi) = ij
3. Deviatie van groepsgemiddelde t.o.v. algemene gemiddelde
(Mi – My) = i
i wordt ook wel ‘effect van groep i’ genoemd (niet verwarren met significatieniveau).
Component drie wil je zo groot mogelijk hebben, want dan is verschil systematisch en niet
toevallig.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper Merel04. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,99. Je zit daarna nergens aan vast.