College 1 en 2 – Inleiding en voorkennis ophalen
Onafhankelijke en afhankelijke variabelen
> Onderzoek doen = vragen beantwoorden met data
> Niet suggereren, maar bewijzen
> Theorie > vraag/hypothese > data > antwoord
> Beantwoording = toetsen van een model (vaak impliciet)
Je wil weten of er een verschil is bij betrokkenheid tussen parttime en fulltime medewerkers
Contract → betrokkenheid
Het contract van een medewerker (parttime of fulltime) is de onafhankelijke variabele en dat zou
mogelijk van invloed kunnen zijn op de betrokkenheid, de afhankelijke variabele. De betrokkenheid is
dus afhankelijk van iemands contract.
Meetniveau
De manier van hoe je de variabele meet. Het meetniveau van de (on)afhankelijke variabelen bepaalt
welke toets je mag doen.
> Nominaal – twee, drie of vier bepaalde niveaus (man, vrouw)
> Ordinaal – rangorde (onderwijs: mavo, havo, vwo etc.)
Nominale en Ordinale meetniveaus betekenen niet zoveel in cijfers, maar het verschil tussen
Nominaal en Ordinaal is dat er bij Ordinaal een rangschikking in zit: eerst komt mavo, dan havo, dan
vwo. Bij Nominaal (man/vrouw, dood/levend) maakt dat niet uit. Het verschil tussen de rangen bij
Ordinaal meetniveau kan je echter niet meten. Er is geen duidelijke grootte tussen mavo en havo en
bijvoorbeeld mbo of wo.
> Interval – een bepaald numeriek getal (schoenmaat). Het verschil tussen 36 en 37 is net zo groot als
het verschil tussen maat 41 en 42. Dit meetniveau is veel preciezer.
> Ratio – de intervallen tussen de verschillende getallen zijn ook precies identiek (leeftijd). Maar het
nulpunt heeft ook een waarde (als je geboren bent, ben je nul. Je moet nog 1 worden. Dus het getal
nul zegt ook iets. Ratio heeft nul als mogelijke waarde.
Tip: zorg voor een informatief meetniveau (interval of ratio indien mogelijk). Niet schalen van 20-30,
31-50 jaar etc. Want dan weet je nog steeds niet precies hoe oud iemand is. Vraag naar het
geboortejaar of verjaardag, dan weet je veel meer. Zoveel info hoeft niet per se, jaren is genoeg.
Random
> Proefpersonen toewijzen aan condities (niveaus van de onafhankelijke variabele) om verschillen of
verbanden te zien op de afhankelijke variabelen
> Toewijzen liefst at random -> de ene komt in groep 2, de volgende in groep 4 en de laatste in groep
3. Dit moet willekeurig zodat je geen invloed hebt op wie waar komt. Deze gelijke verdeling in
verschillende groepen/condities maakt dat je onderzoek betrouwbaarder en meer valide is.
Gemiddelde en standaardafwijking
> Gemiddelde M: som van de scores gedeeld door het aantal observaties
> Gemiddelde van 6, 8, 10, 12 en 14 = 10
> In analyses gaat het vaak om de gemiddelden van groepen die worden vergeleken (bv. teksten met
argument: M = 3.67, teksten zonder: M = 2.68)
> Een gemiddelde zegt niet alles; van belang is ook de standaardafwijking SD
> SD = de gemiddelde afwijking ten opzichte van het gemiddelde: √(som van de gekwadrateerde
afwijking / N – 1)
> Dus: 2, 5, 8 > M = 5 √[(9+0+9)/2] = 3
1
,Bovenstaande berekening tussen haakjes ziet er zo uit: alle waarden ten opzichte van het
gemiddelde pakken. M = 5 -> 5 – 2 = 3. En dan pak je 3 keer zichzelf is 9, dit verklaart die eerste 9.
Dan de afwijking van 5 ten opzichte van het gemiddelde is 0. 0 maal 0 is 0 dus het tweede getal is 0.
Als laatste 8 – het gemiddelde van 5 = 3. 3 maal 3 is 9 dus het ziet er als volgt uit: 9 + 0 + 9 = 18. Dat
deel je door N – 1. Er waren 3 proefpersonen dus 3 – 1 = 2. Dus je doet 18/2 = 9. En daar trek je de
wortel uit dus dat is 3. SD = 3. Dus de gemiddelde afwijking van M = 5 is 3 (SD).
→ dit komt mij wel bekend voor
Waarom is de standaardafwijking zo belangrijk?
> 6, 8, 10, 12, 14 (de 5 proefpersonen scoren dichtbij de 10, die 10 vertegenwoordigt best goed de
groep)
> 2, 3, 5, 9, 21 (de standaardafwijking is groot. Er is niemand die in de buurt komt van de 10. Die 10
vertegenwoordigt niet zo goed die groep en is dus niet zo betrouwbaar)
> Het gemiddelde is telkens 10. Maar als het voor beiden 10 is, zegt dat nog niet zoveel over de
verdeling binnen de groep. De SD laat eigenlijk zien hoe de andere scores binnen die groep om de 10
heen bewegen.
> Kleine SD: scores liggen dichtbij het gemiddelde, er is weinig variatie in de scores en het
gemiddelde doet recht aan de data
> Grote SD: scores liggen ver van het gemiddelde af, er is veel variatie aan scores binnen de groep en
het gemiddelde doet geen recht aan de data
> Kleine SD is beter, want veel scores liggen dichtbij het gemiddelde, er is weinig variatie dus het
gemiddelde doet recht aan de data.
Normaalverdeling
> In de werkelijkheid zijn scores meestal normaal verdeeld: de meeste scores zitten rondom het
gemiddelde en lage/hoge scores komen veel minder vaak voor. Er zijn relatief weinig extreme scores
> Tentamencijfers, voetbaluitslagen, alcoholconsumpties
> Grote SD: brede normaalverdeling
> Kleine SD: smalle normaalverdeling
> 68% van de scores zit tussen 1 SD om M heen
> 95% van de scores zit tussen 2 SD om M heen
> Dit gegeven is belangrijk voor de testtheorie
> Bij een normaalverdeling is M = 0 en SD = 1
> Verdeling van data kan worden omgezet naar zo’n verdeling als we M en SD weten
> De scores worden nu z-scores. De z is het aantal standaarddeviaties dat wordt afgeweken van het
gemiddelde. Er zijn gemiddeld net zo veel waarden met een z van < -2.56 als waarden met een z van
> 2.56 (5%). Met deze score kunnen we voorspellen hoe groot de kans is dat een bepaalde score
voorkomt. Bijvoorbeeld: hoe groot is de kans dat iemand meer dan een 9.0 voor het DVA-tentamen
haalt als M = 6.00?
2
,> Normaalverdeling heeft eigenschappen die we willen gebruiken om uitspraken te kunnen doen of
een bepaalde M afwijkt van een andere M, bijvoorbeeld 3.50 (groep A) en 4.50 (groep B). Vraag:
Hoe groot is de kans dat 4.50 een score is die afkomstig is uit groep A?
Dus: kan die 4.5 wel voorkomen in groep A? Hoe groot is de kans dat de score 4.5 in groep A voor kan
komen? Is die kans significant? Als blijkt dat de score 4.5 vrijwel niet voorkomt in groep A, kunnen we
concluderen dat groep A en groep B significant van elkaar verschillen. Als het gaat om een “kleine”
kans (p < .05 ofwel kleiner dan 5%), dan zijn het twee verschillende groepen!
Nulhypothese – alternatieve hypothese
> Verwachting wordt de alternatieve hypothese genoemd, H1 (groep A scoort beter dan groep B, er
is een verband tussen variabele A en variabele B)
> H1 kan niet worden bewezen met data; we kunnen wel het tegenovergestelde ontkrachten: de H0
> H0 = nulhypothese (altijd status quo; er is geen effect/verschil tussen A en B)
> Als H0 wordt verworpen, dan is er ondersteuning voor H1/kan je H1 aannemen
Populatie – steekproef
> Uitspraken over verbanden of verschillen gaan over algemene verbanden of verschillen
> Verbanden of verschillen in de werkelijkheid
> Omdat we niet alles kunnen onderzoeken, nemen we genoegen met een deel: de steekproef
> Door toetsen te doen met de steekproef willen we uitspraken doen over de populatie
> Voor uitspraken over de steekproef is geen toets nodig: naar de gemiddelden kijken is voldoende
> We maken een model van de werkelijkheid
> Kernvraag is: in hoeverre wijkt dat model af van de werkelijkheid?
> Om de werkelijkheid goed te benaderen, is een voldoende grote steekproef nodig
> Een beter model is een model met een kleine SD (weinig spreiding, scores doen recht aan M)
> Probleem: elke steekproef is anders!
> Verschillende steekproeven hebben verschillende M’s.
> Oplossing: ook deze steekproefverdeling is een normaalverdeling. Dus bij 1 steekproef van 100
proefpersonen kunnen we de M en SD van de populatie schatten.
> Op basis van de M en SD uit de steekproef schatten we de M en SD in populatie
Significantie niveau
> Op die manier vergelijken we de scores (data uit steekproef) met het model (hypothese)
H1: studenten halen meer dan een 6.0 voor het tentamen
H0: studenten halen niet meer dan een 6.0 voor het tentamen
Data: M uit steekproef is 6.8
> Vraag is dan: wijkt 6.8 significant af van 6.0?
> Bij een significant resultaat is de score zo afwijkend in de normaalverdeling, dat die niet hoort bij
de verdeling waarbij de score minder dan een 6.0 is; H1 wordt aangenomen en H0 verworpen.
Eenzijdig/tweezijdig toetsen
> Eenzijdig = een richting
A is groter dan B
of B is groter dan A
> Tweezijdig = geen richting
Ik verwacht dat groep A anders scoort dan groep B, dus ‘A is groter dan B’ of ‘B is groter dan A’.
3
, College 3 – Tussenproefpersonen ANOVA
Het experiment
> De onderzoeker heeft controle op een of meer onafhankelijke variabele (manipulatie)
- factoren, ook wel treatment variables genoemd (geslacht, opleidingsniveau, zit er een metafoor in
de tekst of niet)
- een factor heeft twee of meer niveaus (levels)
> Onderzoeker observeert een effect op afhankelijke variabele
- respons op elk niveau van de onafhankelijke variabele
Bij een experiment gebruik je bijna altijd een variantieanalyse omdat we kijken hoe groepen scoren
op de onafhankelijke variabele. Opzoek naar de respons van de proefpersoon op de afhankelijke
variabele, afhankelijk van de onafhankelijke variabele
Voorbeelden
> Is er een verschil tussen mannen en vrouwen in de tevredenheid over de communicatie met hun
baas?
> Wat is het verschil in het aantal negatieve tweets over bedrijven in de Benelux?
Afhankelijke variabelen: de tevredenheid over de communicatie met hun baas | het aantal negatieve
tweets over bedrijven
Onafhankelijke variabelen: geslacht | land van herkomst
Niveaus van de factoren: mannen en vrouwen | Nederland, België, Luxemburg
> 30 kinderen worden willekeurig verdeeld over 3 reclameadvertenties om te achterhalen wat het
effect is van het soort reclameclaim op hun geloofwaardigheid
> 30 marketeers uit drie verschillende reclamebureaus krijgen per bureau verschillende
reclameadvertenties te zien om te achterhalen wat het effect is van het soort reclameclaim op hun
geloofwaardigheid
Wat is het verschil tussen deze twee experimenten?
Antwoord: bij het eerste experiment worden de proefpersonen willekeurig verdeeld over de
advertenties. Bij het tweede experiment zijn de proefpersonen niet willekeurig verdeeld over de
advertenties.
Volledig gerandomiseerde ontwerpen
Willekeurig (random) gekozen experimentele eenheden (vaak personen) ondergaan treatments
De geloofwaardigheid in de functie van het type claim is gemeten (100 = hoog)
Het idee is dat de proefpersonen random in een van de drie groepen terecht komt zodat een zo
betrouwbaar mogelijk effect te zien is.
One-way ANOVA F-test
> Toetst of minstens 1 populatiegemiddelde verschilt van de andere populatiegemiddelden. We
willen weten of proefpersonen die toevallig in groep A terecht zijn gekomen beter of slechter scoren
dan proefpersonen die toevallig in groep B terecht zijn gekomen.
4