Dataverzameling en -analyse
Week 1
Voorkennis ophalen
- Hoofdstuk 1: De rol van statistiek in onderzoek
o 1.6.1. (On)afhankelijke variabelen
o 1.6.2. Meetniveaus
o 1.7.5. Random
o 1.8. Normaalverdeling
o 1.8.4. Gemiddelde
o 1.8.5. Standaardafwijking
- Hoofdstuk 2: Basisconcepten
o 2.9.2. Nulhypothese
o 2.4. Populatie en steekproef
o 2.9. Significantietoets
o 2.9.5. Eenzijdig/tweezijdig toetsen
- Hoofdstuk 4: Werken met SPSS
Onafhankelijke – afhankelijke variabelen
- Onafhankelijke variabele: de variabele die je manipuleert, waar je controle over hebt
- Afhankelijke variabele: de variabele die afhankelijk is van de onafhankelijke variabele,
alles wat je meet, verandert door de onafhankelijke variabele
- Onderzoek doen = vragen beantwoorden met data
- Niet suggereren, maar bewijzen
- Theorie > vraag/hypothese > data > antwoord
- Beantwoording = het toetsen van een model (vaak impliciet)
- Bijvoorbeeld:
o Betrokkenheid van parttime en fulltime medewerkers
Contract betrokkenheid
Onafhankelijke variabele: contract
Afhankelijke variabele: betrokkenheid
Meetniveau
- Meetniveau (on)afhankelijke variabelen bepaalt de juiste toets!
o Nominaal (man, vrouw)
o Ordinaal (onderwijs)
o Interval (temperatuur in Celsius)
o Ratio (leeftijd)
- Tip: zorg voor een informatief meetniveau (interval of ratio indien mogelijk)
o Interval of ratio is het makkelijkst
Random
- Proefpersonen toewijzen aan condities (niveaus van de onafhankelijke variabele) om
verschillen of verbanden te zien op de afhankelijke variabelen
- Toewijzing liefst at random
1
, - Random proefpersonen aan je condities toewijzen maakt het analyseren makkelijker
- Keuze tussen tussen- en binnenproefpersoon variabele(n) bepaalt ook mede de juiste
toets
o Tussen proefpersoon design: proefpersoon krijgt een conditie te zien
o Binnen proefpersoon design: proefpersoon krijgt beide condities te zien
Gemiddelde en standaardafwijking
- Gemiddelde M: som van de scores gedeeld door het aantal observaties
- Gemiddelde van 6, 8, 10, 12, 14 = 10
- In analyses gaat het vaak om de gemiddelden van groepen die worden vergeleken
(bv. Met argument: M = 3.67, zonder: M = 2.68)
o De vraag is dan of er een significant verschil zit tussen 3.67 en 2.68
- Een gemiddelde zegt niet alles; van belang is ook de standaardafwijking SD
- SD = gemiddelde afwijking ten opzichte van het gemiddelde
- √ (som van de gekwadrateerde afwijking / N - 1)
- 2, 5, 8, > M = 5 > √ [(9+-0+9)/2] = 3
Gemiddelde en standaardafwijking
- 6, 8, 10, 12, 14
- 2, 3, 5, 19, 21
- Gemiddelde is telkens 10
- In de eerste rij is de SD kleiner dan bij de tweede rij, omdat de scores minder van
elkaar verschillen
- Kleine SD: scores liggen dichtbij gemiddelde
- Grote SD: scores liggen ver van gemiddelde af
- Kleine SD is beter, want veel scores dichtbij gemiddelde, weinig variatie, het
gemiddelde doet recht aan de data
o De bovenste reeks is dus het beste
Normaalverdeling
- In de werkelijkheid zijn scores meestal normaalverdeeld: de meeste scores zitten
rondom het gemiddelde en erg lage/hoge scores komen veel minder vaak voor
- Tentamencijfers, voetbaluitslagen, alcoholconsumptie
- “Bergje”: in het middel bevinden zich de meeste scores
van de data
- Grote SD: brede normaalverdeling, “bergje” is breder
- Kleine SD: smalle normaalverdeling, “bergje” is smaller
- 68% van de scores zit tussen 1 SD en M heen
- 95% van de scores zit tussen 2 SD om M heen
- Dit gegeven is belangrijk voor de testtheorie
- Bij een normaalverdeling is M = 0 en SD = 1
- Verdeling van data kan worden omgezet naar zo’n
verdeling als we M en SD weten
- De scores zijn nu z-scores
- Met deze score kunnen we voorspellen hoe groot de kans is dat een bepaalde score
voorkomt
2
, o Bijvoorbeeld: hoe groot is de kans dat iemand meer dan een 9.0 voor het
DVA-tentamen haalt als M = 6.00?
- Normaalverdeling met eigenschappen hebben we nodig om uitspraken te kunnen
doen of een bepaalde M afwijkt van een andere M, bijvoorbeeld 3.50 (groep A) en
4.50 (groep B)
- Een vraag kan dan zijn:
o Hoe groot is de kans dat 4.50 een score is die afkomstig is uit groep A
o Als het gaat om een “kleine” kans, dan zijn het twee verschillende groepen!
Nulhypothese – alternatieve hypothese
- Verwachting wordt de alternatieve hypothese genoemd, H1 (groep A scoort beter
dan groep B, er is een verband tussen variabele A en variabele B)
- H1 kan niet worden bewezen met data: we kunnen wel het tegenovergestelde
ontkrachten: de H0
- H0 = nulhypothese (altijd status quo, dus groep A scoort gelijk aan groep B)
- Als H0 wordt verworpen, dan is er ondersteuning voor H1
Populatie – steekproef
- Uitspraken over verbanden of verschillen gaan over algemene verbanden of
verschillen
- Verbanden of verschillen in de werkelijkheid
- Omdat we niet alles kunnen onderzoeken, nemen we genoegen met een deel: de
steekproef
- Door toetsen te doen met de steekproef willen we uitspraken doen over de populatie
- (NB voor uitspraken over de steekproef is geen toets nodig: naar de gemiddelden
kijken is voldoende!)
- Als de steekproef groter is, is de kans dat je over de algehele populatie iets kan
zeggen groter
- We maken een model van de werkelijkheid
- Kernvraag is: in hoeverre wijkt dat model af van de werkelijkheid?
- Om de werkelijkheid goed te benaderen, is een voldoende grote steekproef nodig
- Een beter model is een model met een kleine SD (weinig spreiding, scores doen recht
aan M)
- Probleem: elke steekproef is anders!
o Verschillende steekproeven hebben verschillende Ms
o Ook deze steekproefverdeling is een normaalverdeling
o Op basis van de M en SD uit de steekproef schatten we de M en SD in de
populatie
Significantie(niveau)
- Op die manier vergelijken we de scores (data uit steekproef) met het model
(hypothese)
o H1: studenten halen meer dan een 6.0 voor het tentamen
o H0: studenten halen niet meer dan een 6.0 voor het tentamen
o Data: M uit de steekproef is 6.8
- Vraag is dan: wijkt 6.8 significant af van 6.0?
3
, - Bij een significant resultaat is de score zo afwijkend in de normaalverdeling, dat die
niet hoort bij de verdeling waarbij de score minder dan een 6.0 is
Eenzijdig/tweezijdig toetsen
- Eenzijdig = een richting
o A is groter dan B
o B is groter dan A
- Tweezijdig = geen richting
o A is niet B (dus ‘A is groter dan B’ of ‘B is groter dan A’)
4