Uitgebreide begrippenlijst onderzoekspracticum 2
Hoorcolleges, Literatuur, aanvullende aantekeningen & tentamentips
+ overzicht gebruikte symbolen, formules, toetsen + oefenopgaven inclusief uitwerking
Ilse v. Meurs 2022-2023
Hoorcolleges
1. Toetsen & Oneway designs
2. T-toetsen
3. Oneway ANOVA
4. ANOVA: Meervoudige vergelijkingen
5. Kritisch denken
6. Niet-parametrische toetsen
7. Factorial Designs
8. Two-way ANOVA: Tweeweg variantieanalyse
9. Quasi-experimentele designs
10. Enkelvoudige lineaire regressie
11. Meervoudige lineaire regressie
Betekenis symbolen OZP2
𝜶 significantieniveau s standaarddeviatie / standaardafwijking
> hoe groot de kans mag zijn dat we van de steekproef
het fout hebben (vaak 0.05; 5%)
df aantal vrijheidsgraden r correlatie
N steekproefgrootte d effectgrootte (Cohen’s d)
Sp Standaarddeviatie Effectgrootte Oneway ANOVA
- geeft aan in hoeverre de totale
variantie wordt verklaard door
de variantie tussen groepen
De ‘gepoolde’ variantie
(SSG)
= schatting van de standaarddeviatie
binnen de groepen op basis van alle Verklaarde variantie: regressie (SPSS)
groepen (schatter van de - enkelvoudige regressie: geeft
samengestelde standaarddeviatie) aan in hoeverre de punten op de
→ staat ook in ANOVA tabel (MSE) → regressielijn liggen
als je van MSE naar formule t-waarde - multipele regressie: geeft aan
wil, moet je dus eerst worteltrekken hoe goed de waarden van y
(dan krijg je Sp) voorspeld worden door de
predictoren
,W1 en W2 som van rangnummers van beide b1 regressiecoëfficiënt
groepen bij non-parametrische toets
W+ som van alle rangnummers die horen ρ (rho): correlatie in de populatie
bij een positief verschil bij
non-parametrische toets
Ni aantal proefpersonen per groep bij 𝛃 (beta): regressiecoëfficiënt in de
non-parametrische toets populatie
Ri som van rangnummers per groep bij t* kritieke t-waarde, dus de waarde van t
non-parametrische toets bij 95% zekerheid
W+ som van positieve rangnummers bij SE Standaard error / standaardfout
Wilcoxon Signed Rank Test SEbj Standaard error die hoort bij b-waarde
die we testen
μW+ verwachte waarde Wilcoxon Signed p N - p - 1 bij multipele regressie betekent
Rank Test het aantal predictoren (voorspellers)
Toetsboom Oneway
,HC1 Inleiding
Inleiding obv steekproef wil je uitspraken doen over de populatie
- populatieparameter weten we niet → schatten o.b.v. steekproef parameters
- testen om te weten hoe goed deze schatting is
Verdelingen
Steekproef = willekeurige groep uit de populatie
50 studenten random uit populatie (populatie = alle studenten uni leiden)
Steekproefverdeling = verdeling van enkele steekproef; bijv gebaseerd op gemiddelde
verdeling op basis van gemiddelde scores studenten
Steekproevenverdeling = theoretische verdeling die ontstaat als je uit de populatie
random steekproeven gaat trekken > verdeling van alle gemiddelden van verschillende
steekproeven
proces steekproefverdeling heel vaak herhalen tot 50 verschillende steekproeven
Populatieverdeling = alle waarden van de populatie, gemiddelde > gemiddelde is gelijk
aan populatiegemiddelde (μ)
alle studenten van uni meegenomen
Centrale limietstelling = naarmate steekproefomvang groter is (N), zal de
steekproefverdeling van het gemiddelde meer lijken op een normale verdeling > dit geldt
ongeacht de vorm van de populatieverdeling
P-waarde P-waarde = maat voor de kans dat de Ho ten onrechte is verworpen (en het gevonden
verschil tussen onderzoeksgroepen dus in werkelijkheid op toeval berust) > P van 0.05
betekent 5% kans dat wij ten onrechte zeggen dat er een effect is (Type-I)
Stappenplan toetsen 1. Hypothese opstellen
- H0: nulhypothese = stelt altijd dat er geen verandering / verschil / relatie
bestaat → we testen of we Ho kunnen verwerpen
- Ha: alternatieve hypothese = geeft aan wat voor verandering / verschil /
relatie er dan wel zou zijn
● Tweezijdig (standaard): we verwachten een verschil te zien en
weten niet wat het verschil is
wie er beter in rekenen; jongens / meisjes?
- voordeel: je hoeft geen keuze te maken over richting Ha: je
bent ingedekt
- nadeel: verwerpingsgebied van 5% moet over 2 kanten
worden verdeeld; kans dat steekproefgemiddelde bij
eenzijdig wel in verwerpingsgebied zou liggen, terwijl bij
, tweezijdig niet
● Eenzijdig (links / rechts): verwachten dat ene groep beter is dan
andere > alleen als het maar één kant op kan gaan
zijn meisjes beter in rekenen dan jongens?
2. Steekproevenverdeling vaststellen
- Steekproevenverdeling = theoretische verdeling die ontstaat als je uit
de populatie random steekproeven zou gaan trekken
- hoe meer proefpersonen, hoe normaler verdeling zal worden
- N groot genoeg? > automatisch vanuit gaan dat het normaal
verdeeld is
- Centrale limietstelling = hoe groter de steekproef (N), hoe meer
de steekproevenverdeling van het gemiddelde op
normaalverdeling lijkt
3. Toets-statistiek uitrekenen
- toetsstatistiek = geeft aan hoeveel de steekproef statistiek en de
populatieparameter van elkaar verschillen
- hoe meer die van elkaar verschillen, hoe minder waarschijnlijk dat je Ho
waar is
- populatieparameter niet bekend → testen Ho > dan hoef je de ware
populatieparameter niet te weten, alleen de populatieparameter die je zou
hebben als de Ho waar zou zijn
4. Verwerpingsgebied bepalen
- verwerpingsgebied = geeft aan welke waardes extreem genoeg zijn om
aan te geven dat we Ho kunnen verwerpen
- nooit 100% zeker weten of we Ho moeten verwerpen → onderzoeker =
vrij om te bepalen hoe zeker je wil zijn (5% = gebruikelijk) →
aangegeven d.m.v. significantieniveau (𝜶)
- 𝜶: hoe groot de kans mag zijn dat we het fout hebben (vaak 0.05; 5%) =
gelijk aan type I-fout = kans dat we Ho foutief verwerpen
- let op: bij tweezijdig toetsen: het verwerpingsgebied wordt over 2 delen verdeeld
5. Statistische conclusie trekken
- door toets statistiek te berekenen + bijbehorende p-waarde op te zoeken
+ te vergelijken met gekozen significantieniveau kan bepaald worden of
toets statistisch significant is
- P < 𝜶 = significant → Ho verwerpen
6. Inhoudelijke conclusie trekken
- o.b.v. statistische conclusie inhoudelijke conclusie trekken
- kan je de Ho verwerpen of niet?
- wat betekent dat?
- Ha neem je officieel niet aan, maar je noemt deze als verklaring
,Type-I Fout (Probability A) het verwerpen van de Ho terwijl Ho waar is > je concludeert dat er een
effect is terwijl het er niet is
Type-II Fout (Probability B) het falen van het verwerpen van de Ho terwijl Ho niet waar is > we
missen een effect dat er daadwerkelijk is
HC1 Soorten onderzoek
Soorten onderzoek
Beschrijvend (één-groepsonderzoek)
onderzoek - inventarisatie van feiten (gemiddelden, medianen, standaarddeviaties e.d.) >
geen conclusies
(Cor)relationeel samenhang tussen 2 of meer variabelen → alleen uitspraken doen over de samenhang /
het verband / de relatie tussen de variabelen (geen causaliteit) > dus geen oorzaak /
gevolg
Quasi-experimenteel samenhang tussen variabelen, groepen krijgen een andere behandeling
→ voorzichtig met causale relaties, want geen echt experiment
Experimenteel samenhang tussen variabelen, groepen krijgen een andere behandeling, proefpersonen
worden random toegewezen > causale uitspraken mogelijk
Designs: Experimentele designs: volgen de regels (beter betrouwbare conclusies, meer info)
Experimenteel VS - randomised groups: iedereen random verdeeld over de condities
Quasi-experimenteel - Matched-subjects design: proefpersonen verdeeld in groepjes met subject
variabele (vb leeftijd / IQ) > vervolgens uit deze groepjes random verdeeld over
condities
- Repeated measures design: iedereen ondergaat alle condities in bepaalde
volgorde, met metingen tussendoor (pretest / posttest)
Quasi-experimentele designs: breken een regel (maturatie, history-effecten,
selection-by-maturation)
- One group designs: breekt de regel dat er vergelijkbare groepen zijn > posttest
only & pretest-posttest
, - Time series: breekt regel dat de andere variabelen gelijk worden gehouden >
longitudinale / cross-sectionele designs
Doelen herkennen ● Beschrijven (hoe vaak en in welke vorm komt iets voor) → cijfers noemen,
hoeveel komt iets voor
● Voorspellen (ontdekken bepaalde samenhang) → correlatie berekend
● Verklaren (causale relatie ontdekken) → correlatie + causatie
Onderzoeksopzet 3 gouden regels
1. manipuleer ten minste 1 variabele
2. zorg voor vergelijkbare groepen
3. houd andere variabelen strikt gelijk
HC1 Validiteit & Variabelen
Interne validiteit zegt iets over kwaliteit van onderzoeksopzet: meet je wat je wil meten?
Je resultaten zijn valide, als de resultaten die je meet ook daadwerkelijk het gevolg zijn
van jouw opzettelijke verandering (of manipulatie) > is het effect uit je onderzoek alleen
toe te schrijven aan de manipulatie?
Externe validiteit gaat over mate waarin je de conclusies van jouw onderzoek kunt generaliseren naar de
populatie > is het onderzoek generaliseerbaar naar de populatie, in verschillende
situaties en/of over tijd?
Soorten variabelen - om conclusies te kunnen trekken + bepalen welke toets moet je weten wat de
afhankelijke & onafhankelijke variabelen zijn + de meetniveaus ervan
Afhankelijke variabele (Y)
- altijd 1 + de oorzaak
Onafhankelijke variabele (X)
- 1 of meer + gevolg