Sta$s$ek 2
BWB221
College 1.
Sta$s$sch vs. inhoudelijk verband
Sta&sche verband ≠ Daadwerkelijk verband
Data / me&ng ßà Interpreta&e a.d.h.v. inhoudelijke theorie
Is een verband in gemeten data betekenisvol (significan&e, p-waarde)? En zo ja, in welke
mate? à Sta&sche toetsen
Sta&s&sche toetsen = in welke mate de totale spreiding in de gemeten uitkomsten
systema&sch is (en niet-systema&sch)
• Systema&sche spreiding = in hoeverre de gemeten waarden systema&sch variëren
aJankelijk van bepaalde andere grootheid
Voorbeeld: Spreiding
Niet alle proefpersonen hebben dezelfde waarde voor X en Y, dus
er zit spreiding in de variabelen.
Elke proefpersoon is gemeten op twee waarden: X en Y
In hoeverre co-variëren de waarden van X en Y over proefpersonen
(= in hoeverre is de spreiding gezamenlijk?)
Som van aantal punten van bijv. waarde X of Y: ∑
Proefpersoon Gemiddelde X Gemiddelde Y Afwijking X Afwijking Y Spreiding X Spreiding Y
xi yi
1 1 9 1 – 4,2 = -3,2 9 – 6,8 = 2,2 (- 3,2)2 = 2,22 =
2 3 1,5 3 – 4,2 = -1,2 1,5 – 6,8= -5,3 (-1,2)2 = (-5,3)2 =
3 3,8 4,2 3,8 – 4,2=-0,4 4,2 – 6,8 =-2,6 (-0,4)2 = (-2,6)2 =
4 2 12,5 2 – 4,2 = -2,2 12,5 – 6,8=5,7 (-2,2)2 = 5,72 =
5 5 6 5 – 4,2 = 0,8 6 – 6,8 = -0,8 0,82 = (-0,8)2 =
6 7 9 7 – 4,2 = 2,8 9 – 6,8 = 2,2 2,82 = 2,22 =
! = 80,6 ! = 129,3 ! =? !=?
n = 19 n = 19 n – 1 = 18 n -1 = 18
X = 80, = X = 129, =
4,2 6,8
T-toets (3 varia&es)
1. OnaJankelijke t-toets (Independent sample t-test): Het vergelijken van 2
gemiddelden van verschillende groepen &jdens één me&ng
2. AJankelijke t-toets (Paired samples t-test): Het vergelijken van twee me&ng in één
groep
3. One sample test: Het vergelijken van gemiddelde waarde in één groep met constante
1
,OnaAankelijke t-toets
Stap 1: hypothese opstellen
• Nulhypothese (H0): “Er is geen effect.” (Alleen toeval speelt een rol).
• Alterna$eve-/onderzoekshypothese (H1): “Er is wel een effect.” (O\ewel verschil in
resultaat tussen groepen is niet 0).
Onderzoeksvoorbeeld
Tennisgroep A à Tradi&onele training: inslijpen van gewenste (ideale) beweging door deze
eindeloos te herhalen (‘drillen’).
Tennisgroep B à Differen&eel leren: bewegingsuitvoering sterk variëren.
Steekproef resultaat: Groep B slaat na de training gemiddeld harder en nauwkeuriger.
Is dit resultaat toevallig of komt het door die training?
à Sta&s&sch hypotheses toetsen gee\ ons een besliscriterium.
- H0: “Er is geen effect van de training.” – Ze slaan gemiddeld even hard. Alleen toeval
zorgt voor verschillen tussen beide groepen.
- H1: “Er is een trainingseffect effect.” – Er is een verschil in gemiddelde slagsnelheid.
Verschil in resultaat tussen groepen is niet 0.
Nulhypothese proberen we met onze sta&s&sche toets op het steekproefresultaat te
verwerpen.
Voorbeeld: De training hee1 geen effect op de gemiddelde slagsnelheid.
Als het lukt om sta&s&sch de nulhypothese te verwerpen is de alterna&eve hypothese H1
aangenomen.
Voorbeeld: De training hee1 een effect op de gemiddelde slagsnelheid.
Eenzijdige versus tweezijdige hypothese
Eenzijdige hypothese Tweezijdige hypothese
(duidelijke rich&ng!) (… verschil tussen …)
H0: μstandaard ≥ μdiff H0: μstandaard = μdiff
H1: μstandaard < μdiff H1: μstandaard ≠ μdiff
Voorbeelden van eenzijdig of tweezijdig toetsen
1. Een onderzoeker wil weten of er een verschil is in studiegedrag tussen BW studenten
en psychologie studenten.
Tweezijdig: ze willen weten of er een verschil is.
H0: μBW studenten = μpsychologie studenten
H1: μ BW studenten ≠ μpsychologie studenten
2. Wanneer thuis een glas bij een onderzoeker valt, ziet hij dat een man sneller reageert
dan een vrouw. De onderzoeker is nieuwsgierig geworden en wil testen en toets of de
mannen gemiddeld een betere reac&e&jd hebben dan vrouwen.
Eenzijdig: de onderzoeker gaat ervan uit dat mannen een beter reac&evermogen hebben,
dus een kleinere reac&e&jd.
H0: μman ≥ μvrouw
H1: μman < μvrouw
2
,Stap 2: veronderstellingen onaJankelijke t-toets m.b.t. meetniveau en verdeling
• Waarneming aselect (niet geselecteerd wie wel/niet mee mogen doen) en
onaJankelijk
• Twee onaJankelijke steekproeven
• AJankelijke variabelen minstens interval niveau
• Waarden aJankelijk van normaal verdeeld (in elke groep) à Histogram met
normaalcurve of kengetallen (skewness, kurtosis)
o Niet te veel afwijken van normale verdeling, anders kloppen formules niet
meer
• Standaarddevia&e van popula&e onbekend
Onderzoek verdeling o.b.v. kengetallen
Bij perfecte normaal verdeling van data:
- Gemiddelde = mediaan = modus
- 99,7% van waarnemingen binnen 3
standaarddevia&es van gemiddelde
- Skewness (scheeJeid) = 0
- Kurtosis (platheid) = 0
- Als < -1 of > 1 dan data niet normaal verdeeld à Geen gebruik parametrisch toetsen!
Stap 3: Toetsgrootheid t berekenen
• Het verschil tussen 2 steekproef uitkomsten wordt uitgedrukt in toetsgrootheid t
Formule toetsgrootheid onaJankelijke t-toets
Stap 4: Kri&eke gebied bepalen
• Kri&eke waarde (Tk) is aJankelijk van alpha (α = 5%) en aantal vrijheidsgraden (df)
o Wanneer t buiten Tk ligt, wordt H0 niet verworpen
o Wanneer t in Tk ligt, wordt H0 verworpen en is het significant
Stap 5: Conclusie rapporteren
Gemiddelde van groep 1 (M=..., SD=…) is significant verschillend van gemiddelde van groep 2
(M=…, SD=…), t(df)=…, p < 0.05.
Gemiddelde van groep 1 (M=..., SD=…) is niet significant verschillend van gemiddelde van
groep 2 (M=…, SD=…), t(df)=…, p > 0.05.
3
, Onderzoeksvoorbeeld: OnaAankelijke t-toets tweezijdig
Is er een verschil in therapietrouw tussen ouderen die thuis voorgeschreven fysio oefeningen
doen en ouderen die trainen met een exergame?
We registreren voor beide groepen het aantal uren oefenen in een maand = aJankelijke
variabele.
Beschrijvende sta&s&ek:
Meetniveau a=ankelijke variabele = ra@o.
Centrummaat en spreidingsmaat = Gemiddelde en standaarddevia@e.
Vooronderstellingen onaJankelijke t-toets
• Waarnemingen aselect?
• Twee onaJankelijke steekproeven (een me&ng bij twee verschillende groepen)?
• AJankelijke variabele minstens interval meetniveau?
• Steekproefomvang groot genoeg? n1= 40; n2 = 42
• Normaal verdeeld?
o Steekproefdata checken van beide groepen!
Hypotheses
Onderzoekshypothese:
Is er een verschil in therapietrouw (het gemiddelde aantal uren oefenen per week)
tussen exergamers en de fysio groep?
Formuleren H0 en H1 in sta&s&sch model
H0: μgame = μfysio
H1: μgame ≠ μfysio (tweezijdig!)
Bereken de toetsgrootheid
In dit geval hebben beide groepen dezelfde standaarddevia&e: sd = 2,5, dus
t = 1.81
De t-waarde is de maat voor de grooye van het verschil in het gemiddelde van beide
steekproeven, waarbij rekening wordt gehouden met de spreiding rondom het gemiddelde
van elke groep.t-waarde kan zowel posi&ef als nega&ef zijn!
4