Samenvatting Toetsende Statistiek. Alan Agresti, Christine Franklin. Statistics: The Art and
Science of Learning from Data
&
Met bijbehorende les/leerdoelen
&
Aanvullende aantekeningen uit de hoorcolleges
Inhoudsopgave
Hoorcollege 1................................................................................................................................................ 2
Hoofdstuk 10: Comparing Two Groups........................................................................................................... 3
Hoofdstuk 10.1: Categorical Response: Comparing Two Proportions.................................................................4
Hoofdstuk 10.2: Quantitative Response: Comparing Two Means.......................................................................4
Hoofdstuk 10.3: Other Ways of Comparing Means and Comparing Proportions................................................4
Hoorcollege 2...................................................................................................................................................6
Hoofdstuk 10.4: Analyzing Dependent Samples..................................................................................................6
Hoofdstuk 10.5: Adjusting for the Effects of Other Variables..............................................................................7
Hoorcollege 3...................................................................................................................................................8
Hoofdstuk 11: Analyzing the Association Between Categorical Variables........................................................9
Hoofdstuk 11.1: Independence and Dependence (Association)...........................................................................9
Hoofdstuk 11.2: Testing Categorical Variables for Independence.....................................................................10
Hoofdstuk 11.3: Determining the Strength of the Association..........................................................................10
Hoofdstuk 11.4: Using Residuals to Reveal the Pattern of Association.............................................................12
Hoofdstuk 11.5: Small Sample Sizes: Fisher’s Exact Test...................................................................................12
Hoorcollege 5.................................................................................................................................................13
Hoofdstuk 12: Analyzing the Association Between Quantitative Variables....................................................13
Hoofdstuk 12.1: Model How Two Variables Are Related...................................................................................13
Hoofdstuk 12.2: Describe Strength of Association.............................................................................................14
Hoorcollege 6.................................................................................................................................................15
Hoofdstuk 12.3: Make Inferences About the Association..................................................................................16
Hoofdstuk 12.4: How the Data Vary Around the Regression Line.....................................................................16
Hoofdstuk 12.5: Exponential Regression: A Model for Nonlinearity..................................................................17
Hoorcollege 7.................................................................................................................................................17
Hoofdstuk 13: Multiple Regression............................................................................................................... 18
Hoofdstuk 13.1: Using Several Variables to Predict a Response........................................................................18
Hoofdstuk 13.2: Extending the Correlation and R2 for Multiple Regression.....................................................19
Hoorcollege 8 (Binaire onafhankelijke variabelen).......................................................................................19
Hoofdstuk 13.3: Using Multiple Regression to Make Inferences.......................................................................21
Hoofdstuk 13.4: Checking a Regression Model Using Residual Plots................................................................21
Hoofdstuk 13.5: Regression and Categorical Predictors....................................................................................22
Hoorcollege 9.................................................................................................................................................22
Hoofdstuk 13.6: Modeling a Categorical Response...........................................................................................22
1
, Logistische regressie (extra literatuur)...............................................................................................................23
Hoorcollege 10 (Binaire onafhankelijke variabelen).....................................................................................23
Hoofdstuk 14: Comparing Groups: Analysis of Variance Methods.................................................................24
Hoofdstuk 14.1: One-Way ANOVA: Comparing Several Means.........................................................................24
Hoofdstuk 14.2: Estimating Differences in Groups for a Single Factor..............................................................24
Hoorcollege 11...............................................................................................................................................24
Hoofdstuk 14.3: Two-Way ANOVA.....................................................................................................................26
Hoorcollege 12...............................................................................................................................................27
Hoofdstuk 15: Nonparametric Statistics....................................................................................................... 28
Hoofdstuk 15.1: Compare Two Groups by Ranking...........................................................................................28
Hoofdstuk 15.2: Nonparametric Methods for Several Groups and for Matched Pairs......................................28
Hoorcollege 13...............................................................................................................................................29
Hoorcollege 1
Toetsende statistiek wordt gebruikt om een uitspraak te doen over de populatie op basis van
beschrijvende statistieken in de steekproef.
Hierdoor kan je antwoord geven op vragen zoals: zijn vrouwen slimmer dan mannen.
Verhoogt wiskunde training de studie prestatie?
Er zijn twee soorten TS
o Schatten van populatieparameters op basis van gevonden gegevens in de steekproef
puntschattingen en BI
o Toetsen van hypothesen over populatieparameters op basis van gevonden gegevens in
de steekproef toetsingsgegevens en testresultaten (t-waarden, z-waarden).
Betrouwbaarheidsinterval
Inferentiële statistiek: steekproef populatie.
o Je wil weten wat de proportie (p) is in een populatie, daarom neem
je een steekproef (P-hoedje).
De populatieparameter heeft een vaste waarde (p) er is een exact
aantal, maar die aantallen weten we niet, dus p is onbekend.
De steekproefwaarde kan worden gebruikt als een schatting (p-hoedje) van de
populatieparameter deze schatting kent een bepaalde onzekerheid.
o Wanneer een steekproef wordt getrokken om iets te zeggen over een vrouwelijke
populatie, kan het zijn dat er in de ene steekproef meer vrouwen aanwezig zijn dan in de
andere.
o Gemiddelde over alle mogelijke steekproeven, zal de gemiddelde waarde gelijk zijn aan
de populatieparameter hoe meer steekproeven, hoe beter.
De precisie van de schatting geven we aan met een BI/CI
o Bij een proportieberekening (z-score)
o Bij een gemiddelde berekening (t-score)
o De ondergrens afronden naar beneden,
de bovengrens afronden naar boven!
Het BI heeft plausibele waarden voor de
populatieparameter op basis van:
o De puntschatting (gevonden
proportie/gemiddelde/verschil enz)
o Kritieke grenzen behorend bij de
toetsingsgrootheid (t, z, etc).
o Standaardfout van de puntschatting
o Houdbaarheid vd aannamen die je doet
(bijv. normaliteit).
Toetsen Wanneer je weet welke toets je moet
gebruiken, kom je uit op de juiste berekening en dus de juiste conclusies!
Stap 1: Assumpties
o Proportie willekeurige getrokken, categorisch, steekproef np > 15 en n(1 – p) > 15
2
, Stap 2: Hypothese H0 : p = p0 , geen effect. Ha : p ≠ wel effect (dus groter, kleiner of niet
gelijk)
o Zonder hypothese, kan er geen kans worden berekend.
Stap 3: Toetsingsgrootheid voor z-toets wordt gebruik gemaakt van een andere
standaardfout dan bij het BI (Se0, ipv Sep). De SE onder de aanname dan H0 waar is.
Stap 4: p-waarde wat is de kans dat we de gevonden of nog extremere waarde
zouden vinden als de nulhypothese waar is? (overschrijdingskans van de gevonden
toetsingsgrootheid in de z-tabel opzoeken).
o Eenzijdige kritieke z-waarde en a (0,05) : 1.64 (of -1,64)
o Tweezijdige kritieke z-waarde en a (0,05): 1.96 (of -1,96)
o Tweezijdige kritieke z-waarde en a (0,10): 1,64 (en -1,64)
o Tweezijdige kritieke z-waarde en a (0,01): 2,58 (en -2,58)
Stap 5: conclusie Significant, wat betekent dat?
o P-waarde < ingezette alfa = significant (verwerp H0)
o P-waarde > ingezette alfa = niet significant (verwerp H0 niet)
o De koppeling met het BI: zie formule hierboven (als je hypothese waarde buiten het BI ligt,
is het significant)
Voorbeeld We meten de intelligentie van alle aanwezige studenten (n=120) met een IQ test. De
gemiddelde IQ-score is 111 met een SD van 19. Wijkt dit af van het gemiddelde 100?
Stap 1: Assumpties
o Gemiddelde willekeurige getrokken, kwantitatief (intelligentie), normaal verdeeld.
o Soms: variantie in populatie bekend: meestal onbekend.
Eenzijdig: robuust tegen schending bij n > 30, tweezijdig: altijd robuust
We gaan tweezijdig toetsen
Stap 2: Hypothese H0 : µ = µ100. Ha : p ≠ 100
Stap 3: Toetsingsgrootheid voor de t-toets wordt gebruik gemaakt van een andere
standaardfout dan bij het BI (Sex, ipv Sep). De Standaardfout onder de aanname dan H0
waar is 19/wortel van 120 = 1,73. 111–100/1,73 = 6,36 (One sample t-test)
o De gevonden steekproef ligt 6,34 Se’s af van de populatiewaarde, onder de aanname
dat het gemiddelde normaal is verdeeld. Is dit een extreme waarde?
Stap 4: p-waarde wat is de kans dat we de gevonden of nog extremere waarde zouden
vinden als de nulhypothese waar is? (overschrijdingskans van de gevonden
toetsingsgrootheid in de t-tabel opzoeken).
o T-tabel: df = 120. De t-waarde van 0,025 is 1,96 (tweezijdig toetsen, dus 0,025 aan de
ene kant en 0,025 aan de andere kant).
o 1,96 is hetzelfde als de z-toets met het 95% BI (bij een voldoende grote steekproef).
Stap 5: conclusie Significant, wat betekent dat?
o Toetsingsgrootheid > ingezette alfa = significant (verwerp H0) verwerp H0, want de P-
waarde is veel kleiner dan de gevonden t-waarde.
o Toetsingsgrootheid < ingezette alfa = niet significant (verwerp H0 niet)
o De aanwezige studenten in de steekproef scoorden significant hoger dan het gemiddelde.
o Koppeling met het BI: 111 – 1,96 x 1,73 = 107,6 en 111 + 1,96 x 1,73 = 114,4
o De score valt niet in het BI, dus significant.
Hoofdstuk 10: Comparing Two Groups
Binary variabele categorische variabele die een groep specificeert met twee mogelijke uitkomsten
(ja/nee, waar/niet waar)
Bijvoorbeeld: mannen en vrouwen
Heet ook wel de verklarende variabele/afhankelijke variabele
Bivariate methode de statistische methode die gebruikt wordt wanneer er twee variabelen zijn.
Worden gebruikt om twee groepen te vergelijken.
Een afhankelijke en een onafhankelijke variabele
Bijvoorbeeld: onderzoeken wie meer drinkt, mannen of vrouwen.
Response variabele De uitkomst variabele waarin vergelijkingen worden gemaakt.
Bijvoorbeeld: Het wel of niet drinken.
Ook wel de Onafhankelijke variabele
Je wil onderzoeken hoe drinken afhangt van gender, niet hoe gender afhangt van drinken.
scheidt aan de hand van hun waarden een verklarende variabele (roken, ja of nee).
3
, Hoofdstuk 10.1: Categorical Response: Comparing Two Proportions
Onafhankelijke steekproeven gerandomiseerde experimenten die deelnemers aselect toewijzen
op twee verschillende behandelingen.
Maar ook observatiestudies die deelnemers in groepen
Categorische response variabele voorspellingen vergelijken groepen aan de hand van hun
populatie proportie in een specifieke categorie.
P1 = groep 1 en N1 = steekproefgrootte
P2 = groep 2 en N2 = steekproefgrootte
De proportie/specifieke steekproefgrootte om de populatieparameters te bepalen
(P1 – P2) om te bepalen wat het verschil is tussen de twee populaties.
Standaardfout Geeft de spreiding tussen het gemiddelde van de steekproefverdeling (de SD van
de geschatte P1 – P2).
Helpt om te voorspellen hoe dicht bij een schatting zit bij de
proportiewaarde
De formule van de standaardfout van (P1 – P2) is
Betrouwbaarheidsinterval voor de toetsingsgrootheid in twee populatieproporties Voegt de
foutenmarge op basis van de standaardfout erbij op (en trekt deze eraf).
Op basis van de centrale limiet stelling.
De steekproevenverdeling van P1 – P2 is normaal verdeeld wanneer de steekproef
voldoende groot is.
Het interpreteren van de BI
0 valt in het BI het is geloofwaardig dat µ1 = µ2 (er is een klein verschil)
(p1 – µ 2) bevat positieve nummers, dan is p1 > p2.
(p1 – p2) bevat negatieve nummers, dan is p1 < p2.
Het BI interval laat zien hoe groot de verschillen zijn.
Leerdoel: De student kent de belangrijkste parametrische statistische
toetsen, de vereiste aannamen en hun toepasbaarheid.
Significantie toetsing om populatieproporties te vergelijken
1. Aannames
o Een categorische response of onafhankelijke variabele voor twee
groepen
o Onafhankelijke aselecte steekproeven met aselecte toewijzing of
een gerandomiseerd experiment
o N1/N2 zijn groot genoeg dat er ten minste vijf successen en vij falen zijn in iedere groep
(wanneer de tweezijdige toets wordt gebruikt)
o Bij eenzijdig: 10 successen en 10 falen
2. Hypothesen
o Null H0 : P1 = p2 (dat is p1 – p2 = 0)
o Alternatief Ha : p1 ≠ p2 (eenzijdige Ha is ook mogelijk)
3. Toetsingsgrootheid zie formule
4. P-waarde tweezijdige toets van waarden die extremer zijn dan de geobserveerde z (uit 3),
als H0 waar zou zijn (plaatje)
5. Conclusie Kleinere p-waarden geven sterker bewijs tegen H0 en ondersteunen Ha.
Interpreteer de P-waarde in context. Wanneer een beslissing nodig is, verwerp H0 wanneer
de p-waarde < 0,05
De standaardfout om twee statistieken/schattingen te vergelijken
De formule zorgt ervoor dat we een BI maken voor het verschil tussen twee
proporties.
o Dit heet de gepoolde proportie (10.3).
Hoofdstuk 10.2: Quantitative Response: Comparing Two Means
Hoofdstuk 10.3: Other Ways of Comparing Means and Comparing Proportions
Kwantitatieve response variabelen twee gemiddelden vergelijken.
X1 = groep 1 en N1 is steekproefgrootte
X2 = groep 2 en N2 is steekproefgrootte
Standaardfout berekenen: De formule gebruiken van Se = s/wortel van n van beide datasets.
4