100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Toetsende statistiek samenvatting boek & college aantekeningen $8.05
Add to cart

Summary

Toetsende statistiek samenvatting boek & college aantekeningen

 29 views  0 purchase
  • Course
  • Institution
  • Book

Een allesomvattende samenvatting van het vak toetsende statistiek. Een vak dat iedereen angst inboezemd! Ik heb dit vak in één keer gehaald met een 7 aan met deze aantekeningen. Na ieder samengevat hoofdstuk komen de belangrijkste aspecten terug vanuit de hoorcolleges met voorbeeldsommen. Ik hoop...

[Show more]

Preview 4 out of 31  pages

  • No
  • 10 t/m 15
  • November 29, 2021
  • 31
  • 2021/2022
  • Summary
avatar-seller
Samenvatting Toetsende Statistiek. Alan Agresti, Christine Franklin. Statistics: The Art and
Science of Learning from Data
&
Met bijbehorende les/leerdoelen
&
Aanvullende aantekeningen uit de hoorcolleges

Inhoudsopgave
Hoorcollege 1................................................................................................................................................ 2

Hoofdstuk 10: Comparing Two Groups........................................................................................................... 3
Hoofdstuk 10.1: Categorical Response: Comparing Two Proportions.................................................................4
Hoofdstuk 10.2: Quantitative Response: Comparing Two Means.......................................................................4
Hoofdstuk 10.3: Other Ways of Comparing Means and Comparing Proportions................................................4
Hoorcollege 2...................................................................................................................................................6
Hoofdstuk 10.4: Analyzing Dependent Samples..................................................................................................6
Hoofdstuk 10.5: Adjusting for the Effects of Other Variables..............................................................................7
Hoorcollege 3...................................................................................................................................................8

Hoofdstuk 11: Analyzing the Association Between Categorical Variables........................................................9
Hoofdstuk 11.1: Independence and Dependence (Association)...........................................................................9
Hoofdstuk 11.2: Testing Categorical Variables for Independence.....................................................................10
Hoofdstuk 11.3: Determining the Strength of the Association..........................................................................10
Hoofdstuk 11.4: Using Residuals to Reveal the Pattern of Association.............................................................12
Hoofdstuk 11.5: Small Sample Sizes: Fisher’s Exact Test...................................................................................12
Hoorcollege 5.................................................................................................................................................13

Hoofdstuk 12: Analyzing the Association Between Quantitative Variables....................................................13
Hoofdstuk 12.1: Model How Two Variables Are Related...................................................................................13
Hoofdstuk 12.2: Describe Strength of Association.............................................................................................14
Hoorcollege 6.................................................................................................................................................15
Hoofdstuk 12.3: Make Inferences About the Association..................................................................................16
Hoofdstuk 12.4: How the Data Vary Around the Regression Line.....................................................................16
Hoofdstuk 12.5: Exponential Regression: A Model for Nonlinearity..................................................................17
Hoorcollege 7.................................................................................................................................................17

Hoofdstuk 13: Multiple Regression............................................................................................................... 18
Hoofdstuk 13.1: Using Several Variables to Predict a Response........................................................................18
Hoofdstuk 13.2: Extending the Correlation and R2 for Multiple Regression.....................................................19
Hoorcollege 8 (Binaire onafhankelijke variabelen).......................................................................................19
Hoofdstuk 13.3: Using Multiple Regression to Make Inferences.......................................................................21
Hoofdstuk 13.4: Checking a Regression Model Using Residual Plots................................................................21
Hoofdstuk 13.5: Regression and Categorical Predictors....................................................................................22
Hoorcollege 9.................................................................................................................................................22
Hoofdstuk 13.6: Modeling a Categorical Response...........................................................................................22

1

, Logistische regressie (extra literatuur)...............................................................................................................23
Hoorcollege 10 (Binaire onafhankelijke variabelen).....................................................................................23

Hoofdstuk 14: Comparing Groups: Analysis of Variance Methods.................................................................24
Hoofdstuk 14.1: One-Way ANOVA: Comparing Several Means.........................................................................24
Hoofdstuk 14.2: Estimating Differences in Groups for a Single Factor..............................................................24
Hoorcollege 11...............................................................................................................................................24
Hoofdstuk 14.3: Two-Way ANOVA.....................................................................................................................26
Hoorcollege 12...............................................................................................................................................27

Hoofdstuk 15: Nonparametric Statistics....................................................................................................... 28
Hoofdstuk 15.1: Compare Two Groups by Ranking...........................................................................................28
Hoofdstuk 15.2: Nonparametric Methods for Several Groups and for Matched Pairs......................................28
Hoorcollege 13...............................................................................................................................................29

Hoorcollege 1
Toetsende statistiek  wordt gebruikt om een uitspraak te doen over de populatie op basis van
beschrijvende statistieken in de steekproef.
 Hierdoor kan je antwoord geven op vragen zoals: zijn vrouwen slimmer dan mannen.
Verhoogt wiskunde training de studie prestatie?
 Er zijn twee soorten TS
o Schatten van populatieparameters op basis van gevonden gegevens in de steekproef
 puntschattingen en BI
o Toetsen van hypothesen over populatieparameters op basis van gevonden gegevens in
de steekproef  toetsingsgegevens en testresultaten (t-waarden, z-waarden).
Betrouwbaarheidsinterval
 Inferentiële statistiek: steekproef  populatie.
o Je wil weten wat de proportie (p) is in een populatie, daarom neem
je een steekproef (P-hoedje).
 De populatieparameter heeft een vaste waarde (p)  er is een exact
aantal, maar die aantallen weten we niet, dus p is onbekend.
 De steekproefwaarde kan worden gebruikt als een schatting (p-hoedje) van de
populatieparameter  deze schatting kent een bepaalde onzekerheid.
o Wanneer een steekproef wordt getrokken om iets te zeggen over een vrouwelijke
populatie, kan het zijn dat er in de ene steekproef meer vrouwen aanwezig zijn dan in de
andere.
o Gemiddelde over alle mogelijke steekproeven, zal de gemiddelde waarde gelijk zijn aan
de populatieparameter  hoe meer steekproeven, hoe beter.
 De precisie van de schatting geven we aan met een BI/CI
o Bij een proportieberekening (z-score)
o Bij een gemiddelde berekening (t-score)
o De ondergrens afronden naar beneden,
de bovengrens afronden naar boven!
 Het BI heeft plausibele waarden voor de
populatieparameter op basis van:
o De puntschatting (gevonden
proportie/gemiddelde/verschil enz)
o Kritieke grenzen behorend bij de
toetsingsgrootheid (t, z, etc).
o Standaardfout van de puntschatting
o Houdbaarheid vd aannamen die je doet
(bijv. normaliteit).
Toetsen  Wanneer je weet welke toets je moet
gebruiken, kom je uit op de juiste berekening en dus de juiste conclusies!
 Stap 1: Assumpties
o Proportie  willekeurige getrokken, categorisch, steekproef np > 15 en n(1 – p) > 15

2

,  Stap 2: Hypothese  H0 : p = p0 , geen effect. Ha : p ≠ wel effect (dus groter, kleiner of niet
gelijk)
o Zonder hypothese, kan er geen kans worden berekend.
 Stap 3: Toetsingsgrootheid  voor z-toets wordt gebruik gemaakt van een andere
standaardfout dan bij het BI (Se0, ipv Sep). De SE onder de aanname dan H0 waar is.
 Stap 4: p-waarde  wat is de kans dat we de gevonden of nog extremere waarde
zouden vinden als de nulhypothese waar is? (overschrijdingskans van de gevonden
toetsingsgrootheid in de z-tabel opzoeken).
o Eenzijdige kritieke z-waarde en a (0,05) : 1.64 (of -1,64)
o Tweezijdige kritieke z-waarde en a (0,05): 1.96 (of -1,96)
o Tweezijdige kritieke z-waarde en a (0,10): 1,64 (en -1,64)
o Tweezijdige kritieke z-waarde en a (0,01): 2,58 (en -2,58)
 Stap 5: conclusie  Significant, wat betekent dat?
o P-waarde < ingezette alfa = significant (verwerp H0)
o P-waarde > ingezette alfa = niet significant (verwerp H0 niet)
o De koppeling met het BI: zie formule hierboven (als je hypothese waarde buiten het BI ligt,
is het significant)

Voorbeeld  We meten de intelligentie van alle aanwezige studenten (n=120) met een IQ test. De
gemiddelde IQ-score is 111 met een SD van 19. Wijkt dit af van het gemiddelde 100?
 Stap 1: Assumpties
o Gemiddelde  willekeurige getrokken, kwantitatief (intelligentie), normaal verdeeld.
o Soms: variantie in populatie bekend: meestal onbekend.
 Eenzijdig: robuust tegen schending bij n > 30, tweezijdig: altijd robuust
 We gaan tweezijdig toetsen
 Stap 2: Hypothese  H0 : µ = µ100. Ha : p ≠ 100
 Stap 3: Toetsingsgrootheid  voor de t-toets wordt gebruik gemaakt van een andere
standaardfout dan bij het BI (Sex, ipv Sep). De Standaardfout onder de aanname dan H0
waar is  19/wortel van 120 = 1,73. 111–100/1,73 = 6,36 (One sample t-test)
o De gevonden steekproef ligt 6,34 Se’s af van de populatiewaarde, onder de aanname
dat het gemiddelde normaal is verdeeld. Is dit een extreme waarde?
 Stap 4: p-waarde  wat is de kans dat we de gevonden of nog extremere waarde zouden
vinden als de nulhypothese waar is? (overschrijdingskans van de gevonden
toetsingsgrootheid in de t-tabel opzoeken).
o T-tabel: df = 120. De t-waarde van 0,025 is 1,96 (tweezijdig toetsen, dus 0,025 aan de
ene kant en 0,025 aan de andere kant).
o 1,96 is hetzelfde als de z-toets met het 95% BI (bij een voldoende grote steekproef).
 Stap 5: conclusie  Significant, wat betekent dat?
o Toetsingsgrootheid > ingezette alfa = significant (verwerp H0)  verwerp H0, want de P-
waarde is veel kleiner dan de gevonden t-waarde.
o Toetsingsgrootheid < ingezette alfa = niet significant (verwerp H0 niet)
o De aanwezige studenten in de steekproef scoorden significant hoger dan het gemiddelde.
o Koppeling met het BI: 111 – 1,96 x 1,73 = 107,6 en 111 + 1,96 x 1,73 = 114,4
o De score valt niet in het BI, dus significant.

Hoofdstuk 10: Comparing Two Groups
Binary variabele  categorische variabele die een groep specificeert met twee mogelijke uitkomsten
(ja/nee, waar/niet waar)
 Bijvoorbeeld: mannen en vrouwen
 Heet ook wel de verklarende variabele/afhankelijke variabele
Bivariate methode  de statistische methode die gebruikt wordt wanneer er twee variabelen zijn.
 Worden gebruikt om twee groepen te vergelijken.
 Een afhankelijke en een onafhankelijke variabele
 Bijvoorbeeld: onderzoeken wie meer drinkt, mannen of vrouwen.
Response variabele  De uitkomst variabele waarin vergelijkingen worden gemaakt.
 Bijvoorbeeld: Het wel of niet drinken.
 Ook wel de Onafhankelijke variabele
Je wil onderzoeken hoe drinken afhangt van gender, niet hoe gender afhangt van drinken.
 scheidt aan de hand van hun waarden een verklarende variabele (roken, ja of nee).

3

, Hoofdstuk 10.1: Categorical Response: Comparing Two Proportions
Onafhankelijke steekproeven  gerandomiseerde experimenten die deelnemers aselect toewijzen
op twee verschillende behandelingen.
Maar ook observatiestudies die deelnemers in groepen

Categorische response variabele  voorspellingen vergelijken groepen aan de hand van hun
populatie proportie in een specifieke categorie.
 P1 = groep 1 en N1 = steekproefgrootte
 P2 = groep 2 en N2 = steekproefgrootte
 De proportie/specifieke steekproefgrootte om de populatieparameters te bepalen
 (P1 – P2) om te bepalen wat het verschil is tussen de twee populaties.
Standaardfout  Geeft de spreiding tussen het gemiddelde van de steekproefverdeling (de SD van
de geschatte P1 – P2).
 Helpt om te voorspellen hoe dicht bij een schatting zit bij de
proportiewaarde
 De formule van de standaardfout van (P1 – P2) is
Betrouwbaarheidsinterval voor de toetsingsgrootheid in twee populatieproporties  Voegt de
foutenmarge op basis van de standaardfout erbij op (en trekt deze eraf).
 Op basis van de centrale limiet stelling.
 De steekproevenverdeling van P1 – P2 is normaal verdeeld wanneer de steekproef
voldoende groot is.
Het interpreteren van de BI
 0 valt in het BI  het is geloofwaardig dat µ1 = µ2 (er is een klein verschil)
 (p1 – µ 2) bevat positieve nummers, dan is p1 > p2.
 (p1 – p2) bevat negatieve nummers, dan is p1 < p2.
 Het BI interval laat zien hoe groot de verschillen zijn.

Leerdoel: De student kent de belangrijkste parametrische statistische
toetsen, de vereiste aannamen en hun toepasbaarheid.
Significantie toetsing om populatieproporties te vergelijken
1. Aannames
o Een categorische response of onafhankelijke variabele voor twee
groepen
o Onafhankelijke aselecte steekproeven met aselecte toewijzing of
een gerandomiseerd experiment
o N1/N2 zijn groot genoeg dat er ten minste vijf successen en vij falen zijn in iedere groep
(wanneer de tweezijdige toets wordt gebruikt)
o Bij eenzijdig: 10 successen en 10 falen
2. Hypothesen
o Null  H0 : P1 = p2 (dat is p1 – p2 = 0)
o Alternatief  Ha : p1 ≠ p2 (eenzijdige Ha is ook mogelijk)
3. Toetsingsgrootheid  zie formule
4. P-waarde  tweezijdige toets van waarden die extremer zijn dan de geobserveerde z (uit 3),
als H0 waar zou zijn (plaatje)
5. Conclusie  Kleinere p-waarden geven sterker bewijs tegen H0 en ondersteunen Ha.
Interpreteer de P-waarde in context. Wanneer een beslissing nodig is, verwerp H0 wanneer
de p-waarde < 0,05
De standaardfout om twee statistieken/schattingen te vergelijken
 De formule zorgt ervoor dat we een BI maken voor het verschil tussen twee
proporties.
o Dit heet de gepoolde proportie (10.3).

Hoofdstuk 10.2: Quantitative Response: Comparing Two Means
Hoofdstuk 10.3: Other Ways of Comparing Means and Comparing Proportions
Kwantitatieve response variabelen  twee gemiddelden vergelijken.
 X1 = groep 1 en N1 is steekproefgrootte
 X2 = groep 2 en N2 is steekproefgrootte
 Standaardfout berekenen: De formule gebruiken van Se = s/wortel van n van beide datasets.

4

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller joannasmeele. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $8.05. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

52510 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$8.05
  • (0)
Add to cart
Added