Toetsende Statistiek Samenvatting
Samengevatte literatuur
Agresti & Franklin – H8: Statistical Inference: Confidence Intervals
8.1 Point and Interval Estimates of Population Parameters
8.2 Constructing a Confidence Interval to Estimate a Population Proportion
8.3 Constructing a Confidence Interval to Estimate a Population Mean
8.4 Choosing the Sample Size for a Study
Agresti & Franklin – H9: Statistical Inference: Significance Tests About Hypotheses
9.1 Steps for Performing a Significance Test
9.2 Significance Tests About Proportions
9.3 Significance Test About Means
9.4 Decisions and Types of Errors in Significance Tests
9.5 Limitations of Significance Tests
9.6 The Likelihood of a Type II Error (Not Rejecting H0, Even Though It’s False)
Agresti & Franklin – H10: Comparing Two Groups
10.1 Categorical Response: How can we Compare Two Proportions?
10.2 Quantitative Response: How can we Compare Two Means?
10.3 Other Ways of Comparing Means and Comparing Proportions
10.4 Analyzing Dependent Samples
10.5 Adjusting for the Effects of Other Variables
Agresti & Franklin – H11: Analyzing the Association Between Categorical Variables
11.1 Independence and Dependence (Association)
11.2 Testing Categorical Variables for Independence
11.3 Determining the Strength of the Association
11.4 Using Residuals to Reveal the Pattern of Association
11.5 Small Sample Sizes: Fisher’s Exact Test
Agresti & Franklin – H12: Analyzing the Association Between Quantitative Variables: Regression Analysis
12.1 Model How Two Variables Are Related
12.2 Describe Strength of Association
12.3 Make Inferences About the Association
12.4 How the Data Vary Around the Regression Line
12.5 Exponential Regression: A Model for Nonlinearity
Agresti & Franklin – H13: Multiple Regression
13.1 Using Several Variables to Predict a Response
13.2 Extending the Correlation and R2 for Multiple Regression
13.3 Using Multiple Regression to Make Inferences
13.4 Checking a Regression Model Using Residual Plots
13.5 Regression and Categorical Predictors
13.6 Modeling a Categorical Response
,Agresti & Franklin – H14: Comparing Groups: Analysis of Variance Methods
14.1 One-Way ANOVA: Comparing Several Means
14.2 Estimating Differences in Groups for a Single Factor
14.3 Two-Way ANOVA
Agresti & Franklin – H15: Nonparametric Statistics
15.1 Comparing Two Groups by Ranking
15.2 Nonparametric Methods for Several Groups and for Matched Pairs
Artikel Agresti & Finlay – Logistic Regression: Modeling Categorical Responses
Artikel Van Peet et al.: Onderscheidingsvermogen en Effectgroottes
Bijgevoegd: een beknopte samenvatting van de relevante onderwerpen uit het vak ‘Beschrijvende Statistiek’
,Recap Beschrijvende Statistiek
Beschrijvende statistiek
Verwijst naar de methoden voor het samenvatten van de verzamelde data. Bestaat vaak uit grafieken en
nummers (zoals gemiddelden en percentages).
Toetsende statistiek
Verwijst naar de methoden voor het maken van beslissingen of voor het maken van voorspellingen over een
populatie, gebaseerd op de verzamelde data vanuit een steekproef.
Parameter
Een numerieke samenvatting van de populatie (echter is deze vaak onbekend).
Statistic
Een numerieke samenvatting van een steekproef uit de populatie. Deze worden gebruikt om de
parameterwaarden te schatten.
Variabelen
Een kenmerk of eigenschap die geobserveerd is in een onderzoek.
• Categorische variabele: wanneer elke observatie hoort bij een set van categorieën (functie: het
beschrijven van het relatieve aantal observaties in de verschillende categorieën).
• Kwantitatieve variabele: als observaties een numerieke hoeveelheid aannemen, die verschillende
magnitudes representeren op die variabele (functie: beschrijven van het centrum en de spreiding).
- Discrete kwantitatieve variabele: als de mogelijke waarden een set van losstaande nummers
vormen, meestal een telling van iets.
- Continue kwantitatieve variabele: als de mogelijke waarde een interval vormen, meestal oneindig
veel mogelijke waarden.
• Responsvariabele: de afhankelijke variabele, de uitkomstvariabele waarop vergelijkingen worden
gedaan.
• Verklarende variabele: de onafhankelijke variabele.
Standaarddeviatie
Beschrijft de typische afstand van het gemiddelde, doet dit door het samenvatten van alle deviaties van het
gemiddelde.
• Deviatie: het verschil tussen een observatie en het steekproefgemiddelde (𝑥 − 𝑥̅ ).
• Variantie: het gemiddelde van de kwadratensom.
z-score (standaardscore)
Het aantal standaarddeviaties dat een observatie van het steekproefgemiddelde valt.
Associaties tussen variabelen
• Twee keer categorisch: data weergeven in een kruistabel, vergelijken van conditionele proporties.
• Eén keer categorisch, één keer kwantitatief: vergelijken van categorieën door het samenvatten van het
centrum en de spreiding van de kwantitatieve variabele.
• Twee keer kwantitatief: analyseren hoe de uitkomst op de responsvariabele de neiging heeft te
veranderen als de waarde op de verklarende variabele veranderd.
Correlatie (coëfficiënt)
Vat de richting van de associatie samen tussen twee kwantitatieve variabelen en de sterkte van de lineaire trend
(alleen te gebruiken voor rechtlijnige relaties). Wordt genoteerd als r, en neemt waarden aan tussen -1 en +1 (en
is onafhankelijk van de eenheid van analyse, en is onafhankelijk van welke variabele als respons- of als
verklarende variabele wordt behandeld).
,Regressielijn
Voorspelt de waarde voor de responsvariabele y als een rechtlijnige functie van de waarde x van de verklarende
variabele. Opzoek gaan naar een formule voor de rechte lijn, die het patroon het beste voorspelt.
• Intercept (a): de waarde van y wanneer x = 0.
• Slope (b): geeft de hoeveelheid aan die 𝑦̂ veranderd, wanneer x met 1 eenheid omhoog gaat. Als de
slope een waarde 0 heeft, dan loopt de regressielijn horizontaal (geen associatie).
- De slope is wel afhankelijk van de eenheid van de variabele.
Residu (schattingsfout)
Voor een observatie in de scatterplot is de verticale afstand tussen het datapunt en de regressielijn de absolute
waarde van het residu.
• Least Square Method: door software, het berekenen van de regressielijn waarin de minste residuen
zitten. Dit is de best passende lijn bij de data (maakt de minste errors). De positieve en negatieve
residuen tellen bij elkaar op tot 0.
- De lijn doorkruist altijd 𝑥̅ 𝑒𝑛 𝑦̅.
Proportie verklaarde variantie
In plaats van het gebruiken van de regressielijn voor het voorspellen van een waarde op y, kun je ook het
centrum van de verdeling gebruiken (zoals 𝑦̅).
• Zowel het gemiddelde als de regressielijn hebben een bepaald residu bij ieder datapunt in de
scatterplot. Met de proportie verklaarde variantie (𝑟 2 ) kun je bepalen hoeveel procent kleiner het
residu is van de regressielijn in vergelijking met 𝑦̅.
• Het is dus de hoeveelheid variantie die verklaard wordt door de regressie (door het trekken van een
lijn), in plaats van de horizontale lijn die je zou trekken voor 𝑦̅. Het is de mate waarin de
regressievergelijking van x en y de afhankelijke (responsvariabele) beter voorspelt dan 𝑦̅.
Regressie uitschieters
Het is hierbij onbelangrijk of de observatie een uitschieter is op de x-waarde, relatief van de andere x-waarden
(of bij y). Regressie uitschieters zijn ver verwijderd van de trend die de rest van de data volgt.
• Invloedrijk: wanneer een observatie een groot effect heeft op de resultaten van een regressie analyse,
hiervoor aan twee condities voldoen:
- De x-waarde is relatief hoog of laag vergeleken de rest van de data.
- De observatie is een regressie uitschieter (valt ver van de trend die de rest van de data volgt).
Lurking variabele
Een derde variabele die niet gemeten is in een onderzoek, maar die de associatie tussen de respons- en
verklarende variabele beïnvloedt.
• Simpson’s paradox: de richting van een associatie kan veranderen nadat een derde variabele
meegenomen wordt (en de data op aparte niveaus wordt geanalyseerd op die variabele).
• Confounder: wanneer twee verklarende variabelen geassocieerd zijn met een responsvariabele, maar
deze zijn ook onderling geassocieerd (wel gemeten in het onderzoek).
Kansverdeling
Elke uitkomst heeft een bepaalde specifieke kans om zich voor te doen. De kansverdeling specificeert de
mogelijke waarden en de kansen hierop (hiervoor dient de variabele wel willekeurig te zijn).
• Gewogen gemiddelde: het gemiddelde van de kansverdeling (de verwachte waarde van x).
Normaalverdeling
Wordt vaak gebruikt voor continue toevalsvariabelen. De vorm is kenmerkend, kent twee parameters (σ en µ).
De kans binnen een bepaald aantal standaarddeviaties van het gemiddelde is hetzelfde voor iedere
normaalverdeling.
• Standaard normaalverdeling: een normaalverdeling met µ = 0, en σ = 1. Het is de verdeling van de
normale z-scores. Elke normaalverdeling kan hiernaar worden omgezet (door het berekenen van z-
scores).
,Binomiaalverdeling
Wanneer elke observatie een binaire/dichotome uitkomstmogelijkheid heeft. De verdeling geeft de kansen weer
voor de mogelijke waarden voor het aantal mogelijke successen, wanneer de volgende condities aanwezig zijn:
1. Elk van de n pogingen heeft twee mogelijke uitkomsten (succes of falen).
2. Elke poging heeft dezelfde kans op succes (p), en dezelfde kans op falen (1 – p).
3. De n pogingen zijn onafhankelijk, het resultaat van de ene poging is niet afhankelijk van het resultaat
van andere pogingen.
• Bij grafische weergave van de binomiaalverdeling is deze symmetrisch bij p = .50.
• De binomiaalverdeling kan goed worden benaderd als normaalverdeling indien het verwachte aantal
successen (np) en het verwachte aantal falen (n (1 – p)) tenminste gelijk zijn aan 15.
- Dan kun je de z-tabel weer gebruiken om de kansen te berekenen.
Populatieverdeling
De verdeling van de populatiewaarden. De waarden van de parameters zijn vaak onbekend, maar staan wel vast.
De specifieke populatieparameter varieert daarom niet. Hierover willen we voorspellingen doen.
Dataverdeling
De verdeling van de steekproefdata. De statistics variëren tussen verschillende steekproeven, daarom variëren
de dataverdelingen ook tussen verschillende steekproeven.
• Bij een aselecte steekproeftrekking geldt dat hoe groter de steekproefgrootte (n), hoe dichterbij de
dataverdeling een populatieverdeling nadert.
Steekproevenverdeling
De verdeling van een steekproef statistic, het geeft de kansen voor alle mogelijke waarden van de statistic. Het
geeft informatie over hoe dichtbij een steekproef statistic zit bij de corresponderende (onbekende) parameter.
Het beschrijft de variabiliteit die zich voordoet van steekproef tot steekproef.
• Je maakt een steekproevenverdeling omdat je wil weten hoe waarschijnlijk de gevonden statistic is die
je hebt gevonden, kijken of je betrouwbaar uitspraken kunt doen over de parameter (door bijvoorbeeld
te kijken of de gevonden steekproef statistic in het betrouwbaarheidsinterval ligt van de
steekproevenverdeling).
• Het gemiddelde van een steekproevenverdeling is gelijk aan de populatieparameter.
Centrale limietstelling
Wanneer een steekproefgrootte toeneemt, dan gaat de steekproevenverdeling steeds meer op een
normaalverdeling lijken (ook wanneer deze scheef verdeeld is). Bij een n van tenminste 30 kun je uitgaan van
een normaalverdeling.
• Dus wanneer je kijkt naar een steekproevenverdeling van een gemiddelde, dan is deze normaal verdeeld
bij n > 30. Bij een steekproevenverdeling van een proportie is het bij benadering normaal verdeeld
wanneer de kans op succes (np) en de kans op falen (n (1 – p)) > 15.
, College 1
AF: H8 en H9
Agresti & Franklin – H8: Statistical Inference: Confidence Intervals
Inleiding
Voor toetsende statistiek methoden zijn randomisatie in dataverzameling, kansberekening, de normale verdeling
en de steekproevenverdeling van belang om twee redenen:
1. Toetsende statistiek gebruikt methoden van kansberekening die aannemen dat de verzamelde data is
verkregen door een aselecte steekproef of een gerandomiseerd experiment.
2. De kansberekeningen verwijzen naar een steekproevenverdeling van een statistic (welke vaak benaderd
kan worden als een normale verdeling).
Er zijn twee typen toetsende statistiek methoden:
1. Schatten van populatieparameters (dit hoofdstuk: leren hoe je de populatieproporties kan schatten
voor categorische variabelen en populatiegemiddelden voor kwantitatieve variabelen).
- De meest informatieve schattingsmethode is om een interval te construeren, een
betrouwbaarheidsinterval genoemd, waarin de onbekende parameter verwacht wordt te vallen.
2. Hypothesetoetsen van de parameterwaarden.
8.1 Point and Interval Estimates of Population Parameters
Populatieparameters
Deze hebben twee typen schattingen:
• Puntschatter: een enkel nummer dat de beste gok is voor de parameter.
- Is niet heel informatief, geeft niet aan hoe dichtbij de schatting waarschijnlijk valt bij de parameter.
• Intervalschatting: een interval van nummers waarbinnen de parameter verwacht wordt te vallen (geeft
een bepaalde margin of error om de puntschatter).
- Meer nuttig, het geeft dus een bepaalde marge weer, dat helpt ons de accuratesse in te schatten
van de puntschatter.
Puntschatter vinden
Als je de data hebt verzameld, kun je de puntschatter bepalen voor:
• Een populatiegemiddelde (µ): het steekproefgemiddelde is de puntschatter van µ.
• Een populatieproportie: de steekproefproportie is de puntschatter van de populatieproportie.
Eigenschappen van puntschatters
Voor elke parameter zijn er verschillende mogelijke puntschatters (voorbeeld: voor een normale verdeling,
is het centrum het gemiddelde en de mediaan, dus twee mogelijke schatters van de centrumwaarde zijn het
gemiddelde en de mediaan). Maar wat maakt de ene schatting beter dan andere? Een goede schatter van
een parameter heeft twee gewilde eigenschappen:
1. Heeft een steekproevenverdeling die gecentreerd is rond de parameter (en is dus een zuivere schatter).
- Het steekproefgemiddelde is een zuivere schatter van het populatiegemiddelde.
- De steekproefproportie is een zuivere schatter van de populatieproportie.
2. Heeft een kleine standaarddeviatie vergeleken met andere schatters (vertelt ons dat de schatter
dichterbij de parameter ligt dan andere schatters).