Samenvatting Toetsende Statistiek
College 1
Hoofdstuk 8 Statistical inference: confidence intervals
Toetsende (inferentiële) statistiek (inferential statistics) = gebruiken van de statistics om iets te
zeggen over de parameter, methode voor het maken van voorspellingen over een populatie
Statistische conclusies (statistical inference) = concluderende methoden helpen ons om te
voorspellen hoe dicht een steekproefstatistic ligt bij een populatieparameter
Statistische concluderende methoden zijn belangrijk:
1. Gebruiken kansberekeningen die ervan uitgaan dat de data zijn verzameld door middel van
willekeurige steekproeven of een willekeurig experiment
2. De kansberekeningen verwijzen naar een kansverdeling of een statistic, die meestal een
ongeveer normaalverdeling heeft
Er zijn twee typen van statistische concluderende methoden:
1. Schatting van populatieparameters
2. Testen van hypotheses over de waarden van de parameters
- Parameter= een numerieke samenvatting van de populatie – statistics= een numerieke
samenvatting van een steekproef (werken we het vaakst mee, gebruiken we voor de
parameter
De meest informatieve schattingsmethode= construeert een interval van getallen, een
betrouwbaarheidsinterval, waar we verwachten dat de onbekende parameter binnen zal vallen
8.1 Point and interval estimates of population parameters
Een puntschatting (point estimate) = een enkel getal die onze beste schatting is naar de parameter
Enkel een puntschatting is vaak niet voldoende, omdat het ons niet verteld hoe dicht de
schatting waarschijnlijk bij de parameter zal liggen
Een intervalschatting (interval estimate) = een interval van getallen waarvan geloofd wordt dat het
de werkelijke waarde van de parameter bevat (puntschatting in het midden hiervan)
, - Is handiger dan een puntschatting, door het integreren van de foutmarge (helpt de
intervalschatting ons bij het pellen van de nauwkeurigheid van de puntschatting)
Puntschatting: een zo goed mogelijke schatting maken van de populatieparameter:
Als we de data verzameld hebben, vinden we de puntschatting door: een geschikte
steekproefstatistic te gebruiken
- Bv. voor een populatiegemiddelde is het steekproefgemiddelde een puntschatting van μ
Eigenschappen van puntschatters:
Een goede schatter van een parameter heeft twee eigenschappen:
1. Een steekproefverdeling die gecentreerd is rond de parameter = een zuivere (unbiased)
schatter
2. Een kleine standaarddeviatie vergeleken met andere schatters > vertelt ons dat de
schatting dichter bij de parameter neigt te vallen dan andere schatters
Voor elke specifieke parameter zijn verschillende mogelijke puntschattingen (bv. voor een
normaalverdeling is het centrum ‘het gemiddelde en de mediaan’ > mogelijke puntschattingen zijn:
- 1. Het steekproefgemiddelde 2. De steekproefmediaan (want symmetrische verdeling)
Intervalschatting: een interval construeren dat de parameter benaderd:
Om te weten of de schatting nuttig is, moeten we weten hoe dicht de schatting waarschijnlijk zal
vallen bij de eigenlijke waarde van de parameter.
Een intervalschatting indiceert precisie door een aantal getallen rond de puntschatting
Het interval is opgebouwd uit getallen die de meest geloofwaardige waarden zijn voor de
onbekende parameter, gebaseerd op de geobserveerde data
Een intervalschatting wordt ook wel ‘betrouwbaarheidsinterval’ genoemd, omdat ze met een
vermoedelijke waarden voor de parameter bevat:
Wordt gevormd door een methode die de puntschatting combineert met de foutmarge
De kans dat deze methode een interval vormt die de parameter bevat, wordt het
betrouwbaarheidsniveau genoemd (= een gekozen getal, dat dicht bij 1 ligt, meestal 0,95)
Om een betrouwbaarheidsinterval te construeren is de steekproevenverdeling van de puntschatting
de sleutel > deze verdeling verteld ons de kans dat de puntschatting binnen een bepaalde afstand
van de parameter zal vallen
De logica achter het construeren van een betrouwbaarheidsinterval:
Een betrouwbaarheidsinterval voor een proportie in de populatie, is gebaseerd op de
steekproevenverdeling van een steekproefproportie, eigenschappen:
- Geeft de mogelijke waarden voor de steekproefproportie en hun kansen weer
- Heeft een ongeveer normale verdeling, voor een groot aantal willekeurige steekproeven
(waarbij np ≥ 15 en n(1-P) ≥ 15)
- Heeft een gemiddelde dat gelijk is aan de populatieproportie p
- Heeft een standaarddeviatie die gelijk is aan √ p(1 – p) / n
De foutenmarge (margin of error) = meet hoe nauwkeurig de puntschatting is in hoe waarschijnlijk hij
de parameter zal schatten
Als een steekproef is geselecteerd, normaal verdeeld is, en de steekproefproportie inderdaad
binnen 1.96 standaarddeviaties van de populatieproportie ligt (95% van de tijd)
- Dan bevat het interval van ‘steekproefproportie -1.96’ tot ‘steekproefproportie +1.96’ de
populatieproportie
, In andere woorden: met een kans van ongeveer 0.95 doet een steekproefproportie zich zo
voor dat het interval de onbekende populatieproportie bevat (95% betrouwbaarheidsinterval
voor de populatieproportie)
8.2 Constructing a confidence interval to estimate a population proportion
Als een categorische variabele meer dan twee categorieën heeft, kan hij nog steeds benaderd
worden als binomiaal door een van de categorieën te classificeren als een succes en de overgebleven
categorieën als een mislukking
Vinden van de 95% betrouwbaarheidsinterval voor een populatieproportie:
De steekproefproportie (de puntschatting) wordt gesymboliseerd door ^p (het dakje staat
hier voor de puntschatting van de parameter) > X gedeeld door alle n
Voor grote willekeurige steekproeven: vertelt de centrale limietstelling ons dat de
steekproevenverdeling van de steekproefproportie ^p ongeveer normaal is
- Dus een foutmarge voor een 95% betrouwbaarheidsinterval bij een normale
steekproefverdeling= 1.96 > dus ongeveer 95% kans dat ^p binnen 1.96
standaarddeviaties van de populatieproportie (p) valt
- Een 95% betrouwbaarheidsinterval wordt gegeven door: puntschatting ± foutmarge, wat
dan wordt: ^p ± 1.96
- De standaarddeviatie van een steekproefproportie is gelijk aan > √ p(1 – p) / n > is
afhankelijk van de onbekende populatieproportie (p) (in praktijk moeten we p schatten)
Een 95% betrouwbaarheidsinterval wordt als volgt berekend voor de populatieproportie (p) = ^p ±
1.96 (se) met SE = √ ^p (1 – ^p) / n
- De standaardfout (SE)= de geschatte standaarddeviatie van de steekproevenverdeling
Bij rapporteren van resultaten alleen de eerste twee of drie decimalen
Steekproefgrootte (n) nodig voor de validiteit van het betrouwbaarheidsinterval voor een proportie:
Het betrouwbaarheidsinterval geld alleen bij grote willekeurige steekproeven (n) > minstens
15 successen en 15 mislukkingen hebt voor een binomiale uitkomst (n ^p ≥ en n(1- ^p) ≥ 15)
Een ander betrouwbaarheidsniveau gebruiken dan 95%:
- 95% is meest gebruikte keuze, sommige toepassingen vragen grotere betrouwbaarheid
- Wel geldt: hoe hoger het betrouwbaarheidsniveau, hoe groter de foutenmarge en hoe
breder het betrouwbaarheidsinterval > dus onnauwkeuriger
Om de kans op een juiste schatting te verhogen gebruiken we een groter
betrouwbaarheidsniveau, zoals 0.99 > berekenen: p = ^p ± 2.58 (se)
Om 100% zeker te zijn van een bepaalde schatting, moet het betrouwbaarheidsinterval alle
mogelijke waarden voor de parameter bevatten > in praktijk daarom iets minder perfecte
betrouwbaarheid > ze kunnen zo een beter betrouwbaarheidsinterval geven (meer waard)
Hoe reken je met een ander betrouwbaarheidsniveau:
De algemene formule voor het betrouwbaarheidsinterval
voor een populatieproportie =
- Dus steekproefproportie ± z-score van de
normale tabel (standaardfout)
- De z-score is afhankelijk van het betrouwbaarheidsinterval > bv. 70%, dan zoek je de z-
waarde van 0.15 of 0.85 (want hier vallen de grenzen) > beide zelfde z-score (+ en -)
De foutmarge is: z(se) = z x (√ ^p (1 – ^p) / n)
, - Dit neemt af wanneer de steekproefomvang (n) toeneemt, voor een gegeven waarde van
^p (hoe groter de waarde van n, hoe smaller het interval)
- En de marge neemt toe als het betrouwbaarheidsniveau groter wordt
Interpretatie van het betrouwbaarheidsinterval:
De 95% betrouwbaarheid is verwezen naar een interpretatie op de lange termijn > hoe de
methode presteert wanneer steeds opnieuw gebruikt bij vele willekeurige steekproeven
Dus op lange termijn zal 95% van alle intervallen de correcte resultaten geven, die de
populatieproporties bevatten
Kansen gelden voor statistics (zoals steekproefproportie), niet voor parameters
De schatting ^p, niet de parameter p, is de toevalsvariabele die een steekproefverdeling en
kansen weergeeft (kunnen dit niet zeggen over de populatie)
De 95% betrouwbaarheid verwijst niet naar de kans van de populatieproportie p > maar naar
de kans die geldt voor de betrouwbaarheidsintervalmethode in de zin van zijn relatieve
frequentie
- Als we deze keer op keer zouden gebruiken voor verschillende methoden, dan zullen we
op de lange termijn in 95% van de gevallen een juiste schatting maken
Bayesische statistieken= statistische schatting gebaseerd op de subjectieve definitie van kans
(hiermee kan je wel wat zeggen over de parameter, maar subjectief)
8.3 Constructing a confidence interval to estimate a population mean
Een betrouwbaarheidsinterval maken voor een populatiegemiddelde:
Het steekproefgemiddelde ( x ) is de puntschatter van het gemiddelde in populatie (μ)
De standaarddeviatie van het steekproefgemiddelde is: σ / √ n , waarbij σ de
standaarddeviatie van de populatie is
Maar σ kennen we hier niet > dus de geschatte standaarddeviatie die gebruikt wordt bij
betrouwbaarheidsintervallen is de standaardfout SE = s / √ n
- Hierbij is zowel μ als σ onbekend > dus geen z-score maar een t-waarde (vallen iets
strenger dan een z-waarde om de missende waarden)
De t-verdeling en zijn proporties:
De t-waarde= als de z-score, maar deze komt van een klokvormige verdeling die iets dikkere
uiteinden heeft (dus meer variabiliteit laat zien) dan een normale verdeling
- Deze verdeling noemen we de t-verdeling
Degrees of freedom (vrijheidsgraden), genoteerd als df= voor een schatting van een
populatiegemiddelde, gelijk aan df= n -1, 1 minder dan de steekproefomvang
Gebruik van de t-verdeling om een betrouwbaarheidsinterval van het gemiddelde op te stellen:
Een 95% betrouwbaarheidsinterval voor het populatiegemiddelde (is= x ± t.025 (se), waarbij
SE = s / √ n
- Een t-waarde kan je opzoeken in de t-tabel in het formuleboek (in combinatie met df)>
daarna keer de standaardfout
- Wanneer df toeneemt, neemt de t-score af richting de z-score
(standaardnormaalverdeling)
- De standaardnormale verdeling is de t-verdeling met df = ∞ > wanneer df boven de 100
ligt, is hij ‘oneindig’ en kijk je naar de onderste balk met dit teken
Je ziet bij een overschrijdingskans van 0.025 (95%) en een n boven 100 > een t-score
van 1.96 (dus gelijk aan standaardnormaalverdeling) > waarden eigenlijk zelfde als z-
score