100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home
Samenvatting Toetsende Statistiek (Agresti & Franklin) Hoofdstuk 8 t/m 15 + collegeaantekeningen €6,69
In winkelwagen

Samenvatting

Samenvatting Toetsende Statistiek (Agresti & Franklin) Hoofdstuk 8 t/m 15 + collegeaantekeningen

 23 keer bekeken  1 keer verkocht

Hierbij een samenvatting voor het vak Toetsende Statistiek. Alle hoofdstukken voor dit vak zijn uitgebreid beschreven met voorbeelden en collegeaantekeningen

Voorbeeld 4 van de 33  pagina's

  • Nee
  • Hoofdstuk 8 t/m hoofdstuk 15
  • 12 maart 2021
  • 33
  • 2020/2021
  • Samenvatting
book image

Titel boek:

Auteur(s):

  • Uitgave:
  • ISBN:
  • Druk:
Alle documenten voor dit vak (5)
avatar-seller
rosaforto
Samenvatting Toetsende Statistiek




College 1
Hoofdstuk 8 Statistical inference: confidence intervals
Toetsende (inferentiële) statistiek (inferential statistics) = gebruiken van de statistics om iets te
zeggen over de parameter, methode voor het maken van voorspellingen over een populatie

Statistische conclusies (statistical inference) = concluderende methoden helpen ons om te
voorspellen hoe dicht een steekproefstatistic ligt bij een populatieparameter
 Statistische concluderende methoden zijn belangrijk:
1. Gebruiken kansberekeningen die ervan uitgaan dat de data zijn verzameld door middel van
willekeurige steekproeven of een willekeurig experiment
2. De kansberekeningen verwijzen naar een kansverdeling of een statistic, die meestal een
ongeveer normaalverdeling heeft

Er zijn twee typen van statistische concluderende methoden:
1. Schatting van populatieparameters
2. Testen van hypotheses over de waarden van de parameters
- Parameter= een numerieke samenvatting van de populatie – statistics= een numerieke
samenvatting van een steekproef (werken we het vaakst mee, gebruiken we voor de
parameter

De meest informatieve schattingsmethode= construeert een interval van getallen, een
betrouwbaarheidsinterval, waar we verwachten dat de onbekende parameter binnen zal vallen

8.1 Point and interval estimates of population parameters
Een puntschatting (point estimate) = een enkel getal die onze beste schatting is naar de parameter
 Enkel een puntschatting is vaak niet voldoende, omdat het ons niet verteld hoe dicht de
schatting waarschijnlijk bij de parameter zal liggen
Een intervalschatting (interval estimate) = een interval van getallen waarvan geloofd wordt dat het
de werkelijke waarde van de parameter bevat (puntschatting in het midden hiervan)

, - Is handiger dan een puntschatting, door het integreren van de foutmarge (helpt de
intervalschatting ons bij het pellen van de nauwkeurigheid van de puntschatting)

Puntschatting: een zo goed mogelijke schatting maken van de populatieparameter:
Als we de data verzameld hebben, vinden we de puntschatting door: een geschikte
steekproefstatistic te gebruiken
- Bv. voor een populatiegemiddelde is het steekproefgemiddelde een puntschatting van μ

Eigenschappen van puntschatters:
 Een goede schatter van een parameter heeft twee eigenschappen:
1. Een steekproefverdeling die gecentreerd is rond de parameter = een zuivere (unbiased)
schatter
2. Een kleine standaarddeviatie vergeleken met andere schatters > vertelt ons dat de
schatting dichter bij de parameter neigt te vallen dan andere schatters

Voor elke specifieke parameter zijn verschillende mogelijke puntschattingen (bv. voor een
normaalverdeling is het centrum ‘het gemiddelde en de mediaan’ > mogelijke puntschattingen zijn:
- 1. Het steekproefgemiddelde 2. De steekproefmediaan (want symmetrische verdeling)

Intervalschatting: een interval construeren dat de parameter benaderd:
Om te weten of de schatting nuttig is, moeten we weten hoe dicht de schatting waarschijnlijk zal
vallen bij de eigenlijke waarde van de parameter.
 Een intervalschatting indiceert precisie door een aantal getallen rond de puntschatting
 Het interval is opgebouwd uit getallen die de meest geloofwaardige waarden zijn voor de
onbekende parameter, gebaseerd op de geobserveerde data

Een intervalschatting wordt ook wel ‘betrouwbaarheidsinterval’ genoemd, omdat ze met een
vermoedelijke waarden voor de parameter bevat:
 Wordt gevormd door een methode die de puntschatting combineert met de foutmarge
 De kans dat deze methode een interval vormt die de parameter bevat, wordt het
betrouwbaarheidsniveau genoemd (= een gekozen getal, dat dicht bij 1 ligt, meestal 0,95)

Om een betrouwbaarheidsinterval te construeren is de steekproevenverdeling van de puntschatting
de sleutel > deze verdeling verteld ons de kans dat de puntschatting binnen een bepaalde afstand
van de parameter zal vallen

De logica achter het construeren van een betrouwbaarheidsinterval:
 Een betrouwbaarheidsinterval voor een proportie in de populatie, is gebaseerd op de
steekproevenverdeling van een steekproefproportie, eigenschappen:
- Geeft de mogelijke waarden voor de steekproefproportie en hun kansen weer
- Heeft een ongeveer normale verdeling, voor een groot aantal willekeurige steekproeven
(waarbij np ≥ 15 en n(1-P) ≥ 15)
- Heeft een gemiddelde dat gelijk is aan de populatieproportie p
- Heeft een standaarddeviatie die gelijk is aan √ p(1 – p) / n

De foutenmarge (margin of error) = meet hoe nauwkeurig de puntschatting is in hoe waarschijnlijk hij
de parameter zal schatten
 Als een steekproef is geselecteerd, normaal verdeeld is, en de steekproefproportie inderdaad
binnen 1.96 standaarddeviaties van de populatieproportie ligt (95% van de tijd)
- Dan bevat het interval van ‘steekproefproportie -1.96’ tot ‘steekproefproportie +1.96’ de
populatieproportie

,  In andere woorden: met een kans van ongeveer 0.95 doet een steekproefproportie zich zo
voor dat het interval de onbekende populatieproportie bevat (95% betrouwbaarheidsinterval
voor de populatieproportie)

8.2 Constructing a confidence interval to estimate a population proportion
Als een categorische variabele meer dan twee categorieën heeft, kan hij nog steeds benaderd
worden als binomiaal door een van de categorieën te classificeren als een succes en de overgebleven
categorieën als een mislukking

Vinden van de 95% betrouwbaarheidsinterval voor een populatieproportie:
 De steekproefproportie (de puntschatting) wordt gesymboliseerd door ^p (het dakje staat
hier voor de puntschatting van de parameter) > X gedeeld door alle n
 Voor grote willekeurige steekproeven: vertelt de centrale limietstelling ons dat de
steekproevenverdeling van de steekproefproportie ^p ongeveer normaal is
- Dus een foutmarge voor een 95% betrouwbaarheidsinterval bij een normale
steekproefverdeling= 1.96 > dus ongeveer 95% kans dat ^p binnen 1.96
standaarddeviaties van de populatieproportie (p) valt
- Een 95% betrouwbaarheidsinterval wordt gegeven door: puntschatting ± foutmarge, wat
dan wordt: ^p ± 1.96
- De standaarddeviatie van een steekproefproportie is gelijk aan > √ p(1 – p) / n > is
afhankelijk van de onbekende populatieproportie (p) (in praktijk moeten we p schatten)

Een 95% betrouwbaarheidsinterval wordt als volgt berekend voor de populatieproportie (p) = ^p ±
1.96 (se) met SE = √ ^p (1 – ^p) / n
- De standaardfout (SE)= de geschatte standaarddeviatie van de steekproevenverdeling
 Bij rapporteren van resultaten alleen de eerste twee of drie decimalen

Steekproefgrootte (n) nodig voor de validiteit van het betrouwbaarheidsinterval voor een proportie:
 Het betrouwbaarheidsinterval geld alleen bij grote willekeurige steekproeven (n) > minstens
15 successen en 15 mislukkingen hebt voor een binomiale uitkomst (n ^p ≥ en n(1- ^p) ≥ 15)

Een ander betrouwbaarheidsniveau gebruiken dan 95%:
- 95% is meest gebruikte keuze, sommige toepassingen vragen grotere betrouwbaarheid
- Wel geldt: hoe hoger het betrouwbaarheidsniveau, hoe groter de foutenmarge en hoe
breder het betrouwbaarheidsinterval > dus onnauwkeuriger
 Om de kans op een juiste schatting te verhogen gebruiken we een groter
betrouwbaarheidsniveau, zoals 0.99 > berekenen: p = ^p ± 2.58 (se)
 Om 100% zeker te zijn van een bepaalde schatting, moet het betrouwbaarheidsinterval alle
mogelijke waarden voor de parameter bevatten > in praktijk daarom iets minder perfecte
betrouwbaarheid > ze kunnen zo een beter betrouwbaarheidsinterval geven (meer waard)

Hoe reken je met een ander betrouwbaarheidsniveau:
De algemene formule voor het betrouwbaarheidsinterval
voor een populatieproportie =

- Dus steekproefproportie ± z-score van de
normale tabel (standaardfout)
- De z-score is afhankelijk van het betrouwbaarheidsinterval > bv. 70%, dan zoek je de z-
waarde van 0.15 of 0.85 (want hier vallen de grenzen) > beide zelfde z-score (+ en -)
 De foutmarge is: z(se) = z x (√ ^p (1 – ^p) / n)

, - Dit neemt af wanneer de steekproefomvang (n) toeneemt, voor een gegeven waarde van
^p (hoe groter de waarde van n, hoe smaller het interval)
- En de marge neemt toe als het betrouwbaarheidsniveau groter wordt

Interpretatie van het betrouwbaarheidsinterval:
 De 95% betrouwbaarheid is verwezen naar een interpretatie op de lange termijn > hoe de
methode presteert wanneer steeds opnieuw gebruikt bij vele willekeurige steekproeven
 Dus op lange termijn zal 95% van alle intervallen de correcte resultaten geven, die de
populatieproporties bevatten

Kansen gelden voor statistics (zoals steekproefproportie), niet voor parameters
 De schatting ^p, niet de parameter p, is de toevalsvariabele die een steekproefverdeling en
kansen weergeeft (kunnen dit niet zeggen over de populatie)
 De 95% betrouwbaarheid verwijst niet naar de kans van de populatieproportie p > maar naar
de kans die geldt voor de betrouwbaarheidsintervalmethode in de zin van zijn relatieve
frequentie
- Als we deze keer op keer zouden gebruiken voor verschillende methoden, dan zullen we
op de lange termijn in 95% van de gevallen een juiste schatting maken
 Bayesische statistieken= statistische schatting gebaseerd op de subjectieve definitie van kans
(hiermee kan je wel wat zeggen over de parameter, maar subjectief)

8.3 Constructing a confidence interval to estimate a population mean
Een betrouwbaarheidsinterval maken voor een populatiegemiddelde:
 Het steekproefgemiddelde ( x ) is de puntschatter van het gemiddelde in populatie (μ)
 De standaarddeviatie van het steekproefgemiddelde is: σ / √ n , waarbij σ de
standaarddeviatie van de populatie is
 Maar σ kennen we hier niet > dus de geschatte standaarddeviatie die gebruikt wordt bij
betrouwbaarheidsintervallen is de standaardfout SE = s / √ n
- Hierbij is zowel μ als σ onbekend > dus geen z-score maar een t-waarde (vallen iets
strenger dan een z-waarde om de missende waarden)

De t-verdeling en zijn proporties:
De t-waarde= als de z-score, maar deze komt van een klokvormige verdeling die iets dikkere
uiteinden heeft (dus meer variabiliteit laat zien) dan een normale verdeling
- Deze verdeling noemen we de t-verdeling

Degrees of freedom (vrijheidsgraden), genoteerd als df= voor een schatting van een
populatiegemiddelde, gelijk aan df= n -1, 1 minder dan de steekproefomvang

Gebruik van de t-verdeling om een betrouwbaarheidsinterval van het gemiddelde op te stellen:
 Een 95% betrouwbaarheidsinterval voor het populatiegemiddelde (is= x ± t.025 (se), waarbij
SE = s / √ n
- Een t-waarde kan je opzoeken in de t-tabel in het formuleboek (in combinatie met df)>
daarna keer de standaardfout
- Wanneer df toeneemt, neemt de t-score af richting de z-score
(standaardnormaalverdeling)
- De standaardnormale verdeling is de t-verdeling met df = ∞ > wanneer df boven de 100
ligt, is hij ‘oneindig’ en kijk je naar de onderste balk met dit teken
 Je ziet bij een overschrijdingskans van 0.025 (95%) en een n boven 100 > een t-score
van 1.96 (dus gelijk aan standaardnormaalverdeling) > waarden eigenlijk zelfde als z-
score

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

Verzekerd van kwaliteit door reviews

Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper rosaforto. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €6,69. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 54879 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
€6,69  1x  verkocht
  • (0)
In winkelwagen
Toegevoegd