Hoofdstuk 7
Wanneer σ onbekend is, moeten we σ toch vaststellen ook al zijn we
meer geïnteresseerd in µ.
Uit hoofdstuk 5 is bekend dat het steekproefgemiddelde 𝑥̅ Normaal
verdeeld met een gemiddelde µ en de standaarddeviatie σ/√n.
Wanneer σ onbekend is, moet deze worden geschat van de bestaande
data met standaard deviatie s.
We schatten de standaard deviatie met:
Dit wordt de standaard error (𝑆𝐸𝑥̅ ) genoemd.
Deze statistiek heeft geen Normale verdeling maar een t-verdeling. Een SRS van grootte n is
afkomstig van een N(µ,σ) populatie. Dan heeft de één-steekproef statistiek, een t-verdeling met n – 1
graden van vrijheid:
We gebruiken t(k) voor de t-verdeling met k graden van vrijheid. De graden van vrijheid voor de t-
test komt van de steekproef standaard deviatie s in de noemer van t. Er is een verschillende t-
verdeling voor elke steekproef grootte.
De density curve van de t(k)-verdelingen zijn vergelijkbaar met de vorm van de Normaal verdeling.
De t-verdeling heeft alleen meer kans in de staarten en minder in het centrum. We zien dat als de
graden van vrijheid k toeneemt, de t(k)-density dichterbij de N(0,1)-curve komt. Dit weerspiegelt het
feit dat s dichterbij σ ligt als de steekproef grootte toeneemt.
De één-steekproef t – betrouwbaarheidsinterval
Tabel D geeft de waarden van t* voor de t-verdelingen.
In hoofdstuk 6 hebben we gekeken naar z-betrouwbaarheidsinterval. Voor de t-test geldt het
volgende:
Veronderstel dat een SRS van grootte n is getrokken van een populatie die een onbekende µ heeft.
𝑠
Een niveau C betrouwbaarheidsinterval voor µ is: 𝑥̅ ± 𝑡 ∗ waar t* de waarde voor de t(n-1)
√𝑛
dichtheidscurve met gebied C tussen -t* en t*.
𝑠
De kwantiteit 𝑡 ∗ is de marge van error om uit data σ te schatten. Het betrouwbaarheidsinterval
√𝑛
is precies C wanneer de populatieverdeling Normaal is en ongeveer correct voor grote n in andere
gevallen.
1
,Voorbeeld
In een huidig rapport van The Nielson Company, een bedrijf die gaat over media informatie,
concluderen dat adolescenten in de leeftijd van 18 tot 24 jaar gemiddeld 18.5 uur per week televisie
kijken. Is dit gemiddelde voor redenvatbaar voor college studenten? Om dit te onderzoeken, pak een
95% betrouwbaarheidsinterval voor de gemiddelde tijd (uren per week) van televisie kijken onder
U.S. college studenten. We geven de volgende SRS van grootte 8 van de populatie
3.0 16.5 10.5 40.5 5.5 33.5 0.0 6.5
3.0+16.5+10.5+40.5+5.5+33.5+0.0+6.5
Het steekproef gemiddelde: 𝑥̅ = = 14.5
8
𝑠 14.854
Graden van vrijheid: n – 1 = 7. De 𝑆𝐸𝑥̅ = √𝑛 = = 5.252
√8
Tabel D: df = 7. Dus:
𝑠
t* = 2.365. Dus betrouwbaarheidsinterval: 𝑥̅ ± 𝑡∗
√𝑛
14.854
14.5 ± 2.365∗ √8
14.5 ± 2.365∗ 5.252
14.5 ± 12.421
Dus: (2.08, 26.92). We zijn 95% zeker dat onder adolescenten de tijd van televisie kijken ligt tussen
2.1 en 26.9 uur per week.
De één-steekproef t-test
We gebruiken s in plaats van σ, en we gebruiken een t-verdeling om waarde P te vinden.
Een SRS van grootte n is getrokken van een populatie die een onbekend gemiddelde µ heeft. Om de
hypothese H0 : µ = µ0 te testen, gebaseerd op de SRS van grootte n, bereken de één-steekproef t-test:
𝑥̅ − µ
𝑡 = 𝑠/ √𝑛0
In termen van een random variabele T, die de t(n – 1 )-verdeling
heeft, de P-waarde voor een test tegen H0 :
Deze P-waarden zijn precies als de populatieverdeling Normaal is en
zijn ongeveer correct voor een grootte n in andere gevallen.
2
, Vervolg op het bovenstaand voorbeeld
We willen onderzoeken of de gemiddelde tijd van U.S. college studenten verschilt van het rapport
over het gemiddelde van 18 tot 24 jarigen met het significantie niveau 0.05. Specifiek testen we:
H0 : µ = 18.5 n=8 𝑥̅ = 14.5
Ha : µ ≠ 18.5 s = 14.584
𝑥̅ − µ0 14.5− 18.5
De t-test statistiek is 𝑡= 𝑠/√𝑛
dus 𝑡= 14.584/ √8
= −0.762
Dit betekent dat het steekproef gemiddelde 𝑥̅ = 14.5, meer dan 0.75 standaarddeviatie beneden de
nulhypothese µ = 18.5 ligt.
De graden van vrijheid is 7 dus deze t-test heeft de t(7)-verdeling.
Tabel D geeft het volgende weer:
p 0.25 0.20
t* 0.711 0.896
We kunnen concluderen dat de P-waarde tussen 2x0.20 = 0.40 en 2x0.25 = 0.50 ligt. Er is niet genoeg
bewijs dat we de nulhypothese kunnen verwerpen voor 0.05-niveau.
Matched-pairs t-procedures
Proefpersonen zijn opgedeeld in paren en hun uitkomsten worden vergeleken binnen het gematchte
paar. Dan kunnen deze vergeleken worden.
➔ Verschilscores worden vergeleken, daar wordt gemiddelde en SD uitgehaald waardoor de t-
statistiekformule ook weer kan worden toegepast om de P-waarde uit te rekenen.
Verschil scores:
- Het verschil 𝑥̅2 – 𝑥̅1
- Het verschil in de gemiddelden is gelijk aan het gemiddelde van de verschillen
- Steekproefgemiddelde van de verschil scores:
Gelijkwaardigheids-testen
- We proberen om te bewijzen dat het gemiddelde verschil binnen een acceptabel gebied rond
0 ligt. We kunnen dit uitvoeren met gebruik van een betrouwbaarheidsinterval
Veronderstel dat een SRS van grootte n is getrokken van een populatie die een onbekende µ heeft.
Om te testen of µ, met een significantie niveau σ, binnen een spreiding van gelijkwaardigheid aan µ0,
gespecifieerd met de interval µ0 ± δ:1
1. Bereken het betrouwbaarheidsinterval met C = 1 – 2σ
2. Vergelijk dit interval met de spreiding van gelijkwaardigheid
Als het betrouwbaarheidsinterval helemaal binnen µ0 ± δ valt, kan je concluderen dat µ gelijkwaardig
is aan µ0 . Als het betrouwbaarheidsinterval buiten de gelijkwaardigheidsspreiding valt of het bevat
waarde binnen én buiten de spreiding, kan je concluderen dat µ niet gelijkwaardig is aan µ0 .
Robuust
Een statistische gevolgtrekking procedure wordt robuust genoemd, als de benodigde kans
berekeningen ongevoelig zijn voor schendingen van de gemaakte aannames. Deze robuuste
procedures zijn erg nuttig in statistische praktijk omdat ze gebruikt kunnen worden over een wijde
spreiding van condities met een goed resultaat.
1
δ/Δ = ‘de verandering in’
3
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper IlseGeers. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.