Extensive summary Craig, B: Introduction to the Practice of Statistics - Statistics
Summary Lectures and Readings: Statistics 1 - Introduction (FSWPE1-032)
Detailed Summary: Lectures and Readings STATISTICS 2.2 FSWPE2-022
All for this textbook (11)
Written for
Universiteit Leiden (UL)
Pedagogische Wetenschappen
Onderzoekspracticum 2
All documents for this subject (38)
2
reviews
By: WarshaC • 4 year ago
By: tessa0004 • 4 year ago
Seller
Follow
IlseGeers
Reviews received
Content preview
Hoofdstuk 7
Wanneer σ onbekend is, moeten we σ toch vaststellen ook al zijn we
meer geïnteresseerd in µ.
Uit hoofdstuk 5 is bekend dat het steekproefgemiddelde 𝑥̅ Normaal
verdeeld met een gemiddelde µ en de standaarddeviatie σ/√n.
Wanneer σ onbekend is, moet deze worden geschat van de bestaande
data met standaard deviatie s.
We schatten de standaard deviatie met:
Dit wordt de standaard error (𝑆𝐸𝑥̅ ) genoemd.
Deze statistiek heeft geen Normale verdeling maar een t-verdeling. Een SRS van grootte n is
afkomstig van een N(µ,σ) populatie. Dan heeft de één-steekproef statistiek, een t-verdeling met n – 1
graden van vrijheid:
We gebruiken t(k) voor de t-verdeling met k graden van vrijheid. De graden van vrijheid voor de t-
test komt van de steekproef standaard deviatie s in de noemer van t. Er is een verschillende t-
verdeling voor elke steekproef grootte.
De density curve van de t(k)-verdelingen zijn vergelijkbaar met de vorm van de Normaal verdeling.
De t-verdeling heeft alleen meer kans in de staarten en minder in het centrum. We zien dat als de
graden van vrijheid k toeneemt, de t(k)-density dichterbij de N(0,1)-curve komt. Dit weerspiegelt het
feit dat s dichterbij σ ligt als de steekproef grootte toeneemt.
De één-steekproef t – betrouwbaarheidsinterval
Tabel D geeft de waarden van t* voor de t-verdelingen.
In hoofdstuk 6 hebben we gekeken naar z-betrouwbaarheidsinterval. Voor de t-test geldt het
volgende:
Veronderstel dat een SRS van grootte n is getrokken van een populatie die een onbekende µ heeft.
𝑠
Een niveau C betrouwbaarheidsinterval voor µ is: 𝑥̅ ± 𝑡 ∗ waar t* de waarde voor de t(n-1)
√𝑛
dichtheidscurve met gebied C tussen -t* en t*.
𝑠
De kwantiteit 𝑡 ∗ is de marge van error om uit data σ te schatten. Het betrouwbaarheidsinterval
√𝑛
is precies C wanneer de populatieverdeling Normaal is en ongeveer correct voor grote n in andere
gevallen.
1
,Voorbeeld
In een huidig rapport van The Nielson Company, een bedrijf die gaat over media informatie,
concluderen dat adolescenten in de leeftijd van 18 tot 24 jaar gemiddeld 18.5 uur per week televisie
kijken. Is dit gemiddelde voor redenvatbaar voor college studenten? Om dit te onderzoeken, pak een
95% betrouwbaarheidsinterval voor de gemiddelde tijd (uren per week) van televisie kijken onder
U.S. college studenten. We geven de volgende SRS van grootte 8 van de populatie
3.0 16.5 10.5 40.5 5.5 33.5 0.0 6.5
3.0+16.5+10.5+40.5+5.5+33.5+0.0+6.5
Het steekproef gemiddelde: 𝑥̅ = = 14.5
8
𝑠 14.854
Graden van vrijheid: n – 1 = 7. De 𝑆𝐸𝑥̅ = √𝑛 = = 5.252
√8
Tabel D: df = 7. Dus:
𝑠
t* = 2.365. Dus betrouwbaarheidsinterval: 𝑥̅ ± 𝑡∗
√𝑛
14.854
14.5 ± 2.365∗ √8
14.5 ± 2.365∗ 5.252
14.5 ± 12.421
Dus: (2.08, 26.92). We zijn 95% zeker dat onder adolescenten de tijd van televisie kijken ligt tussen
2.1 en 26.9 uur per week.
De één-steekproef t-test
We gebruiken s in plaats van σ, en we gebruiken een t-verdeling om waarde P te vinden.
Een SRS van grootte n is getrokken van een populatie die een onbekend gemiddelde µ heeft. Om de
hypothese H0 : µ = µ0 te testen, gebaseerd op de SRS van grootte n, bereken de één-steekproef t-test:
𝑥̅ − µ
𝑡 = 𝑠/ √𝑛0
In termen van een random variabele T, die de t(n – 1 )-verdeling
heeft, de P-waarde voor een test tegen H0 :
Deze P-waarden zijn precies als de populatieverdeling Normaal is en
zijn ongeveer correct voor een grootte n in andere gevallen.
2
, Vervolg op het bovenstaand voorbeeld
We willen onderzoeken of de gemiddelde tijd van U.S. college studenten verschilt van het rapport
over het gemiddelde van 18 tot 24 jarigen met het significantie niveau 0.05. Specifiek testen we:
H0 : µ = 18.5 n=8 𝑥̅ = 14.5
Ha : µ ≠ 18.5 s = 14.584
𝑥̅ − µ0 14.5− 18.5
De t-test statistiek is 𝑡= 𝑠/√𝑛
dus 𝑡= 14.584/ √8
= −0.762
Dit betekent dat het steekproef gemiddelde 𝑥̅ = 14.5, meer dan 0.75 standaarddeviatie beneden de
nulhypothese µ = 18.5 ligt.
De graden van vrijheid is 7 dus deze t-test heeft de t(7)-verdeling.
Tabel D geeft het volgende weer:
p 0.25 0.20
t* 0.711 0.896
We kunnen concluderen dat de P-waarde tussen 2x0.20 = 0.40 en 2x0.25 = 0.50 ligt. Er is niet genoeg
bewijs dat we de nulhypothese kunnen verwerpen voor 0.05-niveau.
Matched-pairs t-procedures
Proefpersonen zijn opgedeeld in paren en hun uitkomsten worden vergeleken binnen het gematchte
paar. Dan kunnen deze vergeleken worden.
➔ Verschilscores worden vergeleken, daar wordt gemiddelde en SD uitgehaald waardoor de t-
statistiekformule ook weer kan worden toegepast om de P-waarde uit te rekenen.
Verschil scores:
- Het verschil 𝑥̅2 – 𝑥̅1
- Het verschil in de gemiddelden is gelijk aan het gemiddelde van de verschillen
- Steekproefgemiddelde van de verschil scores:
Gelijkwaardigheids-testen
- We proberen om te bewijzen dat het gemiddelde verschil binnen een acceptabel gebied rond
0 ligt. We kunnen dit uitvoeren met gebruik van een betrouwbaarheidsinterval
Veronderstel dat een SRS van grootte n is getrokken van een populatie die een onbekende µ heeft.
Om te testen of µ, met een significantie niveau σ, binnen een spreiding van gelijkwaardigheid aan µ0,
gespecifieerd met de interval µ0 ± δ:1
1. Bereken het betrouwbaarheidsinterval met C = 1 – 2σ
2. Vergelijk dit interval met de spreiding van gelijkwaardigheid
Als het betrouwbaarheidsinterval helemaal binnen µ0 ± δ valt, kan je concluderen dat µ gelijkwaardig
is aan µ0 . Als het betrouwbaarheidsinterval buiten de gelijkwaardigheidsspreiding valt of het bevat
waarde binnen én buiten de spreiding, kan je concluderen dat µ niet gelijkwaardig is aan µ0 .
Robuust
Een statistische gevolgtrekking procedure wordt robuust genoemd, als de benodigde kans
berekeningen ongevoelig zijn voor schendingen van de gemaakte aannames. Deze robuuste
procedures zijn erg nuttig in statistische praktijk omdat ze gebruikt kunnen worden over een wijde
spreiding van condities met een goed resultaat.
1
δ/Δ = ‘de verandering in’
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller IlseGeers. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.01. You're not tied to anything after your purchase.