Summary

Deel 2 Samenvatting hoofdstukken 'The Practice of Statistics in the Life Sciences'

Name: Deel 2 Samenvatting hoofdstukken 'The Practice of Statistics in the Life Sciences'
SKU: doc_1213802
Rating: 4.33 (3 reviews)
Author: aloeffen

3 reviews

14 purchases

Course
Klassieke statistische methoden

Institution
Universiteit Utrecht (UU)

Book
Practice of Statistics in the Life Sciences

Samenvatting van de volgende hoofdstukken van The Practice of Statistics in the Life Sciences: 19, 20, 22 t/m 24 en 26. Bevat tevens hoofdstuk 5 van het boek Measurement in Medicine over betrouwbaarheid en bevat daarnaast een stuk over poweranalyse en groepsgrootteberekening. Ik heb een 9,4 gehaald...

[Show more]

Preview 4 out of 42 pages

View example

Summarized whole book? No
Which chapters are summarized? Hoofdstukken: 19, 20, 22 t/m 24 en 26
Uploaded on July 12, 2021
Number of pages 42
Written in 2020/2021
Type Summary

statistiek
onderzoek
psls

Book Title:Practice of Statistics in the Life Sciences

Author(s):Brigitte Baldi, David S. Moore

Edition:Unknown
ISBN:9781319187606
Edition:4

Institution
Universiteit Utrecht (UU)
Education
Klinische Gezondheidwetenschappen
Course
Klassieke statistische methoden

3 reviews

By: saapkelisannebakker • 2 year ago

By: senorita__01 • 2 year ago

By: Isabelbek • 2 year ago

Translated by Google

It covers almost all the themes needed for the KSM test! Very happy with it.

aloeffen

Member since 8 year 151 documents sold

$6.99

Also available in package deal from $11.30

Add to cart

Add to wishlist

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Also available in package deal (1)

Samenvatting hoofdstukken The Practice of Statistics in the Life Sciences

$ 13.98 $ 11.30

34x sold

2 items

1. Summary - Deel 1 samenvatting hoofdstukken the practice of statistics in the life sciences
2. Summary - Deel 2 samenvatting hoofdstukken 'the practice of statistics in the life sciences'
Show more

Samenvatting stof Klassieke Statistische Methoden

Hoofdstuk 19: interference about a population proportion

Wanneer het gaat om het bestuderen van categorische variabelen.
Het schatten van één populatieproportie middels een steekproefproportie.
Het vergelijken van twee populatieproporties komt in hoofdstuk 20 aan de orde.

Populatieproportie: p
𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑖𝑛 𝑑𝑒 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓
Steekproefproportie: p̂ =
𝑡𝑜𝑡𝑎𝑎𝑙 𝑎𝑎𝑛𝑡𝑎𝑙 𝑖𝑛𝑑𝑖𝑣𝑖𝑑𝑢𝑒𝑛 𝑖𝑛 𝑑𝑒 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓

We gaan weer uit van de steekproefverdeling, maar dan voor proporties.

De steekproefverdeling van p̂
X = random variabele, is een telling van de voorvallen van een categorische variabele in een bepaald aantal
𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑖𝑛 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓 𝑋
observaties. Bij n voorvallen is de steekproefproportie: p̂ = =
𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓𝑔𝑟𝑜𝑜𝑡𝑡𝑒 𝑛

De steekproevenverdeling van de steekproefproportie bij een categorische variabele werkt op dezelfde manier
als de steekproevenverdeling van x̄: je neemt een grote steekproefgrootte en veel steekproeven →
steekproevenverdeling van de steekproefproportie.
- Het gemiddelde van de steekproefverdeling is p (daadwerkelijke proportie). Daarom is p̂ een zuivere
schatter van p.
- De standaarddeviatie is √𝑝(1 − 𝑝)/𝑛. Dit geldt alleen wanneer de populatie veel (minstens 20 keer)
groter is dan de steekproef. De standaarddeviatie wordt kleiner met de snelheid van √𝑛. Als we de
standaarddeviatie met 10 willen verkleinen hebben 100 keer zo veel observaties nodig.
- Als de steekproefgrootte toeneemt wordt de steekproefverdeling bij benadering normaal (geen
normale benadering gebruiken wanneer de steekproef klein is). Deze is het minst accuraat wanneer p
dicht bij 0 of 1 ligt (dan zijn grotere steekproeven nodig) als je normaal wil benaderen.
- Hoe groter de steekproefgrootte, hoe kleiner de spreiding, hoe dichter bij p.

Voorwaarden voor inferentie van een proportie:
- We hebben een SRS uit de populatie;
- De steekproefgrootte n is groot genoeg om zeker te zijn dat de steekproefverdeling van p̂ dicht bij
normaal ligt;
- De populatie is vele malen groter dan de steekproef (is bijna altijd zo).

Betrouwbaarheidsintervallen voor een proportie bij grote steekproeven

Betrouwbaarheidsinterval = p̂ ± foutmarge
Foutmarge m = kritische waarde × SE

We weten p niet. We gebruiken de standaardfout van p̂ .

𝑝̂(1−𝑝̂)
SEp̂ = √
𝑛
𝑝̂(1−𝑝̂)
Level C betrouwbaarheidsinterval voor p: p̂ ± z* √
𝑛
Dus: schatter ± z* SEschatter

Dit is alleen te gebruiken als zowel het aantal successen als het aantal mislukkingen minimaal 15 zijn.

We gebruiken hier dus kritieke z-scores en gaan niet uit van de t-verdeling (wat we wel doen wanneer we
inferentie willen doen van een gemiddelde waarbij de populatiestandaarddeviatie onbekend is).

,Voorbeeld:
Successen en mislukkingen zijn beiden groter dan 15.
p̂ = 0.27
n = 1921

0.27(1−0.27)
SEp̂ = √ = 0.01
1921

Z* voor een 95% BHI is 1.96 (tabel C).

m = 1.96 × 0.01 = 0.02

95% BHI voor p: p̂ ± m = 0.27 ± 0.02 = 0.25-0.29

Hiermee kunnen we zeggen dat we 95% zeker zijn dat de ware populatieproportie ergens tussen 0.25% en
0.29% ligt.

Liever niet afronden tussendoor, afronden op 4 decimalen in de meeste gevallen.
Bekijk ook altijd of er sprake is van non-respons en of dit tot bias leidt.

Meer accurate berekening van het betrouwbaarheidsinterval voor een proportie

Hier volgt een accurater betrouwbaarheidsinterval voor een proportie. In principe moet je deze altijd
gebruiken, maar je kunt het eens tegenkomen dat de manier voor grote steekproeven, zoals hierboven
beschreven, gebruikt is.

Dit noemen we de plus vier methode. Er worden 4 waarnemingen bij opgeteld, waarvan 2 successen en 2
mislukkingen. De plus vier schatter van p bereken je als volgt:

𝑎𝑎𝑛𝑡𝑎𝑙 𝑠𝑢𝑐𝑐𝑒𝑠𝑠𝑒𝑛 𝑖𝑛 𝑑𝑒 𝑠𝑡𝑒𝑒𝑘𝑝𝑟𝑜𝑒𝑓+2
p~ =
𝑛+4

Het betrouwbaarheidsinterval is precies hetzelfde, maar dan met de nieuwe steekproefgrootte en het nieuwe
aantal successen. Dus hiermee het BHI voor grote steekproeven gebruiken.

Je kunt dit gebruiken bij minimaal een 90% BHI en een minimale steekproefgrootte van 10. Het aantal
successen en mislukkingen maakt niet uit.

De plus vier methode is accurater omdat deze ervoor zorgt dat de geschatte proportie p̂ dichter naar 0.5
getrokken wordt en weg van 0 of 1 (welke dichterbij ligt).

𝑝~(1−𝑝~)
De SE wordt dan: √
(𝑛+4)

Het kiezen van de steekproefgrootte
Op deze manier zowel voor de methode van grote steekproeven als de plus vier methode.

Steekproefgrootte kiezen voor een gewenste foutmarge (je wil bijv. een 95% BHI):

𝑧∗ 2
n = ( ) p* (1-p*)
𝑚

z* is de kritische waarde voor het niveau BHI dat we willen.

𝑝̂(1−𝑝̂)
m = z* √ → er wordt meestal dus gegeven hoe groot de m maximaal mag zijn, deze vul je dan in
𝑛
bovenstaande formule in. De m ligt altijd ver onder de 1.

,We hebben om n te berekenen dus vooraf een geschatte waarde van p̂ nodig (p*), omdat we die voor het
kiezen van de steekproef dus nog niet weten. Dit kan op de volgende manieren:

- Gebruik p* = 0.5, m is het grootst wanneer p̂ = 0.5, dus bij iedere andere waarde van p̂ zullen we een
kleinere m krijgen dan gepland. Dit kun je doen wanneer je verwacht dat p̂ ergens tussen 0.3 en 0.7 zal
liggen.
- Kies een schatting op basis van een pilotstudie of een voorgaande ervaring met vergelijkbare studies.
Doe dit wanneer je verwacht dat p̂ onder 0.3 of boven 0.7 zal liggen. Anders zul je een veel grotere n
krijgen dan je eigenlijk nodig hebt als je dan p* = 0.5 gebruikt.

Voorbeeld:

Je wil weten hoe groot de sample moet zijn om een m=0.04 (4%) en 95% betrouwbaarheid te krijgen. Je
verwacht dat p̂ tussen 0.3 en 0.7 zal liggen, dus gebruikt p* = 0.5

1.96 2
Dit geeft: n = ( ) (0.5)(1 - 0.5) = 600.25 → altijd naar boven afronden dus n = 601.
0.04

Hoe kleiner je de m wilt, hoe groter je steekproef moet zijn. Let wel op dat de populatie een stuk groter moet
zijn dan je steekproef.

Hypothesetoets voor een proportie

Wanneer H0 waar is, is de steekproefverdeling voor p̂ ongeveer normaal verdeeld met p0 in het centrum en
standaarddeviatie √𝑝0(1 − 𝑝0)/𝑛

De toets statistiek voor H0: p = p0 is de steekproefproportie p̂ gestandaardiseerd door gebruik te maken van de
waarde onder p0 (omdat H0 ons een hypothetische waarde geeft hoeven hier verder geen aanpassingen
gedaan te worden):

̂−p0
p
z=
√𝑝0(1−𝑝0)
𝑛

De z-waarde is ongeveer normaal verdeeld wanneer H0 waar is. De p-waarde kun je als volgt weer aflezen in
tabel B.

Toets stappen:
- Neem een SRS uit een grote populatie met onbekende proportie van successen.
- Neem H0: p = p0
̂ −p0
p
- Bereken de z-waarde: z =
√𝑝0(1−𝑝0)
𝑛
- De p-waarde van een toets van H0 tegen:
Ha: p > p0 is P(Z ≥ z)

Ha: p < p0 is P(Z ≤ z)

Ha: p ≠ p0 is 2P(Z ≥ |z|)

Gebruik deze toets wanneer n is zo groot dat np0 en n(1-p0) gelijk of groter zijn dan 10.
Dit zijn de verwachte successen en mislukkingen wanneer H0 waar is.

Voorbeeld:
N=20
H0: p = 0.5, Ha: p > 0.5
p̂ = 0.95

, ̂−p0
p 0.95 −0.5
z= = (1−0.5)
= 4.025
√𝑝0(1−𝑝0) √0.5
𝑛 20

p-waarde: dit is het gebied rechts van z = 4.025. Normalcdf (4.025, 1e99, 0, 1) = 2.85e-5, wat ongeveer
neerkomt op 0.00003. Tabel C vertelt alleen dat P kleiner is dan 0.0005 omdat z = 4.025 groter is dan de
grootste kritische waarde 3.291 in de rij met de z-waardes.

Hoofdstuk 20: het vergelijken van twee proporties
Het vergelijken van de proporties van successen in twee populaties bij categorische variabelen.
We vergelijken de populaties middels inferentie over het verschil p1-p2, deze schatten we met p̂ 1- p̂ 2.

De steekproefverdeling van een verschil tussen proporties
- Wanneer de steekproeven groot zijn is de verdeling van p̂ 1- p̂ 2 ongeveer normaal verdeeld.
- Het gemiddelde van de steekproefverdeling van p̂ 1- p̂ 2 is p1-p2. Dat betekent dat de het verschil
tussen de steekproefproporties een zuivere schatter is voor het verschil tussen de
populatieproporties.
𝑃1 (1−𝑃1 ) 𝑃2 (1−𝑝2 )
- De standaarddeviatie van de steekproefverdeling: √ +
𝑛1 𝑛2

Betrouwbaarheidsinterval voor grote steekproeven voor het vergelijken van proporties
De bovenstaande standaarddeviatie bevat de onbekende parameters p1 en p2. Deze moeten we vervangen
met de schatters. We kunnen deze vervangen voor de steekproefproporties, zo krijgen we de standaardfout
van de statistiek p̂ 1- p̂ 2:

p̂1 (1−p̂1 ) p̂2 (1−p̂2 )
SE = √ +
𝑛1 𝑛2

Het betrouwbaarheidsinterval bereken je weer op dezelfde manier als in het vorige hoofdstuk:

(p̂ 1 - p̂ 2) ± z*SE

Gebruik dit alleen wanneer het aantal successen en het aantal mislukkingen in beide groepen minimaal 10 is.

Voorbeeld:
n1 = 355, aantal successen = 174, p̂ 1 = 0.4901
n2 = 342, aantal successen = 134, p̂ 2 = 0.3918

p̂ 1 - p̂ 2 = 0.0983

0.4901 (1−0.4901) 0.3918 (1−0.3918)
SE = √ + = 0.03743
355 342

Kritische waarde z* voor een 95% BHI = 1.96

Fourtmarge = 1.96 × 0.03743 = 0.0734

95% BHI voor p1 – p2 : 0.0983 ± 0.0734 = 0.0249 tot 0.1717

We zijn voor 95% zeker dat het percentage [successen] in groep 1 tussen de 0.0249% en 0.1717% (of 2 en 17
procentpunten) hoger ligt dan het percentage [successen] in groep 2.

Accuratere betrouwbaarheidsintervallen voor het vergelijken van proporties

Plus vier betrouwbaarheidsinterval: voeg vier fictieve observaties toe, één succes en één mislukking in beide
steekproeven. Bereken met deze nieuwe waarden het betrouwbaarheidsinterval volgens de grote
steekproeven methode. Gebruik dit wanneer de steekproefgrootte van beide groepen minimaal 5 is. Het aantal
successen of mislukkingen maakt niet uit.

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller aloeffen. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $6.99. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

62774 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 15 years now

Start selling

Popular Universities in the United States

Popular books

Find notes and summaries for these qualifications

Seller

Summary

Deel 2 Samenvatting hoofdstukken 'The Practice of Statistics in the Life Sciences'

Document information

Subjects

Connected book

Written for

3 reviews

Seller

Reviews received

Content preview

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Quick and easy check-out

Focus on what matters

Frequently asked questions

What do I get when I buy this document?

Satisfaction guarantee: how does it work?

Who am I buying these notes from?

Will I be stuck with a subscription?

Can Stuvia be trusted?