100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Statistiek voor data science samenvatting | 17/20 EERSTE ZIT HIR $10.72   Add to cart

Summary

Statistiek voor data science samenvatting | 17/20 EERSTE ZIT HIR

 9 views  0 purchase
  • Course
  • Institution

Deze samenvatting omvat alle leerstof uit de lessen Statistiek voor data science , gegeven aan de tweedejaars studenten Handelsingenieur door Christophe Croux. Deze samenvatting is gebaseerd op notities uit de lessen, aangevuld met de cursus en de powerpoints. Ik scoorde met deze samenvatting een 1...

[Show more]

Preview 4 out of 33  pages

  • October 3, 2024
  • 33
  • 2024/2025
  • Summary
avatar-seller
Statistiek voor data science
6. Hoofdstuk 6: Verdeling van steekproefgrootheden
6.0 Inleiding
In de praktijk kennen we meestal de kansverdeling niet van een situatie en dus ook niet de
verwachte waarde en de variantie. We bekijken kort 2 termen:
- Parameter: een numerieke beschrijvende maat van een populatie. De waarde ervan
is bijna altijd onbekend (bv: 𝑝 (kans op succes) in een binomiaal experiment, µ
(verwachting) en σ (standaardafwijking) bij een normale verdeling).
- Steekproefgrootheid: een numerieke beschrijvende maat van een steekproef. Deze
grootheid wordt berekend uit de waarden in de steekproef (bv: 𝑥 (gemiddelde) en 𝑠
(standaardafwijking) van een steekproef).


6.1 De verdeling van een steekproefgrootheid
De uitkomst van een steekproefgrootheid hangt van het toeval af en is bijgevolg een
stochastische variabele met een kansverdeling. Zo kan de kansverdeling voor een
steekproefgrootheid helemaal verschillen van een andere rond eenzelfde populatievariantie.




6.2 De centrale limietstelling

Eigenschappen van de kansverdeling van 𝑥: veronderstel een aselecte steekproef van 𝑛
waarnemingen getrokken uit een willekeurige populatie:
- De verwachting van de kansverdeling van het steekproefgemiddelde is de
verwachting van de populatie waaruit de steekproef wordt genomen. Dat wil zeggen:
µ𝑥 = 𝐸(𝑥) = µ.
- De standaardafwijking van de kansverdeling van het steekproefgemiddelde is gelijk
σ
aan: σ𝑥 = , waarbij σ𝑥 staat voor de standaardfout (standard error SE) van het
𝑛
gemiddelde en σ de standaardafwijking is van de populatie waaruit men trekt.

,Hierbij komen 3 belangrijke stellingen te pas:
- Steekproef uit een normale verdeling: als een aselecte steekproef van 𝑛
waarnemingen uit een populatie met een normale kansverdeling wordt genomen, zal
de kansverdeling van 𝑥 een normale verdeling zijn (blijft normaal).
- Steekproef uit een willekeurige verdeling: centrale limietstelling: als een aselecte
steekproef van 𝑛 waarnemingen uit een willekeurige populatie met verwachting µ en
standaardafwijking σ wordt genomen, zal, als 𝑛 groot genoeg is, de kansverdeling
van 𝑥 bij benadering normaal zijn met verwachting µ𝑥 = µ en standaardafwijking
σ
σ𝑥 = . Hoe groter de steekproef is, des te beter zal de benadering zijn.
𝑛
- De vraag rijst nu: Hoe groot moet 𝑛
zijn opdat de normale verdeling
een goede benadering geeft? Het
hangt af van de vorm van de
populatie, hoe meer de verdeling
afwijkt van de oorspronkelijke
populatie, des te groter de
steekproefomvang moet zijn. Voor
de meeste populaties zien we dat
𝑛 ≥ 30 voldoende zal zijn.




7. Hoofdstuk 7: Betrouwbaarheidsintervallen
gebaseerd op één enkele steekproef
7.1 Schatten van een parameter
(Punt)schatter: een regel of een formule voor een populatieparameter die ons zegt hoe we
uit de steekproef een getal moeten berekenen om de populatieparameter te schatten. Een
(punt)schatter is dus een steekproefgrootheid. De uitkomst van een schatter (een concreet
getal dus) noemen we een schatting.

Betrouwbaarheidsinterval (of intervalschatter): een regel of een formule die ons zegt hoe we
uit de steekproef een interval moeten berekenen dat de waarde van de parameter met een
bepaalde (hoge) waarschijnlijkheid bevat.

,7.2 Betrouwbaarheidsinterval voor een verwachting (𝑛 groot)
De betrouwbaarheidscoëfficiënt(1 − α) is de kans dat een betrouwbaarheidsinterval de
populatieparameter bevat. Uitgedrukt als percentage noemen we dit het
betrouwbaarheidsniveau.




Betrouwbaarheidsinterval voor µ (bij grote 𝑛):
σ
- σ bekend: 𝑥 ± 𝑧α/2σ𝑥 = 𝑥 ± 𝑧α/2 .
𝑛
𝑠
- σ onbekend: 𝑥 ± 𝑧α/2σ𝑥 ≈ 𝑥 ± 𝑧α/2 .
𝑛
⇒ Waarbij 𝑧α/2 de 𝑧-waarde is die hoort bij een oppervlakte α/2 in de staart van een
standaardnormale verdeling. σ𝑥 de standaardafwijking van de kansverdeling van 𝑥. σ en 𝑠 de
standaardafwijkingen in resp. populatie en steekproef.

Voorwaarden voor de geldigheid:

- De steekproef is een aselecte steekproef uit de populatie.
- De steekproefgrootte 𝑛 is groot (𝑛 ≥ 30). Deze voorwaarde komt voort uit de
centrale limietstelling. Hierdoor is de kansverdeling van 𝑥 bij benadering normaal. Bij
een grote 𝑛 zal 𝑠 ook een goede schatter zijn voor σ.

We bekijken een voorbeeld ter illustratie:

, 7.3 Betrouwbaarheidsinterval voor een verwachting (𝑛 klein)

Bij kleine steekproeven kunnen we niet langer veronderstellen dat de kansverdeling van 𝑥 bij
benadering normaal is, omdat de centrale limietstelling enkel geldt voor grote 𝑛, behalve als
de populatie waaruit we 𝑥 vinden normaal verdeeld is dan is 𝑥 ook normaal verdeeld (supra).

De standaardafwijking σ van de populatie is bijna altijd onbekend. Bij kleine steekproeven
kan 𝑠 van de steekproef een slechte benadering zijn voor σ van de populatie. Als de
populatie waaruit de steekproef wordt getrokken normaal verdeeld is, kunnen we bij een
𝑥−µ
onbekende σ gebruik maken van de steekproefgrootheid 𝑡 = .
𝑠/ 𝑛


2
𝑡-verdeling: een verdeling gebaseerd op een 𝑁(0, 1) en χ verdeling (zie slide 17-18 voor
achtergrondinfo die niet strikt te kennen is). De 𝑡-verdeling lijkt sterk op de normale
verdeling, maar is variabeler. Ze hangt niet alleen af van 𝑥, maar ook van 𝑠. Hij hangt af van
de vrijheidsgraden. Als de steekproef omvang 𝑛 heeft, dan heeft de 𝑡-verdeling 𝑛 − 1
vrijheidsgraden. Ook heeft deze heeft zwaardere staarten dan de normale verdeling. Hoe
kleiner 𝑛, hoe zwaarder de staarten. Voor 𝑛 → ∞ wordt de 𝑡-verdeling terug een
standaardnormale verdeling.




𝑠
Betrouwbaarheidsinterval voor kleine steekproef: 𝑥 ± 𝑡α/2 , waarbij 𝑡α/2 gebaseerd is op
𝑛
(𝑛 − 1) vrijheidsgraden. We doen dit bij de veronderstelling van een aselecte steekproef
uit een populatie genomen die bij benadering normaal is verdeeld en waarbij σ onbekend is.
We moeten aannemen dat de populatie waaruit de steekproef werd genomen normaal
verdeeld is. We moeten dus het interval vormen met een 𝑡α/2-waarde in plaats van een 𝑧α/2
-waarde (dat geeft een breder interval). We krijgen een lagere nauwkeurigheid omdat de
breedte van het interval omgekeerd evenredig is met 𝑛.


7.4 Betrouwbaarheidsinterval voor een fractie (𝑛 groot)
Als we de BI willen zoeken van een fractie dan zoeken we eigenlijk naar de “kans op succes”
#𝑠𝑢𝑐𝑐𝑒𝑠𝑒𝑛
𝑝 in een binomiaal experiment. We baseren ons hierbij op de steekproeffractie 𝑝= 𝑇𝑜𝑡𝑎𝑎𝑙
die de fractie positieve antwoorden geeft t.o.v. de totale antwoorden. Om de kansverdeling

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller adamloots. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $10.72. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

72042 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$10.72
  • (0)
  Add to cart