Summary

Statistiek voor data science samenvatting | 17/20 EERSTE ZIT HIR

9 views 0 purchase

Course
Statistiek voor data science (D0H19A)

Institution
Katholieke Universiteit Leuven (KU Leuven)

Deze samenvatting omvat alle leerstof uit de lessen Statistiek voor data science , gegeven aan de tweedejaars studenten Handelsingenieur door Christophe Croux. Deze samenvatting is gebaseerd op notities uit de lessen, aangevuld met de cursus en de powerpoints. Ik scoorde met deze samenvatting een 1...

[Show more]

Preview 4 out of 33 pages

View example

Uploaded on October 3, 2024
Number of pages 33
Written in 2024/2025
Type Summary

hir
statistiek
data
science
eerste
zit
r

Institution
Katholieke Universiteit Leuven (KU Leuven)
Education
Bachelor Handelsingenieur
Course
Statistiek voor data science (D0H19A)

adamloots

Member since 1 year 52 documents sold

$10.70

Also available in package deal from $26.77

Add to cart

Add to wishlist

100% satisfaction guarantee
Immediately available after payment
Both online and in PDF
No strings attached

Also available in package deal (1)

Pakket tweede jaar HIR

$ 65.23 $ 26.77

2x sold

7 items

1. Summary - conceptuele natuurkunde met technische toepassingen 15/20 eerste zit | hir
2. Summary - externe financiële verslaggeving samenvatting | 14/20 eerste zit hir/tew
3. Summary - Kansrekenen en beschrijvende statistiek | 14/20 eerste zit hir
4. Summary - Statistiek voor data science samenvatting | 17/20 eerste zit hir
5. Summary - Productie en logistiek management samenvatting | 18/20 eerste zit hir/tew
6. Summary - Linear optimisation samenvatting | 15/20 eerste zit hir
7. Summary - Bedrijfsfinanciering samenvatting | 18/20 eerste zit hir/tew
Show more

Statistiek voor data science
6. Hoofdstuk 6: Verdeling van steekproefgrootheden
6.0 Inleiding
In de praktijk kennen we meestal de kansverdeling niet van een situatie en dus ook niet de
verwachte waarde en de variantie. We bekijken kort 2 termen:
- Parameter: een numerieke beschrijvende maat van een populatie. De waarde ervan
is bijna altijd onbekend (bv: 𝑝 (kans op succes) in een binomiaal experiment, µ
(verwachting) en σ (standaardafwijking) bij een normale verdeling).
- Steekproefgrootheid: een numerieke beschrijvende maat van een steekproef. Deze
grootheid wordt berekend uit de waarden in de steekproef (bv: 𝑥 (gemiddelde) en 𝑠
(standaardafwijking) van een steekproef).

6.1 De verdeling van een steekproefgrootheid
De uitkomst van een steekproefgrootheid hangt van het toeval af en is bijgevolg een
stochastische variabele met een kansverdeling. Zo kan de kansverdeling voor een
steekproefgrootheid helemaal verschillen van een andere rond eenzelfde populatievariantie.

6.2 De centrale limietstelling

Eigenschappen van de kansverdeling van 𝑥: veronderstel een aselecte steekproef van 𝑛
waarnemingen getrokken uit een willekeurige populatie:
- De verwachting van de kansverdeling van het steekproefgemiddelde is de
verwachting van de populatie waaruit de steekproef wordt genomen. Dat wil zeggen:
µ𝑥 = 𝐸(𝑥) = µ.
- De standaardafwijking van de kansverdeling van het steekproefgemiddelde is gelijk
σ
aan: σ𝑥 = , waarbij σ𝑥 staat voor de standaardfout (standard error SE) van het
𝑛
gemiddelde en σ de standaardafwijking is van de populatie waaruit men trekt.

,Hierbij komen 3 belangrijke stellingen te pas:
- Steekproef uit een normale verdeling: als een aselecte steekproef van 𝑛
waarnemingen uit een populatie met een normale kansverdeling wordt genomen, zal
de kansverdeling van 𝑥 een normale verdeling zijn (blijft normaal).
- Steekproef uit een willekeurige verdeling: centrale limietstelling: als een aselecte
steekproef van 𝑛 waarnemingen uit een willekeurige populatie met verwachting µ en
standaardafwijking σ wordt genomen, zal, als 𝑛 groot genoeg is, de kansverdeling
van 𝑥 bij benadering normaal zijn met verwachting µ𝑥 = µ en standaardafwijking
σ
σ𝑥 = . Hoe groter de steekproef is, des te beter zal de benadering zijn.
𝑛
- De vraag rijst nu: Hoe groot moet 𝑛
zijn opdat de normale verdeling
een goede benadering geeft? Het
hangt af van de vorm van de
populatie, hoe meer de verdeling
afwijkt van de oorspronkelijke
populatie, des te groter de
steekproefomvang moet zijn. Voor
de meeste populaties zien we dat
𝑛 ≥ 30 voldoende zal zijn.

7. Hoofdstuk 7: Betrouwbaarheidsintervallen
gebaseerd op één enkele steekproef
7.1 Schatten van een parameter
(Punt)schatter: een regel of een formule voor een populatieparameter die ons zegt hoe we
uit de steekproef een getal moeten berekenen om de populatieparameter te schatten. Een
(punt)schatter is dus een steekproefgrootheid. De uitkomst van een schatter (een concreet
getal dus) noemen we een schatting.

Betrouwbaarheidsinterval (of intervalschatter): een regel of een formule die ons zegt hoe we
uit de steekproef een interval moeten berekenen dat de waarde van de parameter met een
bepaalde (hoge) waarschijnlijkheid bevat.

,7.2 Betrouwbaarheidsinterval voor een verwachting (𝑛 groot)
De betrouwbaarheidscoëfficiënt(1 − α) is de kans dat een betrouwbaarheidsinterval de
populatieparameter bevat. Uitgedrukt als percentage noemen we dit het
betrouwbaarheidsniveau.

Betrouwbaarheidsinterval voor µ (bij grote 𝑛):
σ
- σ bekend: 𝑥 ± 𝑧α/2σ𝑥 = 𝑥 ± 𝑧α/2 .
𝑛
𝑠
- σ onbekend: 𝑥 ± 𝑧α/2σ𝑥 ≈ 𝑥 ± 𝑧α/2 .
𝑛
⇒ Waarbij 𝑧α/2 de 𝑧-waarde is die hoort bij een oppervlakte α/2 in de staart van een
standaardnormale verdeling. σ𝑥 de standaardafwijking van de kansverdeling van 𝑥. σ en 𝑠 de
standaardafwijkingen in resp. populatie en steekproef.

Voorwaarden voor de geldigheid:

- De steekproef is een aselecte steekproef uit de populatie.
- De steekproefgrootte 𝑛 is groot (𝑛 ≥ 30). Deze voorwaarde komt voort uit de
centrale limietstelling. Hierdoor is de kansverdeling van 𝑥 bij benadering normaal. Bij
een grote 𝑛 zal 𝑠 ook een goede schatter zijn voor σ.

We bekijken een voorbeeld ter illustratie:

, 7.3 Betrouwbaarheidsinterval voor een verwachting (𝑛 klein)

Bij kleine steekproeven kunnen we niet langer veronderstellen dat de kansverdeling van 𝑥 bij
benadering normaal is, omdat de centrale limietstelling enkel geldt voor grote 𝑛, behalve als
de populatie waaruit we 𝑥 vinden normaal verdeeld is dan is 𝑥 ook normaal verdeeld (supra).

De standaardafwijking σ van de populatie is bijna altijd onbekend. Bij kleine steekproeven
kan 𝑠 van de steekproef een slechte benadering zijn voor σ van de populatie. Als de
populatie waaruit de steekproef wordt getrokken normaal verdeeld is, kunnen we bij een
𝑥−µ
onbekende σ gebruik maken van de steekproefgrootheid 𝑡 = .
𝑠/ 𝑛

2
𝑡-verdeling: een verdeling gebaseerd op een 𝑁(0, 1) en χ verdeling (zie slide 17-18 voor
achtergrondinfo die niet strikt te kennen is). De 𝑡-verdeling lijkt sterk op de normale
verdeling, maar is variabeler. Ze hangt niet alleen af van 𝑥, maar ook van 𝑠. Hij hangt af van
de vrijheidsgraden. Als de steekproef omvang 𝑛 heeft, dan heeft de 𝑡-verdeling 𝑛 − 1
vrijheidsgraden. Ook heeft deze heeft zwaardere staarten dan de normale verdeling. Hoe
kleiner 𝑛, hoe zwaarder de staarten. Voor 𝑛 → ∞ wordt de 𝑡-verdeling terug een
standaardnormale verdeling.

𝑠
Betrouwbaarheidsinterval voor kleine steekproef: 𝑥 ± 𝑡α/2 , waarbij 𝑡α/2 gebaseerd is op
𝑛
(𝑛 − 1) vrijheidsgraden. We doen dit bij de veronderstelling van een aselecte steekproef
uit een populatie genomen die bij benadering normaal is verdeeld en waarbij σ onbekend is.
We moeten aannemen dat de populatie waaruit de steekproef werd genomen normaal
verdeeld is. We moeten dus het interval vormen met een 𝑡α/2-waarde in plaats van een 𝑧α/2
-waarde (dat geeft een breder interval). We krijgen een lagere nauwkeurigheid omdat de
breedte van het interval omgekeerd evenredig is met 𝑛.

7.4 Betrouwbaarheidsinterval voor een fractie (𝑛 groot)
Als we de BI willen zoeken van een fractie dan zoeken we eigenlijk naar de “kans op succes”
#𝑠𝑢𝑐𝑐𝑒𝑠𝑒𝑛
𝑝 in een binomiaal experiment. We baseren ons hierbij op de steekproeffractie 𝑝= 𝑇𝑜𝑡𝑎𝑎𝑙
die de fractie positieve antwoorden geeft t.o.v. de totale antwoorden. Om de kansverdeling

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller adamloots. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $10.70. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

50843 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling

Popular Universities in the United States

Popular books

Find notes and summaries for these qualifications

Seller