Samenvatting

Statistiek voor data science samenvatting | 17/20 EERSTE ZIT HIR

1 keer verkocht

Instelling
Katholieke Universiteit Leuven (KU Leuven)

Deze samenvatting omvat alle leerstof uit de lessen Statistiek voor data science , gegeven aan de tweedejaars studenten Handelsingenieur door Christophe Croux. Deze samenvatting is gebaseerd op notities uit de lessen, aangevuld met de cursus en de powerpoints. Ik scoorde met deze samenvatting een 1...

[Meer zien]

Voorbeeld 4 van de 33 pagina's

Bekijk voorbeeld

Geupload op 3 oktober 2024
Aantal pagina's 33
Geschreven in 2024/2025
Type Samenvatting

Volgen

adamloots Lid sinds 1 jaar 72 documenten verkocht

€9,99

Ook beschikbaar in voordeelbundel v.a. €24,99

In winkelwagen

Opslaan

100% tevredenheidsgarantie
Direct beschikbaar na je betaling
Lees online óf als PDF
Geen vaste maandelijkse kosten

Ook beschikbaar in voordeelbundel (2)

Pakket tweede jaar HIR

€ 62,89 € 34,99

3x verkocht

7 items

1. Samenvatting - conceptuele natuurkunde met technische toepassingen 15/20 eerste zit | hir
2. Samenvatting - externe financiële verslaggeving samenvatting | 14/20 eerste zit hir/tew
3. Samenvatting - Kansrekenen en beschrijvende statistiek | 14/20 eerste zit hir
4. Samenvatting - Statistiek voor data science samenvatting | 17/20 eerste zit hir
5. Samenvatting - Productie en logistiek management samenvatting | 18/20 eerste zit hir/tew
6. Samenvatting - Linear optimisation samenvatting | 15/20 eerste zit hir
7. Samenvatting - Bedrijfsfinanciering samenvatting | 18/20 eerste zit hir/tew
Meer zien

HIR jaar 2 semester 2 pakket | MINIMAAL 15/20 EERSTE ZIT

€ 36,94 € 24,99 4 items

1. Samenvatting - Statistiek voor data science samenvatting | 17/20 eerste zit hir
2. Samenvatting - Productie en logistiek management samenvatting | 18/20 eerste zit hir/tew
3. Samenvatting - Linear optimisation samenvatting | 15/20 eerste zit hir
4. Samenvatting - Bedrijfsfinanciering samenvatting | 18/20 eerste zit hir/tew
Meer zien

Statistiek voor data science
6. Hoofdstuk 6: Verdeling van steekproefgrootheden
6.0 Inleiding
In de praktijk kennen we meestal de kansverdeling niet van een situatie en dus ook niet de
verwachte waarde en de variantie. We bekijken kort 2 termen:
- Parameter: een numerieke beschrijvende maat van een populatie. De waarde ervan
is bijna altijd onbekend (bv: 𝑝 (kans op succes) in een binomiaal experiment, µ
(verwachting) en σ (standaardafwijking) bij een normale verdeling).
- Steekproefgrootheid: een numerieke beschrijvende maat van een steekproef. Deze
grootheid wordt berekend uit de waarden in de steekproef (bv: 𝑥 (gemiddelde) en 𝑠
(standaardafwijking) van een steekproef).

6.1 De verdeling van een steekproefgrootheid
De uitkomst van een steekproefgrootheid hangt van het toeval af en is bijgevolg een
stochastische variabele met een kansverdeling. Zo kan de kansverdeling voor een
steekproefgrootheid helemaal verschillen van een andere rond eenzelfde populatievariantie.

6.2 De centrale limietstelling

Eigenschappen van de kansverdeling van 𝑥: veronderstel een aselecte steekproef van 𝑛
waarnemingen getrokken uit een willekeurige populatie:
- De verwachting van de kansverdeling van het steekproefgemiddelde is de
verwachting van de populatie waaruit de steekproef wordt genomen. Dat wil zeggen:
µ𝑥 = 𝐸(𝑥) = µ.
- De standaardafwijking van de kansverdeling van het steekproefgemiddelde is gelijk
σ
aan: σ𝑥 = , waarbij σ𝑥 staat voor de standaardfout (standard error SE) van het
𝑛
gemiddelde en σ de standaardafwijking is van de populatie waaruit men trekt.

,Hierbij komen 3 belangrijke stellingen te pas:
- Steekproef uit een normale verdeling: als een aselecte steekproef van 𝑛
waarnemingen uit een populatie met een normale kansverdeling wordt genomen, zal
de kansverdeling van 𝑥 een normale verdeling zijn (blijft normaal).
- Steekproef uit een willekeurige verdeling: centrale limietstelling: als een aselecte
steekproef van 𝑛 waarnemingen uit een willekeurige populatie met verwachting µ en
standaardafwijking σ wordt genomen, zal, als 𝑛 groot genoeg is, de kansverdeling
van 𝑥 bij benadering normaal zijn met verwachting µ𝑥 = µ en standaardafwijking
σ
σ𝑥 = . Hoe groter de steekproef is, des te beter zal de benadering zijn.
𝑛
- De vraag rijst nu: Hoe groot moet 𝑛
zijn opdat de normale verdeling
een goede benadering geeft? Het
hangt af van de vorm van de
populatie, hoe meer de verdeling
afwijkt van de oorspronkelijke
populatie, des te groter de
steekproefomvang moet zijn. Voor
de meeste populaties zien we dat
𝑛 ≥ 30 voldoende zal zijn.

7. Hoofdstuk 7: Betrouwbaarheidsintervallen
gebaseerd op één enkele steekproef
7.1 Schatten van een parameter
(Punt)schatter: een regel of een formule voor een populatieparameter die ons zegt hoe we
uit de steekproef een getal moeten berekenen om de populatieparameter te schatten. Een
(punt)schatter is dus een steekproefgrootheid. De uitkomst van een schatter (een concreet
getal dus) noemen we een schatting.

Betrouwbaarheidsinterval (of intervalschatter): een regel of een formule die ons zegt hoe we
uit de steekproef een interval moeten berekenen dat de waarde van de parameter met een
bepaalde (hoge) waarschijnlijkheid bevat.

,7.2 Betrouwbaarheidsinterval voor een verwachting (𝑛 groot)
De betrouwbaarheidscoëfficiënt(1 − α) is de kans dat een betrouwbaarheidsinterval de
populatieparameter bevat. Uitgedrukt als percentage noemen we dit het
betrouwbaarheidsniveau.

Betrouwbaarheidsinterval voor µ (bij grote 𝑛):
σ
- σ bekend: 𝑥 ± 𝑧α/2σ𝑥 = 𝑥 ± 𝑧α/2 .
𝑛
𝑠
- σ onbekend: 𝑥 ± 𝑧α/2σ𝑥 ≈ 𝑥 ± 𝑧α/2 .
𝑛
⇒ Waarbij 𝑧α/2 de 𝑧-waarde is die hoort bij een oppervlakte α/2 in de staart van een
standaardnormale verdeling. σ𝑥 de standaardafwijking van de kansverdeling van 𝑥. σ en 𝑠 de
standaardafwijkingen in resp. populatie en steekproef.

Voorwaarden voor de geldigheid:

- De steekproef is een aselecte steekproef uit de populatie.
- De steekproefgrootte 𝑛 is groot (𝑛 ≥ 30). Deze voorwaarde komt voort uit de
centrale limietstelling. Hierdoor is de kansverdeling van 𝑥 bij benadering normaal. Bij
een grote 𝑛 zal 𝑠 ook een goede schatter zijn voor σ.

We bekijken een voorbeeld ter illustratie:

, 7.3 Betrouwbaarheidsinterval voor een verwachting (𝑛 klein)

Bij kleine steekproeven kunnen we niet langer veronderstellen dat de kansverdeling van 𝑥 bij
benadering normaal is, omdat de centrale limietstelling enkel geldt voor grote 𝑛, behalve als
de populatie waaruit we 𝑥 vinden normaal verdeeld is dan is 𝑥 ook normaal verdeeld (supra).

De standaardafwijking σ van de populatie is bijna altijd onbekend. Bij kleine steekproeven
kan 𝑠 van de steekproef een slechte benadering zijn voor σ van de populatie. Als de
populatie waaruit de steekproef wordt getrokken normaal verdeeld is, kunnen we bij een
𝑥−µ
onbekende σ gebruik maken van de steekproefgrootheid 𝑡 = .
𝑠/ 𝑛

2
𝑡-verdeling: een verdeling gebaseerd op een 𝑁(0, 1) en χ verdeling (zie slide 17-18 voor
achtergrondinfo die niet strikt te kennen is). De 𝑡-verdeling lijkt sterk op de normale
verdeling, maar is variabeler. Ze hangt niet alleen af van 𝑥, maar ook van 𝑠. Hij hangt af van
de vrijheidsgraden. Als de steekproef omvang 𝑛 heeft, dan heeft de 𝑡-verdeling 𝑛 − 1
vrijheidsgraden. Ook heeft deze heeft zwaardere staarten dan de normale verdeling. Hoe
kleiner 𝑛, hoe zwaarder de staarten. Voor 𝑛 → ∞ wordt de 𝑡-verdeling terug een
standaardnormale verdeling.

𝑠
Betrouwbaarheidsinterval voor kleine steekproef: 𝑥 ± 𝑡α/2 , waarbij 𝑡α/2 gebaseerd is op
𝑛
(𝑛 − 1) vrijheidsgraden. We doen dit bij de veronderstelling van een aselecte steekproef
uit een populatie genomen die bij benadering normaal is verdeeld en waarbij σ onbekend is.
We moeten aannemen dat de populatie waaruit de steekproef werd genomen normaal
verdeeld is. We moeten dus het interval vormen met een 𝑡α/2-waarde in plaats van een 𝑧α/2
-waarde (dat geeft een breder interval). We krijgen een lagere nauwkeurigheid omdat de
breedte van het interval omgekeerd evenredig is met 𝑛.

7.4 Betrouwbaarheidsinterval voor een fractie (𝑛 groot)
Als we de BI willen zoeken van een fractie dan zoeken we eigenlijk naar de “kans op succes”
#𝑠𝑢𝑐𝑐𝑒𝑠𝑒𝑛
𝑝 in een binomiaal experiment. We baseren ons hierbij op de steekproeffractie 𝑝= 𝑇𝑜𝑡𝑎𝑎𝑙
die de fractie positieve antwoorden geeft t.o.v. de totale antwoorden. Om de kansverdeling

Dit zijn jouw voordelen als je samenvattingen koopt bij Stuvia:

Bewezen kwaliteit door reviews

Studenten hebben al meer dan 850.000 samenvattingen beoordeeld. Zo weet jij zeker dat je de beste keuze maakt!

In een paar klikken geregeld

Geen gedoe — betaal gewoon eenmalig met iDeal, Bancontact of creditcard en je bent klaar. Geen abonnement nodig.

Focus op de essentie

Studenten maken samenvattingen voor studenten. Dat betekent: actuele inhoud waar jij écht wat aan hebt. Geen overbodige details!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper adamloots. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €9,99. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 64419 samenvattingen verkocht

Opgericht in 2010, al 15 jaar dé plek om samenvattingen te kopen

Start met verkopen

Laatst bekeken door jou

Tentamen (uitwerkingen) ·

(0)

ICEV Final Exam Questions with 100% Correct Answers | Latest Version 2024 | Verified

Voordeelbundel ·

(0)

BIOL 200 Exam Package Deal 100% Guaranteed Pass.

Voordeelbundel ·

(0)

Samenvatting

Statistiek voor data science samenvatting | 17/20 EERSTE ZIT HIR

Document informatie

Onderwerpen

Geschreven voor

Verkoper

Ontvangen beoordelingen

Voorbeeld van de inhoud

Dit zijn jouw voordelen als je samenvattingen koopt bij Stuvia:

Bewezen kwaliteit door reviews

In een paar klikken geregeld

Focus op de essentie

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Tevredenheidsgarantie: hoe werkt dat?

Van wie koop ik deze samenvatting?

Zit ik meteen vast aan een abonnement?

Is Stuvia te vertrouwen?

Laatst bekeken door jou

Tentamen (uitwerkingen) ·

ICEV Final Exam Questions with 100% Correct Answers | Latest Version 2024 | Verified

Voordeelbundel ·

BIOL 200 Exam Package Deal 100% Guaranteed Pass.

Voordeelbundel ·

LU 6 Kennis 'haar-en talg (afwijkingen) Leerdoel 1 tot en met 19