100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Statistiek 2 (HFST 1 t.e.m. 13) $5.51   Add to cart

Summary

Samenvatting Statistiek 2 (HFST 1 t.e.m. 13)

2 reviews
 461 views  39 purchases
  • Course
  • Institution
  • Book

Samenvatting van hoofdstukken 1 t.e.m. 13 van het vak Statistiek 2 uit 2de bachelor TEW BK. Let op: de overige hoofdstukken uit het boek zijn ook te kennen, maar zijn niet opgenomen in deze samenvatting.

Preview 5 out of 115  pages

  • No
  • H1, h2, h3, h4, h5, h6, h7, h8, h9, h10, h11, h12, h13
  • May 30, 2018
  • 115
  • 2017/2018
  • Summary

2  reviews

review-writer-avatar

By: hanvanwijnsberghe1 • 3 year ago

review-writer-avatar

By: hingst_sander • 4 year ago

avatar-seller
DEEL I: SCHATTERS EN TOETSEN
Hoofdstuk 1: Het schatten van
populatieparameters
1.1 Inleiding: schatter versus schatting
De populatieparameters µ, σ2, π en λ zijn in de praktijk zelden of nooit bekend. Men zal deze
parameters dus proberen te schatten. Deze schatting is gebaseerd op een aantal metingen of
waarnemingen 𝑥1 , 𝑥2 , … , 𝑥𝑛 , met andere woorden: de steekproefgegevens.

De schatting voor een onbekende zal een functie zijn van de verzamelde steekproefwaarden
𝑥1 , 𝑥2 , … , 𝑥𝑛 (bv. steekproefgemiddelde 𝑥̅ ). Elke onderzoeker die hetzelfde probleem bestudeert,
verkrijgt echter andere steekproefwaarden en bijgevolg ook een ander steekproefgemiddelde of
andere schatting. De reden hiervoor is dat de onbekende die we zoeken een kansvariabele is. Het
trekken van een steekproef en het verzamelen van steekproefgegevens is een kansexperiment.

We kunnen dit voorstellen door hoofdletters te gebruiken voor de steekproefwaarnemingen
𝑋1 , 𝑋2 , … , 𝑋𝑛 . We kunnen dit ook voorstellen door een hoofdletter te gebruiken voor bv. het
steekproefgemiddelde 𝑋̅. Het steekproefgemiddelde wordt dan geïnterpreteerd als een
kansvariabele en dan spreekt men van een schatter in plaats van een schatting.

• Schatting = reëel getal (kleine letter)
• Schatter = kansvariabele waarvan de waarde nog niet bekend is (hoofdletter)
o Een schatter heeft een
▪ verwachte waarde
▪ variantie
▪ kansverdeling of -dichtheid

Men wil graag een schatting verkrijgen die gemiddeld gelijk is aan de onbekende parameter en liefst
gegarandeerd dicht bij de onbekende parameter ligt.
Met andere woorden:
• De schatter moet onvertekend zijn (zuiver)
• De schatter moet een kleine variantie hebben

1.2 Het schatten van een gemiddelde
Twee simulatiestudies:
• Normaal verdeelde populatie
• Populatie met exponentiële kansdichtheid

1.2.1 Gemiddelde van een normaal verdeelde populatie
Opties op de onbekende waarde µ te schatten:
• Steekproefgemiddelde (X ̅ of E(X)) berekenen
• Mediaan (Me) berekenen

Bij een normaal verdeelde populatie: µ = E(X) = Me



1

,We kunnen dus per steekproef een gemiddelde en een mediaan berekenen (bv. 1000 steekproeven).
Steekproefmedianen liggen over het algemeen verder van het populatiegemiddelde dan
steekproefgemiddeldes.

Het gemiddelde van alle steekproefmedianen en het gemiddelde van alle steekproefgemiddeldes
liggen bijzonder dicht bij de echte waarde van µ. Als het aantal steekproeven zou opgedreven
worden, dan zouden de gemiddeldes van de steekproefgemiddeldes en de steekproefmedianen
gelijk worden aan de ‘onbekende’ µ.
 We zeggen dus dat het steekproefgemiddelde en de -mediaan zuivere schatters of
onvertekende schatters zijn van het gemiddelde van een normaal verdeelde populatie.

Het steekproefgemiddelde is echter een betrouwbaardere schatter voor het onbekende
populatiegemiddelde dan de mediaan. De grotere variantie van de medianen geeft aan dat de
medianen doorgaans verder af liggen van hun gemiddelde dan de steekproefgemiddeldes. Het
steekproefgemiddelde ligt doorgaans dichter bij de onbekende µ.
 We zeggen dus dat de ene schatter (steekproefgemiddelde) een efficiëntere of een
preciezere schatter is dan de andere (mediaan).

1.2.2 Gemiddelde van een exponentieel verdeelde populatie
Opties om de onbekende waarde µ te schatten:
• Steekproefgemiddelde (X̅ of E(X)) berekenen

De mediaan is bij een exponentieel verdeelde populatie een vertekende schatter van het
populatiegemiddelde. De mediaan is totaal niet gelijk aan µ, en dit zal ook niet veranderen als het
aantal steekproeven wordt verhoogd.

1.3 Criteria voor schatters
1.3.1 Een onvertekende of zuivere schatter
Een ideale schatter bestaat niet. Uit voorgaande blijkt wel dat sommige schatters, namelijk zuivere of
onvertekende schatters, gemiddeld gezien gelijk zijn aan de onbekende populatieparameters, terwijl
andere systematisch een populatieparameter onder- of overschatten.

Definitie 1.3.1
Een schatter 𝜃̂ voor een populatieparameter 𝜃 is zuiver of onvertekend indien 𝐸(𝜃̂) = 𝜃.

De vertekening van een schatter is het verschil: 𝑉(𝜃̂) = |𝐸(𝜃̂) − 𝜃|. Een zuivere schatter heeft een
vertekening van 0.

Bij een onvertekende schatter verwacht men, vooraleer de steekproefgegevens verzameld zijn, dat
de uiteindelijke schatting precies gelijk zal zijn aan de gezochte parameter. Zodra de
steekproefgegevens verzameld zijn, zal de schatting wel in de buurt van de onbekende
populatieparameter liggen, maar niet precies erop.

Het symbool θ̂ wordt gebruikt om een schatter (of schattingsmethode) aan te duiden voor de
onbekende parameter θ. De drie specifieke schatters die wij gaan gebruiken zijn:
• Steekproefgemiddelde ̅ X
• Steekproefproportie P ̂
• Steekproefvariantie S 2

Het steekproefgemiddelde X ̅ is een onvertekende of zuivere schatter van een populatiegemiddelde µ
Dit geldt eigenlijk voor alle mogelijke lineaire functies Y = ∑ni=1 αi Xi van de steekproefwaarnemingen

2

,waarvoor ∑ni=1 αi = 1, en het steekproefgemiddelde is een speciaal geval van zo’n lineaire
1
combinatie waarbij elke αi = 𝑛:
𝑛
1 1 1 1 1
𝑋̅ = ∑ 𝑋𝑖 = (𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ) = 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
𝑛 𝑛 𝑛 𝑛 𝑛
𝑖=1

Het steekproefgemiddelde heeft de kleinste variantie van alle mogelijke lineaire functies van
𝑋1 , 𝑋2 , … , 𝑋𝑛 . Met andere woorden: het steekproefgemiddelde zal de onderzoeker doorgaans een
schatting opleveren die dichter bij het populatiegemiddelde ligt dan om het even welke andere
lineaire functie Y van 𝑋1 , 𝑋2 , … , 𝑋𝑛 .
 = beste lineaire onvertekende schatter
= best lineair unbiased estimater (BLUE)

De steekproefvariantie S 2 is een onvertekende schatter van een populatievariantie σ2 :
𝑛
1
2
𝑆 = ∑(𝑋𝑖 − 𝑋̅)2
𝑛−1
𝑖=1
De steekproefstandaarddeviatie S is wel een vertekende schatter van de populatiestandaarddeviatie
σ.

De steekproefproportie P ̂ is een speciaal geval van een steekproefgemiddelde. De verwachte waarde
̂ een onvertekende schatter is.
ervan is gelijk aan de populatieproportie π, zodat ook P

1.3.2 Precisie of efficiëntie van een schatter
Schatters moeten zo betrouwbaar mogelijk zijn en schattingen opleveren die dicht bij de onbekende
populatieparameter liggen. De schatter moet dus een kleine variantie of standaarddeviatie bezitten.
Een schatter met een kleine variantie noemt men een precieze of efficiënte schatter.

Wanneer 𝜃̂1 en 𝜃̂2 twee onvertekende of zuivere schatters zijn voor eenzelfde onbekende
̂ )
𝑣𝑎𝑟(𝜃
populatieparameter 𝜃, dan wordt de relatieve efficiëntie van 𝜃̂2 t.o.v. 𝜃̂1 berekend als 𝑣𝑎𝑟(𝜃̂1 ).
2


Soms moet men kiezen tussen een onvertekende inefficiënte schatter en een vertekende efficiënte
schatter. Om een beslissing te nemen, kiest men voor de schatter die de kleinste gemiddelde
gekwadrateerde afwijking (GGA) bezit:

Definitie 1.3.2
De gemiddelde gekwadrateerde afwijking van een schatter 𝜃̂ is de som van zijn variantie en het
kwadraat van zijn vertekening:
2
𝐺𝐺𝐴(𝜃̂) = 𝑣𝑎𝑟(𝜃̂) + (𝑉(𝜃̂))

Ten slotte is het ook wenselijk dat de nauwkeurigheid of de precisie van een schatter toeneemt
naarmate het aantal waarnemingen toeneemt. Meer waarnemingen leveren immers meer
informatie, zodat betere schattingen verwacht kunnen worden.

1.4 Methodes voor het berekenen van schatters
Er zijn drie methoden om schatters te vinden:
• Methode van de momenten
• Methode van de kleinste kwadraten
• Methode van de grootste aannemelijkheid (maximum likelihood method)



3

,1.5 Het steekproefgemiddelde
1.5.1 Verwachte waarde en variantie
We beschouwen het steekproefgemiddelde als een kansvariabele of schatter zolang we geen data
verzameld hebben, dus zolang de individuele waarnemingen 𝑋1 , 𝑋2 , … , 𝑋𝑛 niet bekend zijn.
𝑛
1
𝑋̅ = ∑ 𝑋𝑖
𝑛
𝑖=1

Zodra de gegevens verzameld zijn, gebruiken we voor de individuele waarnemingen kleine letters:
𝑥1 , 𝑥2 , … , 𝑥𝑛 . We berekenen het steekproefgemiddelde (schatting) op basis van deze waarnemingen.
𝑛
1
𝑥̅ = ∑ 𝑥𝑖
𝑛
𝑖=1

Stelling 1.1
Voor een lukrake steekproef uit een populatie met verwachte waarde µ geldt dat: 𝐸(𝑋̅) = µ.

Bewijs
𝑛
1
𝐸(𝑋̅) = 𝐸 ( ∑ 𝑋𝑖 )
𝑛
𝑖=1
𝑛
1
= ∑ 𝐸(𝑋𝑖 )
𝑛
𝑖=1
1
= (µ + µ + ⋯ + µ)
𝑛
𝑛µ
=
𝑛

Deze stelling geeft aan dat, voordat de steekproefgegevens verzameld worden, de verwachte waarde
van het steekproefgemiddelde gelijk is aan het populatiegemiddelde. Met andere woorden, deze
stelling toont aan dat het steekproefgemiddelde een onvertekende of zuivere schatter is van het
populatiegemiddelde. Eens de steekproef uitgevoerd, vinden we voor de steekproefwaarnemingen
𝑥1 , 𝑥2 , … , 𝑥𝑛 een steekproefgemiddelde 𝑥̅ , dit zal natuurlijk niet precies gelijk zijn aan µ.

Om een idee te krijgen van de grootte van de mogelijke afwijkingen tussen het
steekproefgemiddelde 𝑋̅ en het populatiegemiddelde µ, kan men de variantie en de
standaarddeviatie van 𝑋̅ bestuderen. De standaarddeviatie van een steekproefgemiddelde ligt lager
dan de standaarddeviatie van een individuele waarneming (= populatiestandaarddeviatie). Bijgevolg
zal ook de variantie van een steekproefgemiddelde kleiner zijn dan de variantie van een individuele
waarneming.

Stelling 1.2
Voor een lukrake steekproef van n waarnemingen uit een populatie met variantie 𝜎 2 geldt dat
𝜎2
𝜎𝑋2̅ = 𝑣𝑎𝑟(𝑋̅) =
𝑛
en
𝜎
𝜎𝑋̅ =
√𝑛




4

, Bewijs
𝑛
1
𝜎𝑋2̅ = 𝑣𝑎𝑟(𝑋̅) = 𝑣𝑎𝑟 ( ∑ 𝑋𝑖 )
𝑛
𝑖=1
𝑛
1
= ∑ 𝑣𝑎𝑟(𝑋𝑖 )
𝑛2
𝑖=1
1
= 2 (𝜎 2 + 𝜎 2 + ⋯ + 𝜎 2 )
𝑛
𝑛𝜎 2
= 2
𝑛
𝜎2
=
𝑛
In de tweede stap van het bewijs wordt verondersteld dat de covariantie tussen twee verschillende
steekproefwaarnemingen 𝑋𝑖 en 𝑋𝑗 gelijk is aan 0. Dan is de variantie van een lineaire combinatie van
kansvariabelen gelijk aan een lineaire combinatie van de varianties, met gekwadrateerde
coëfficiënten:
𝑣𝑎𝑟(𝑎𝑋 + 𝑏𝑌) = 𝑎2 𝑣𝑎𝑟(𝑋) + 𝑏 2 𝑣𝑎𝑟(𝑌) + 2𝑎𝑏 𝑐𝑜𝑣(𝑋, 𝑌)
wat vereenvoudigd kan worden tot
𝑣𝑎𝑟(𝑎𝑋 + 𝑏𝑌) = 𝑎2 𝑣𝑎𝑟(𝑋) + 𝑏 2 𝑣𝑎𝑟(𝑌)
indien de kansvariabelen X en Y onafhankelijk of ongecorreleerd zijn (𝑐𝑜𝑣(𝑋, 𝑌) = 0).

Het bewijs geeft aan dat de variantie van het steekproefgemiddelde lineair afneemt wanneer de
steekproefgrootte n toeneemt. Dit betekent dat, naarmate een steekproef groter wordt, de kans
groter wordt dat een steekproefgemiddelde 𝑥̅ dicht bij (de onbekende) µ zal liggen.

𝜎𝑋̅ = standaardfout of standard error (vierkantswortel van deze variantie)
𝑠
o Geschatte versie:
√𝑛

1.5.2 Kansdichtheid van het steekproefgemiddelde uit een normaal verdeelde
populatie
Stelling 1.3
Indien 𝑋1 , 𝑋2 , … , 𝑋𝑘 onafhankelijke normaal verdeelde kansvariabelen zijn met verwachte waarden
respectievelijk gelijk aan 𝐸(𝑋1 ) = 𝜇1 , 𝐸(𝑋2 ) = 𝜇2 , … , 𝐸(𝑋𝑘 ) = 𝜇𝑘 en varianties respectievelijk gelijk
aan 𝑣𝑎𝑟(𝑋1 ) = 𝜎12 , 𝑣𝑎𝑟(𝑋2 ) = 𝜎22 , … , 𝑣𝑎𝑟(𝑋𝑘 ) = 𝜎𝑘2 , dan is er een lineaire functie
𝑌 = 𝛼0 + ∑𝑘𝑖=1 𝛼𝑖 𝑋𝑖 eveneens normaal verdeeld met verwachte waarde 𝐸(𝑌) = 𝛼0 + ∑𝑘𝑖=1 𝛼𝑖 𝜇𝑖 en
variantie 𝑣𝑎𝑟(𝑌) = ∑𝑘𝑖=1 𝛼𝑖2 𝜎𝑖2 .

Uit deze stelling volgt dat het gemiddelde van een aantal normaal verdeelde kansvariabelen met
eenzelfde variantie 𝜎 2 eveneens normaal verdeeld is. Immers, het gemiddelde van een aantal
1
variabelen 𝑋1 , 𝑋2 , … , 𝑋𝑘 is een lineaire functie waarbij 𝛼0 = 0 en 𝛼𝑖 = 𝑛. Bijgevolg hebben we in dit
𝜎2
geval dat het steekproefgemiddelde 𝑋̅ normaal verdeeld is met gemiddelde µ en variantie 𝑛
:
𝜎2
𝑋̅~N (µ, )
𝑛




5

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller katrienvanaken. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $5.51. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

79271 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$5.51  39x  sold
  • (2)
  Add to cart