Statistiek voor pedagogen deel 2
3.4. Naar statistische inferentie
Statistische inferentie
= ... het afleiden van conclusies over de omvangrijkere populatie uit gegevens over
geselecteerde elementen.
Probleemstelling enkele definities: “Gemiddelde intelligentie van studenten?”
Populatie
= ... de groep van subjecten/eenheden waarin ik geïnteresseerd
ben.
= ... alle studenten.
Parameter
= ... een getal dat een kenmerk van de gehele populatie beschrijft.
Het is een vastgesteld getal, maar in praktijk weten we de waarde
niet.
= ... het is wat je te weten wilt komen van die populatie (we gaan
die dus nooit kennen, maar proberen te schatten).
= ... gemiddelde intelligentie van alle studenten (𝜇).
Steekproefgrootheid (of statistiek)
= ... een getal dat een kenmerk van een steekproef beschrijft.
= ... gemiddelde intelligentie van de studenten in onze steekproef
(𝑋̅).
Schatter
= Vaak gebruiken we een steekproefgrootheid om een
(onbekende) parameter te schatten. Dan noemen we die
grootheid de schatter.
1
, = ... de gemiddelde intelligentie van de studenten in de steekproef
wordt gebruikt om de gemiddelde intelligentie van alle
studenten te schatten (𝑋̅ als schatter van 𝜇).
Steekproefvariabiliteit
= ... de waarde van de steekproefgrootheid varieert van steekproef
tot steekproef.
Populatie: alle professoren Steekproef: n = 100
Parameter Steekproefgrootheid
𝑝=? 𝑝̂ = ?
Schatter voor ...
Kwaliteit van die schatter?
Groot aantal steekproeven (n = 100) nemen.
Verdeling van de
steekproefgrootheid:
→ Verwachte waarde
(𝑋̅)
&
→ Standaardafwijking
()
2
, Populatie: alle professoren Steekproef: n = 100
Parameter Steekproefgrootheid
𝜇=? 𝑋̅ = ?
Schatter voor ...
Kwaliteit van die schatter?
Net zoals hiervoor een groot aantal steekproeven (n = 100) nemen.
Verdeling van de
steekproefgrootheid:
→ Verwachte waarde
(𝑋̅)
&
→ Standaardafwijking
()
3.4.1. Steekproefvariabiliteit
Steekproefvariabiliteit
= ... de waarde van de steekproefgrootheid (bijv. 66% in winkel onderzoek) varieert
bij herhaalde aselecte steekproeftrekking.
Aselecte steekproeven voorkómen vertekeningen door de manier van steekproeftrekking, maar
ze kunnen er nog steeds naast zitten vanwege de variabiliteit van de resultaten bij een aselecte
steekproef.
3
, Er zijn twee voordelen van een aselecte steekproef:
1. Aselect kiezen gaat vertekening tegen.
2. Wanneer we veel steekproeftrekkingen van dezelfde omvang uit
dezelfde populatie trekken, de variatie van steekproef tot
steekproef een voorspelbaar patroon volgt.
Alle statistische inferentie is gebaseerd nagaan hoe betrouwbaar een procedure is door te vragen
wat er zou gebeuren als we die vaak zouden herhalen.
Om te begrijpen waarom steekproefvariabiliteit de resultaten niet ongeldig maakt, vragen we
ons af:
‘Wat zou er gebeuren als we veel steekproeven zouden nemen?’
De antwoorden:
□ Neem een groot aantal aselecte steekproeven van een bepaalde omvang uit
dezelfde bevolking.
□ Bereken de steekproeffractie 𝑝̂ voor elke steekproef.
□ Maak een histogram van de waarden van 𝑝̂
□ Bestudeer ...
➢ ... de vorm,
➢ ... het centrum,
➢ ... en de spreiding van de verdeling die in het histogram is weergegeven,
➢ ... en de uitschieters,
➢ ... of andere afwijkingen.
EAS 𝑛 = 100 𝑝̂ = 0,64
EAS 𝑛 = 100 𝑝̂ = 0,55
EAS 𝑛 = 100 𝑝̂ = 0,61
𝑝 = 0,60
4
3.4. Naar statistische inferentie
Statistische inferentie
= ... het afleiden van conclusies over de omvangrijkere populatie uit gegevens over
geselecteerde elementen.
Probleemstelling enkele definities: “Gemiddelde intelligentie van studenten?”
Populatie
= ... de groep van subjecten/eenheden waarin ik geïnteresseerd
ben.
= ... alle studenten.
Parameter
= ... een getal dat een kenmerk van de gehele populatie beschrijft.
Het is een vastgesteld getal, maar in praktijk weten we de waarde
niet.
= ... het is wat je te weten wilt komen van die populatie (we gaan
die dus nooit kennen, maar proberen te schatten).
= ... gemiddelde intelligentie van alle studenten (𝜇).
Steekproefgrootheid (of statistiek)
= ... een getal dat een kenmerk van een steekproef beschrijft.
= ... gemiddelde intelligentie van de studenten in onze steekproef
(𝑋̅).
Schatter
= Vaak gebruiken we een steekproefgrootheid om een
(onbekende) parameter te schatten. Dan noemen we die
grootheid de schatter.
1
, = ... de gemiddelde intelligentie van de studenten in de steekproef
wordt gebruikt om de gemiddelde intelligentie van alle
studenten te schatten (𝑋̅ als schatter van 𝜇).
Steekproefvariabiliteit
= ... de waarde van de steekproefgrootheid varieert van steekproef
tot steekproef.
Populatie: alle professoren Steekproef: n = 100
Parameter Steekproefgrootheid
𝑝=? 𝑝̂ = ?
Schatter voor ...
Kwaliteit van die schatter?
Groot aantal steekproeven (n = 100) nemen.
Verdeling van de
steekproefgrootheid:
→ Verwachte waarde
(𝑋̅)
&
→ Standaardafwijking
()
2
, Populatie: alle professoren Steekproef: n = 100
Parameter Steekproefgrootheid
𝜇=? 𝑋̅ = ?
Schatter voor ...
Kwaliteit van die schatter?
Net zoals hiervoor een groot aantal steekproeven (n = 100) nemen.
Verdeling van de
steekproefgrootheid:
→ Verwachte waarde
(𝑋̅)
&
→ Standaardafwijking
()
3.4.1. Steekproefvariabiliteit
Steekproefvariabiliteit
= ... de waarde van de steekproefgrootheid (bijv. 66% in winkel onderzoek) varieert
bij herhaalde aselecte steekproeftrekking.
Aselecte steekproeven voorkómen vertekeningen door de manier van steekproeftrekking, maar
ze kunnen er nog steeds naast zitten vanwege de variabiliteit van de resultaten bij een aselecte
steekproef.
3
, Er zijn twee voordelen van een aselecte steekproef:
1. Aselect kiezen gaat vertekening tegen.
2. Wanneer we veel steekproeftrekkingen van dezelfde omvang uit
dezelfde populatie trekken, de variatie van steekproef tot
steekproef een voorspelbaar patroon volgt.
Alle statistische inferentie is gebaseerd nagaan hoe betrouwbaar een procedure is door te vragen
wat er zou gebeuren als we die vaak zouden herhalen.
Om te begrijpen waarom steekproefvariabiliteit de resultaten niet ongeldig maakt, vragen we
ons af:
‘Wat zou er gebeuren als we veel steekproeven zouden nemen?’
De antwoorden:
□ Neem een groot aantal aselecte steekproeven van een bepaalde omvang uit
dezelfde bevolking.
□ Bereken de steekproeffractie 𝑝̂ voor elke steekproef.
□ Maak een histogram van de waarden van 𝑝̂
□ Bestudeer ...
➢ ... de vorm,
➢ ... het centrum,
➢ ... en de spreiding van de verdeling die in het histogram is weergegeven,
➢ ... en de uitschieters,
➢ ... of andere afwijkingen.
EAS 𝑛 = 100 𝑝̂ = 0,64
EAS 𝑛 = 100 𝑝̂ = 0,55
EAS 𝑛 = 100 𝑝̂ = 0,61
𝑝 = 0,60
4