Week 1
Principe van toetsen en t-toets voor 1 gemiddelde
Z-toets voor één gemiddelde
Een leestest, die gebruikt wordt om laaggeletterdheid vast te stellen was 20 jaar geleden normaal
verdeeld met μ = 200 en σ = 64 diagnose laaggeletterdheid wordt gesteld bij een score < 120). Nu er
meer aandacht is voor dit probleem, heeft men opnieuw een onderzoek uitgevoerd onder 100
volwassenen. Men vermoedt dat het gemiddelde nu hoger ligt. In de steekproef van 100 personen
bleek 𝑋 = 210 te zijn. Men gaat ervan uit dat de spreiding gelijk is gebleven α = .05).).
Je stelt hypotheses op en deze ga je toetsen middels de z-toets voor één gemiddelde. De hypothesen
gaan over het populatiegemiddelde.
Passende statistische hypothesen:
H0: μ ≤ 200
H1: μ > 200 eenzijdige toets, gerichte hypothese de verwachting).
μ is de gemiddelde score op de leestest voor laaggeletterdheid.
Het idee van statistisch toetsen
We hebben te maken met een bepaalde populatie waar we uitspraken over willen doen. We gaan niet
de gehele populatie onderzoeken. Dit is onmogelijk. We gaan onderzoek doen met behulp van een
steekproef. Als we dit op aselecte wijze doen, dan hopen we dat deze steekproef representatief is
voor de populatie. Op basis van hetgeen dat we in de steekproef vinden, stellen we de vraag: wat
gaan we met de H0 doen? Mag ik deze verwerpen ja/nee, op basis van het steekproefgemiddelde dat
ik vind?
Is 210 een voldoende groot gemiddelde om H0 te verwerpen? Wanneer is het gemiddelde zodanig
groot dat je H0 gaat verwerpen?
In het voorbeeld is de sigma gegeven, waardoor je een z-toets voor één gemiddelde kunt gebruiken.
Assumpties z-toets voor één gemiddelde u:
- De scores zijn onafhankelijk random steekproef).
- Populatievariantie van de scores is bekend.
- Indien de scores zeer scheef verdeeld zijn, moet n > 30 zijn.
Drie verdelingen
Je hebt steeds te maken met drie soorten verdelingen.
Links: populatieverdeling, onze vraag is ‘Hoe ziet dat er nu uit?’. We weten niet of deze daadwerkelijk
normaal verdeeld is. Echter, hier hoeven we ons geen zorgen over te maken, omdat n > 30.
Midden: steekproevenverdeling van gemiddelden. Uit een populatie met een interval- of ratiovariabele
met gemiddelde u en standaarddeviatie o wordt een steekproef getrokken ter grootte van n. Berekend
wordt X gemiddeld. Wanneer dit steekproeftrekken, met steeds dezelfde n van voldoende grootte:
tenminste 30), oneindig vaak wordt herhaald dan is de frequentieverdeling van de gemiddelden, ofwel
de steekproevenverdeling, een normale verdeling centrale limietstelling). Het centrum van de normale
verdeling wordt u en de standaarddeviatie van de normale verdeling wordt de standaardfout van het
gemiddelde.
Dit is een hypothetische verdeling: hoe zouden steekproefgemiddelden van steekproeven ter grootte
van 100 variëren bij herhaald steekproeftrekken. Je verwacht dat de meeste steekproefgemiddelden in
de buurt zullen liggen van het populatiegemiddelde 200). Deze verdeling zal smaller zijn, omdat deze
gemiddeldes minder variëren dan de oorspronkelijke scores. De standaarddeviatie van deze verdeling
heet de standaardfout. Te berekenen met:
Rechts: verdeling van een steekproefresultaat.
,Manier 1: wel/niet H0 verwerpen: toetsingsgrootheid z
De steekproevenverdeling voor het gemiddelde volgt een standaardnormale verdeling.
Je kunt de Xgemiddeldes, die normaal verdeeld zijn, transformeren naar een z-verdeling. De z-scores
geven de afwijkingen ten opzichte van het gemiddelde weer, uitgedrukt in standaarddeviaties.
Hoever ligt een specifiek steekproefgemiddelde af van het gemiddelde van de steekproevenverdeling?
Het specifieke steekproefresultaat van 210 ligt
1,5).625). standaarddeviaties boven het gemiddelde.
Bij toetsen ga je uit van de H0. Om te besluiten of dit voldoende bijzonder is om de
H0 te verwerpen:
Je moet van tevoren een grens kiezen foutenkans
alpha). We gaan uit van een alpha van 5).%, rechts
eenzijdig gerichte vraagstelling). Vanaf een z van
1,645). gaan we H0 verwerpen. Middels ons specifieke
resultaat met een z van 1,5).625). die is kleiner dan de
kritieke waarde 1,645).) verwerpen we H0 NIET.
Als een steekproefresultaat niet in het kritieke gebied valt, dan wordt de H0 niet verworpen. In dit
geval wordt de H0 niet verworpen: het gemiddelde op de leestest is niet statistisch significant
toegenomen geen statistisch significant verschil) sinds 20 jaar geleden.
Manier 2: wel/niet H0 verwerpen: p-waarde
Indien de overschrijdingskans groter is dan de alpha, dan H0 niet verwerpen.
Manier 3: wel/niet H0 verwerpen: voorspellingsinterval voor
Gegeven μ kan een voorspellingsinterval voor worden berekend m.b.v. zk en de
VI = Geeft aan hoezeer steekproefschattingen uiteen kunnen lopen voor een bepaalde
populatieparameter.
Vind je een steekproefgemiddelde dat buiten de grenzen van het voorspellingsinterval valt, dan ga je
H0 verwerpen.
Manier 4: wel/niet H0 verwerpen: betrouwbaarheidsinterval voor u
Gegeven kan een betrouwbaarheidsinterval voor μ worden berekend m.b.v. zk en de
BIμ = Geeft aan hoe nauwkeurig de schatting uit een steekproef is.
Foutmarge: Zk * SE
Dit is de breedte van het interval aan elke kant van de berekende statistische grootheid of
populatieparameter.
Effectgrootte Cohen’s d
We willen weten hoe groot het verschil is tussen het steekproefresultaat en hetgeen we verwachten
H0).
Met de berekening van de gestandaardiseerde effectgrootte d kun je nagaan hoe je het gevonden
verschil kunt interpreteren. Wanneer je een effect hebt van 0,2: het gevonden steekproefresultaat ligt
0,2 standaarddeviaties boven/onder het verwachte populatiegemiddelde.
,T-toets voor 1 gemiddelde u
Voorbeeld
In Nederland was het gemiddelde aantal personen per huishouden in 1990: 2.72 personen.
Een nieuw onderzoek gehouden in 2015). gaat uit van het vermoeden dat het gemiddelde kleiner
geworden is.
Van 49 aselect gekozen huishoudens in 2015). blijkt het gemiddelde aantal personen 2.408 te zijn. De
standaarddeviatie in deze steekproef is 1.135)..
Is het steekproefgemiddelde zodanig klein dat het populatiegemiddelde veranderd is.
H0: u 2,72
H1: u < 2,72
Probleem
In de meeste gevallen is de populatiestandaarddeviatie σ niet bekend. Om de standaarddeviatie van
de populatie te bepalen, heb je het gemiddelde nodig. De standaarddeviatie is namelijk een
gemiddelde afstand tot het gemiddelde.
Oplossing
Op basis van een statistische grootheid kunnen we een populatieparameter gaan schatten. We
kunnen sigma gaan schatten met de standaarddeviatie in de steekproef 1,135).).
Wat moeten we dan doen?
- o standaarddeviatie in de populatie) schatten met s standaarddeviatie in de steekproef).
- Steekproef: s = 1,135)..
- Geschatte standaardfout van het gemiddelde:
Schatten van de populatievariantie en de standaardfout
We zien hier de variantie in de steekproef S2 met bijbehorende formule). Je ziet dat er gedeeld wordt
door N-1.
Wat betekent N-1?
Dit zijn vrij variërende scores. Als we de spreiding in de steekproef gebruiken als een schatter voor de
spreiding in de populatie, wat je meestal doet, dan moet je er rekening mee houden dat als je de
gemiddelde afstand tot het gemiddelde wilt berekenen, dat je dan ook al het gemiddelde gebruikt van
de steekproef. Je gebruikt dus al een stukje informatie uit de steekproef, om vervolgens iets te zeggen
over de spreiding in de steekproef. In statistische termen gezegd: dit kost je een vrijheidsgraad.
Dus: je pakt al informatie uit de steekproef het gemiddelde). Daarmee wil je iets zeggen over de
spreiding in de steekproef. Je moet dan corrigeren voor het stukje informatie dat je hebt gebruikt: N-1.
De variantie is dan de gemiddelde gekwadrateerde afstand tot het gemiddelde, maar dan gemiddeld
per vrij variërende scores, in plaats van voor alle scores. De standaarddeviatie is de wortel uit de
variantie: de gemiddelde afstand tot het gemiddelde, gemiddeld per vrijheidsgraad.
Aantal vrijheidsgraden degrees of freedom = n -1) gebruikt om de standaarddeviatie in de populatie te
schatten en dus de standaardfout te schatten.
De geschatte standaarddeviatie van steekproefgemiddelden standaardfout) is gelijk aan geschatte
standaarddeviatie / wortel n).
Maar..
Het steekproefgemiddelde kunnen we gebruiken als schatter voor het populatiegemiddelde. Maar als
je één steekproef trekt, dan zal dit niet precies het populatiegemiddelde zijn. Als je dan ook nog de
, standaarddeviatie van de populatie gaat schatten, dan heb je nog meer onzekerheid. We mogen er
dan niet vanuit gaan dat als we herhaald steekproeftrekken uit de populatie, dat de
steekproevenverdeling van gemiddelden, een standaardnormale verdeling is. We hebben namelijk
extra onzekerheid over de spreiding.
Dus:
- Elke steekproef geeft een andere standaarddeviatie en dus ook een andere standaardfout.
- Je hebt niet alleen onzekerheid over het gemiddelde, maar ook over de standaarddeviatie in
de populatie.
- De steekproevenverdeling van X gemiddeld van alle mogelijke steekproeven met gelijke
grootte n volgt nu NIET meer de normale verdeling.
T-verdeling
- De steekproevenverdeling van X gemiddeld volgt een t-verdeling met df = N-1.
- Df = degrees of freedom/ aantal vrijheidsgraden voor schatten van de standaarddeviatie in de
populatie.
- De t-verdeling neemt de extra onzekerheid over de schatting van de
populatiestandaarddeviatie ook mee.
Het is een combinatie van de normale verdeling de z-verdeling: onzekerheid rondom
gemiddelde) en de chi-kwadraatverdeling onzekerheid rondom spreiding).
Op tentamen: welke kansverdeling is te gebruiken?
Antwoord dan: t-verdeling met 31 vrijheidsgraden.
T van 2 is iets minder hoog dan Z van 2.
Bij Z: 1 betekent 1 standaarddeviatie boven gemiddelde.
Bij T: 1 en een beetje, door de vrijheidsgraden, hier heb je het stukje onzekerheid.
Bij t-verdeling ga je minder snel de H0 verwerpen.
T-verdeling versus de standaardnormale verdeling
- Er is een verzameling van t-verdelingen. Voor elke df is er een andere t-verdeling. De t-
verdeling is symmetrisch rond t = 0.
- Dikkere staarten dan de standaardnormale verdeling z-verdeling).
- T-verdeling lijkt meer op de standaardnormale verdeling naarmate df dus n) groter is.
Naarmate je steekproef groter is, krijg je een t-verdeling die meer lijkt op de standaardnormale
verdeling. Je hebt bij een grotere steekproef minder onzekerheid over de schatting van de
standaarddeviatie in de populatie.
Per N-1 vrijheidsgraden, dus per waarneming/steekproefresultaat, heb je een andere t-
verdeling. Heb je weinig waarnemingen vrijheidsgraden), dan is je verdeling platter en breder.
Heb je meer vrijheidsgraden, dus een preciezere schatting, dan krijg je meer een normale
verdeling.
- Als je een kritiek gebied wilt bepalen, een alpha van 5).%, dan schuiven in de t-verdeling de
kritieke waarden op verder van het midden) ten opzichte van de z-verdeling.
Kritieke t-waarden
Je hebt een verzameling van t-verdelingen, afhankelijk van het aantal vrijheidsgraden.