Statistiek 2
Samenvatting
,Les 1
Gauss curve VS. T-verdeling
o Normale verdeling met gemiddelde µ en standaarddeviatie σ geldt:
- Tussen -1 σ en +1 σ 68% van alle metingen
- Tussen –2 σ en +2 σ (1,96) 95% procent van alle metingen
- Tussen -3 σ en +3 σ 99,7% van alle metingen
o N < 30 student- t. alles boven de 30 is normaal verdeling
Toetsen
Twee (of drie) manieren:
1) 95% BI uitrekenen: valt μ in dit interval?
2) Toetsingsgrootheid z uitrekenen: z berekend is
groter dan z kritisch 95%?
3) p uitrekenen: is p berekend kleiner dan 5%? = NORM.S.INV.
T-toets
1) µ in 95% BI?
2) T berekend groter dan t kritisch
3) P bij t berekend kleiner dan α = T.VERD.2T
o Gerichte hypothese je verwacht van te voren een verschil + gegronde
reden éénzijdig.
o Ongerichte hypothese geen verwachting + geen gegronde reden
tweezijdig
α-waarde VS. P-waarde
o α: Het significantieniveau geeft de waarschijnlijkheid om H 0 te verwerpen,
terwijl die toch juist is (wordt ook wel onbetrouwbaarheid genoemd). Deze
wordt van te voren (a priori) geselecteerd.
o p: De p-waarde is de berekende waarde van de waarschijnlijkheid dat een
verschil per toeval gevonden wordt. Deze wordt berekend aan de hand
van de waarnemingen.
o M.a.w. de p-waarde is de berekende waarde die het verschil aangeeft met
het a priori aangenomen significantieniveau
Type I & type II fouten
o Betrouwbaarheid: je vindt geen significant verschil (p>0,05) en in
werkelijkheid is er geen significant verschil (H 0 correct aangenomen)
o Type I fout (α): je vindt een significant verschil (p< 0,05), maar in
werkelijkheid is er geen significant verschil. Definitie: de kans op het
onterecht verwerpen van Ho
o Power: je vindt een significant verschil (p<0,05) en in werkelijkheid is er
wel een significant verschil (Ho correct verworpen)
o Type II fout (β): je vindt geen significant verschil (p>0,05) , maar in
werkelijkheid is er wel een significant verschil. Definitie: de kans op het
onterecht accepteren van Ho
, Ho is wel Ho is niet
waar waar
Neemt Ho Correct β
aan 1-α Type II fout
Correct Vals negatief
negatief
Verwerpt Ho α Correct
Type I fout Power (1- β)
Vals positief Correct
positief
Power van een toets
o Power: je vindt een significant verschil (p<0,05) en in werkelijkheid is er
wel een significant verschil (Ho correct verwerpen)
o Doel van hypothese toetsen is om de power zo groot mogelijk te hebben
o Power= 1 – β
o Wat heb je nodig om de power te bereken van een toets?
- µ0 en µA / µ1
- α (significantie niveau)
- aantal waarnemingen (n)
- sigma
x−µ 0
zα=
o σ
√n
x−µ A
zβ =
o σ
√n
( )
2
( z β−z α ) . σ
o n=
( µ0−µ A )
- Hoe groot moet n minimaal zijn om een onderscheidend vermogen te
hebben bij een gekozen significantieniveau?
- Uitkomst naar boven afronden
- Let op : Zα is positief en Zβ is negatief
o De power berekenen is altijd one sided, omdat je alternatieve hypothese
altijd maar één kant van de Ho hypothese is gericht.
o De power is de kans dat de waarde niet bij de populatie met een bepaald
gemiddelde hoort.
o Een grote power betekent dat er goed onderscheid gemaakt kan worden
tussen de populaties
o Stel je zou α= 0,01 significantieniveau hebben
gebruikt. Zou de power groter of kleiner worden
naar rechts verschuilen, dus kleiner.
Beïnvloeden type I & type II fouten
Samenvatting
,Les 1
Gauss curve VS. T-verdeling
o Normale verdeling met gemiddelde µ en standaarddeviatie σ geldt:
- Tussen -1 σ en +1 σ 68% van alle metingen
- Tussen –2 σ en +2 σ (1,96) 95% procent van alle metingen
- Tussen -3 σ en +3 σ 99,7% van alle metingen
o N < 30 student- t. alles boven de 30 is normaal verdeling
Toetsen
Twee (of drie) manieren:
1) 95% BI uitrekenen: valt μ in dit interval?
2) Toetsingsgrootheid z uitrekenen: z berekend is
groter dan z kritisch 95%?
3) p uitrekenen: is p berekend kleiner dan 5%? = NORM.S.INV.
T-toets
1) µ in 95% BI?
2) T berekend groter dan t kritisch
3) P bij t berekend kleiner dan α = T.VERD.2T
o Gerichte hypothese je verwacht van te voren een verschil + gegronde
reden éénzijdig.
o Ongerichte hypothese geen verwachting + geen gegronde reden
tweezijdig
α-waarde VS. P-waarde
o α: Het significantieniveau geeft de waarschijnlijkheid om H 0 te verwerpen,
terwijl die toch juist is (wordt ook wel onbetrouwbaarheid genoemd). Deze
wordt van te voren (a priori) geselecteerd.
o p: De p-waarde is de berekende waarde van de waarschijnlijkheid dat een
verschil per toeval gevonden wordt. Deze wordt berekend aan de hand
van de waarnemingen.
o M.a.w. de p-waarde is de berekende waarde die het verschil aangeeft met
het a priori aangenomen significantieniveau
Type I & type II fouten
o Betrouwbaarheid: je vindt geen significant verschil (p>0,05) en in
werkelijkheid is er geen significant verschil (H 0 correct aangenomen)
o Type I fout (α): je vindt een significant verschil (p< 0,05), maar in
werkelijkheid is er geen significant verschil. Definitie: de kans op het
onterecht verwerpen van Ho
o Power: je vindt een significant verschil (p<0,05) en in werkelijkheid is er
wel een significant verschil (Ho correct verworpen)
o Type II fout (β): je vindt geen significant verschil (p>0,05) , maar in
werkelijkheid is er wel een significant verschil. Definitie: de kans op het
onterecht accepteren van Ho
, Ho is wel Ho is niet
waar waar
Neemt Ho Correct β
aan 1-α Type II fout
Correct Vals negatief
negatief
Verwerpt Ho α Correct
Type I fout Power (1- β)
Vals positief Correct
positief
Power van een toets
o Power: je vindt een significant verschil (p<0,05) en in werkelijkheid is er
wel een significant verschil (Ho correct verwerpen)
o Doel van hypothese toetsen is om de power zo groot mogelijk te hebben
o Power= 1 – β
o Wat heb je nodig om de power te bereken van een toets?
- µ0 en µA / µ1
- α (significantie niveau)
- aantal waarnemingen (n)
- sigma
x−µ 0
zα=
o σ
√n
x−µ A
zβ =
o σ
√n
( )
2
( z β−z α ) . σ
o n=
( µ0−µ A )
- Hoe groot moet n minimaal zijn om een onderscheidend vermogen te
hebben bij een gekozen significantieniveau?
- Uitkomst naar boven afronden
- Let op : Zα is positief en Zβ is negatief
o De power berekenen is altijd one sided, omdat je alternatieve hypothese
altijd maar één kant van de Ho hypothese is gericht.
o De power is de kans dat de waarde niet bij de populatie met een bepaald
gemiddelde hoort.
o Een grote power betekent dat er goed onderscheid gemaakt kan worden
tussen de populaties
o Stel je zou α= 0,01 significantieniveau hebben
gebruikt. Zou de power groter of kleiner worden
naar rechts verschuilen, dus kleiner.
Beïnvloeden type I & type II fouten