Samenvatting Statistiek II (A)
Statistiek II (A)
H1: Puntschatters
• Een schatter θˆ voor een populatieparameter θ is zuiver als E (θˆ) = θ , zoniet is het een
vertekende schatter. De maat van onzuiverheid = vertekening (bias) = B (θˆ) = E (θˆ) − θ
• Relatieve efficiëntie voor zuivere schatters
Var θˆ1 < 1 ⇒ θˆ1 efficiënter dan θˆ2
Var θˆ2 > 1 ⇒ θˆ2 efficiënter dan θˆ1
• MSE (Mean Squared Error)
2
MSE (θˆ) = E (θˆ − θ )2 = Var θˆ + B (θˆ)
→ relatieve efficiëntie onzuivere schatters
MSE θˆ1 < 1 ⇒ θˆ1 efficiënter dan θˆ2
MSE θˆ2 > 1 ⇒ θˆ2 efficiënter dan θˆ1
• Momentenschatter
Populatiemomenten µk : µk = E X k
1 n k
Steekproefmomenten µ̂k : µˆ k = ∑ X i
n i =1
• Meest aannemelijke schatter
L(θ ) = product van de respectieve kansdichtheden = f ( x1 ;θ ) ⋅ f ( x 2 ;θ ) ⋅⋅⋅ f ( x n ;θ )
→ Meest aannemelijke schatter θˆ = waarde voor θ die L(θ ) maximaliseert
ℓ (θ ) = ln ( L (θ ) )
1/18
,Samenvatting Statistiek II (A)
H2: Betrouwbaarheidsintervallen
1) BI voor populatiegemiddelde
• Normaal verdeeld en variantie gekend
σ σ
Tweezijdig: P X − z1−α 2 µ X + z1−α 2 = 1− α
n n
→ 100(1-α)% BI
σ σ σ
X − z1−α 2 ; X + z1−α 2 met breedte: 2 ⋅ z1−α 2
n n n
X −µ σ
Eenzijdig: P z1−α = P µ X − z1−α = 1− α
σ n n
→ 100(1-α)% BI
σ
X − z1−α ; +∞
n
X −µ σ
Of P − z1−α = P µ X + z1−α = 1− α
σ n n
→ 100(1-α)% BI
σ
−∞; X + z1−α
n
• Normaal verdeeld en variantie ongekend
2
σ 2 schatten met S 2 =
1 n
(
∑ Xi − X
n − 1 i =1
)
X −µ
⇒ maar ∼ N (0,1), wel ∼ t n −1
S n
X −µ
P t n −1,α 2 t n −1,1−α 2 = 1 − α
S n
= −tn −1,1−α 2
→ 100(1-α)% BI
S S S S
X − t n −1,1−α 2 ; X + t n −1,1−α 2 −∞; X + t n −1,1−α 2 of X − t n −1,1−α 2 ; +∞
n n n n
2/18
, Samenvatting Statistiek II (A)
2) BI voor verschil in populatiegemiddelden
• Onafhankelijk, Normaal verdeeld en varianties gekend
(X 1 )
− X 2 − ( µ1 − µ2 )
∼ N (0,1)
σ 12 σ 22
+
n1 n2
→ 100(1-α)% BI
σ2 σ2 σ2 σ2
X 1 − X 2 − z1−α 2 1 + 2 ; X 1 − X 2 + z1−α 2 1 + 2
n1 n2 n1 n2
• Onafhankelijk, Normaal verdeeld en varianties ongekend maar gelijk
(X 1 )
− X 2 − ( µ1 − µ2 )
∼ t n1 + n2 −2 met S =
2 (n1 − 1)S12 + (n2 − 1)S22
n1 + n2 − 2
p
1 1
SP +
n1 n2
→ 100(1-α)% BI
1 1 1 1
X 1 − X 2 − t n1 + n2 − 2,1−α 2SP + ; X 1 − X 2 + t n1 + n2 − 2,1−α 2SP +
n1 n2 n1 n2
• Onafhankelijk, Normaal verdeeld en varianties ongekend en verschillend
2
S12 S22
+
(X 1 )
− X 2 − ( µ1 − µ2 )
∼ tν met ν = n1 n2 (Welch benadering)
( 1 1) + ( 2 2 )
2 2
S12 S22 S 2
n S 2
n
+
n1 n2 n1 − 1 n2 − 1
→ 100(1-α)% BI
S12 S22 S12 S22
X 1 − X 2 − tν ,1−α 2 + ; X 1 − X 2 + tν ,1−α 2 +
n1 n2 n1 n2
• Gepaarde waarnemingen, Normaal verdeeld
Nieuwe kansvariabele D = X 1 − X 2
Var [D ] = Var [ X 1 ] + Var [ X 2 ] − 2Cov [ X 1 , X 2 ] = σ 12 + σ 22 − 2σ 12
D − ( µ1 − µ2 )
⇒ ∼ t n −1
SD n
3/18
Statistiek II (A)
H1: Puntschatters
• Een schatter θˆ voor een populatieparameter θ is zuiver als E (θˆ) = θ , zoniet is het een
vertekende schatter. De maat van onzuiverheid = vertekening (bias) = B (θˆ) = E (θˆ) − θ
• Relatieve efficiëntie voor zuivere schatters
Var θˆ1 < 1 ⇒ θˆ1 efficiënter dan θˆ2
Var θˆ2 > 1 ⇒ θˆ2 efficiënter dan θˆ1
• MSE (Mean Squared Error)
2
MSE (θˆ) = E (θˆ − θ )2 = Var θˆ + B (θˆ)
→ relatieve efficiëntie onzuivere schatters
MSE θˆ1 < 1 ⇒ θˆ1 efficiënter dan θˆ2
MSE θˆ2 > 1 ⇒ θˆ2 efficiënter dan θˆ1
• Momentenschatter
Populatiemomenten µk : µk = E X k
1 n k
Steekproefmomenten µ̂k : µˆ k = ∑ X i
n i =1
• Meest aannemelijke schatter
L(θ ) = product van de respectieve kansdichtheden = f ( x1 ;θ ) ⋅ f ( x 2 ;θ ) ⋅⋅⋅ f ( x n ;θ )
→ Meest aannemelijke schatter θˆ = waarde voor θ die L(θ ) maximaliseert
ℓ (θ ) = ln ( L (θ ) )
1/18
,Samenvatting Statistiek II (A)
H2: Betrouwbaarheidsintervallen
1) BI voor populatiegemiddelde
• Normaal verdeeld en variantie gekend
σ σ
Tweezijdig: P X − z1−α 2 µ X + z1−α 2 = 1− α
n n
→ 100(1-α)% BI
σ σ σ
X − z1−α 2 ; X + z1−α 2 met breedte: 2 ⋅ z1−α 2
n n n
X −µ σ
Eenzijdig: P z1−α = P µ X − z1−α = 1− α
σ n n
→ 100(1-α)% BI
σ
X − z1−α ; +∞
n
X −µ σ
Of P − z1−α = P µ X + z1−α = 1− α
σ n n
→ 100(1-α)% BI
σ
−∞; X + z1−α
n
• Normaal verdeeld en variantie ongekend
2
σ 2 schatten met S 2 =
1 n
(
∑ Xi − X
n − 1 i =1
)
X −µ
⇒ maar ∼ N (0,1), wel ∼ t n −1
S n
X −µ
P t n −1,α 2 t n −1,1−α 2 = 1 − α
S n
= −tn −1,1−α 2
→ 100(1-α)% BI
S S S S
X − t n −1,1−α 2 ; X + t n −1,1−α 2 −∞; X + t n −1,1−α 2 of X − t n −1,1−α 2 ; +∞
n n n n
2/18
, Samenvatting Statistiek II (A)
2) BI voor verschil in populatiegemiddelden
• Onafhankelijk, Normaal verdeeld en varianties gekend
(X 1 )
− X 2 − ( µ1 − µ2 )
∼ N (0,1)
σ 12 σ 22
+
n1 n2
→ 100(1-α)% BI
σ2 σ2 σ2 σ2
X 1 − X 2 − z1−α 2 1 + 2 ; X 1 − X 2 + z1−α 2 1 + 2
n1 n2 n1 n2
• Onafhankelijk, Normaal verdeeld en varianties ongekend maar gelijk
(X 1 )
− X 2 − ( µ1 − µ2 )
∼ t n1 + n2 −2 met S =
2 (n1 − 1)S12 + (n2 − 1)S22
n1 + n2 − 2
p
1 1
SP +
n1 n2
→ 100(1-α)% BI
1 1 1 1
X 1 − X 2 − t n1 + n2 − 2,1−α 2SP + ; X 1 − X 2 + t n1 + n2 − 2,1−α 2SP +
n1 n2 n1 n2
• Onafhankelijk, Normaal verdeeld en varianties ongekend en verschillend
2
S12 S22
+
(X 1 )
− X 2 − ( µ1 − µ2 )
∼ tν met ν = n1 n2 (Welch benadering)
( 1 1) + ( 2 2 )
2 2
S12 S22 S 2
n S 2
n
+
n1 n2 n1 − 1 n2 − 1
→ 100(1-α)% BI
S12 S22 S12 S22
X 1 − X 2 − tν ,1−α 2 + ; X 1 − X 2 + tν ,1−α 2 +
n1 n2 n1 n2
• Gepaarde waarnemingen, Normaal verdeeld
Nieuwe kansvariabele D = X 1 − X 2
Var [D ] = Var [ X 1 ] + Var [ X 2 ] − 2Cov [ X 1 , X 2 ] = σ 12 + σ 22 − 2σ 12
D − ( µ1 − µ2 )
⇒ ∼ t n −1
SD n
3/18