Statistiek 1B
Statistische inferentie = parameters schatten mbv statistics
Uit statistiek 1a
o Kansrekening waarbij randomisatie, verwijst naar sampling distributie met Normale
verdeling
o Z-waarde (Z > .. ) = 1-… en (Z < .. ) = ..
Sampling distributions (SD)
CLS: als n groot is, dan is SD van x-bar ongv. Normaal verdeeld
• Ongeacht de vorm van populatie
• Voorwaarde: SRS, eindige 𝜎, grote n
• Als X̄ ~ N(u,o), dan is X normaal verdeeld, ook bij kleine n
Hoe groter de n hoe groter de Normale verdeling benaderd wordt, hoe de populatie ook
verdeeld is.
Continue/kwantitatieve variabelen > statistic = xbar (one-sample voor 1 gem.) en xbar1 –
xbar2 (two-sample voor 2 gem.)
Categorische variabelen > statistic = pdakje (one-sample voor 1 proportie) en pdakje1-
pdakje2 (two-sample voor 2 proporties)
Statistische inferentie – gebaseerd op sampling distributions van statistics
1. Betrouwbaarheidsinterval
2. Significantietoetsing
➢ Tonen aan of verschil (bij bijv. tekentoets) significant is, rekening gehouden met SE
Hypothesetoetsing
Benadering 1 (Bayesiaans): begin met apriori (geloof over waarschijnlijkheid van
hypothesen), verzamel waarnemingen, kom tot nieuw, beter geloof over waarschijnlijkheid
van beide hypothesen
Benadering 2 (NHST): begin met hypothese die je niet gelooft, verzamel waarnemingen,
bereken teststatistic, bereken P-waarde gegeven die hypothese, vergelijk die kans met
drempelwaarde, verwerp hypothese wel/niet
Frequentistische aanpak: verzekert ons dat we correcte conclusies
trekken voor een vast percentage van onderzoeken, in the long run. Domineert in PSY.
Bayesiaanse aanpak: kwantificeert bewijs in een bepaalde dataset
voor een bepaalde hypothes
Onnauwkeurigheidsmarges: BHI, SE, effectgrootte en Power
Beschrijvende statistieken: grafieken (boxplot, scatterplot), samenvattingsmaten (gem.,
st.dev., mediaan M, correlaties)
Inferentiele statistieken: BHI voor parameter schatten of sigf. Toets voor verkrijgen bewering
over populatie
, CONTINUE/KWANTITATIEVE VARIABELEN
VOOR ÉÉN VERDELING/POPULATIE
Betrouwbaarheidsinterval – parameterwaarde schatten
➢ interval dat meest geloofwaardige waarden van parameter bevat. Schat mogelijke
waarden van u, met duidelijk wel/niet verwerpen van H0. Geeft inschatting van waar
parameter ongeveer zal liggen.
➢ breedte zegt iets over nauwkeurigheid van schatting, hoe goed gevonden gem. te
onderscheiden is van ander gem. en hoe gevoelig onderzoeksmethode is (smal BHI).
Betrouwbaarheidsniveau C (confidence level) = kans dat methode een
interval produceert dat parameter bevat. Interval is verkregen uit steekproef met methode die
ons correct resultaat geeft in C% van de gevallen, interval van steekproef kan u wel óf niet
bevatten. Betrouwbaarheid methode bij herhaling.
o C is exact C als de populatieverdeling normaal is en is ongeveer C bij andere
populatie-verdelingen, als n voldoende groot is.
puntschatter: een enkel getal dat onze “beste gok” is voor de parameter
intervalschatter: een interval van getallen dat de parameterwaarde (hopelijk) zal bevatten
Als we heel vaak een steekproef trekken (dus bij herhaling) en elke keer een interval
opstellen, dan zullen C% van deze intervallen 𝜇 bevatten. C% van de scores ligt tussen..en..
Elke Normale verdeling heeft kans C dat x̄ (en dus u)
tussen z* standaard-deviaties onder en boven
gemiddelde ligt: u – z* o/n en u + z* o/n
Z* zijn grenzen onderin
Opp = C, in percentage
Opp = p, in proportie. Kans zoals C
Doel: smal BHI (liefst door vergroten n)
Kleinere C > kleinere ME, maar dat wil je niet. Houdt C gelijk en vergroot n, zo verkleint ME.
o hoge C > dan levert je methode bijna altijd correcte antwoorden (onderzoeker kiest
dit, bepaalt z*)
o kleine ME > geeft accuratere schatting van parameter, dat wil je
Smaller BHI = kleinere ME
Smaller BHI = kleinere C kiezen > kleinere z* > kleinere ME. Maar is vaak niet wat je wil
Smaller BHI = kleinere o (staat vast door populatie) > kleinere ME maar die is vaak
bekend/onveranderlijk
Smaller BHI = kleinere variabiliteit o/n, grotere n
________________________________________________
C-BHI : schatter ± margin of error
schatter = beste gok parameter (dus statistic) > bepaalt ME; standaardfout en
verdeling (kritieke waarde)
ME = indicatie nauwkeurigheid schatter (afh. van variabiliteit schattter mbv
SD (ox̄ = o/n) en niveau C) = helft van breedte interval (van 0 naar t*/-t*)
̄X = gevoelig voor outliers
z* = kritieke waarde van de standaardnormale verdeling
C = opp. Binnen de kritieke punten −z* en z*
(Minimale) n kiezen (one-sample z en t)
ME klein genoeg voor C%-BHI breedte te krijgen
𝑛 = ((z*o) / 𝑚)2 n geeft breedte kleiner dan 2m en m < wat ME is