Craig, B: Introduction to the Practice of Statistics
Een samenvatting van statistiek 1B, incl. formules en een aantal voorbeelden. Geeft een goede, extra uitleg boven op de stof of is zeer volledige samenvatting. Hiermee is een 8 behaald op het tentamen
Uit statistiek 1a
o Kansrekening waarbij randomisatie, verwijst naar sampling distributie met Normale
verdeling
o Z-waarde (Z > .. ) = 1-… en (Z < .. ) = ..
Sampling distributions (SD)
CLS: als n groot is, dan is SD van x-bar ongv. Normaal verdeeld
• Ongeacht de vorm van populatie
• Voorwaarde: SRS, eindige 𝜎, grote n
• Als X̄ ~ N(u,o), dan is X normaal verdeeld, ook bij kleine n
Hoe groter de n hoe groter de Normale verdeling benaderd wordt, hoe de populatie ook
verdeeld is.
Continue/kwantitatieve variabelen > statistic = xbar (one-sample voor 1 gem.) en xbar1 –
xbar2 (two-sample voor 2 gem.)
Categorische variabelen > statistic = pdakje (one-sample voor 1 proportie) en pdakje1-
pdakje2 (two-sample voor 2 proporties)
Statistische inferentie – gebaseerd op sampling distributions van statistics
1. Betrouwbaarheidsinterval
2. Significantietoetsing
➢ Tonen aan of verschil (bij bijv. tekentoets) significant is, rekening gehouden met SE
Hypothesetoetsing
Benadering 1 (Bayesiaans): begin met apriori (geloof over waarschijnlijkheid van
hypothesen), verzamel waarnemingen, kom tot nieuw, beter geloof over waarschijnlijkheid
van beide hypothesen
Benadering 2 (NHST): begin met hypothese die je niet gelooft, verzamel waarnemingen,
bereken teststatistic, bereken P-waarde gegeven die hypothese, vergelijk die kans met
drempelwaarde, verwerp hypothese wel/niet
Frequentistische aanpak: verzekert ons dat we correcte conclusies
trekken voor een vast percentage van onderzoeken, in the long run. Domineert in PSY.
Bayesiaanse aanpak: kwantificeert bewijs in een bepaalde dataset
voor een bepaalde hypothes
Onnauwkeurigheidsmarges: BHI, SE, effectgrootte en Power
Beschrijvende statistieken: grafieken (boxplot, scatterplot), samenvattingsmaten (gem.,
st.dev., mediaan M, correlaties)
Inferentiele statistieken: BHI voor parameter schatten of sigf. Toets voor verkrijgen bewering
over populatie
, CONTINUE/KWANTITATIEVE VARIABELEN
VOOR ÉÉN VERDELING/POPULATIE
Betrouwbaarheidsinterval – parameterwaarde schatten
➢ interval dat meest geloofwaardige waarden van parameter bevat. Schat mogelijke
waarden van u, met duidelijk wel/niet verwerpen van H0. Geeft inschatting van waar
parameter ongeveer zal liggen.
➢ breedte zegt iets over nauwkeurigheid van schatting, hoe goed gevonden gem. te
onderscheiden is van ander gem. en hoe gevoelig onderzoeksmethode is (smal BHI).
Betrouwbaarheidsniveau C (confidence level) = kans dat methode een
interval produceert dat parameter bevat. Interval is verkregen uit steekproef met methode die
ons correct resultaat geeft in C% van de gevallen, interval van steekproef kan u wel óf niet
bevatten. Betrouwbaarheid methode bij herhaling.
o C is exact C als de populatieverdeling normaal is en is ongeveer C bij andere
populatie-verdelingen, als n voldoende groot is.
puntschatter: een enkel getal dat onze “beste gok” is voor de parameter
intervalschatter: een interval van getallen dat de parameterwaarde (hopelijk) zal bevatten
Als we heel vaak een steekproef trekken (dus bij herhaling) en elke keer een interval
opstellen, dan zullen C% van deze intervallen 𝜇 bevatten. C% van de scores ligt tussen..en..
Elke Normale verdeling heeft kans C dat x̄ (en dus u)
tussen z* standaard-deviaties onder en boven
gemiddelde ligt: u – z* o/n en u + z* o/n
Z* zijn grenzen onderin
Opp = C, in percentage
Opp = p, in proportie. Kans zoals C
Doel: smal BHI (liefst door vergroten n)
Kleinere C > kleinere ME, maar dat wil je niet. Houdt C gelijk en vergroot n, zo verkleint ME.
o hoge C > dan levert je methode bijna altijd correcte antwoorden (onderzoeker kiest
dit, bepaalt z*)
o kleine ME > geeft accuratere schatting van parameter, dat wil je
Smaller BHI = kleinere ME
Smaller BHI = kleinere C kiezen > kleinere z* > kleinere ME. Maar is vaak niet wat je wil
Smaller BHI = kleinere o (staat vast door populatie) > kleinere ME maar die is vaak
bekend/onveranderlijk
Smaller BHI = kleinere variabiliteit o/n, grotere n
________________________________________________
C-BHI : schatter ± margin of error
schatter = beste gok parameter (dus statistic) > bepaalt ME; standaardfout en
verdeling (kritieke waarde)
ME = indicatie nauwkeurigheid schatter (afh. van variabiliteit schattter mbv
SD (ox̄ = o/n) en niveau C) = helft van breedte interval (van 0 naar t*/-t*)
̄X = gevoelig voor outliers
z* = kritieke waarde van de standaardnormale verdeling
C = opp. Binnen de kritieke punten −z* en z*
(Minimale) n kiezen (one-sample z en t)
ME klein genoeg voor C%-BHI breedte te krijgen
𝑛 = ((z*o) / 𝑚)2 n geeft breedte kleiner dan 2m en m < wat ME is
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller jkm88. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.60. You're not tied to anything after your purchase.