Samenvatting Hoorcolleges
8 Hoorcolleges
Samenvatting Boek
“Discovering Statistics using IBM SPSS Statistics”
— A. Field
Radboud Universiteit Nijmegen
Yoël Guijt
, Hoorcollege 1:
Basisbeginselen statistiek
Conceptuele achtergronden:
> Observatie > theorie > hypothese > data > analyse > uitspraken
> Afhankelijke variabelen vs onafhankelijke variabelen, spreiding, modellen optellen \
Beschrijvende statistiek = populatie
Verklarende statistiek = populatie - steekproef - uitspraak steekproef
Kwalitatief = Nominaal & Ordinaal
Kwantitatief = Interval & Ratio
Centrale tendentie = Waar ligt de gra ek? Welke waarden?
Spreiding = Breed, smal, dicht bij gemiddelde?
Vorm = Hoe loopt de guur? Heel spits? Heel scheef?
Eigenschappen:
Centrale tendentie = Gemiddelde, mediaan, modus
Spreiding = Bereik, interkwartiel-afstand (Q3-Q1), Variantie (s^2), Standaarddeviatie (s)
Vorm = Scheefheid, Spitsheid
Modus = Mode = Kan bij; N/O/I/R
Mediaan = M/m = Kan bij; O/I/R
Gemiddelde = Mu / X = Kan bij; I/R
Variantie = (Xi - X)^2 / N-1 = Hoe ver van het gemiddelde?
Standaarddeviatie = Wortel variantie = Wortel (Xi-X)^2 / n-1
Vuistregel:
68% binnen : MU +/- 1 standaardafwijkingen
95% binnen : MU +/- 2 standaardafwijkingen
99,7% binnen : MU +/- 3 standaardafwijkingen
Z-score:
Z = (Xi - X) / standaardafwijking Z = Mate voor hoe uitzonderlijk een waarde is
Scheefheid:
Links - scheef: Gemiddelde < Mediaan < Modus (==>Staat van links naar rechts)
Symmetrisch: Gemiddelde = mediaan = modus
Rechts - scheef: Modus < Mediaan < Gemiddelde (==>Staat van links naar rechts)
fi fi
, Hoorcollege 2:
Centrale limietsteking en betrouwbaarheidsintervallen
Kwantitatieve data:
Centrale tendentie = Gemiddelde, modus, mediaan
Variatie (spreiding) = Variantie / standaarddeviatie , bereik, interkwartiel range
Vorm = Scheefheid, spitsheid
Kansverdelingen:
Discrete kansverdeling = Binomiaal , poisson
Continue kansverdeling = Normale, uniforme, exponentiële
Binomiaal: Wel of niet —> Kans is 50%, p = 0.50 —> In 100 verwacht je van 50
=> Vrijwel altijd normaal verdeeld
Gemiddelde = MU = n*p (kans op succes bijvoorbeeld)
Standaarddeviatie: s = Wortel van n*p*q (q is kans op falen, 1-p)
Normale verdeling:
=> Klokvorming & symmetrisch
Karakteristieken:
Gemiddelde = Modus = Mediaan (heeft in theorie oneindige range)
Intervallen: 90% = 1,645 Z ; 95% = 1,96 Z ; 99% = 2,58 Z
Z-score = (Xi - X) / s
Basisbeginselen verklarende statistiek:
> Vanuit steekproef uitspraken doen over populatie
> Mate van onzekerheid
> Hoe zuiver en e cient ; scheef/spits
Kwaliteit van je schattingen = StandaardFout S —> SE = std / wortel(n)
Zuiverheid = Vrijwel op het gemiddelde? —> Bij gemiddelde?
E ciëntie = Liefst kleine standaarddeviatie (kleine spreiding) —> Kleine STD
Centrale limietstelling:
Bij n>30! Mu = MU & Sigma = s (gemiddelde/std steekproef & populatie gelijk)
StandaardDeviatie (Std) = Hoe ver een waarneming van het gemiddelde afwijkt
StandaardFout (SE) = Hoe ver een steekproef-gemiddelde van het gemiddelde afwijkt
Betrouwbaarheid-coë ciënt = ALPHA a ; mate van onzekerheid inbouwen.
> Intervalschattingen ipv punt-schattingen
Intervallen: MU +/- Z * SE —> StandaardFOUT gebruiken!
Kleine steekproeven:
Bij n<30; Centrale limietstelling gaat niet meer op!
> Correctie inbouwen = T-verdeling ipv Z-verdeling —> Vrijheidsgraden n-1
ffi
ffi ffi E