STATISTIEK: MINI SAMENVATTING BELANGRIJKE AANDACHTSPUNTEN
DEEL 1: UNIVARIATE BESCHRIJVENDE STATISTIEK
Variabelen:
- Kwalitatieve / categorische variabelen (cijfers hebben geen betekenis)
Nominale variabelen onderscheiden, maar niet ordenen (bv. geslacht, kleuren, ...)
Ordinale variabelen ordenen (bv. opleiding, slecht-goed, medaille, …)
- Kwantitatieve / metrische variabelen (cijfers zijn betekenisvol)
Intervalvariabelen hoeveel meer/minder (bv. graden Celsius, geboortejaar, …)
Ratiovariabelen nul-waarde heeft betekenis (bv. leeftijd, budget, …)
Andere classificatie (variabelen):
- Continue variabelen tussenliggende waarde (bv. 2j – 2,7j – 3j // tijd, inkomen, …)
- Discrete variabelen eindige uitkomstenverzameling (bv. 1, 2, 3, … // kinderen, …)
Maten van positie:
- Gemiddelde = x (x1 + x2+ … + xn)/n
Enkel voor metrische variabelen
Gevoelig voor uitschieters
- Mediaan = M (n+1)/2
Middenpunt van de verdeling
Geschikt vanaf ordinaal meetniveau
- Modus = M0
Waarde met hoogste frequentie
Bv.: getrouwd = 70% <-> alleenstaand = 30% modus = getrouwd
Geschikt vanaf nominaal meetniveau
- Kwartielen = Q1 – Q2 – Q3
Geschikt vanaf ordinaal meetniveau
Maten van spreiding:
- IKA = interkwartielafstand Q = Q3 – Q1
Geschikt vanaf metrisch meetniveau
Uitschieters = Q3 + 1,5 x IKA <-> Q1 – 1,5 x IKA
- Variantie = s2
n
s2=∑ ¿ ¿ ¿¿
i =1
Geschikt voor metrische variabelen
- Standaardafwijking = s
√∑
n
s= ¿¿ ¿ ¿ ¿
i=1
Geschikt voor metrische variabelen
Vorm van verdeling:
- Symmetrisch = spiegelbeeld
- Rechts a-symmetrisch = lange staart naar recht ->
- Links a-symmetrisch = lange staart naar links <-
Transformaties:
- X optellen met a verdeling schuift op & spreidingsmaten blijven ongewijzigd
- X vermenigvuldigen met getal b > 1 verdeling schuift op & spreiding wordt groter
x−μ
Z-score: z=
σ
, xi −x
Z-transformatie: Z X = standaardisatie
i
s
DEEL 2: BIVARIATE BESCHRIJVENDE STATISTIEK
Categorische variabelen: bivariate frequentie/kruistabel associatiematen
Metrische variabelen: spreidingsdiagram correlatie- en regressieanalyse
Symmetrisch = wederzijdse samenhang, geen effect op elkaar
A-symmetrisch = effect-relatie (X = onafhankelijk / Y = afhankelijk)
Odds = associatiemaat
odds 1
- oddsratio=
odds 2
- Hoeveel keer meer x1 dan x2 ?
Chi-kwadraat gebaseerde associatiematen:
- X2= ∑
¿¿¿¿
- Gevoelig voor n & gevoelig voor aantal rijen en kolommen
Maten voor de associatie tussen nominale variabelen:
- Cramer’s V:
[ 0,1 ]
- Phi:
V=
√ X2
n(k−1)
0,10 zwak
0,30 medium
0,50 sterk
Enkel voor 2x2 tabellen
√
2
X
∅=
n
Andere associatiematen:
- Nominaal: Phi, Lambda [ 0,1 ]
Ordinaal: Gamma, Somer’s D, tau [ −1 ,+1 ]
Regressierechte: y = a + bx
- a = intercept
- b = richtingscoëfficiënt
Covariantie:
Correlatie:
2
2 s ^y
Determinatiecoëfficiënt r2: r xy= 2
sy
- Zeer gevoelig voor uitschieters/outliers
Multivariate analyse (= meer dan 2 variabelen)
Gemeenschappelijke Intermediaire variabele Verstrengeling Interactie-effect
afhankelijkheid
X Y X Y X Y