Meetniveau Onderscheid Volgorde in Vaste afstand Vast nulpunt Centrummaat
makend waarden tussen getallen
Nominaal Ja Modus Kwalitatief
Ordinaal Ja Ja Mediaan Kwalitatief
Interval Ja Ja Ja Gemiddelde Kwantitatief
Ratio Ja Ja Ja Ja Gemiddelde Kwantitatief
+ continu variabelen: kan iedere waarde aannemen; lengte, gewicht/discrete variabelen: gehele getallen; schoenmaat kan alleen 40 of 40,5
- Kwantitatieve variabelen: verdeling van scores
1. Univariate frequentieverdeling (één variabele):
Neem √ N klassen (overzichtelijk, maar informatieverlies)
Hieruit kun je verder naar: percentielscores (betere vergelijking op basis van schaal 0-100)
Hieruit kun je verder naar: Cumulatieve frequentiepolygoon a.d.h.v. percentielscore.
2. Kwartielscores
Klassen Exacte grenzen f cf (P) % c%
2 1,5 – 2,5 1 1 8,33 8,33
3 2,5 – 3,5 1 2 8,33 16,67
4 3,5 – 4,5 1 3 8,33 25
5 4,5 – 5,5 3 6 25 50
6 5,5 – 6,5 4 10 33,33 83,33
7 6,5 – 7,5 1 11 8,33 91,67
8 7,5 – 8,5 1 12 8,33 100
ll=lower limit/ np = totaal aantal X percentiel/ cf=hoeveel waarnemingen eronder/ fi=frequentie in klasse/ w= breedte tussen grenzen
Hieruit kun je naar een boxplot: minimum, Q1(25%), Mediaan, Q3(75%), Maximum
Interkwartielafstand (IKA) = Q3 – Q1
aangepast voor uitbijters: minimum wordt dan reasonable lower boundery: Q1 – 1,5(IKA)
maximum wordt dan reasonable upper boundery: Q3 + 1.5(IKA)
- Grafieken
1. Steelbladdiagram:
overzichtelijk zonder informatieverlies
Kwalitatieve variabele in
2. Staafdiagram:
Kwantitatieve variabele in:
3. Histogram
Deze verdeling is niet symmetrisch, maar positief (rechts) scheef met één top (unimodaal)
4. Frequentiepolygoon: of een cumulatieve frequentiepolygoon
- Centrale tendentiematen (meten van het centrum):
1. Modus meest voorkomend (meerdere mogelijk) zinvol bij nominaal meetniveau
, 2. Mediaan ‘in het midden’ zinvol vanaf ordinaal meetniveau, niet gevoelig voor uitbijters
3. Rekenkundig gemiddelde statistisch sterk, maar gevoelig voor uitbijters (niet resistent)
* Voor dichotome variabelen (alleen scores 0 of 1) geldt dat het gemiddelde gelijk is aan de proportie met score 1
* Som van de afwijkingen van het gemiddelde is nul
* Som van de gekwadrateerde afwijkingen van het gemiddelde is minimaal
- Standaardafwijking = standaarddeviatie = wortel uit de variantie (meten van spreiding)
= σ voor populatie/ s voor steekproef S = √ s2
De steekproefvariantie s2 is een schatter van de ‘echte’ populatievariantie σ2
Als je dan toch de formule voor variantie gebruikt om op basis van de steekproef de populatievariantie te schatten, dan zul je meestal iets
te optimistisch zijn en een te kleine variantie schatten (onderschatting). Door te delen door n-1 corrigeer je dit.
steekproefgemiddelde is een ‘zuivere schatter’ van het populatiegemiddelde, delen door n - 1 is alleen nodig bij de
steekproefstandaarddeviatie
- De normale verdeling (dichtheidskromme): vloeiende benadering v/d histogram van een kwantitatieve variabele
Standaardnormale verdeling: 68 – 95 – 99.7 regel (68%, 95%, 99.7% binnen 1,2,3 σ van μ)
Nog nauwkeuriger: Tabel A (z-scores en p-waarden ‘probability of obtaining a test statistic)
Kans die op basis van z-score tot stand komt staat gelijk aan het zoveelste percentiel.
* Een scheve verdeling, omgezet naar z-scores levert geen standaardnormale verdeling op! (Ook al is gemiddelde 0, en standaarddeviatie
1)
- Spreidingsdiagrammen
kijkt naar correlatie r XY : de lineaire samenhang tussen twee kwantitatieve (min. Interval) variabelen: -r XY is gevoelig voor uitbijters
- het aantal waarnemingen heeft geen invloed op de grootte van r XY
- r XY is een onderschatting van niet-lineaire samenhang
- Homogeniteit: bij een grovere meetschaal (bv. lengte in m i.p.v. cm) wordt r XY lager
- Bij een te kleine steekproef kan toeval een grote rol spelen
- Geen onderscheid onafhankelijke en afhankelijke variabele
- Correlatie tussen -1 en +1
- Correlatie vaak weergegeven als r
- Pearson product-moment correlatie coefficient r:
Uitrekenen omdat relatie beoordelen a.d.h.v. spreidingsdiagram misleidend kan zijn; door een kleine schaal kan verband sterker lijken dan
dat het is.