Samenvatting
Statistics The Art and Science of Learning from Data
,Exploring Data with Graphs and Numerical Summaries
Twee manieren van statistiek:
1. Beschrijvende statistiek (sample statistics): Een samenvatting geven van je data.
Samenvatting/beschrijving van één variabelen (= univariaat). Géén verbanden beschrijven.
Meetniveau van variabelen
Centrale tendentie (gemiddelde, mediaan, modus)
Verdeling (histogram, barchart)
Spreidingsmaten (standaarddeviatie, variantie)
2. Inferentiële statistiek (population statistics): o.b.v. data uit de steekproef doe je een
voorspelling over de populatie.
Variabele: is een kenmerk dat in een onderzoek wordt waargenomen. Voorbeeld: het onderzoeken
van global warming. Bewolking, regen, hoge temperatuur etc. kunnen variabelen zijn.
Meetniveaus
Het onderscheid tussen meetniveaus is belangrijk, omdat ze verschillende rekenkundige/statistische
operaties toestaan.
Dichotoom
o Kenmerk dichotome variabele: hoewel een dichotome variabele eigenlijk nominaal is,
kun je er toch zinvol een gemiddelde van uitrekenen.
Nominaal
o studierichting die je volgt: politicologie, bestuurskunde etc. (categorisch)
Ordinaal
o kledingmaat S, M, L, XL
Interval/ratio
o hoeveelheid groente in gram dat je per dag eet
o aantal keer dat je per jaar naar de kapper gaat (discreet: je kan niet 1,5 keer naar de
kapper gaan)
Twee contrasten variabelen
Categorisch vs. kwantitatief: categorisch heeft kenmerken en geen getallen. Kwantitatief
heeft getallen.
Discreet vs. continu: discreet zijn hele getallen (kind) en continu zijn ook kommagetallen
(seconden).
, Categorische variabelen
Categorisch: hebben als waarden geen getallen, maar alleen kenmerken of categorieën. Bijv: geslacht,
nationaliteit, religie, opleidingsniveau. Kunnen we opdelen in:
Nominaal (nominal): de variabele heeft meerdere groepen, maar er is geen rangordening.
Bijv: nationaliteit, religie, studierichting. Je kunt de verschillende groepen aanduiden met een
kleur, letter of symbool. Je hebt er niets aan om hiervan gemiddeldes uit te rekenen. Maar ook
met een getal. Een ‘speciaal geval’ van een nominale variabele is:
o Dichotoom (dummy variabele): 0/1 kenmerk. Bijv. geslacht.
Ordinaal (ordinal): de groepen hebben een rangordening, maar geen vast afstand. Bijv:
rangen in het leger, opleidingsniveau (vmbo, havo, vwo). Ordinale variabelen worden soms
voor het gemak als kwantitatief behandeld!
Kwantitatieve variabelen
Kwantitatief (scale): variabelen die als waarde getallen aannemen (leefijd, gewicht, inkomen). Bryman
noemt deze variabelen interval/ratio = de stap van 1 naar 2 is hetzelfde als de stap van 23 naar 24.
Stappen zijn allemaal even groot. Zijn op te delen in twee soorten:
Discreet: variabele waarbij slechts bepaalde waarden kunnen voorkomen. Alleen hele
getallen: 0, 1, 2, 3 (aantal kinderen of huisdieren)
Continu: variabele waarbij oneindig veel mogelijkheden zijn in waarde (tijd, afstand,
gewicht). Bijv: de tijdsduur van het college = 44,999 minuten.
Dataset in SPSS van beschrijvende statistiek
De analyse-eenheden zijn de 5 mensen (cases). M is hier niet nuttig, maar wat wel?