ESLAAGD!
G
Samenvatting
Basisbegrippen statistiek
voor criminologen
C00A5B
, Statistiek
Hoofdstuk 1 - Doel van de statistiek
1. Inleiding
Definitie statistiek = gegevens verzamelen van een hele populatie op basis van een steekproef, wel
onnauwkeurig
Dark number
Verzamelen - presenteren - interpreteren
2. Verzamelen van gegevens
Populatie = groep waarover we uitspraak willen doen
Steekproef = n / deelverzameling van n onderzoekseenheden die representatief is voor de populatie
Representatief voor een kenmerk als die in gelijke mate voorkomt in steekproef en populatie
(Toevals)variabele = X / verschillende uitkomsten en bepaald door toeval
Altijd noteren met HOOFDLETTER
Uitkomstenverzameling = S / de verzameling van alle mogelijke waarden
X1, X2, X3 kunnen allemaal kenmerken zijn die je onderzoekt
Notatie resultaten uit steekproef:
kleine x is gegevens
bij 1 toevalsvariabele: x1, x2, … xn
bij 2 toevalsvariabelen X en Y: (x1, y1), (x2, y2), …, (xn, yn)
bij p toevalsvariabelen x1, …, xp: xi,y, i (persoon) = {1, …, n), j (toevalsvariabele) = {1, …, p}
gegevens in kleine letters schrijven
Gegevensmatrix:
Onderzoekseenheden = onderzochten
Data-analyse
1. Beschrijvende statistiek: exploratie van gegevens
2. Inductieve statistiek: uitspraken doen over de populatie op basis van de steekproefgegevens
3. Classificatie van gegevens
Kwalitatieve / categorische variabelen:
Nominale meetniveau: de uitkomsten worden enkel gebruikt om de onderzoekseenheden van elkaar te
onderscheiden (te klasseren)
Geen ordening mogelijk
Geen wiskundige berekeningen mogelijk
Statistiek 1
, Ordinale meetniveau: de elementen van de uitkomstenverzameling kunnen geordend worden volgens een
bepaald ordeningscriterium
Geen berekeningen mogelijk, wel vergelijkingen
→ beide discreet
Kwantitatieve variabelen:
Metrisch meetniveau: verschillen in meetwaarden uitgebrukt in hoeveelheden, numerieke betekenis,
berekeningen mogelijk
Discreet: uitkomsten duidelijk afgescheiden van elkaar
Geen mogelijke uitkomstvariabele tussen twee opeenvolgende bv. aantal veroordelingen
→ soms beschouwd als continu door grote hoeveelheid mogelijke uitkomsten
Continu: de mogelijke uitkomsten worden gegeven door een of meerdere intervallen
Uitkomstvariabelen tussen twee opeenvolgende
→ worden discreet voorgesteld in de praktijk
→ soms gegroepeerd tot categorische uitkomsten bv. <1 uur, 2 - 5 uur, > 5 uur
Hiërarchie van meetniveaus
Laag: nominaal (classificatie o.b.v. (on)gelijkheid
Hoger: ordinaal ( + ordering)
Hoogst: metrisch ( + meeteenheid)
4. Van steekproef naar populatie
Beschrijvende statistiek (steekproef)
= gegevens samenvatten a.d.h.v. numerieke kenmerken en grafische voorstellingen
Steekproefpercentage is benadering van populatiepercentage
Eerst exploratieve analyse van steekproefgegevens, daarna gehele populatie
Veel verschillen?
Uitschieters?
Trends?
Hoe meer steekproefgegevens, hoe accurater de benadering van de onbekende populatiewaarde
Inductieve statistiek (populatie)
Wet van de grote aantallen = hoe groter de steekproef, hoe dichter de steekproefwaarde de populatiewaarde
benadert
Hoofdstuk 2 - Beschrijvende statistiek
0. Inleiding
Statistiek 2