STATISTIEK
Hoofdstuk 1 niet voor examen!
Hoofdstuk 2: Inleidende begrippen
Doel =Inzicht in begrippenkader van kwantitatief criminologisch onderzoek
1. Inleiding:
Objecten/onderzoekseenheden = de personen of zaken over wie je iets zegt
Bv. eerstejaarsstudenten, misdaadartikelen…
Variabelen = kenmerken van het object/ de onderzoekseenheid
Bv. de gemiddelde leeftijd, de lengte…
Afhankelijke variabele = de variabele waarover je een voorspelling doet/hetgeen onderzocht wordt.
Te verklaren variabele
Onafhankelijke variabele = de variabele waarvan je gaat meten of ze een verandering veroorzaakt bij
de afhankelijke variabele. De verlarende variabele
Overgeneralisatie = wanneer we ons niet houden aan de onderzoekspopulatie die we op voorhand hebben
gedefiniëerd
Bv. Belgen tussen de 15 en 90 jaar -> alle Belgen
Onderzoekspopulatie = de verzameling individuen waarover we uitspraak willen doen
Steekproef(samples) = een staal uit de onderzoekspopulatie die we daadwerkelijk ondervragen
Moet toevalsgewijs (= willekeurig,aselect, ad random) en representatief (= de kenmerken
van de steekproef moeten evenredig zijn met de kenmerken van de onderzoekspopulatie) zijn
-> niet representatief, d.w.z. dat een bepaalde groep oververtegenwoordigd is, en een andere
ondervertegenwoordigd
Respondenten = De personen zelf die we uiteindelijk bevraagd hebben
2. Beschrijven, schatten en veralgemenen als statistische bedrijvigheid:
Statistiek = het geheel van regels en proceures om gemeten kenmerken te verwerken
2 soorten:
1. Beschrijvende statistiek: op een overzichtelijke en samenvattende of synthetische wijze weergeven
van kenmerken die voorkomen in een onderzoekspopulatie of in een steekproef, wanneer we niet alle
eenheden kunnen bevragen.(kwantitatieve beschrijving(sv) van de kenmerken van de steekproef)
-vraag hoe grote hoeveelheden van gegevens zo overzichtelijk mogelijk kunnen gepresenteerd
worden, zonder dat er informatie verloren gaat. Hierbij is men onderhevig aan 2 beperkingen:
Resultaten kunnen niet veralgemeend worden, beschrijvend biedt momentopname die
uitsluitend geldig is voor de onderzochte groep
Laat niet toe causaliteit vast te stellen, maar omgekeerd moet het een oorzaak-gevolg-
verband wel in cijfers terug te vinden zijn
- gegevens worden in categorieen teruggebracht, vergeleken.deze categorieen worden beinvloed door de wet.
Theorie die men hanteert.
-sommige vinden beschrijvende statistiek reductionistisch: dit wil zeggen dat ze rijke info tot naakte cijfers
herleidt. Dit is ook zo maar dit heeft zijn redenen nl. beschrijvende is maar het begin van een reeks van vragen
die de criminoloog zich stelt. Bij het verwerken van deze gegevens speelt theorie een grote rol
1
, -Adhv van beschrijvende kan je wel ideen opdoen over de samenhang van kenmerken, we kunnen
veronderstellingen hebben over de wijze waarop criminologische kenmerken samenhangen zoals
leeftijd,criminaliteit, we kunnen deze hypothetisch opschrijven en via inductieve statistiek toetsen
oftewel waarheidsgehalte ervan nagaan.
2. Inductieve of inferentiële statistiek: veralgemenen van de gegevens die verzameld zijn door de
steekproef, naar de onderzoekspopulatie waaruit ze getrokken werden in termen van
waarschijnlijkheid
-toetsbare stellingen: bepaalde veronderstellingen,
-> “Kan de steekproef veralgemeend worden tot de totale onderzoekspopulatie?”
Hypothesen testen = verbanden onderzoeken
Bv. het verband tussen het surfen op louche sites en slachtoffer worden van fishing
Hypothese = een specifieke stelling betreffende de al dan niet causale relatie tussen 2 of
meer concepten, die afgeleid zijn uit de theorie
Een hypothese omvat 3 soorten hypotheses:
1) de onderzoekshypothese: formuleert de betrokken stelling in de richting van de verwachtingen van
de onderzoeker,in de positieve zin (af te leiden uit opgave)
2) de nulhuypothese (H0): de hypothese dat er geen verband bestaat tussen de variabelen -> een
omkering van de onderzoekshypothese. Bv. geen verschil tussen geslachten
3) de alternatieve hypothese (Ha): indien we vaststellen dat er wel een veband is, dus dat de
nulhypothese mag verworpen worden -> klopt (voorlopig) de onderzoekshypothese, deze heten we
dan de alternatieve hypothese
3. Statistiek en de beantwoording van beschrijvende en verklarende onderzoeksvragen:
Goed geformuleerde onderzoeksvraag is belangrijk want geeft richting aan het onderzoek
Types onderzoeksvragen:
1. Beschrijvende onderzoeksvragen: vraag die een kwantitatieve beschrijving van het fenomeen
inhoudt. Geeft opsomming van het voorkomen van bepaalde verschijnselen en brengt dit in verband
met bepaalde andere verschijnselen, zonder een verklaring te geven van het fenomeen. Veel
criminologisch onderzoek is beschrijvend.
Bv. Hoeveel studenten werden al eens slachtoffer van diefstal?
2. Verkennende onderzoeksvragen/exploratieve onderzoeksvragen: vraag die de samenhang van
variabelen bestudeert , tasten veronderstellingen af. Situeert zich tussen beschrijvende en verklarende
vragen. Kwantitatiee verkenning van het fenomeen.
Bv. Is er een verband tussen de leeftijd en delinquent gedrag?
3. Verklarende onderzoeksvragen: dragen bij tot de criminologische theorie, een vraag waarmee het
antwoord verklarend is. Ze verklaren kwantitatief de eventuele verschillen of veranderingen in
uitkomstvariabelen. Verklaren is altijd het uiteinedlijke doel maar is niet altijd haalbaar als er bv.
weinig over bekend is.
Zoekt oorzakelijke verbanden.
2
,Bv. Spelen genetische factoren een rol bij chronisch gebruik van geweld? / Kunnen genetische factoren
chronisch gebruik van geweld verklaren?
Zie voorbeeldvragen p. 24
4. Statistische eenheden:
= onderzoekseenheden(cases) waar men een uitspraak over wil doen, die eenheden hebben kenmerken of
variabelen. Bv. studenten, leerlingen, inwoners bepaald gebied,scholen, gemeenten, landen, dossiers,
bedrijven.
Kenmerken beschrijven de eenheden, deze kenmerken noemen we variabelen bv. gebeurtenissen uit leven van
een persoon.
Variabelen= de kenmerken van statistische eenheden die varieren en die verschillende scores hebben op een
bepaald kenmerk.
- Variabiliteit (= veranderbaarheid, diversiteit, verschillen): wordt uitgedrukt in spreidingsmaten:
-De variabelen van onderzoekseenheden moeten variëren, als dit niet zo is: constante (= een kenmerk dat niet
varieert, of een kenmerke waarop alle eenheden dezelfde waarden hebben. Constante variabelen zijn niet
bruikbaar in statistiek)
-Ook moet er voldoende spreiding zijn binnen de variabelen, wanneer er onvoldoende spreiding is binnen de
verschillende variabelen (dus wanneer de kenmerken zich vooral concentreren in 1 bepaald onderscheid)
kunnen we een kenmerk indien nodig schrappen
-Spreiding = per kenmerk tenminste twee verschillende waarden zjn en dat de eenheden verspreid zijn over de
categorieen of waarden van die kenmerken.
-> Binnen de criminologie vaak problematisch bv. de spreiding van slachtoffers, daders, gevangenen
-spreiding bereken je door getal-gemiddelde
- Centraliteit: geeft grote tendensen weer: de modus, de mediaan…
5. Univariate, bivariate en multivariate beschrijvende analyse:
Soorten analyses zijn afhankelijk van de hoeveelheid variabelen die je bij de analyse wilt betrekken:
- Univariaat: analyse van 1 kenmerk varieert, hier komt het op neer de verdeling van een kernmerk accuraat te
beschrijven. Maten van centraliteit en spreiding bv. gemiddelde
- Bivariaat: bestudeert samenhang tussen 2 kenmerken, 2 kenmerken van buurten beschouwen we als 2
onderzoekseenheden (bv. criminaliteitsniveau en werkloosheidsniveau) 2 kenmerken worden met elkaar in
verband gebracht, men zoekt de samenhang/correlatie tussen deze kenmerken. Bv. pearson correlatie
- Multivariaat/multivariabelen analyse: bestudeert samenhang tussen 3 of meerdere kenmerken , regressie
-> belangrijkste, je moet met alle variabelen rekening houden in een analyse! Het volstaat niet om
enkel een relatie tussen 2 kenmerken te bestuderen
Opletten! -> je voorspelt op basis van gegevens, die kunnen correct of vals zijn
Bv. is het gebruik van heroïne de oorzaak verklarend voor het plegen van ernstige
vermogenscriminaliteit, of is het omgekeerd?
Analysen gebruiken we om onderzoeksvragen in de kwantitatieve criminologie te behandelen
3
,Statistische analysetechnieken zijn dependent of niet-dependent:
- dependent: we veronderstellen een oorzaak-gevolg relatie
- niet-dependent: we veronderstellen geen oorzaak-gevolg relatie (enkel samenhang)
-> de samenhang tussen variabelen is dus niet altijd causaliteit!
Extra niet in boek maar wel op pp
VARIABILITEIT EN VERSCHIL
̶ Statistiek draait om het begrijpen (modelleren, verklaren) van verschillen (variabiliteit, onzekerheid)
̶ Bv. Waarom verschillen eerstejaarsstudenten in de mate waarin ze seksueel slachtoffer worden?
̶ Bv. Waarom verschillen straten in de mate waarin er criminaliteit voorkomt? =verschilt sterk tussen
studenten dus kunnen we verder onderverdelen bv. woonplaats
Verschil = onzekerheid, je wil onzekerheid reduceren
Onderzoekseenheden moeten verschillen van variabelen
-geen verschil = constante bv. iedereen
̶ Onderzoekseenheden waarover men uitspraken wil doen, moeten dus onderling verschillen
(variabiliteit) op de bestudeerde kenmerken (variabelen)
̶ Bv. Mate waarin eerstejaarsstudenten seksueel slachtoffer worden verschilt tussen
eerstejaarsstudenten (veel geen, sommige een beetje, weinig zeer veel)
̶ Bv. Niet alle straten in een stad kennen evenveel delicten (veel geen, sommige een beetje, weinig,
zeer veel)
̶ Verschil impliceert ‘onzekerheid’
̶ Uiteindelijk is het doel om die ‘onzekerheid’ te modeleren of voorspellen
̶ Indien géén verschil, dan vervalt een variabele tot een constante en is er zekerheid (want steeds
dezelfde waarde)
VARIABILITEIT IMPLICEERT ONZEKERHEID
̶ Verschillen (variabiliteit) op een kenmerk (variabele) impliceren onzekerheid Δ
̶ Bv. We kunnen niet met zekerheid zeggen welke eerstejaarsstudent wel of
niet slachtoffer zal worden
̶ Bv. We kunnen niet met zekerheid zeggen in welke straat er delicten zullen
Voorkomen =we spreken altijd van waarschijnlijkheid
̶ Onzekerheid Δop verdeling van het te verklaren kenmerk (afhankelijke
variabele 𝑦) tussen de onderzoekseenheden trachten we te modelleren (bv.
regressie) en te verklaren (begrijpen) om ultiem die onzekerheid te beperken
̶ Bv. Waarom wordt de ene eerstejaarsstudent wél seksueel slachtoffer en
4
, de andere niet?
̶ Bv. Waarom komt criminaliteit voor in de ene straat en in de andere niet?
GEBREK AAN VARIABILITEIT IS EEN PROBLEEM
̶ Als een kenmerk niet varieert (verschilt) tussen onderzoekseenheden, vervalt dat
kenmerk tot een constante 𝑐zonder onzekerheid Δ(≠variabele)
̶ Bv . Indien elke eerstejaarstudent in dezelfde mate seksueel slachtoffer wordt (of
niet ), kan je geen kenmerken van eerstejaarsstudenten gebruiken om de mate van
seksueel slachtofferschap te verklaren
̶ Bv . Indien criminaliteit in dezelfde mate voorkomt over alle straten heen (of niet ), kan je geen
kenmerken van die straten hanteren om criminaliteit te verklaren
- Ultiem valt er dan niets te begrijpen of te verklaren
̶ Er is geen onzekerheidsprobleem meer om op te lossen
-Zonder variabiliteit, geen kwantitatief onderzoek want elke oplossing is perfect
gedefinieerd (deterministisch) en er kan dus geen onzekerheid Δ onderzocht of verklaard
(~ gemodelleerd , beperkt) worden
WAAROM IS VARIABILITEIT ZO BELANGRIJK
̶ Ultiem trachten we verschillen op een kenmerk tussen onderzoekseenheden te verklaren
̶ Daarvoor zoeken we naar andere kenmerken (zgn. onafhankelijke variabelen 𝑥) waarvan de verschillen
samenhangen (dezelfde
mate van variabiliteit of verschil vertonen, zgn. co variabiliteit ) met de waargenomen verschillen op het te
verklaren kenmerk 𝑦(zgn. afhankelijke variabelen 𝑦
̶ Bv. Waarom wordt de ene eerstejaarsstudent wél slachtoffer van criminaliteit en de andere niet?
Misschien speelt geslacht een rol! Maar … als alle onderzoekseenheden mannelijke
eerstejaarsstudenten zijn, kan je niet nagaan of geslacht een rol speelt
(er zijn geen verschillen op)
̶ Bv. Waarom komt criminaliteit voor in de ene straat en in de andere niet? Misschien speelt de
aanwezigheid van een café een rol! Maar .. als alle onderzoekseenheden straten zonder cafés zijn, kan
je niet nagaan of de aanwezigheid van een café een ro l speelt (er zijn geen verschillen op de
aanwezigheid van een café)
= =voldoende spreiding = ten minste 2 kenmerken
̶ Dit impliceert dat een constant kenmerk 𝑐geen verklaring kan zijn voor waargenomen verschillen op het te
verklaren kenmerk 𝑦
̶ M.a.w. een constante voegt geen informatie toe die toelaat de mate van onzekerheid te beperken
5