Samenvatting - Statistiek in de criminologie (B001628A)
7 keer bekeken 0 keer verkocht
Vak
Statistiek in de criminologie (B001628A)
Instelling
Universiteit Gent (UGent)
Deze samenvatting heeft zeer beknopt de theorie weer, er volgen op het examen slechts enkele theorievragen want de focus ligt uiteraard op de oefeningen. Hiermee weet je al het nodige!
Theorie statistiek
H2: Inleidende begrippen
Objecten/onderzoekseenheden = over wie of wat je op basis van het criminologisch onderzoek een uitspraak doet
Variabelen = kenmerken (leeftijd, geslacht, vooropleiding, studiekeuze, …) die worden onderzocht
Onderzoekspopulatie = de verzameling van individuen waarover we een uitspraak willen doen
Steekproef = een staal uit de onderzoekspopulatie
Respondenten = de personen die we uiteindelijk bevraagd hebben / een deelverzameling van de
onderzoekspopulatie
Belangen van een steekproef: toevalsgewijs en representatief karakter
Representativiteit = een kenmerk in de steekproef komt evenveel voor als in de onderzoekspopulatie
Beschrijvende statistiek = op een overzichtelijke en samenvattende of synthetische wijze weergeven van kenmerken
die voorkomen in een onderzoekspopulatie of in een steekproef
Inductieve of inferentiële statistiek = het veralgemenen van de gegevens verzameld voor een steekproef naar de
onderzoekspopulatie waaruit ze getrokken werden
Hypothesen = specifieke stellingen betreffende de (causale) relatie tussen twee of meer concepten, die afgeleid zijn
uit de theorie omvat nu een onderzoekshypothese, een nulhypothese en een alternatieve hypothese
Een beschrijvende onderzoeksvraag = betreft de kwantitatieve beschrijving van een fenomeen onder studie
Een verkennende / exploratieve onderzoeksvraag = hebben betrekking op het aftasten van (nieuwe)
veronderstellingen
Een verklarende onderzoeksvraag = is er op gericht geobserveerde verschillen of veranderingen in
uitkomstvariabelen te verklaren vanuit kenmerken die eigen zijn aan een theoretisch paradigma
Statistische eenheden = de onderzoekseenheden waar men een uitspraak over wilt doen de eenheden waarover
uitspraken gedaan worden, dienen bij voorkeur te verschillen op criminologisch relevante kenmerken, dat wil zeggen
dat ze variabiliteit of spreiding dienen te vertonen
Variabelen = de kenmerken van statistische eenheden die variëren en die verschillende scores hebben op een
bepaald kenmerk
Constante = als een kenmerk niet varieert kan niet gebruikt worden in statistisch onderzoek
Een univariate analyse = een analyse van één kenmerk dat varieert
Een bivariate analyse = wanneer twee variabelen met elkaar in verband gebracht worden
Een multivariate analyse = wanneer je meer dan twee variabelen gebruikt
Discrete variabelen = verzameling van de natuurlijke getallen (vb. aantal kinderen)
Continue variabelen = verzameling van de reële getallen (vb. tijd, afstand)
Het nominale meetniveau = brengt de kenmerken van onderzoekseenheden onder in elkaar uitsluitende categorieën
(categorische gegevens) exclusiviteit en exhaustiviteit
Exclusiviteit = houdt in dat de categorieën elkaar niet mogen overlappen
Exhaustiviteit = impliceert dat het classificatiesysteem alle onderzoekseenheden moet kunnen classificeren, m.a.w.
elk geval moet in een categorie kunnen worden gebracht
,Het ordinale meetniveau = wordt gekenmerkt door het principe van de ordenbaarheid van de categorieën op een
continuüm plaatsen
Een dichotomie = een variabele die slechts twee waarden kan aannemen
Een polytomie = een variabele die meer dan twee categorieën kent
Het interval meetniveau = er is niet alleen sprake van een rangordening, maar de intervallen tussen de verschillende
waarden hebben een exacte betekenis (vb. temperatuur) leeftijd en inkomensklassen kunnen op het interval
niveau als de afstanden tussen de waarden altijd even groot zijn
Het ratio niveau = het niveau waarbij er sprake is van een rangordening en waarbij de intervallen betekenis hebben
en er een natuurlijk nulpunt aanwezig is (vb. lengte)
Gegevensmatrix = bevat de informatie van elke statistische eenheid waarover men informatie verzameld, die
informatie heeft betrekking op kenmerken die variëren (variabelen) en de statistische eenheden nemen dus
verschillende waarden aan op deze kenmerken r*k tabel (rijen en kolommen)
n
Het sommatieteken = ∑ xi i = index, m = ondergrens van de sommatie, n = bovengrens van de sommatie
i=m
Frequentietabellen = tellingen van hoe vaak iedere waarde van een variabele voorkomt
Kruistabellen = tellingen van hoe vaak waarden van twee variabelen in combinatie met elkaar voorkomen
H2: De univariate statistiek
Absolute frequentie = het totaal aantal elementen van de steekproef voorgesteld door de letter ‘n’ = steekproefgrote
Relatieve frequentie = berekenen door percentages te presenteren proporties: absolute frequentie delen door
het aantal waarnemingen percentages: proporties vermenigvuldigen met 100 MAAR ! als de steekproef minder
dan 30 eenheden bevat werkt men beter met absolute aantallen i.p.v. percentages
Cumulatieve percentages = de percentages van elke volgende waarde bij de voorgaande opgeteld
Grafische voorstellingen van gegevens: taartdiagram/cirkeldiagram, staafdiagram, histogram, lijndiagram,
frequentiepolygoon
Parameters van centraliteit
De modus = een centrummaat en betreft de categorie van de variabele met de frequentie die het vaakst voorkomt
De mediaan = het middelpunt van de verdeling de mediaan is de middelste van de (oneven) aantal waarden in de
rangschikking naar grootte in frequentietabel: (n+1)/2
De kwantielen/kwartielen = mediaan is een speciaal geval van de maten die we kwantielen noemen drie gelijke
groepen indelen Q1 = 25%, Q2 = 50% (mediaan) en Q3 = 75% (Q0 = minimum en Q4 = maximum)
Het rekenkundig gemiddelde = een centrummaat dat gebruikt wordt bij variabelen gemeten op het metrische
X 1+ X 2+…+ Xn
niveau, dus bij interval en ratio-variabelen x=
n
kenmerken: enkel voor metrische variabelen + is het evenwichtspunt van de verdeling + gevoelig voor uitschieters
+ de som van alle afwijkingen tov het gemiddelde is nul = deviatiescores (X- X ¿
, Parameters van spreiding
De variatieratio (VR) = de proportie waarnemingen die niet tot de modale categorie behoren in percentage of in
proportie uitgedrukt
De index van diversiteit (ID) = gebaseerd op de relatieve frequenties van de categorieën, maar het enige verschil is
nu dat rekening wordt gehouden met de proportie van waarnemingen binnen iedere categorie of equivalentieklasse
ID = 1 – de som van de gekwadrateerde proporties in elke categorie
ID = de kans dat twee willekeurig gekozen eenheden van de steekproef van een verschillende categorie zijn
nominaal meetniveau
De variatiebreedte = het verschil tussen de grootste en kleinste waargenomen waarde ordinaal meetniveau
De interkwartiel-afstand = het verschil tussen het derde en eerste kwartiel ordinaal meetniveau
De gemiddelde absolute afwijking = de som van de absolute waarden van de afwijkingen van elke waarde ten
aanzien van het rekenkundig gemiddelde, gedeeld door het aantal waarneming
De variatie / Sum of Squares = de som van de gekwadrateerde afwijking van elke waarde t.o.v. het gemiddelde
∑ (X −X )² metrisch meetniveau
De (steekproef)variantie = de variatie gedeeld door het aantal steekproefeenheden – 1
∑ ( X−X )² metrisch
n−1
meetniveau
De (steekproef)standaardafwijking = de vierkantswortel van de variantie
√ ∑ ( X −X )² metrisch niveau
n−1
De variatiecoëfficiënt = standaardafwijking / gemiddelde metrisch niveau
Nominaal Ordinaal Metrisch
Maten van Modus Modus Modus
centraliteit Mediaan Mediaan
Kwartielen Kwartielen
Rekenkundig gemiddeld
Maten van Variatieratio Variatiebreedte Gemiddelde absolute afwijking
spreiding Index van diversiteit Interkwartielafstand Variatie
Variantie
Standaardafwijking
Variatiecoëfficiënt
Parameters van vorm
Symmetrisch = het rekenkundig gemiddeld en de mediaan zijn aan elkaar gelijk
Positief asymmetrisch = de verdeling heeft een langere staart rechts gemiddelde groter dan mediaan
Negatief asymmetrisch = de verdeling heeft een langere staart links gemiddelde kleiner dan mediaan
De empirische coëfficiënt van Pearson = bereken het verschil tussen het gemiddelde en de mediaan en deel deze
waarde door de standaardafwijking een verdeling is positief asymmetrisch als de coëfficiënt een positieve waarde
heeft en negatief asymmetrisch als de coëfficiënt een negatieve waarde heeft
Afplatting / kurtosis = de mate van afplatting van de gegevens rondom het rekenkundig gemiddelde
Mesokurtische verdelingen = gemiddelde afplatting
Leptokurtische verdelingen = scherper
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper ilonamasselis. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,49. Je zit daarna nergens aan vast.