Samenvatting - Statistiek in de criminologie (B001628A)
8 views 0 purchase
Course
Statistiek in de criminologie (B001628A)
Institution
Universiteit Gent (UGent)
Deze samenvatting heeft zeer beknopt de theorie weer, er volgen op het examen slechts enkele theorievragen want de focus ligt uiteraard op de oefeningen. Hiermee weet je al het nodige!
Theorie statistiek
H2: Inleidende begrippen
Objecten/onderzoekseenheden = over wie of wat je op basis van het criminologisch onderzoek een uitspraak doet
Variabelen = kenmerken (leeftijd, geslacht, vooropleiding, studiekeuze, …) die worden onderzocht
Onderzoekspopulatie = de verzameling van individuen waarover we een uitspraak willen doen
Steekproef = een staal uit de onderzoekspopulatie
Respondenten = de personen die we uiteindelijk bevraagd hebben / een deelverzameling van de
onderzoekspopulatie
Belangen van een steekproef: toevalsgewijs en representatief karakter
Representativiteit = een kenmerk in de steekproef komt evenveel voor als in de onderzoekspopulatie
Beschrijvende statistiek = op een overzichtelijke en samenvattende of synthetische wijze weergeven van kenmerken
die voorkomen in een onderzoekspopulatie of in een steekproef
Inductieve of inferentiële statistiek = het veralgemenen van de gegevens verzameld voor een steekproef naar de
onderzoekspopulatie waaruit ze getrokken werden
Hypothesen = specifieke stellingen betreffende de (causale) relatie tussen twee of meer concepten, die afgeleid zijn
uit de theorie omvat nu een onderzoekshypothese, een nulhypothese en een alternatieve hypothese
Een beschrijvende onderzoeksvraag = betreft de kwantitatieve beschrijving van een fenomeen onder studie
Een verkennende / exploratieve onderzoeksvraag = hebben betrekking op het aftasten van (nieuwe)
veronderstellingen
Een verklarende onderzoeksvraag = is er op gericht geobserveerde verschillen of veranderingen in
uitkomstvariabelen te verklaren vanuit kenmerken die eigen zijn aan een theoretisch paradigma
Statistische eenheden = de onderzoekseenheden waar men een uitspraak over wilt doen de eenheden waarover
uitspraken gedaan worden, dienen bij voorkeur te verschillen op criminologisch relevante kenmerken, dat wil zeggen
dat ze variabiliteit of spreiding dienen te vertonen
Variabelen = de kenmerken van statistische eenheden die variëren en die verschillende scores hebben op een
bepaald kenmerk
Constante = als een kenmerk niet varieert kan niet gebruikt worden in statistisch onderzoek
Een univariate analyse = een analyse van één kenmerk dat varieert
Een bivariate analyse = wanneer twee variabelen met elkaar in verband gebracht worden
Een multivariate analyse = wanneer je meer dan twee variabelen gebruikt
Discrete variabelen = verzameling van de natuurlijke getallen (vb. aantal kinderen)
Continue variabelen = verzameling van de reële getallen (vb. tijd, afstand)
Het nominale meetniveau = brengt de kenmerken van onderzoekseenheden onder in elkaar uitsluitende categorieën
(categorische gegevens) exclusiviteit en exhaustiviteit
Exclusiviteit = houdt in dat de categorieën elkaar niet mogen overlappen
Exhaustiviteit = impliceert dat het classificatiesysteem alle onderzoekseenheden moet kunnen classificeren, m.a.w.
elk geval moet in een categorie kunnen worden gebracht
,Het ordinale meetniveau = wordt gekenmerkt door het principe van de ordenbaarheid van de categorieën op een
continuüm plaatsen
Een dichotomie = een variabele die slechts twee waarden kan aannemen
Een polytomie = een variabele die meer dan twee categorieën kent
Het interval meetniveau = er is niet alleen sprake van een rangordening, maar de intervallen tussen de verschillende
waarden hebben een exacte betekenis (vb. temperatuur) leeftijd en inkomensklassen kunnen op het interval
niveau als de afstanden tussen de waarden altijd even groot zijn
Het ratio niveau = het niveau waarbij er sprake is van een rangordening en waarbij de intervallen betekenis hebben
en er een natuurlijk nulpunt aanwezig is (vb. lengte)
Gegevensmatrix = bevat de informatie van elke statistische eenheid waarover men informatie verzameld, die
informatie heeft betrekking op kenmerken die variëren (variabelen) en de statistische eenheden nemen dus
verschillende waarden aan op deze kenmerken r*k tabel (rijen en kolommen)
n
Het sommatieteken = ∑ xi i = index, m = ondergrens van de sommatie, n = bovengrens van de sommatie
i=m
Frequentietabellen = tellingen van hoe vaak iedere waarde van een variabele voorkomt
Kruistabellen = tellingen van hoe vaak waarden van twee variabelen in combinatie met elkaar voorkomen
H2: De univariate statistiek
Absolute frequentie = het totaal aantal elementen van de steekproef voorgesteld door de letter ‘n’ = steekproefgrote
Relatieve frequentie = berekenen door percentages te presenteren proporties: absolute frequentie delen door
het aantal waarnemingen percentages: proporties vermenigvuldigen met 100 MAAR ! als de steekproef minder
dan 30 eenheden bevat werkt men beter met absolute aantallen i.p.v. percentages
Cumulatieve percentages = de percentages van elke volgende waarde bij de voorgaande opgeteld
Grafische voorstellingen van gegevens: taartdiagram/cirkeldiagram, staafdiagram, histogram, lijndiagram,
frequentiepolygoon
Parameters van centraliteit
De modus = een centrummaat en betreft de categorie van de variabele met de frequentie die het vaakst voorkomt
De mediaan = het middelpunt van de verdeling de mediaan is de middelste van de (oneven) aantal waarden in de
rangschikking naar grootte in frequentietabel: (n+1)/2
De kwantielen/kwartielen = mediaan is een speciaal geval van de maten die we kwantielen noemen drie gelijke
groepen indelen Q1 = 25%, Q2 = 50% (mediaan) en Q3 = 75% (Q0 = minimum en Q4 = maximum)
Het rekenkundig gemiddelde = een centrummaat dat gebruikt wordt bij variabelen gemeten op het metrische
X 1+ X 2+…+ Xn
niveau, dus bij interval en ratio-variabelen x=
n
kenmerken: enkel voor metrische variabelen + is het evenwichtspunt van de verdeling + gevoelig voor uitschieters
+ de som van alle afwijkingen tov het gemiddelde is nul = deviatiescores (X- X ¿
, Parameters van spreiding
De variatieratio (VR) = de proportie waarnemingen die niet tot de modale categorie behoren in percentage of in
proportie uitgedrukt
De index van diversiteit (ID) = gebaseerd op de relatieve frequenties van de categorieën, maar het enige verschil is
nu dat rekening wordt gehouden met de proportie van waarnemingen binnen iedere categorie of equivalentieklasse
ID = 1 – de som van de gekwadrateerde proporties in elke categorie
ID = de kans dat twee willekeurig gekozen eenheden van de steekproef van een verschillende categorie zijn
nominaal meetniveau
De variatiebreedte = het verschil tussen de grootste en kleinste waargenomen waarde ordinaal meetniveau
De interkwartiel-afstand = het verschil tussen het derde en eerste kwartiel ordinaal meetniveau
De gemiddelde absolute afwijking = de som van de absolute waarden van de afwijkingen van elke waarde ten
aanzien van het rekenkundig gemiddelde, gedeeld door het aantal waarneming
De variatie / Sum of Squares = de som van de gekwadrateerde afwijking van elke waarde t.o.v. het gemiddelde
∑ (X −X )² metrisch meetniveau
De (steekproef)variantie = de variatie gedeeld door het aantal steekproefeenheden – 1
∑ ( X−X )² metrisch
n−1
meetniveau
De (steekproef)standaardafwijking = de vierkantswortel van de variantie
√ ∑ ( X −X )² metrisch niveau
n−1
De variatiecoëfficiënt = standaardafwijking / gemiddelde metrisch niveau
Nominaal Ordinaal Metrisch
Maten van Modus Modus Modus
centraliteit Mediaan Mediaan
Kwartielen Kwartielen
Rekenkundig gemiddeld
Maten van Variatieratio Variatiebreedte Gemiddelde absolute afwijking
spreiding Index van diversiteit Interkwartielafstand Variatie
Variantie
Standaardafwijking
Variatiecoëfficiënt
Parameters van vorm
Symmetrisch = het rekenkundig gemiddeld en de mediaan zijn aan elkaar gelijk
Positief asymmetrisch = de verdeling heeft een langere staart rechts gemiddelde groter dan mediaan
Negatief asymmetrisch = de verdeling heeft een langere staart links gemiddelde kleiner dan mediaan
De empirische coëfficiënt van Pearson = bereken het verschil tussen het gemiddelde en de mediaan en deel deze
waarde door de standaardafwijking een verdeling is positief asymmetrisch als de coëfficiënt een positieve waarde
heeft en negatief asymmetrisch als de coëfficiënt een negatieve waarde heeft
Afplatting / kurtosis = de mate van afplatting van de gegevens rondom het rekenkundig gemiddelde
Mesokurtische verdelingen = gemiddelde afplatting
Leptokurtische verdelingen = scherper
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ilonamasselis. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $5.83. You're not tied to anything after your purchase.