Deze samenvatting heeft zeer beknopt de theorie weer, er volgen op het examen slechts enkele theorievragen want de focus ligt uiteraard op de oefeningen. Hiermee weet je al het nodige!
Theorie statistiek
H2: Inleidende begrippen
Objecten/onderzoekseenheden = over wie of wat je op basis van het criminologisch onderzoek een uitspraak doet
Variabelen = kenmerken (leeftijd, geslacht, vooropleiding, studiekeuze, …) die worden onderzocht
Onderzoekspopulatie = de verzameling van individuen waarover we een uitspraak willen doen
Steekproef = een staal uit de onderzoekspopulatie
Respondenten = de personen die we uiteindelijk bevraagd hebben / een deelverzameling van de
onderzoekspopulatie
Belangen van een steekproef: toevalsgewijs en representatief karakter
Representativiteit = een kenmerk in de steekproef komt evenveel voor als in de onderzoekspopulatie
Beschrijvende statistiek = op een overzichtelijke en samenvattende of synthetische wijze weergeven van kenmerken
die voorkomen in een onderzoekspopulatie of in een steekproef
Inductieve of inferentiële statistiek = het veralgemenen van de gegevens verzameld voor een steekproef naar de
onderzoekspopulatie waaruit ze getrokken werden
Hypothesen = specifieke stellingen betreffende de (causale) relatie tussen twee of meer concepten, die afgeleid zijn
uit de theorie omvat nu een onderzoekshypothese, een nulhypothese en een alternatieve hypothese
Een beschrijvende onderzoeksvraag = betreft de kwantitatieve beschrijving van een fenomeen onder studie
Een verkennende / exploratieve onderzoeksvraag = hebben betrekking op het aftasten van (nieuwe)
veronderstellingen
Een verklarende onderzoeksvraag = is er op gericht geobserveerde verschillen of veranderingen in
uitkomstvariabelen te verklaren vanuit kenmerken die eigen zijn aan een theoretisch paradigma
Statistische eenheden = de onderzoekseenheden waar men een uitspraak over wilt doen de eenheden waarover
uitspraken gedaan worden, dienen bij voorkeur te verschillen op criminologisch relevante kenmerken, dat wil zeggen
dat ze variabiliteit of spreiding dienen te vertonen
Variabelen = de kenmerken van statistische eenheden die variëren en die verschillende scores hebben op een
bepaald kenmerk
Constante = als een kenmerk niet varieert kan niet gebruikt worden in statistisch onderzoek
Een univariate analyse = een analyse van één kenmerk dat varieert
Een bivariate analyse = wanneer twee variabelen met elkaar in verband gebracht worden
Een multivariate analyse = wanneer je meer dan twee variabelen gebruikt
Discrete variabelen = verzameling van de natuurlijke getallen (vb. aantal kinderen)
Continue variabelen = verzameling van de reële getallen (vb. tijd, afstand)
Het nominale meetniveau = brengt de kenmerken van onderzoekseenheden onder in elkaar uitsluitende categorieën
(categorische gegevens) exclusiviteit en exhaustiviteit
Exclusiviteit = houdt in dat de categorieën elkaar niet mogen overlappen
Exhaustiviteit = impliceert dat het classificatiesysteem alle onderzoekseenheden moet kunnen classificeren, m.a.w.
elk geval moet in een categorie kunnen worden gebracht
,Het ordinale meetniveau = wordt gekenmerkt door het principe van de ordenbaarheid van de categorieën op een
continuüm plaatsen
Een dichotomie = een variabele die slechts twee waarden kan aannemen
Een polytomie = een variabele die meer dan twee categorieën kent
Het interval meetniveau = er is niet alleen sprake van een rangordening, maar de intervallen tussen de verschillende
waarden hebben een exacte betekenis (vb. temperatuur) leeftijd en inkomensklassen kunnen op het interval
niveau als de afstanden tussen de waarden altijd even groot zijn
Het ratio niveau = het niveau waarbij er sprake is van een rangordening en waarbij de intervallen betekenis hebben
en er een natuurlijk nulpunt aanwezig is (vb. lengte)
Gegevensmatrix = bevat de informatie van elke statistische eenheid waarover men informatie verzameld, die
informatie heeft betrekking op kenmerken die variëren (variabelen) en de statistische eenheden nemen dus
verschillende waarden aan op deze kenmerken r*k tabel (rijen en kolommen)
n
Het sommatieteken = ∑ xi i = index, m = ondergrens van de sommatie, n = bovengrens van de sommatie
i=m
Frequentietabellen = tellingen van hoe vaak iedere waarde van een variabele voorkomt
Kruistabellen = tellingen van hoe vaak waarden van twee variabelen in combinatie met elkaar voorkomen
H2: De univariate statistiek
Absolute frequentie = het totaal aantal elementen van de steekproef voorgesteld door de letter ‘n’ = steekproefgrote
Relatieve frequentie = berekenen door percentages te presenteren proporties: absolute frequentie delen door
het aantal waarnemingen percentages: proporties vermenigvuldigen met 100 MAAR ! als de steekproef minder
dan 30 eenheden bevat werkt men beter met absolute aantallen i.p.v. percentages
Cumulatieve percentages = de percentages van elke volgende waarde bij de voorgaande opgeteld
Grafische voorstellingen van gegevens: taartdiagram/cirkeldiagram, staafdiagram, histogram, lijndiagram,
frequentiepolygoon
Parameters van centraliteit
De modus = een centrummaat en betreft de categorie van de variabele met de frequentie die het vaakst voorkomt
De mediaan = het middelpunt van de verdeling de mediaan is de middelste van de (oneven) aantal waarden in de
rangschikking naar grootte in frequentietabel: (n+1)/2
De kwantielen/kwartielen = mediaan is een speciaal geval van de maten die we kwantielen noemen drie gelijke
groepen indelen Q1 = 25%, Q2 = 50% (mediaan) en Q3 = 75% (Q0 = minimum en Q4 = maximum)
Het rekenkundig gemiddelde = een centrummaat dat gebruikt wordt bij variabelen gemeten op het metrische
X 1+ X 2+…+ Xn
niveau, dus bij interval en ratio-variabelen x=
n
kenmerken: enkel voor metrische variabelen + is het evenwichtspunt van de verdeling + gevoelig voor uitschieters
+ de som van alle afwijkingen tov het gemiddelde is nul = deviatiescores (X- X ¿
, Parameters van spreiding
De variatieratio (VR) = de proportie waarnemingen die niet tot de modale categorie behoren in percentage of in
proportie uitgedrukt
De index van diversiteit (ID) = gebaseerd op de relatieve frequenties van de categorieën, maar het enige verschil is
nu dat rekening wordt gehouden met de proportie van waarnemingen binnen iedere categorie of equivalentieklasse
ID = 1 – de som van de gekwadrateerde proporties in elke categorie
ID = de kans dat twee willekeurig gekozen eenheden van de steekproef van een verschillende categorie zijn
nominaal meetniveau
De variatiebreedte = het verschil tussen de grootste en kleinste waargenomen waarde ordinaal meetniveau
De interkwartiel-afstand = het verschil tussen het derde en eerste kwartiel ordinaal meetniveau
De gemiddelde absolute afwijking = de som van de absolute waarden van de afwijkingen van elke waarde ten
aanzien van het rekenkundig gemiddelde, gedeeld door het aantal waarneming
De variatie / Sum of Squares = de som van de gekwadrateerde afwijking van elke waarde t.o.v. het gemiddelde
∑ (X −X )² metrisch meetniveau
De (steekproef)variantie = de variatie gedeeld door het aantal steekproefeenheden – 1
∑ ( X−X )² metrisch
n−1
meetniveau
De (steekproef)standaardafwijking = de vierkantswortel van de variantie
√ ∑ ( X −X )² metrisch niveau
n−1
De variatiecoëfficiënt = standaardafwijking / gemiddelde metrisch niveau
Nominaal Ordinaal Metrisch
Maten van Modus Modus Modus
centraliteit Mediaan Mediaan
Kwartielen Kwartielen
Rekenkundig gemiddeld
Maten van Variatieratio Variatiebreedte Gemiddelde absolute afwijking
spreiding Index van diversiteit Interkwartielafstand Variatie
Variantie
Standaardafwijking
Variatiecoëfficiënt
Parameters van vorm
Symmetrisch = het rekenkundig gemiddeld en de mediaan zijn aan elkaar gelijk
Positief asymmetrisch = de verdeling heeft een langere staart rechts gemiddelde groter dan mediaan
Negatief asymmetrisch = de verdeling heeft een langere staart links gemiddelde kleiner dan mediaan
De empirische coëfficiënt van Pearson = bereken het verschil tussen het gemiddelde en de mediaan en deel deze
waarde door de standaardafwijking een verdeling is positief asymmetrisch als de coëfficiënt een positieve waarde
heeft en negatief asymmetrisch als de coëfficiënt een negatieve waarde heeft
Afplatting / kurtosis = de mate van afplatting van de gegevens rondom het rekenkundig gemiddelde
Mesokurtische verdelingen = gemiddelde afplatting
Leptokurtische verdelingen = scherper
Les avantages d'acheter des résumés chez Stuvia:
Qualité garantie par les avis des clients
Les clients de Stuvia ont évalués plus de 700 000 résumés. C'est comme ça que vous savez que vous achetez les meilleurs documents.
L’achat facile et rapide
Vous pouvez payer rapidement avec iDeal, carte de crédit ou Stuvia-crédit pour les résumés. Il n'y a pas d'adhésion nécessaire.
Focus sur l’essentiel
Vos camarades écrivent eux-mêmes les notes d’étude, c’est pourquoi les documents sont toujours fiables et à jour. Cela garantit que vous arrivez rapidement au coeur du matériel.
Foire aux questions
Qu'est-ce que j'obtiens en achetant ce document ?
Vous obtenez un PDF, disponible immédiatement après votre achat. Le document acheté est accessible à tout moment, n'importe où et indéfiniment via votre profil.
Garantie de remboursement : comment ça marche ?
Notre garantie de satisfaction garantit que vous trouverez toujours un document d'étude qui vous convient. Vous remplissez un formulaire et notre équipe du service client s'occupe du reste.
Auprès de qui est-ce que j'achète ce résumé ?
Stuvia est une place de marché. Alors, vous n'achetez donc pas ce document chez nous, mais auprès du vendeur ilonamasselis. Stuvia facilite les paiements au vendeur.
Est-ce que j'aurai un abonnement?
Non, vous n'achetez ce résumé que pour €5,49. Vous n'êtes lié à rien après votre achat.