Een volledige samenvatting voor het vak multivariate analyse, voor de studie criminologie aan de VU. Naast alle voorgeschreven hoofdstukken (H1 - H10) zijn de hoorcolleges er ook in verwerkt. Ook bevat deze relevante SPSS output met een toelichting daarbij, en zijn belangrijke grafieken uit het boe...
Samenvatting – Multivariate analyse voor criminologen en ander sociale wetenschappers – P5 + P6
Hoofdstuk 1, 2 en 3 worden als bekend veronderstelt bij de student. Desondanks worden ze hier wel
behandeld, ze worden gezien als basiskennis.
Hoofdstuk 1: Inleiding
Multivariate betekent letterlijk dat je naar meerdere (multi) variabelen (variaat) tegelijk wilt kijken.
Een theorie postuleert vaak verbanden tussen meerdere, en diverse, kenmerken. Met multivariate
technieken kunnen hele theorieën in één keer getoetst worden.
1.1 Methoden en technieken, statistiek
Multivariate methoden behoren tot het domein van de methoden en technieken. Methoden en
technieken is een verzamelnaam voor alle ‘kennis-gereedschap’ dat nodig is voor het ontwerpen, op
zetten, uitvoeren en analyseren van sociaalwetenschappelijk onderzoek (waaronder criminologisch
onderzoek). Het heeft dus betrekking op design-kwesties. Verder heeft het ook betrekking op
bijvoorbeeld de steekproefkeuze. Daarnaast gebruiken we dus statistiek, wat er bijv. over gaat hoe
we toetsen kunnen gebruiken om over de hele populatie iets te kunnen zeggen.
1.2 Criminaliteit en criminologie
Het boek behandelt veel criminologische voorbeelden, maar dat betekent niet dat alle technieken
daar speciaal voor zijn ontwikkelt.
1.2.1 Specifieke statistische problemen, speciale methoden en technieken voor de criminologie
Het meest aanwezige en bekendste systeem is het gegeven dat we van doen hebben met een
populatie die niet bekend is, en niet gekend en onderzocht wenst te worden. Er is geen lijst van alle
criminelen in Nederland. De leden van de populatie hebben geen belang bij het onderzoek, zij
hebben zich gedragen op een manier die strafbaar is. In de medische wereld bijv., hebben patiënten
belang bij het onderzoek. Wel hebben we relatief makkelijk toegang tot officiële gegevens. Het
probleem is dat het deel van de criminaliteit dat we zien, vaak niet representatief is voor de hele
populatie. Een derde kenmerk is dat veel gegevens over criminaliteit scheef tot zeer scheef verdeeld
zijn, en niet normaal verdeeld. Een deel van de mensen pleegt nooit een delict, een waarschijnlijk
aanzienlijker aantal doet het 1 keer, en een heel klein deel is hoogactief. Ook binnen de levensloop
van criminelen is het scheef verdeeld. Verder is de geografische verdeling óók scheef, in de steden
vinden we veel meer criminaliteit. Bovendien is kwalitatief criminaliteit ook scheef, want het grootste
deel is vermogenscriminaliteit. Hierdoor lopen veel traditionele statistische methoden stuk.
1.3 Univariate, bivariate en multivariate technieken
Multivariate technieken zijn complexer dan bivariate en univariate technieken. Univariate technieken
kijk namelijk slechts naar één variabele, en bivariate technieken onderzoeken het verband tussen
twee variabelen. Hierbij kijken we vaak naar correlatie. Multivariate technieken zijn dan strikt
genomen drie of meer variabelen die we in samenhang willen bekijken. In de praktijk zijn tien a
vijftien variabelen geen uitzondering. Ze worden dan altijd in hun onderlinge samenhang
geanalyseerd.
1.4 Kenmerken van multivariate technieken
De kenmerken die hieronder genoemd worden kunnen eigenschappen van de gegevens zelf zijn (bijv.
het meetniveau of de verdeling), of van de vraagstelling.
1. Kwantitatief
In dit boek worden alleen technieken voor kwantitatieve analyses behandelt. We kunnen wel
kwaliteit meten, bijv. de aard van het delict, maar er wordt met de gegevens gerekend.
, 2. Toetsend of explorerend
Dit levert een keuzemoment op. Als er hypotheses getoetst worden, heb je een toetsende
analyse nodig. Is het verkennen van data voldoende, dan gebruik je een exploratieve analyse.
Gebruik je toetsende analyses, dan is er dus vaak een veronderstelling (bijv. er is geen
verschil in maatschappelijke aanpassing na behandeling X of Y). Explorerende analyses zijn
gemakkelijker, er kunnen geen verdelingseisen worden gesteld. Maar ze leveren ook minder
krachtige uitspraken op. In de praktijk geven onderzoekers dus, indien mogelijk, de voorkeur
aan toetsende analyses.
3. Datareductie vs. modeltoetsing
We verrichten multivariate analyses, niet omdat we geïnteresseerd zijn in de relaties tussen
allerlei variabelen, maar omdat we een groot aantal variabelen willen terugbrengen tot een
kleiner, beter behapbaar, aantal variabelen. Uit 100 variabelen (door 100 vragen aan
respondenten bijv.) willen we een aantal kleinere ‘combi’ variabelen maken. We zijn dus wel
geïnteresseerd in relaties tussen die 100 variabelen, maar we willen vooral het grote aantal
gegevens naar een kleiner aantal terugbrengen. Dat is de datareductie.
Als we wel expliciet in relaties tussen diverse variabelen zijn geïnteresseerd, bijv. of een
delinquente grootouder het risico vergroot dat kleinkinderen delinquent zijn (en we rekening
houden met delinquentie van ouders), stellen we een model op waarbij e naar bepaalde
uitkomstmaten kijken. We onderzoek hoe de relaties liggen en of er verbanden zijn, en of zij
dezelfde richting hebben die we theoretisch veronderstellen. Dat is een modeltoetsing.
4. Hoog vs. laag meetniveau data
Meetniveaus zijn eerder behandelt, en komen later in dit boek ook nog terug. Een ordinaal
meetniveau is een lager meetniveau dan een interval niveau. Afhankelijk van het meetniveau
kies je de techniek.
5. Voorspelling vs. samenhang, asymmetrisch vs. symmetrisch
Soms is er duidelijk een onderscheid in de uitkomstmaat en anderzijds de voorspellende
factoren. Als ze variabelen duidelijk een andere rol spelen (guilty plea en de strafmaat), dan
heb je asymmetrische technieken nodig. Een symmetrische vraag is dan de vraag naar
samenhang tussen kenmerken A en B, en het is dan symmetrisch, omdat zij beiden dezelfde
rol hebben. We kunnen ze van plaats wisselen en de vraag verandert dan niet.
1.5 Wat gaan we doen in dit boek?
In dit boek worden diverse technieken uitgelegd met een SPSS voorbeeld. Op multivariateanalyse.nl
is meer informatie te vinden incl. datasets. Zoals al eerder benoemd, is H2 en 3 een herhaling van
eerder behandeld stof.
Hoofdstuk 2: Methodologie in vogelvlucht
2.1 Inleiding
Dit hoofdstuk omvat algemene begrippen die van belang zijn voor de multivariate technieken die
later worden besproken.
2.1.1. Meetniveaus
Meten is het toekennen van getallen aan waarnemingen. Je kan categorieën een naam geven, maar
ook een getal. Je kan veroordelingen bijv. ook tellen. Dat zijn de meetniveaus. Als je soorten delict
een getal geeft, dan zijn dat geen getallen waar je mee kan rekenen. Maar getallen voor het aantal
delicten die iemand gepleegd heeft, kan je wel mee rekenen. Het meetniveau moet je vaststellen,
zodat je kan bepalen welke soort berekeningen en analyses je nodig hebt.
, - Nominaal meetniveau: Op dit niveau worden getallen toegekend aan waarnemingen, maar
die hebben geen andere functie dan een label geven, een classificatie. Bijv. als we de delicten
geweld, vermogen gaan classificeren. Delicten zou je dus i.p.v. 1, 2 en 3 ook 1266, -83 en
88899 kunnen geven, dan zou het dezelfde betekenis hebben. Dat is nominaal.
- Ordinaal meetniveau: Hierbij is er een rangorde in de getallen die je aan metingen hebt
toegekend. De ene heeft dan een grotere waarde dan de ander. Bijv. als je respondenten
vraagt welk type delict zij ernstiger vinden. Je mag de getallen ook transformeren, zolang de
ordening maar hetzelfde blijft (delict 1 wordt i.p.v. nummer 1 nummer 2, en delict 2 wordt
nummer 4, enz.) Dat noem je een monotone transformatie.
- Interval meetniveau: In dit geval hebben de verschillen tussen metingen wel een vaste
betekenis. Het klassieke voorbeeld is de tempratuur; of je in Celsius of Fahrenheit hebt
gemeten, het verschil blijft hetzelfde. Veel schalen zijn op intervalniveau. Deze hebben geen
vast nulpunt. De mogelijke transformatie is hier de lineaire transformatie, f(x) = a + bx.
- Ratio meetniveau: Hierbij ligt er nog meer informatie in de metingen besloten. Niet alleen de
verhouding van verschillen ligt vast, maar de verhouding zelf van de metingen ook. het
klassieke voorbeeld is de prijs van een product; als een bepaald boek twee keer zo duur is als
een tijdschrift, dan is dat zo ongeacht of je de prijs uitdrukt in euro’s of dollars. Ratio kent
wel een vast nulpunt; gratis is gratis.
- Absoluut meetniveau: Hierbij ligt alle informatie vast, bijv. bij frequentietellingen. Als je 7
delicten hebt gepleegd, is het niet zinnig om dit in een andere eenheid uit te drukken.
Hoe lager het meetniveau is (bijv. nominaal is heel laag), des te meer vrijheid de onderzoeker heeft
om de metingen te transformeren. De keerzijde is dat er dan ook minder informatie ligt besloten.
Absoluut is het hoogste meetniveau, en hoe hoger, des te minder mogelijkheden er zijn om de
metingen in andere getallen uit te drukken. Bij dichotome variabelen, met slechte twee categorieën,
is alleen bijv. ‘ja’ of ‘nee’ mogelijk. Omdat je hierbij altijd een rechte lijn kan trekken, kan je ze toch
meenemen als interval variabelen. In de praktijk worden voor interval, ratio en absolute metingen
dezelfde standaard kwantitatieve technieken gebruikt, en voor ordinale en nominale metingen
gebruik je andere statistische technieken.
2.2 Afhankelijke en onafhankelijke variabelen
We proberen vaak te beschrijven waarmee een verschijnsel verband heeft, en we waarmee het niet
samenhangt. We proberen spurieuze verbanden te laten vertroebelen. De centrale maat waarin we
geïnteresseerd zijn, bijv. recidive, welbevinden, celcapaciteit, is de afhankelijke variabele. De
oorzaken zijn dan de onafhankelijke variabelen. Onafhankelijke variabelen kunnen ook weer uit
andere onafhankelijke variabelen voorspelt worden. Onafhankelijke variabelen worden ook
predictoren of covariaten genoemd.
2.3 Modellen
Modellen hebben structuurovereenkomst met de werkelijkheid die zij beschrijven, maar ze staan wel
los van de werkelijkheid, je kan ermee experimenteren. Een constellatie is een model als: het model
onafhankelijk is van de werkelijkheid, bekender is dan de werkelijkheid, en in structuur overeenkomt
met de werkelijkheid. Haal je een factor weg, dan wordt een model simpeler, en voeg je er een toe,
dan wordt het model gecompliceerder. Als er extra coëfficiënten aan een model worden toegevoegd
noemt men dit ook wel een extra parameter.
, In het algemeen geldt dat simpele modellen makkelijker werken, eenvoudiger te toetsen zijn, maar
ook minder verklaringskracht hebben. Als de afhankelijke variabelen volgens de voorspelling sterk
lijkt op de waargenomen afhankelijke variabele, dan hebben de een model fit, of goodness of fit. Een
voorbeeld voor een fitmaat is de R^2 (%verklaarde variantie). Het model past dan goed bij gegevens
uit de werkelijkheid. Modellen kunnen ook té complex worden, dus simpelheid (parsimonie) heeft
wel de voorkeur. Het is niet moeilijk om een model fit te krijgen als je veel variabelen toevoegt, de
kunst is om dat met een zo eenvoudig mogelijk model te hebben.
2.4 Operationaliseren en meten
Theorieën bevatten allerlei begrippen, bijv. zelfcontrole van Hirshi. Als we in de praktijk onderzoek
willen gaan doen, moeten we veel preciezer aangeven wat we daarmee bedoelen. Het is namelijk
niet direct afmeetbaar, zoals een schoenmaat wel is. Niet direct afleesbare begrippen noemen we
ook wel constructen. De term hypothetische construct is dan een abstracte term die een niet-
uitwindig waarneembaar van een persoon bedoelt, die veronderstelt wordt aanwezig te zijn. Dit
moet dan afgeleid kunnen worden uit wél waarneembare kenmerken.
Om aan te geven wat we onder de constructen verstaan, moeten we een conceptuele definitie
geven. Een lage zelfcontrole is bijv. de neiging van een individu om delicten te plegen door een
gebrek aan remmen. Het is van belang om in een theorie te onderzoeken wat er precies onder en
construct wordt verstaan. Hierna moeten wij vaststellen óf en hoe veel een construct in de
werkelijkheid voorkomt, we moeten het gaan meten. Daarvoor is er een operationele definitie
nodig. Dan weet je wat je moet doen om een construct vast te stellen.
Hoofdstuk 3: Statistiek, univariate en bivariate technieken in vogelvlucht
Statistiek wordt hier behandeld in de zin van ‘een verzameling van methoden om berekeningen uit te
voeren op gegevens die doorgaans uit en steekproef afkomstig zijn’.
3.1 Beschrijvende statistiek
Als we gegevens over 100 scholieren m.b.t. door hun gepleegde criminaliteit verzameld hebben,
moeten we die bevindingen samenvatten; anders wordt het heel onoverzichtelijk. Je wilt in zijn
algemeenheid iets over de resultaten weten. Daarom moeten we de bevindingen op een
informatieve manier samenvatten. Bij de beschrijving heb je twee maten: maten van centrale
tendentie van maten van spreiding.
3.1.1 Maten voor centrale tendentie: gemiddelde, mediaan en modus
Het gemiddelde is bekend; de som van de waarnemingen gedeeld door het aantal waarnemingen.
Deze wordt ook het allermeest gebruikt. Het nadeel is dat het gevoelig is voor extreme scores,
waardoor het soms geen goede samenvatting is. In dat geval kan je beter de mediaan gebruiken, die
blijft gelijk, en is dus niet gevoelig voor uitbijters. De mediaan is de waarde waar 50% van de
waarnemingen boven (en dus ook onder) ligt. Dit is belangrijk in criminologisch onderzoek, omdat
het vaak scheef verdeeld is. De modus is dan nog de waarneming die het vaakst voorkomt in de data,
bijv. het modale inkomen. Als er twee categorieën even vaak voorkomen, noem je dit bimodaal.
3.1.2 Maten voor spreiding: variantie en standaarddeviatie
Er worden drie maten gebruikt om aan te geven hoeveel variantie er om
de maat van centrale tendentie is, en de makkelijkste is de range, het
spectrum waarop de getallen zich bevinden (bijv. ergens tussen 1 en 7).
Soms, als er uitbijters zijn, rapporteert men de range waar het hoogste en laagste getal
verwijderd zijn.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller hannahvu. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.50. You're not tied to anything after your purchase.