100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home
Samenvatting Metho 3 Kwantitatief Luik - academiejaar 2022//20! $5.86   Add to cart

Summary

Samenvatting Metho 3 Kwantitatief Luik - academiejaar 2022//20!

 15 views  0 purchase
  • Course
  • Institution

Samenvatting van het kwantitatieve luik van het vak 'Methodologie deel 3' behorend tot de bachelor Criminologische Wetenschappen aan de KUL Leuven.

Preview 2 out of 13  pages

  • June 7, 2023
  • 13
  • 2022/2023
  • Summary
avatar-seller
Samenvatting Methodologie deel 3 – Kwantitatief luik
Academiejaar 2022/2023 – Prof. Pleysier
Een codeboek: legt de link tussen enerzijds het antwoord v.d. respondent en anderzijds de code of het
cijfer zoals weergeven in het databestand.

SPSS = software pakket voor het uitvoeren van statistische analyses op kwantitatieve data.
2 tabbladen in SPSS:
 Dataview: hierin worden de data (antwoorden v.d. respondent) in een gecodeerde vorm
ingegeven met behulp v.h. codeboek. Elke rij geeft één casus weer (de antwoorden van één
respondent op de verschillende vragen). Elke kolom geeft één variabele (de antwoord v.d.
verschillende respondenten op één vraag) weer.
 Variabele view = de weergave van het codeboek. In de rijen de variabelen daaraan wordt het
type variabele toegekend (nominaal/metrisch/ordinaal) en de breedte v.d. variabele.
o Een label = een iets uitgebreidere beschrijving van de variabele zodat je in het
databestand zelf kan zien waarover het gaat en niet telkens naar het codeboek hoeft
terug te grijpen. Zorgt ervoor dat de output leesbaar wordt.
o Values = per variabele de waarden v.d. labels opgeven. Belangrijk om de output
leesbaar en interpreteerbaar te maken. De waarden geven weer wat de verschillende
antwoordcodes betekenen.

Item non-respons = respondenten hebben op bepaalde vragen niet geantwoord. Dit verkleint de
steekproef waardoor de statische power daalt: het vinden van statistische verbanden wordt moeilijker.
Een antwoordoptie als ‘weet niet’ verstoort de ordinale antwoordschaal en mag als missing beschouwd
worden in de analyse. Een tussenoptie, vluchtweg zoals ‘noch eens, noch oneens’ is meer te verkiezen
om op te nemen in je vragenlijst omdat dit het ordinale karakter niet verstoort.
 Missing values = ontbrekende waarden die voorkomen doordat een respondent “vergeet” een
vraag in te vullen waardoor de cellen in de datamatrix leeg blijven → speciale code in SPSS:
9, 99 of 999.
o Using misser values = gegevens waarbij de onderzoeker aangeeft dat ze ontbreken en
waaraan de onderzoeker zelf een speciale code zal toekennen en deze later op missing
zal plaatsen.
o System missing values = worden door technische redenen door SPSS zelf
aangegeven.
 Statistische power = wanneer er een correlatie is en je die ook effectief aantreft.
o Bij grote steekproeven vind je snel significante verbanden, maar moet je altijd kijken
of die ook relevant zijn. En omgekeerd bij kleine steekproeven vind je niet snel
significante verbanden terug, maar dat wil niet zeggen dat in je steekproef zelf geen
relevante resultaten terug te vinden zijn (die bij een grotere steekproef wel significant
zouden zijn).

Er zijn 2 strategieën bij ontbrekende waarden:
1. Listwise deletion = niets doen. De respondenten die niet hebben geantwoord op die vraag
worden ook uit de analyse verwijderd. Op zich is dit niet noodzakelijk een groot probleem.
Dat kan een groter probleem worden wanneer je met multivariate analyses werkt. Omwille
van de eenvoudige reden dat multivariaat wil zeggen dat je meerdere variabelen in één analyse
betrekt: meerdere variabelen dat wil dus zeggen ook meerdere respondenten die op bepaalde
vragen niet kunnen hebben geantwoord en dat zijn niet altijd dezelfde respondenten.
2. Imputatie = het invullen van de ontbrekende waarden door die missing values een waarde toe
te kennen. Hiervoor bestaan complexe en eenvoudige technieken:
a. Relatief eenvoudige imputatie = een schaal waarbij je op gelijkwaardige stellingen
moet antwoorden van helemaal eens tot helemaal oneens en één respondent heeft
negen van dat soort vragen ingevuld, dan zou je kunnen berekenen wat de meest


1

, voorkomende score was van die respondent op die negen andere vragen en die waarde
imputeren op de plaats waar het antwoord ontbreekt.
b. Complexe imputatie = op zoek gaan naar een dubbelganger: een respondent die bijna
op alle dezelfde antwoorden heeft gegeven. Dan gebruik je de vraag van die
dubbelganger om de missing value van die andere respondent aan te vullen.
Er zijn potentieel ook wel een aantal problemen mee verbonden:
o Aard v.d. missings:
 MCAR = Missing Completely at Random → het niet geven van een antwoord
is blijkbaar toevallig. Het aanvullen van die waarden via imputatie is
misschien wel gerechtvaardigd.
 MAR = Missing at Random → het niet geven van een antwoord is blijkbaar
toevallig. Het aanvullen van die waarden via imputatie is misschien wel
gerechtvaardigd.
 MNAR = Missing Not at Random → die uitval is er niet toevallig gekomen,
de respondent had een bepaalde reden om niet te antwoorden op die vraag.
Als je dan dat antwoord invult, maak je de fout misschien nog groter.
 Geen antwoord want vraag was niet van toepassing op de respondent
→ code 8,88 of 888 toekennen.
o Wat te doen met missing values is eigenlijk een ongoing debate onder methodologen:
we proberen maximaal in te zetten op het vermijden van missing values door
respondenten te stimuleren om op alle vragen te beantwoorden door het bedreigend
karakter van bepaalde vragen eventueel wat aan te pakken. Indien dit nog niet lukt
worden de complexe imputatietechnieken boven de eenvoudige imputatietechnieken
verkozen, maar het blijft ‘lapwerk’ en ‘kiezen uit twee kwaden’.

Op het moment dat die data is ingegeven rest er nog een belangrijke laatste stap en dat is het proces
van datacleaning: het opkuisten van onze data. Het is mogelijk dat op het moment dat onze data is
ingegeven er fouten zijn ingeslopen.
 Data-entry = benoemen van variabelen door het invoeren van data.
 Datacleaning = het opvragen van een frequentietabel en screenen van de data op fouten.
We gaan voor elk die variabelen frequentietabellen opvragen om na te gaan of wat we hebben
ingegeven ook klopt, maar via frequentietabellen kun je niet alle fouten op het spoor komen. We gaan
controleren op onmogelijke antwoorden en op onmogelijke combinaties van antwoorden: de detectie
van outliers:
 Outliers = zijn waarden die op zich wel mogelijk zijn, maar zeer extreem zijn.
 Univariate outliers = extreme waarden op één variabele → zou je op het spoor kunnen
komen door frequentietabellen of grafieken per variabele op te vragen (voor nominale of
ordinale variabelen).
 Bivariate outliers = je bekijkt de combinatie van twee waarden, elk van die waarden klopt op
zich wel wanneer je deze univariaat bekijkt, maar de bivariate combinatie maakt dat het een
outlier is → zou je op het spoor kunnen komen door te kijken naar een kruistabel of indien het
om metrische variabelen gaat een scatterplot/puntenwolk op te vragen.
o Bivariate outliers kunnen een hefboomeffect (=leverage) teweeg brengen: de
bivariate outlier heeft effect wanneer de samenhang (correlatie) tussen X en Y zouden
worden berekend → die ene respondent zorgt ervoor dat mijn inschatting van de
samenhang tussen X en Y wordt scheefgetrokken.
Indien het echt onmogelijke waarden zijn, kun je die corrigeren in het beste geval op basis van de
oorspronkelijke vragenlijst. Bij kwantitatief onderzoek gaan we in principe op zoek naar patronen die
overeenkomen met onze steekproef. Wanneer één enkele respondent dat patroon verstoort (een
outlier), zou het in de geest v.h. kwantitatief onderzoek beter zijn om die uit onze analyse te
verwijderen en verder te gaan met de rest v.d. steekproef waar wel dat patroon aanwezig is. Maar er is
altijd voorzichtigheid geboden bij het verwijderen van een outlier.

Veldcoderen = het zoeken van een oplossing op het moment dat het probleem zich aandoet. Daarmee
verlies je een stuk van je standaardisatie.

2

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller 5amengevat. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $5.86. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

73314 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
$5.86
  • (0)
  Add to cart