Samenvatting Methodologie deel 3 – Kwantitatief luik
Academiejaar 2022/2023 – Prof. Pleysier
Een codeboek: legt de link tussen enerzijds het antwoord v.d. respondent en anderzijds de code of het
cijfer zoals weergeven in het databestand.
SPSS = software pakket voor het uitvoeren van statistische analyses op kwantitatieve data.
2 tabbladen in SPSS:
Dataview: hierin worden de data (antwoorden v.d. respondent) in een gecodeerde vorm
ingegeven met behulp v.h. codeboek. Elke rij geeft één casus weer (de antwoorden van één
respondent op de verschillende vragen). Elke kolom geeft één variabele (de antwoord v.d.
verschillende respondenten op één vraag) weer.
Variabele view = de weergave van het codeboek. In de rijen de variabelen daaraan wordt het
type variabele toegekend (nominaal/metrisch/ordinaal) en de breedte v.d. variabele.
o Een label = een iets uitgebreidere beschrijving van de variabele zodat je in het
databestand zelf kan zien waarover het gaat en niet telkens naar het codeboek hoeft
terug te grijpen. Zorgt ervoor dat de output leesbaar wordt.
o Values = per variabele de waarden v.d. labels opgeven. Belangrijk om de output
leesbaar en interpreteerbaar te maken. De waarden geven weer wat de verschillende
antwoordcodes betekenen.
Item non-respons = respondenten hebben op bepaalde vragen niet geantwoord. Dit verkleint de
steekproef waardoor de statische power daalt: het vinden van statistische verbanden wordt moeilijker.
Een antwoordoptie als ‘weet niet’ verstoort de ordinale antwoordschaal en mag als missing beschouwd
worden in de analyse. Een tussenoptie, vluchtweg zoals ‘noch eens, noch oneens’ is meer te verkiezen
om op te nemen in je vragenlijst omdat dit het ordinale karakter niet verstoort.
Missing values = ontbrekende waarden die voorkomen doordat een respondent “vergeet” een
vraag in te vullen waardoor de cellen in de datamatrix leeg blijven → speciale code in SPSS:
9, 99 of 999.
o Using misser values = gegevens waarbij de onderzoeker aangeeft dat ze ontbreken en
waaraan de onderzoeker zelf een speciale code zal toekennen en deze later op missing
zal plaatsen.
o System missing values = worden door technische redenen door SPSS zelf
aangegeven.
Statistische power = wanneer er een correlatie is en je die ook effectief aantreft.
o Bij grote steekproeven vind je snel significante verbanden, maar moet je altijd kijken
of die ook relevant zijn. En omgekeerd bij kleine steekproeven vind je niet snel
significante verbanden terug, maar dat wil niet zeggen dat in je steekproef zelf geen
relevante resultaten terug te vinden zijn (die bij een grotere steekproef wel significant
zouden zijn).
Er zijn 2 strategieën bij ontbrekende waarden:
1. Listwise deletion = niets doen. De respondenten die niet hebben geantwoord op die vraag
worden ook uit de analyse verwijderd. Op zich is dit niet noodzakelijk een groot probleem.
Dat kan een groter probleem worden wanneer je met multivariate analyses werkt. Omwille
van de eenvoudige reden dat multivariaat wil zeggen dat je meerdere variabelen in één analyse
betrekt: meerdere variabelen dat wil dus zeggen ook meerdere respondenten die op bepaalde
vragen niet kunnen hebben geantwoord en dat zijn niet altijd dezelfde respondenten.
2. Imputatie = het invullen van de ontbrekende waarden door die missing values een waarde toe
te kennen. Hiervoor bestaan complexe en eenvoudige technieken:
a. Relatief eenvoudige imputatie = een schaal waarbij je op gelijkwaardige stellingen
moet antwoorden van helemaal eens tot helemaal oneens en één respondent heeft
negen van dat soort vragen ingevuld, dan zou je kunnen berekenen wat de meest
1
, voorkomende score was van die respondent op die negen andere vragen en die waarde
imputeren op de plaats waar het antwoord ontbreekt.
b. Complexe imputatie = op zoek gaan naar een dubbelganger: een respondent die bijna
op alle dezelfde antwoorden heeft gegeven. Dan gebruik je de vraag van die
dubbelganger om de missing value van die andere respondent aan te vullen.
Er zijn potentieel ook wel een aantal problemen mee verbonden:
o Aard v.d. missings:
MCAR = Missing Completely at Random → het niet geven van een antwoord
is blijkbaar toevallig. Het aanvullen van die waarden via imputatie is
misschien wel gerechtvaardigd.
MAR = Missing at Random → het niet geven van een antwoord is blijkbaar
toevallig. Het aanvullen van die waarden via imputatie is misschien wel
gerechtvaardigd.
MNAR = Missing Not at Random → die uitval is er niet toevallig gekomen,
de respondent had een bepaalde reden om niet te antwoorden op die vraag.
Als je dan dat antwoord invult, maak je de fout misschien nog groter.
Geen antwoord want vraag was niet van toepassing op de respondent
→ code 8,88 of 888 toekennen.
o Wat te doen met missing values is eigenlijk een ongoing debate onder methodologen:
we proberen maximaal in te zetten op het vermijden van missing values door
respondenten te stimuleren om op alle vragen te beantwoorden door het bedreigend
karakter van bepaalde vragen eventueel wat aan te pakken. Indien dit nog niet lukt
worden de complexe imputatietechnieken boven de eenvoudige imputatietechnieken
verkozen, maar het blijft ‘lapwerk’ en ‘kiezen uit twee kwaden’.
Op het moment dat die data is ingegeven rest er nog een belangrijke laatste stap en dat is het proces
van datacleaning: het opkuisten van onze data. Het is mogelijk dat op het moment dat onze data is
ingegeven er fouten zijn ingeslopen.
Data-entry = benoemen van variabelen door het invoeren van data.
Datacleaning = het opvragen van een frequentietabel en screenen van de data op fouten.
We gaan voor elk die variabelen frequentietabellen opvragen om na te gaan of wat we hebben
ingegeven ook klopt, maar via frequentietabellen kun je niet alle fouten op het spoor komen. We gaan
controleren op onmogelijke antwoorden en op onmogelijke combinaties van antwoorden: de detectie
van outliers:
Outliers = zijn waarden die op zich wel mogelijk zijn, maar zeer extreem zijn.
Univariate outliers = extreme waarden op één variabele → zou je op het spoor kunnen
komen door frequentietabellen of grafieken per variabele op te vragen (voor nominale of
ordinale variabelen).
Bivariate outliers = je bekijkt de combinatie van twee waarden, elk van die waarden klopt op
zich wel wanneer je deze univariaat bekijkt, maar de bivariate combinatie maakt dat het een
outlier is → zou je op het spoor kunnen komen door te kijken naar een kruistabel of indien het
om metrische variabelen gaat een scatterplot/puntenwolk op te vragen.
o Bivariate outliers kunnen een hefboomeffect (=leverage) teweeg brengen: de
bivariate outlier heeft effect wanneer de samenhang (correlatie) tussen X en Y zouden
worden berekend → die ene respondent zorgt ervoor dat mijn inschatting van de
samenhang tussen X en Y wordt scheefgetrokken.
Indien het echt onmogelijke waarden zijn, kun je die corrigeren in het beste geval op basis van de
oorspronkelijke vragenlijst. Bij kwantitatief onderzoek gaan we in principe op zoek naar patronen die
overeenkomen met onze steekproef. Wanneer één enkele respondent dat patroon verstoort (een
outlier), zou het in de geest v.h. kwantitatief onderzoek beter zijn om die uit onze analyse te
verwijderen en verder te gaan met de rest v.d. steekproef waar wel dat patroon aanwezig is. Maar er is
altijd voorzichtigheid geboden bij het verwijderen van een outlier.
Veldcoderen = het zoeken van een oplossing op het moment dat het probleem zich aandoet. Daarmee
verlies je een stuk van je standaardisatie.
2
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper 5amengevat. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €5,09. Je zit daarna nergens aan vast.