TOE Grasple
Kwalitatief
K0 (NVivo)
Het doel van kwalitatieve data analyse is het opdelen van gegevens in hanteerbare fragmenten. Deze
fragmenten sorteer en herschik je zodat specifieke processen of patronen kunnen worden
onderscheiden. De kwalitatieve data analyse bestaat uit vijf stappen:
1. Data management en voorbereiding
2. Doornemen en reduceren van de data
3. Coderen van de data
4. Memo’s schrijven
5. Construeren en toetsen van modellen
Via SolisWorkspace heb je toegang tot allerlei programma’s zoals NVIVO, SPSS & JASP.
NVivo is een softwarepakket om kwalitatieve data mee te analyseren. In NVivo kan verschillende
soorten data gebruikt worden zoals, teksten, beeld & audiofragmenten. NVivo is geschikt als er veel
data geanalyseerd moet worden. De data-analyse in NVivo bestaat uit drie stappen;
1. Data importeren
NVivo kan verschillende soorten data importeren, deze data is te vinden onder files.
2. Coderen van de data
Codes zijn labels die worden gegeven aan tekstdelen. Coding stripes worden gebruikt om
codes te organiseren.
3. Organiseren van codes
Dit kan op verschillende manieren;
a. Het maken van subcodes
b. Het samenvoegen van codes
c. Coding stripes gebruiken
Er is niet één juiste manier! Bij open coderen van identieke data kunnen verschillende
onderzoekers verschillende resultaten vinden
K1 (Data importeren in Nvivo, open, axial en selectief coderen)
Het belangrijkste doel van inductief coderen is theorievorming.
Inductief coderen start met open coderen. Bij open coderen hou je de volgende vragen in je
achterhoofd:
Welke fragmenten zitten er in de data
Waarom is dat fragment een betekenisvol geheel?
Is het fragment relevant voor het onderzoek/de onderzoeksvraag. Is dit niet het geval dan
hoeft het niet gecodeerd te worden
Welke code past er bij het fragment
Zijn er fragmenten in de data die bij vergelijking dezelfde code kunnen krijgen? Of moeten ze
juist verschillende codes krijgen?
Daarnaast zijn de volgende aandachtspunten belangrijk:
Alleen fragmenten die relevant zijn voor de onderzoeksvraag coderen
, Codes moeten inhoudelijk zijn, en niet functioneel. Codes mogen geen container begrippen
zijn. De gecodeerde data moet ook de context van de uitspraak bevatten.
Maak unieke codes, plaats niet teveel stukken tekst onder dezelfde code in de fase van open
coderen
Bij axiaal coderen is het de bedoeling dat de losse codes samengevoegd worden in een aantal
hoofdcodes die bepaalde thema’s weergeven. Je kijkt naar de relaties tussen verschillende codes.
Daarnaast is het belangrijk op de axiale codes te definiëren.
Het laatste onderdeel van inductief coderen is het selectief coderen. In deze fase wordt een
antwoord geformuleerd op de onderzoeksvraag. Hierbij beantwoord je de volgende vragen:
Wat is de belangrijkste boodschap van de respondenten met betrekking tot de
onderzoeksvraag?
Hoe zijn de axiale codes aan elkaar gerelateerd? Kun je deze samenvoegen tot één of twee
hoofdthema’s
Is het mogelijk om een conceptueel model te maken op basis van deze data?
Let bij het selectief coderen op:
Mogelijke causaliteit
Fenomenen
Strategieën
Omstandigheden die mogelijk de relatie tussen variabelen beïnvloeden
(Inter)actie
Consequenties
Het is gebruikelijk in kwalitatief onderzoek dat de fasen (open, axiaal en selectief coderen) niet in
vaste volgorde worden doorlopen.
K2 (Deductief coderen)
Deductief coderen richt zich op theorietoetsing. Het gaat om onderwerpen waarover al informatie
bekend is en waarvoor er van tevoren codes kunnen worden opgesteld. Tijdens het onderzoek wordt
er nagegaan in hoeverre de al bekende codes terug te vinden zijn in de nieuwe data. Er kunnen
nieuwe codes toegevoegd worden als blijkt dat niet alle data in de van tevoren opgestelde codes
past.
Voordat je deductief kunt coderen moet er een goede categorisatiematrix zijn waarmee gecodeerd
kan worden.
,Correlationeel
C0: SPSS in SolisWorkspace, inleiding tot SPSS
Installeer SolisWorkspace op je laptop. Of koop SPSS voor 9 euro en bespaar jezelf heel veel gezeik.
Statistical Package for the Social Sciences (SPSS) is een softwarepakket dat gebruikt wordt voor het
uitvoeren van berekeningen en het creëren van visualisaties op basis van data. Let op!! welk
decimaalteken wordt gebruikt, vaak is dit een punt (.) in plaats van een komma (,).
SPSS hanteert twee bestanden;
1. De data file
dit is waar SPSS de onbewerkte data bewaart
2. De output file
Dit is waar SPSS de opgevraagde bewerkingen en gemaakte visualisaties bewaart
Dit betekend dus dat wanneer er nieuwe data wordt ingevoerd of huidige data wordt veranderd in de
data file, deze veranderingen niet worden toegepast in de output file. Je zult dus je analyses en
visualisaties opnieuw moeten maken. Bovendien moeten beiden bestanden apart worden
opgeslagen.
In de data file van SPSS zijn er twee verschillende views;
1. Variable view
Variable view geeft gedetailleerde informatie over de betekenis van variabelen en de
waarden die bij deze variabelen horen. Er zijn verschillende kolommen die elk een andere
functie hebben.
a. Name
De naam van het variabel (spaties zijn niet toegestaan)
b. Type
i. String; de waardes zijn woorden of tekst
ii. Nummeric; de waardes zijn getallen
c. Width
d. Decimals
e. Label
Hier kan de langere omschrijving van de variabel, zoals de operationele definitie.
f. Values
g. Missing
h. Columns
i. Align
j. Measure
k. Role
2. Data view
Data view geeft gedetailleerde informatie over de scores van de respondenten
Output in SPSS
Grafieken en berekeningen worden onder elkaar op chronologisch volgorde weergegeven. Van elke
analyse komen de resultaten in de output file. SPSS kan ook codes geven voor de uitvoering van de
analyse, deze code kun je opslaan en later opnieuw gebruiken. Deze codes worden vrijgegeven door
de SPSS Syntax.
Je kan zelf gegevens invullen. Om nieuwe variabelen toe te voegen ga je naar variable view en voeg je
de naam van de variabelen in bij Name. Je kan de width aanpassen als jou gekozen naam te lang is.
,Daarnaast pas je aan of het variabel in nummers (nummeric) of letters (string) wordt uitgedrukt. Je
kan ook de parameter decimals aanpassen om aan te passen hoeveel decimalen achter de komma
SPSS nog weergeeft.
Als je vervolgens de observaties wilt invullen ga je naar dataview, hier kan je de verschillende
observaties invullen.
Coderen en het Codeboek
Het is handig/belangrijk om de data te coderen. Dit omdat als je alles handmatig invult je lang bezig
bent en veel fouten kunt maken. Coderen houdt in dat je elk antwoord vervangt door een getal en
vervolgens dit getal koppelt aan een label (een naam). Dit gebeurt vooral bij categorische data
(nominale/ordinale variabelen) omdat dit vaak woorden/zinnen zijn. Bij open vragen heeft coderen
geen nut.
Voorbeeld:
De bovenstaande tabel wordt opgenomen in het codeboek, hier verzamel je al je codes.
Data importeren in SPSS
Dit kan met Excel en CSV bestanden.
Excel: Ga nu in SPSS naar File > Open > Data en navigeer naar waar je het bestand hebt opgeslagen.
Selecteer 'Excel files' of 'All files' als het bestandstype en open het bestand.
Je kan maar 1 werkblad tegelijkertijd importeren.
C1a: Eerste visualisatie
In de bovenste balk vind je verschillende opties (net zoals in word, powerpoint, excel). Om een grafiek
te maken volg je de volgende stappen:
Graphs → chart builder → ok (je krijgt een meldingsscherm te zien)
Je komt nu in een scherm waarin je je grafiek kan maken, hiervoor heb je verschillende opties. Deze
staan links onder in. Je kiest welke soort grafiek je wilt. Deze sleep je vervolgens naar het lege vak
(rechts boven). Vervolgens sleep je de variabelen die je wilt gebruiken naar de goede plek
(bijvoorbeeld x-as of y-as).
,Verschillende soorten variabelen vragen om verschillende soorten grafieken.
Cirkeldiagram/staafdiagram bij nomiaal of ordinaal meetniveau. Dit is goed als er niet te veel groepen
zijn en alle groepen hebben voldoende hoge frequenties
Frequentietabellen
Een frequentietabel betekent hoe vaak een waarde voor komt. Frequentietabellen gebruik je vooral
bij categorische variabelen (ordinaal/nominaal).
Stappen voor het maken van een frequentietabel:
Analyze → descriptive statistics → frequencies → sleep de benodigde variabelen in het rechter
scherm
Na het uitvoeren van de stappen krijg je dit te zien in het output venster.
In de bovenste tabel ‘statistics’ staat weergegeven welke waardes er zijn meegenomen.
Valid zijn de waardes die zijn mee genomen bij de variabel ‘theme’
Missing zijn de waardes die niet zijn mee genomen bij de variabel ‘theme’.
C1c: Beschrijvende statistiek
Er zijn twee manieren om beschrijvende statistiek te bereken in SPSS;
1. Via descriptive statistics
2. Via Frequenties
Op de eerste manier volg je de volgende stappen:
Analyze → descriptive statistics → descriptives → sleep de gewenste variabelen naar het lege vak →
options → selecteer de gewenste statistieken (mean, std. Deviation, maxium) → continue → ok
Op de tweede manier volg je de volgende stappen:
Analyze → descriptive statistics → frequencies → sleep de gewenste variabelen naar het lege vak →
statistics → selecteer de gewenste statistieken → continue → ok
,C1d: Meer grafieken
Veel voorkomende grafieken:
1. Histogram
Bij niet kwantitatieve variabelen (interval/ratio) kan je een histogram gebruiken.
2. Geclusterde staafdiagram
Hierbij worden er categorische variabelen samen, je geeft aan op welke variabel je wilt
clusteren.
Deze vind je bij bar en dan de tweede optie. Dit gebruik je als je bijvoorbeeld de verhouding
van jongens en meisjes bij verschillende sporten wilt visualiseren.
3. Boxplot
Bij een boxplot kan je zowel de spreiding als het centrum zien.
Op de X-as zet je de categorische variabele (geeft groepen aan)
Op de Y-as zet je de variabele waarvan je het centrum en de variatie wilt laten zien
(interval/ratio variabele)
4. Spreidingsdiagram
Een variabel is een eenheid die bij verschillende omstandigheden verschillende waarden kan
aannemen.
Een observatie is de collectie data afkomstig van een object.
C1E: nieuwe variabelen
Transform → compute variable → nieuwe naam in target variable → berekening in ‘nummeric
expression’ → sleep benodigde variabelen naar nummeric experssion → ok
Het nieuwe variabel verschijnt helemaal rechts bij data view en helemaal onderaan bij variable view.
Het kan zijn dat variabelen positieve en negatieve waarden hebben. Je kunt deze variabelen in SPSS
veranderen naar een absolute variabel. Een absoluut variabel is een variabel waarbij de negatieve
waarden positief worden en de positieve waarden positief blijven. Er zijn twee manieren waarop je
dit kan doen, voor beide zijn de eerste stappen hetzelfde;
Transform → compute variable → passende naar bij target variable →
1. Als je weet welke functie je nodig hebt kun je deze selecteren in function groups (voor
absolute waarde doe je het volgende):
arithmetic → selecteer ‘abs’ in ‘functions and special variable’ vak → plaats ‘abs’ in nummeric
expression vak
2. Klik op de groep 'All'. In het kader 'Functions and Special Variables' verschijnt nu een lijst van
alle beschikbare functies → Wanneer je in de lijst op een willekeurige functie klikt, kun je
middels het toetsenbord een functie intikken. De lijst verspring naar de benodigde functie. →
Tik nu 'abs'. De lijst springt nu naar de absolute waarde functie. → Klik op de functie 'Abs' →
plaats deze via de pijl in het bovenste kader 'Numeric Expression'.
C1F: correlatie berekenen
Wanneer er een relatie gevonden is tussen twee variabelen, en de relatie is lineair, kunnen we voor
deze relatie bepalen hoe sterk de relatie is. Dit doen we m.b.v. de correlatiecoëfficiënt r.
Correlatie berekenen in SPSS:
,Analyze → correlate → bivariate → variabelen in het vak slepen → ok
In de tabel kunnen we ten eerste de correlatie tussen de twee variabelen terugvinden. SPSS maakt
een tabel met de correlaties tussen alle combinaties van variabelen; dit heet een correlatiematrix.
Hierdoor staat de correlatie er twee keer in: zowel de correlatie tussen 'CITO rekenvaardigheidscore'
en 'voormeting bewerkingen' als de correlatie tussen 'voormeting bewerkingen' en 'CITO
rekenvaardigheidscore'. Deze zijn precies gelijk. Dat is hier ,717** in de rij van Pearson Correlation.
SPSS toetst automatisch of de correlatie significant is. De default is een tweezijdige toets. In de
correlatiematrix is de p-waarde terug te vinden voor deze toets. De p-waarde staat in de rij van Sig.
Hier kan je ook zien of het een- of tweezijdig getoetst is, dit staat tussen de haakjes. Onder de tabel
staat welke waarde wordt aangenomen als significantieniveau.
De hypothese worden als volgt genoteerd:
H0 : p = 0
Ha: p ≠ 0
Wanneer een onderzoeker variabelen op ordinaal meetniveau heeft, kan de onderzoeker geen
gewone correlatie uitrekenen. Een van de voorwaarden voor deze correlatie, ook wel Pearson
correlatie genoemd, is dat de variabelen van interval of ratio meetniveau zijn. In dit geval kan de
onderzoeker er voor kiezen een andere correlatie te gebruiken: voor ordinale variabelen is dit de
Spearman correlatie. In SPSS kan dit ook.
C1G: Syntax
SPSS staat voor Statistical Package for the Social Sciences. Het is software die gebruikt kan worden
voor statistische analyses. Ook al gebruik jij de pull-down menu's, achter de schermen wordt er een
programmeertaal gebruikt. In het SYNTAX venster van SPSS kun je dit zichtbaar maken, bewerken en
uit laten voeren.
Als je veel berekeningen doet op een groot databestand, is het verstandig alle juiste SYNTAX op te
slaan. Op deze manier kun je heel eenvoudig zien welke berekeningen je hebt uitgevoerd en die
nogmaals uitvoeren als je bijvoorbeeld respondenten hebt toegevoegd.
SYNTAX code kun je ook zelf schrijven of aanpassen. Door te beginnen met kleine dingen aanpassen
leer je langzaam hoe de SYNTAX werkt. Zo kun je een variabele naam vervangen, een stukje code
weghalen of vervangen. Zo is de SYNTAX handig als je dezelfde handelingen uit moet voeren op veel
verschillende variabelen. Je kunt de code in het SYNTAX venster gewoon kopiëren en dan aanpassen
met andere variabele namen.
,Ook kun je opmerkingen toevoegen, zodat je later nog weet wat je precies gedaan hebt. Om een
opmerking toe te voegen, begin je op een lege regel in de SYNTAX. Begin de regel met een * en eindig
de regel met een punt (.); op deze manier leest SPSS deze regel niet als bewerking wanneer er
SYNTAX uitgevoerd wordt.
Om het SYNTAX venster te openen voer je een opdracht uit (zoals het maken van een frequentietabel)
in plaats van nu op ‘ok’ te klikken kies je voor ‘paste’
Als je de code wilt uit laten voeren, selecteer je het juiste stuk code. Nu kun je onder het menu RUN
de optie SELECTION kiezen, of gewoon op de groene pijl (►) drukken. Nu is de output te vinden in
het OUTPUT venster van SPSS.
C2a: oorzaken van bias survey
Operationaliseren.
Wanneer we fysieke kenmerken meten, is het voor iedereen meteen duidelijk wat er mee bedoeld
wordt, hoe het gemeten moet worden en welke waarden de variabele aan kan nemen. Bij
theoretische begrippen is dat vaak wat minder duidelijk. Daarom is het belangrijk dat onderzoekers
het hele proces van operationalisatie doorlopen en duidelijk beschrijven.
Bij het meten van theoretische begrippen (constructs), maken veel sociaal wetenschappelijke
onderzoekers gebruik van een vragenlijst (survey). Bij het gebruiken van een vragenlijst in onderzoek,
zijn er vier mogelijk bronnen van fouten:
1. Non-respons
2. Dekkingsfouten
Een dekkingsfout kan ontstaan wanneer het steekproefkader (de lijst) niet gelijk is aan de
doelpopulatie.
3. Steekproeffouten
4. Meetfouten
Meetfouten ontstaan wanneer de manier van meten invloed heeft op de response van de
participanten. Dit kan komen door:
a. het ontwerp van de vragenlijst (survey design)
i. telescoop effect
ii. volgorde effect
iii. leading question
iv. double barreled question
v. vakjargon en moeilijke woorden in vragenlijsten
vi. gevoelige onderwerpen
b. de interviewer
c. de omgeving
Meetfouten als gevolg van survey design
Om meetfouten zo veel mogelijk te beperken, is het belangrijk dat er simpele en duidelijke vragen
worden gesteld. Zo niet, kan dit tot vertekening van de resultaten leiden (question bias). Hiervoor is
,het belangrijk dat we naar het antwoordproces (response process) kijken. Wanneer een respondent
een vraag gaat beantwoorden, gaat het brein door deze 4 stappen:
Het telescoopeffect beschrijft vertekening die ontstaat door de onzekerheid over het terughalen van
informatie uit het verleden. Dit neemt toe hoe verder de herinneringen in het verleden vallen. Een
belangrijk resultaat van het telescoopeffect is het overschatten van het aantal keer dat je iets gedaan
hebt. Dat komt voornamelijk doordat mensen onbewust de neiging hebben de periode waarnaar
gevraagd wordt iets te verlengen, zowel naar achteren als naar voren. Dit soort vragen hebben
invloed op de fases retrieval & judgement.
De volgorde waarin vragen gesteld worden kan ook vertekening veroorzaken. De vraag vóór een vraag
kan een bepaalde context creëren, waardoor het antwoord op de vraag erna beïnvloed wordt.
Verschillen kunnen best groot zijn. Dit is het volgorde effect. Een mooie oplossing is om de helft van
de respondenten de ene volgorde te geven en de andere helft de andere volgorde. Op deze manier
kan de vertekening ontdekt worden.
Het volgende advies is om leidende vragen (leading questions) te vermijden. Een leidende vraag is
een vraag waarbij de woorden die in de vraag gebruikt worden de respondent naar een bepaald
(door de onderzoek blijkbaar gewenst) antwoord leiden.
Een double barreled question is een vraag waarin twee verschillende dingen gevraagd worden maar
waar maar één antwoord op gegeven kan worden. Het is belangrijk dit soort vragen te vermijden.
Ook het aanbieden van de antwoordcategorieën bij vragen/ stellingen in een vragenlijst vergt de
aandacht van de onderzoeker. Bij het gebruik van een Likert schaal (helemaal niet mee eens -
helemaal mee eens) moet de onderzoeker kiezen uit hoeveel opties de respondenten moeten kiezen.
Veel gebruikte aantallen zijn 5 en 7. Sommige onderzoekers geven de voorkeur aan een even aantal
(zoals 4 of 6) om te voorkomen dat respondenten in het midden van de schaal gaan antwoorden.
Er zijn twee kenmerken waar de antwoordcategorieën altijd aan moeten voldoen.
1. De antwoorden moeten uitputtend zijn:
Iedereen moet zich kunnen identificeren met één van de aangeboden
antwoordmogelijkheden. Het mag niet zo zijn dat het antwoord van een respondent niet
tussen de antwoordcategorieën staat. Een oplossing hiervoor is een antwoordcategorie
"Anders" of "Overig". Een andere mogelijkheid is een open vraag.
2. De antwoorden moeten uitsluitend zijn:
Respondenten moeten in de mogelijkheid gesteld worden een antwoord te kúnnen kiezen.
Het mag niet zo zijn dat het antwoord van een respondent in twee antwoordcategorieën valt.
In veel vragenlijsten kom je matrixvragen tegen. Een matrixvraag is een verzameling vragen die
allemaal dezelfde antwoordcategorieën hebben. Hier een voorbeeld:
, Response bias:
Bij het beantwoorden van vragenlijsten (en daarbij matrixvragen), gaan we er van uit dat
respondenten netjes de stappen van het antwoordproces volgen. Vaak is het zo, dat respondenten
stappen overslaan. Hierdoor kan response bias ontstaan. Er zijn verschillende bronnen van deze vorm
van vertekening, zoals:
Acquiescence Bias
de respondenten hebben de neiging om het maar eens te zijn met een stelling, vooral als de
respondent twijfelt of hij/zij de inhoud wel helemaal goed begrijpt. Doordat respondenten
het dan vaker eens zijn dan niet eens, wordt dit ook wel "yes-saying" genoemd.
Fence Sitting
het vermijden van extreme antwoordopties. Vooral als er veel opties zijn, zullen
respondenten de uitersten vermijden ook al is dat misschien wel het antwoord wat het best
bij hen past.
Straightlining
mensen na het beantwoorden van meerdere vragen de neiging krijgen om overal maar
hetzelfde antwoord te geven. Wanneer overal het rechter bolletje inkleurt (of juist het linker
bolletje), noemen we dat straightlining. Onderzoekers proberen dit op te vangen door
sommige vragen/stellingen negatief in plaats van positief te formuleren, hierdoor ontstaat
dus vertekening. Respondenten die de vragen goed lezen, zullen deze vraag gewoon op de
juiste manier beantwoorden.
Primacy/Recency effects
Vertekening die vooral voorkomen bij vragen waar de respondent uit een (lange) rij opties
moet kiezen.
o Primacy: respondenten hebben (vooral bij vragenlijsten die op papier of het internet
afgenomen worden) meer de neiging opties bovenaan de lijst te kiezen dan onderaan
de lijst (deze opties lezen ze het eerst en het best)
o Recency: respondenten hebben (vooral bij vragenlijsten die via de telefoon
afgenomen worden) meer de neiging opties onderaan de lijst te kiezen (deze hebben
ze als laatste gehoord, de eerste zijn ze dan al weer vergeten).
Social Desirability
Het schrijven van goede, heldere, eenduidige vragen voor een vragenlijst is heel belangrijk. In deze les
hebben we verschillende bronnen van
vertekening bekeken die het resultaat zijn
van niet zorgvuldig geformuleerde vragen
(question bias). Ook hebben we gekeken
naar verschillende bronnen van
vertekening die veroorzaakt worden door
het gedrag van de respondenten zelf
(response bias).
C2b: voorbereiding
Bij het analyseren van vragenlijsten,
worden de namen van de items vaak
vraag1, vraag2, enz. genoemd. Om te
weten met welke vragen deze overeenkomen, worden de labels van de items gebruikt om de vragen
in te voeren. Dit kun je allemaal bekijken in de Variable View.