Samenvatting van de stof van het vak "Kwantitatieve Onderzoeksmethodologie". In de hoorcolleges, de basis van deze samenvatting, wordt uitgebreid uitgelegd wat elk onderwerp inhoud en hoe deze toegepast moet worden. Uitleg door middel van een stappenplan en SPSS output .
De volgende onderwerpen ...
Hoorcollege 1
Validiteit
De mate waarin de gemeten kenmerken daadwerkelijk de kenmerken zijn van de onderzochte objecten
(systematische of random error).
Betrouwbaarheid
De mate waarin de metingen van de kenmerken dezelfde resultaten oplevert als het onderzoek onder
dezelfde omstandigheden zou worden herhaald.
Bruikbaarheid
De mate waarin de onderzoeksresultaten goed aansluiten bij het probleem van de opdrachtgever, ofwel
die daadwerkelijk kunnen bijdragen aan de oplossing van een praktijkprobleem
Formulering vragen
Gebruik gewone woorden
Gebruik eenduidige woorden
Vermijd impliciete veronderstellingen
Vermijd generalisaties en schattingen
Gebruik positieve en negatieve stellingen
Representativiteit
Een steekproef is representatief op het moment dat dezelfde kenmerken worden vertoond als de
populatie waar de steekproef uit getrokken is. Meer concreet houdt representativiteit in dat de
verdeling van de onderzochte variabelen in de steekproef hetzelfde is als in de populatie.
Representativiteit is van groot belang voor de generaliseerbaarheid van de onderzoeksresultaten. Als
bepaalde groepen in de steekproef onder- of oververtegenwoordigd zijn in de steekproef, dan mogen
de onderzoeksresultaten niet zonder meer van toepassing worden verklaard op de populatie. De
representativiteit van de steekproef heeft dus consequenties voor de externe validiteit van het
onderzoek.
Beschrijvende statistieken: frequentietabel (categorisch) of histogram (metrisch)
Toetsende statistieken: een univariate χ2-toets (categorisch) of t-toets (metrisch)
Significantie van 0.30
In het hoorcollege is aangegeven dat het bij een toets op representativiteit gebruikelijk is om
uit te gaan van een hogere alfa dan bij andere toetsen. Doorgaans wil je de kans op een type I
fout zoveel mogelijk beperken en kies je voor een lage waarde voor alfa (over het algemeen
5%). Bij een toets op representativiteit is het meer van belang de kans op een type II fout klein
,te houden. Deze kans, aangeduid als bèta, wordt kleiner naarmate een grotere alfa gekozen
wordt. Niet te snel concluderen dat een populatie representatief is. Bij de meeste statistische
toetsen wil je de kans op een type I fout zo klein mogelijk houden. Doorgaans heb je immers
hypothesen die gaan over een verschil, een verandering of een correlatie. Je wilt niet te snel
de nulhypothese dat er geen verschil, geen verandering of geen correlatie is verwerpen en het
risico lopen dat de nullhypothese hypothese
toch waar is (= de definitie van een type I fout).
Bij de uitgevoerde representativiteittoetsen wil
je juist dat de nulhypothese opgaat. Je wilt te
snel de nulhypothese behouden, terwijl deze
eigenlijk niet waar is. Ofwel, je wilt de kans op
een type II fout minimaliseren.
Doel: geen significant effect -> steekproef is representatief
Data cleaning
Allereerst kijkt de onderzoeker of alle gegevens in de datamatrix kloppen. Dat doet hij door
middel van vier stappen: Codes, Missings declareren, Routings & Response set. Daarna zal
hij een missing value analyse uitvoeren. Je kunt frequentietabellen draaien van je variabelen
en kijken of je fouten of slordigheden ziet. Je kunt ook kruistabellen draaien en kijken of je
daar opmerkelijke zaken ziet. Kortom, data cleaning wordt gebruikt om de verkregen data op
te schonen, te controleren en goed weer te geven in een statistisch programma, waarna
begonnen kan worden aan statistische procedures.
Response set
Van response set is sprake als respondenten op een bepaalde systematische manier de vragen
beantwoorden, zodanig dat dit ten koste gaat van de validiteit van de meting. Wanneer
bijvoorbeeld een aantal Likertitems achter elkaar voorgelegd worden, kan het zijn dat
respondenten een patroon laten zien zonder dat het inhoudelijk (meet je wat je wilt meten)
logisch is. Wanneer je response set meent te hebben waargenomen, moet je eerst beoordelen
of het gevonden patroon inhoudelijk toch mogelijk is (door de vragen en gegeven antwoorden
naast elkaar te leggen). Is er inderdaad sprake van response set dan moet je de omvang ervan
, bepalen. Is het aantal respondenten met response set laag dan zou je ze bijvoorbeeld kunnen
verwijderen of de scores van hen op die betreffende variabelen missing maken.
Missing value analyse
Met missing value analyse gaat de onderzoeker kijken of de ontbrekende scores op variabelen
samenhangen. Het is van belang om te onderzoeken welke processen hebben geleid tot
missing data, zodat de juiste stappen kunnen worden ondernomen om met missing data om te
gaan. We onderscheiden missing data random (MAR) en completely at random (MCAR).
MAR betekent dat de ontbrekende scores op een variabele afhankelijk zijn van ontbrekende
waarden op een andere variabele: er is sprake van selectiviteit. Bijvoorbeeld dat het
voorkomen van ontbrekende scores op de variabele inkomen afhankelijk is van het geslacht
van de respondent (mannen blijken minder geneigd dan vrouwen om hun inkomen op te
geven). Meer algemeen: MAR betekent dat er onderliggende patronen aanwezig zijn tussen
missing data en andere variabelen. MCAR houdt in dat de ontbrekende scores willekeurig zijn
verdeeld over alle respondenten en variabelen in de steekproef. Missing data hebben
praktische consequenties, namelijk dat de steekproefgrootte kan worden aangetast en dus ook
de statistische power. Ook de geldigheid van uitspraken die over de onderzoekseenheden
worden gedaan, kan worden aangetast.
Stap 1: type missing data vaststellen. Bij deze stap onderzoek je of je de missing data al dan
niet negeerbaar zijn. Er zijn drie voorbeelden van negeerbare missing data:
-non-response/steekproef;
-routings
-censored data/ontwerp.
Naast negeerbare missing data heeft de onderzoeker ook vaak te maken met data die niet te
negeren zijn. Daarvan zijn twee categorieën: te verklaren missing processen en
onverklaarbaar missing processen. De niet negeerbare missing data word behandelt in de
volgende stappen
Stap 2: omvang van de missing data vaststellen. Hoeveel
respondenten blijven erover voor de analyse van je data? Missing
data lager dan 10% is te verwaarlozen mits deze volledig random
zijn (in tabel hoogste waarde slechts 2.7%). Je moet overigens
wel uitkijken of respondenten dan wel variabelen verwijderd
kunnen worden wanneer deze buitensporig hoge missings hebben.
Dan kan ook andere oorzaken hebben, bijvoorbeeld een verkeerde routing in de vragenlijst.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper twanvanderlinden. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €6,49. Je zit daarna nergens aan vast.