Correlationeel
Part I – Chapter 7 – Survey Research, p. 189-208
Survey = onderzoeksmethode waarbij onderzoekers participanten vragen een reeks
vragen stellen.
Een survey is primaire dataverzameling: als onderzoekers hun eigen data
verzamelen.
Secundaire data = data gebruiken die al eerder door iemand anders verzameld is.
Key informant: centraal persoon waarmee de onderzoeker het meeste contact
heeft.
Modes of administration = hoe de survey gedaan wordt (persoonlijk/ online etc.).
Self-administerd questionnaire (SAQ) = survey door mail of online.
Kan afgenomen worden met gesloten vragen = alleen antwoorden in vooraf
ingestelde antwoorden (response categories). Of open vragen.
Cross-sectionele survey = data verzameld op één tijdsmoment.
Longitudinale survey = data verzameld op meerdere momenten over tijd heen.
Twee soorten:
- Herhaalde cross-sectionele survey = data verzameld op meerdere
momenten maar bij verschillende individuen.
- Panel survey = data verzameld op meerdere momenten bij dezelfde
individuen.
Attrition = verlies van participanten in de loop van de tijd.
Poll = korte survey over één onderwerp, vaak ja/nee antwoorden.
Split-ballot design: een survey waarin een random geselecteerde groep van de
respondenten (vaak 50%) een bepaalde module krijgen en de andere 50% een
andere.
Errors in surveys:
1. Non-response fouten: Non-response is als mensen vragen niet
beantwoorden of helemaal niet meedoen. Je krijgt dan een incomplete
dataset, kan vertekening van de werkelijkheid veroorzaken.
2. Measurement error: wanneer de meetmethode invloed heeft op de
antwoorden/ resultaten.
3. Dekkingsfouten: Als een deel van de populatie niet op de lijst staat, zijn de
resultaten niet dekkend voor de gehele populatie.
4. Sampling error: verschillen in de karaktereigenschappen van de steekproef
en de populatie.
Response rate = % van de gecontacteerde mensen om deel te nemen die ook
daadwerkelijk deelnemen.
Interviewer effect = wanneer de aanwezigheid van de interviewer de antwoorden
van de participant kunnen beïnvloeden.
Meest gebruikte modes of administration:
1. Face-to-face
Paradata = informatie over waar de data was verzameld (waar, omgevingsgeluid,
aanwezigheid andere mensen, etc.). Kan paper-and-pencil interview (PAPI) of
computer-assisted personal interview (CAPI). Showcard = kaart met de
antwoordmogelijkheden. Skip pattern = vraag/ reeks vragen die geassocieerd zijn
met een conditioneel antwoord op een vorige vraag (de screener vraag).
Bij face-to-face is wel grotere kans op interviewer effect, bijvoorbeeld sociale
wenselijkheidsbias = antwoorden wat je denkt dat juist/ verwacht is. Kan
verminderd worden door de interviewer en participant te matchen op
persoonlijkheidskenmerken. Audio computer-assisted self-interview (ACASI) =
,wanneer de respondent een laptop/ tablet gebruikt om te luisteren naar de vragen en
deze te beantwoorden.
2. Over de telefoon
Random-digit dialing (RDD) = random telefoonnummers toetsen om surveys af te
nemen.
Gebruiken computer-assisted telephone interview (CATI) technologie.
3. Via mail
Minder interviewer effecten. Zijn goedkoop. Hebben lagere response rate.
4. Online
Goedkoop, geen interviewer effecten. Makkelijk te ontwerpen. Kan respondenten over
grotere geografische gebieden bereiken. Ook lagere response rate. Mensen zonder
internet kunnen niet meedoen.
5. Mixed-mode
Twee of meer modes of administration gebruiken binnen hetzelfde onderzoek.
Mode-effects = manieren waarop de mode of administration de antwoorden van de
respondent kunnen beïnvloeden.
Part IV – Chapter 8 – Bivariate Correlational Research, p. 203-227
Correlatie
Bivariate correlatie is een verband tussen twee variabelen:
Correlatie ≠ causaliteit!!!!
Geen correlatie ≠ geen verband!!!!
Categorische variabelen: Als de getallen van de waarden geen hoeveelheden
maar categorieën vertegenwoordigen. Bjivoorbeeld: 1 = auto, 2 = fiets, 3 = tram, …
Kwantitatieve variabelen: Wanneer de getallen wel hoeveelheden aangeven.
Bijvoorbeeld: IQ, min. = 60, max = 140.
De Spearman correlatiecoëfficiënt meet de sterkte en de richting tussen
twee ordinale variabelen. Het kán ook zijn dat één variabele ordinaal is en de andere
interval/ratio.
Statistische validiteit
Hoe kunnen we de waarde van een resultaat beoordelen? Factoren die misschien die
de spreidingsdiagram, correlatiecoëfficiënt, staafdiagram of de verschilscore heeft
beïnvloed.
Verschillende manieren om een resultaat op z’n waarde te beoordelen: significantie,
relevantie, nauwkeurigheid en geschiktheid:
- Is de juiste toets gekozen?
- Is er voldaan aan de voorwaarden van de uitgevoerde hypothesetoets?
, - Is de toets op de juiste manier uitgevoerd?
- Zijn de resultaten van de toets op de juiste manier geïnterpreteerd?
Effect size = hoe sterk de relatie tussen twee of meer variabelen is.
Als een CI niet nul omvat (zoals bijvoorbeeld [-0.07, -0.64]), is de association
statistisch significant.
Uitschieters in de data kunnen het gemiddelde en de standaarddeviatie
beïnvloeden, maar ook de correlatiecoëfficiënt r.
Restriction of range: als er geen volledig bereik is van scores in de association, kan
de correlatie kleiner lijken dan deze werkelijk is.
Als er geen lineair verband is, is r = 0, maar dit betekent niet dat er helemaal geen
verband is. Er kan ook een curvilineair verband zijn.
Interne validiteit
Voor causaliteit is covariantie, temporal precedence (directionality problem), en
interne validiteit (third-variable problem) nodig.
Interne validiteit = alternatieve verklaringen voor gevonden data moeten
uitgesloten zijn.
Een potentiële derde variabele moet logisch correleren met allebei de gemeten
variabelen.
Spurious (valse) correlatie: als er wel correlatie is, maar alleen dankzij een derde
variabele.
Externe validiteit
Externe validiteit = in welke mate de resultaten gegeneraliseerd kunnen worden
voor de gehele populatie.
Voor externe validiteit is het belangrijk dat participanten random geselecteerd zijn.
Als de relatie tussen twee variabelen verandert afhankelijk van het level van een
andere variabele, is die andere variabele een moderator. Als er een moderator is die
de relatie kan veranderen, kunnen de resultaten niet gegeneraliseerd worden naar
andere situaties.
Part IV – Chapter 9 – Multivariate Correlational Research, p. 267-269
Multivariate correlatie = verband tussen meer dan 2 variabelen.
Construct/ begripsvaliditeit is belangrijk: afhankelijke variabele = hoe goed gemeten?
Onafhankelijke variabele = hoe goed gemanipuleerd?
Externe validiteit is belangrijk: kunnen de resultaten gegeneraliseerd worden?
Statistische validiteit is belangrijk: zijn de statistische resultaten/ conclusies wel juist?
Hoe nauwkeurig is er gewerkt? Zijn de resultaten relevant?
Part IV – Statistics Review – Inferential Statistics, p. 499-500
Correlatiecoëfficiënt r is een beschrijvende statistiek. Statistische significantie
evalueren met NHST:
Stap 1: aannemen dat er geen effect is (nulhypothese).
Stap 2: data verzamelen.
Stap 3: bereken de waarschijnlijkheid van het krijgen van deze of extremere data, als
nulhypothese waar is.
Stap 4: besluiten of je de H0 verwerpt of niet. Als je H0 verwerpt ga je ervanuit dat er
wél effect is, en dat de correlatiecoëfficiënt statistisch significant is.