TOE HC1 4 februari
Correlational research I Surveys
Correlationeel onderzoek = kwantitatief onderzoek (getallen) – relatie tussen variabelen
Hoeveelheid digitale data is enorm gegroeid
Twee manieren waarop correlationele data wordt geproduceerd:
- Designed (opzettelijk)
o Experiment
o Survey
o Administrative
- Organic (toeval)
o Aspirational
o Transactional
Data verzamelen om werkelijkheid of relaties te kunnen beschrijven en te kunnen generaliseren =
inferentie. Doel van inferentie:
- Beschrijven
- Oorzaak/gevolg bepalen
- Voorspellen
Soorten vragenlijsten:
- Face-to-face (CAPI: Computer Assisted Personal Interview)
- Mail
- Telefoon (CATI: Computer Assisted Telephone Interview)
- Internet
- Mixed-mode (oa om negatieve effecten van panel surveys tegen te gaan)
Verschil in bemoeienis en interactie met interviewer, privacy, communicatie en technologie
Panel surveys: onderzoekers volgen mensen over de tijd heen > ontwikkeling beschrijven (+) maar
ook uitval (-) en panel conditioning = leereffecten (-)
Bij fouten in onderzoek kan je een vertekening van de werkelijkheid krijgen:
, Target population = doelpopulatie = populatie waarin je geïnteresseerd bent
Sampling frame = steekproefkader = lijst van de mensen waaruit de steekproef getrokken wordt
Coverage error = dekkingsfout
Hoeveel mensen uit je doelpopulatie staan ook echt op je lijst? Steekproefkader is niet gelijk
aan de doelpopulatie
Speelt rol als de mensen die niet op jouw lijst staan, anders zijn dan de mensen die op jouw
lijst staan
Twee soorten: over-coverage (overschatting) en under-coverage (onderschatting)
Sampling error = steekproeffout
Hoe kleiner de steekproef, hoe groter de standaardfout. Als standaardfout te groot is kan je
verschillen die er wel zijn, niet terugvinden in de data.
Ook van belang of je een aselecte steekproef gebruikt of niet
Foutmarge van 3 percentagepunten is acceptabel
Nonreponse error
Als mensen die geselecteerd zijn voor de vragenlijst, geen antwoord geven
Wordt pas een probleem als de mensen die niet antwoorden anders zijn dan de mensen die
wel antwoorden
Twee soorten: unit-nonresponse (weigering meedoen) en item-nonresponse (weigeren
bepaalde vragen)
Adjustment error
Fout die rol speelt wanneer de data anders wordt behandeld door de data-analist
Kan gebeuren bij gewogen gemiddelde berekenen, imputation (het invullen van gegevens)
Measurement error
Komt voor doordat mensen een verkeerd antwoord geven
VB: effect van de manier waarop je de vragenlijst afneemt (= survey mode effects)
Correlational research I Surveys
Correlationeel onderzoek = kwantitatief onderzoek (getallen) – relatie tussen variabelen
Hoeveelheid digitale data is enorm gegroeid
Twee manieren waarop correlationele data wordt geproduceerd:
- Designed (opzettelijk)
o Experiment
o Survey
o Administrative
- Organic (toeval)
o Aspirational
o Transactional
Data verzamelen om werkelijkheid of relaties te kunnen beschrijven en te kunnen generaliseren =
inferentie. Doel van inferentie:
- Beschrijven
- Oorzaak/gevolg bepalen
- Voorspellen
Soorten vragenlijsten:
- Face-to-face (CAPI: Computer Assisted Personal Interview)
- Telefoon (CATI: Computer Assisted Telephone Interview)
- Internet
- Mixed-mode (oa om negatieve effecten van panel surveys tegen te gaan)
Verschil in bemoeienis en interactie met interviewer, privacy, communicatie en technologie
Panel surveys: onderzoekers volgen mensen over de tijd heen > ontwikkeling beschrijven (+) maar
ook uitval (-) en panel conditioning = leereffecten (-)
Bij fouten in onderzoek kan je een vertekening van de werkelijkheid krijgen:
, Target population = doelpopulatie = populatie waarin je geïnteresseerd bent
Sampling frame = steekproefkader = lijst van de mensen waaruit de steekproef getrokken wordt
Coverage error = dekkingsfout
Hoeveel mensen uit je doelpopulatie staan ook echt op je lijst? Steekproefkader is niet gelijk
aan de doelpopulatie
Speelt rol als de mensen die niet op jouw lijst staan, anders zijn dan de mensen die op jouw
lijst staan
Twee soorten: over-coverage (overschatting) en under-coverage (onderschatting)
Sampling error = steekproeffout
Hoe kleiner de steekproef, hoe groter de standaardfout. Als standaardfout te groot is kan je
verschillen die er wel zijn, niet terugvinden in de data.
Ook van belang of je een aselecte steekproef gebruikt of niet
Foutmarge van 3 percentagepunten is acceptabel
Nonreponse error
Als mensen die geselecteerd zijn voor de vragenlijst, geen antwoord geven
Wordt pas een probleem als de mensen die niet antwoorden anders zijn dan de mensen die
wel antwoorden
Twee soorten: unit-nonresponse (weigering meedoen) en item-nonresponse (weigeren
bepaalde vragen)
Adjustment error
Fout die rol speelt wanneer de data anders wordt behandeld door de data-analist
Kan gebeuren bij gewogen gemiddelde berekenen, imputation (het invullen van gegevens)
Measurement error
Komt voor doordat mensen een verkeerd antwoord geven
VB: effect van de manier waarop je de vragenlijst afneemt (= survey mode effects)