Toe – hoorcolleges corelationeel
Verschillende types correlationele data
- Tevredenheid van de klant
- Pollen (bv. politiek, bij verkiezingen)
- Overheid statistieken (bv. door cbs om te weten wat er speelt onder de bevolking)
door de groei van digitale media groeit digitale data bijna exponentieel
Correlationele data
- Data worden geproduceerd op verschillende data
1. Toevallig/organic/ready made: wij hebben als onderzoekers ontwerpen gemaakt,
je hoeft geen moeite voor de data te doen
asperationeel: posts op fb, twitter en insta, mensen willen wat delen met de
wereld dus de mensen doen dit opzettelijk
transactioneel: transacties, wat gebeurd er met je bankkaart, creditcard,
bonuskaart, gegevens van de energiemaatschappij
2. Opzettelijk/designed/custom made
experiment
survey
administratief: bv. belastingdienst
Correlationele data (designed)
Populatie hier wil je iets over leren data verzamelen dingen beschrijven met data
conclusies trekken over de steekproef terugkoppelen naar populatie (inferentie)
We ontwerpen een studie & verzamelen data om:
1. De sociale realiteit de beschrijven
2. Bestuderen (causale) relatie
3. Generaliseren naar de doel populatie
Inferentiele doelen (generalisatie)
, 1. Beschrijven (data verzamelen omdat je dingen wil beschrijven, bv. hoe gaan dingen in
NL?)
vb hc: the impact of fathering daughters on men’s preferences for gender-equality
policies
how likely are you to vote in the democratic primary election or caucus in your
state to choose the democratic nominee for the 2020 presidential election? (dit zou
ook voorspellend kunnen zijn, maar dan moet je als opties alleen ‘ja’ ‘nee’ geven en
niet de optie van misschien wel/misschien niet.
2. Causaliteit (wat veroorzaakt bv. een verandering in de mening van mensen?)
3. Voorspellen
vb hc: which of these democrats would be your first choice in the Iowa caucuses
Hoe moet je het afnemen? Surveymethoden
1. Face-to-face (CAPI: computer assistant personal interview)
2. Post (mail)
3. Telefoon (CATI: computer assistant telephone interview) denk aan van die callcenters
4. Internet
5. Gemixte methode
Verschillen tussen de methoden
- Degree of interviewer involvement (bij face-to-face is er veel invloed, via internet
geen)
- Degree of interaction with the respondent (bij face-to-face en telefoon is er
interactie)
- Degree of privacy (als er een interviewer is, is er minder privacy)
- Channels of
communication
- visueel: kun je
plaatje/filmpje laten
zien?
- auditief: geluidsopname
- Technology use
Surveymethoden in NL
- Population register (registratie bij gemeente van iedere inwoner) & meer dan 90%
internet gebruik
- telefoon surveys (random digit dialing) niet wijd gebruikt
- Mode mixes
- bv. Post met uitnodiging tot internet surveys
- bv. Telefonisch component als de nummers bekend zijn
- Marktonderzoekers gebruiken beide probability (selecte steekproef) en
nonprobability (aselecte steekproeven) online panels
- Gemixte-apparaten surveys
- Bv. computer/smartphone
, Types of gemixte-mode designs
dit doe je omdat de antwoorden die mensen geven methode afhankelijk kunnen zijn (bv.
anoniem kunnen mensen andere antwoorden geven, of de ene methode om mensen voor je
te winnen en de andere om de mening te peilen)
- Een mode voor sommige respondenten, een andere mode voor anderen
- bv. online survey met post component voor degenen zonder internet
- Een mode voor werving, een andere voor survey administratie
- bv. mail uitnodiging voor een online vragenlijst
- Een mode voor datacollectie, een andere voor herinneringen/follow-ups
- bv. telefoon herinneringen voor online surveys
- Een mode voor het hoofdgedeelte van het interview, een andere voor sommige
subset of answers (bv. gevoelige onderwerpen)
- bv. telefoon & audio computer self-administrered (ACASI)
- Een mode voor een wave of the panel survey, another for others
- bv. Eerste wave face-to-face, die daarna online om kosten te besparen
Cross-sectioneel en panel surveys
- Panel surveys interviewen respondenten over de tijd, dus bv. ieder jaar dezelfde
vragenlijst (content vaak hetzelfde, maar kunnen verschillen)
- Voordelen hiervan:
- je kan within-person verandering beschrijven & causaliteit
- je kan onderscheid (disentangle) maken tussen leeftijd, periode en cohort effecten
- Nadelen:
- attrition/uitval (drop-out or consecutive wave-nonresponse)
- panel conditioning/learning effects (op een gegeven moment weet je wel hoe de
vragenlijst gaat en vul je gewoon dezelfde antwoorden in)
Voorbeeld discussie over of we wel/geen zomer- en wintertijd moeten afschaffen
- De EU ging onderzoeken wat mensen nou eigenlijk van die zomertijd vonden, dit
werd gestuurd naar alle inwoners van de EU. Ze kregen 4,1 miljoen antwoorden. 70%
van de mensen kwam uit Duitsland, 8,6% uit Frankrijk, 6% Oostenrijk, rest: anders.