grasple
Correlationeel hoorcollege 1
correlationele data genereren:
- toevallig: organisch
- doelgericht: ontworpen/ designed
correlationele data (designed): we verzamelen data om:
- sociale werkelijkheid te beschrijven
- (causale) relaties bestuderen
- generaliseren naar doelpopulatie
Soorten surveys
- face to face (CAPI)
- post
- telefonisch (CATI)
- internet
- mixed-modes
Verschillen tussen de surveys
- mate van betrokkenheid interviewer
- mate van interactie met correspondent
- mate privacy
- communicatiemogelijkheden: auditief, visueel
- gebruik van technologie
,In NL
- veel gebruik van combinaties
- marktonderzoekers gebruiken selecte en aselecte online panels
- ontworpen voor verschillende sociale media
Panelonderzoeken:
- volgen mensen over de tijd
- inhoud vd vragenlijsten is meestal hetzelfde, maar kan verschillen
- binnen- persoon verandering, causaliteit
- leeftijds-, periode-, cohorteffecten verklaren
potentiële fouten:
- fall- out
- no respons
- leereffecten
! let op omgepoolde items in een likert schaal
Correlationeel hoorcollege 2: Betrouwbaarheid & Regressie
,een goed meetinstrument:
- hoge betrouwbaarheid
- hoge begrips(validiteit)
we meten de sterkte van een relatie met correlatie (r)
- deze is altijd tussen de -1 en 1
Hoe meet je de betrouwbaarheid zonder meerdere metingen?
- met de cronbach's alpha
- deze meet de interne consistentie: in welke mate zijn de items van de
vragenlijsten met elkaar gecorreleerd?
- om dit te gebruiken moeten alle items in dezelfde richting zijn gecodeerd
- over het algemeen:
- alpha < 0.7 = slecht
- alpha >0.8 = goed
- afhankelijk van het gebruik van de enquête
Schaalverbetering
- controleer de correlaties tussen de individuele items en de schaal zonder dat
item
- item-rest correlatie/ item-total correlatie
- vuistregel: r it ongeveer 0.2= item kan mogelijk worden verwijderd
- controleer ook wat er gebeurt met de cronbach's alpha als de schaal zou zijn
zonder het specifieke item
- ‘’crohnbachs alpha if item dropped’’
- vuistregel: alpha neemt het meest toe = item kan als eerste worden
verwijderd
variabele creëren
1. ompolen van items
2. betrouwbaarheidsanalyse
3. schaalscore berekenen
correlatie wordt gebruikt om:
- de sterkte van de lineaire relatie te meten
- de richting van de lineaire verband te meten
regressie wordt gebruikt om:
- de lineaire relatie te beschrijven met een vergelijking
- voorspellingen doen met behulp van deze vergelijking
, variabelen in regressie
- de variabele die wordt voorspeld: Y, afhankelijke variabele
- de variabele die wordt gebruikt om voorspellingen te doen: X, onafhankelijke
variabele
de regressielijn bepalen
- least squares regression: een methode om bij een gegeven verzameling
punten in het xy-vlak, die verondersteld worden (min of meer) op een rechte
lijn te liggen, de best passende lijn te bepalen .
- met behulp van de residuen
- de vergelijking met de kleinste som van gekwadrateerde residuen is de
winnaar =R2
Als er weinig spreiding is rond de regressielijn, dan. .
- zijn de meeste residuen klein
- zullen de voorspellingen met de regressievergelijking zeer nauwkeurig zijn
Als er meer spreiding is rond de regressielijn, dan. . .
- zijn de residuen over het algemeen groter
- zullen de voorspellingen met de regressievergelijking minder nauwkeurig zijn
de standaardschattingsfout:
- maat voor de nauwkeurigheid van de voorspellingen
- standaardafwijking van de residuen
- de gemiddelde grootte van de fouten die we maken als we de regressie
gebruiken om voorspellingen te doen
- RMSE
- RMSE = 5.3 , betekent: Als we een productiviteitsscore voorspellen op
basis van PTSS, zitten we gemiddeld ongeveer 5,3 punten naast de
werkelijke productiviteitsscore
Regressievergelijking
- wordt bepaald door wiskundig de kleinste som van gekwadrateerde residuen
(SSR) te bepalen
R2 = maat voor hoe goed de lijn bij de data past