Samenvatting Onderzoekspracticum: Data-analyse
Thema 1 Inleiding
1.1 Inleiding en ethiek
Empirisch onderzoek -> onderzoek waarbij data wordt verzameld.
Wetenschap is er om de realiteit te begrijpen en deze uiteindelijk naar onze hand te zetten: bruggen
bouwen (ziektes bestrijden bijvoorbeeld).
Vijf fasen van onderzoek:
1. Onderzoeksvraag formuleren;
2. Studie ontwerpen;
3. Data verzamelen;
4. Data analyseren;
5. Rapporteren.
De fases kunnen ook door elkaar lopen
Ethiek en integriteit zijn belangrijk, want:
Psychologie is vaak onderzoek met mensen. Onderzoek moet niet ten koste van de mens zelf
gaan;
Onderzoek is vaak van publieksgeld, dus het onderzoek moet de moeite waard zijn, repliceer
baar (het onderzoek moet herhaald kunnen worden) zijn en alle stappen moeten transparant
en herleidbaar zijn.
Onderzoek die ethische commissies beoordelen:
Informed consent: deelnemers doen geheel vrijwillig mee en de data wordt geanonimiseerd;
Data-management: daarin wordt beschreven hoe data wordt opgeslagen en hoe ze worden
geanonimiseerd etc.
- Hoe ga je met de metadata om: vragenlijsten en scores op de vragenlijsten. Eigenlijk al
het gebruikte materiaal. Hoe gaan zij deze producten opslaan en verwerken?
Full disclosure: volledig openheid geven over het onderzoeksproces.
1.2 Validiteit en betrouwbaarheid
Onderzoek kan geen accurate reprenstatie geven van wat er speelt. Er is dus geen perfecte meting.
Als je iets voor de tweede keer meet komt er niet hetzelfde uit.
Betrouwbaarheid
De mate waarin een meting bij herhaling hetzelfde resultaat oplevert:
- Meetfout is als je niet meet wat je wilt meten door externe factoren: als we willen meten
hoe depressief iemand is, kan je op een zonnige dag een andere uitkomst hebben dan op
een regenachtige dag. Een ander voorbeeld bij een intelligentietest: de één is in de
ochtend vermoeider bij het afnemen van de test dan de ander. Dat maakt de test
onbetrouwbaar;
- Stabiliteit van een meetinstrument over herhaalde metingen;
- Hoe minder meetfouten, hoe meer het onderzoek betrouwbaar is.
- Betrouwbaarheid is dat de resultaten dicht bij elkaar liggen; zelfde resultaten bij nieuw
onderzoek.
Validiteit
, De mate waarin een meetinstrument meet wat het moet meten:
- Komt realiteit binnen een onderzoek overeen met de realiteit in de echte wereld?
Intelligentie dat altijd 100 aangeeft is niet valide, want er is altijd verschil tussen mensen.
- Validiteit is dat de spreiding voldoende is zodat je meet wat je wilt meten (niet alleen
mensen uit Amsterdam meten, maar uit de heel Nederland om een goed beeld te krijgen
van een bepaalde populatie uit Nederland).
1.3 Populaties en steekproeven
We kunnen niet alle mensen onderzoeken, want:
De groep is simpelweg te groot
Groepen zijn ook vaak mensen in het verleden of in de toekomst
Daarom onderzoeken we niet de hele groep, maar wordt er een steekproef genomen. Een
verstorende factor hiervan is ‘toeval’ want:
Ten eerste is er de meetfout, geen meting is perfect;
Ten tweede steekproeftoeval: door toeval kunnen één of meerdere uitzonderlijke mensen in
een steekproef belanden.
Een aselecte steekproef is wanneer deelnemers willekeurig worden gekozen, voorbeelden zijn:
Aselecte steekproef: iedereen heeft evenveel kans om in een steekproef te belanden. Een
aselecte steekproef is representatief (valide), maar er kunnen meetfouten in zitten
(betrouwbaarheid)
Gestratificeerde steekproef: de populatie wordt eerst opgedeeld in kenmerken, waarna uit
elk deel een aselecte steekproef wordt genomen. Er worden evenveel mannen als vrouwen
geselecteerd.
Multilevel-steekproef: als de onderzoekseenheden (deelnemers) georganiseerd zijn in
grotere groepen, bijvoorbeeld scholieren in klassen, wordt er soms eerst een aselecte
steekproef van scholen genomen, waarna een aselecte steekproef van klassen wordt
genomen.
Selectie steekproef: deelnemers worden weloverwogen geselecteerd op basis van hun kenmerken
(leeftijd, geslacht, ziekte). Een selecte steekproef is niet representatief (valide), maar er kunnen wel
meetfouten inzitten (betrouwbaarheid). Nadeel hiervan is een lagere generaliseerbaarheid en
mogelijk lagere validiteit, voorbeelden:
Convenience: deelnemers worden gekozen, omdat ze mogelijk toegankelijk zijn, zonder dat
er veel aandacht wordt besteed aan representativiteit (vragen van kennis en vrienden).
Snowball sampling: start met een klein aantal weloverwogen personen. Die personen vragen
weer kennissen van hen. Wordt veel gebruikt bij moeilijk te bereiken mensen, zoals
sekswerkers etc.
1.4 Operationalisaties
Bij elk onderzoekseenheid in een steekproef worden vairabelen gemeten. Een variabele is iets dat
varieert of zou kunnen variëren (intelligentie, optimisme, extraversie). Variabelen kunnen nooit exact
gemeten worden.
Constructen: psychologische variabelen, zoals ze door een theorie worden gedefinieerd (bijvoorbeeld
optimisme of depressie). Iedereen weet bijvoorbeeld wat een depressie is, maar de definitie verschilt
van persoon tot persoon. Ten tweede weten mensen vaak moeilijk hoe zij bij zichzelf moeten scoren.
Zo zijn er bijvoorbeeld mensen die zichzelf overschatten ten aanzien van intelligentie.
, Operationalisaties: link tussen theoretische constructen en de realiteit. Je maakt een abstract begrip
meetbaar. Bij een onderzoekseenheid (een deelnemer) worden deze operationalisaties gemeten. Er
zijn twee soorten operationalisaties:
Meetinstrumenten: heeft als doel datapunten te verzamelen, zoals getallen, zonder het
construct te beïnvloeden, terwijl manipulaties juist het construct willen beïnvloeden;
Manipulaties: maken het mogelijk om te onderzoeken of er een causaal verband bestaat
tussen twee variabelen.
Operationalisatie is van belang in onderzoek voor de betrouwbaarheid en validiteit. De
operationalisatie kan in het ene onderzoek zorgen voor een validiteit, maar in het andere onderzoek
juist niet. Bijvoorbeeld dezelfde operationalisatie gebruiken bij volwassenen en jeugd.
Stimulu: beelden, geluiden, die aan deelnemers gepresenteerd worden, bijv: de vragen bij een
vragenlijst of de instructies die deelnemers krijgen.
Kwalitatief onderzoek (iets nieuws leren)
Dit wordt gedaan als er een nieuw fenomeen is, waarvoor nog geen meetinstrumenten zijn
ontwikkeld. Voordeel: kan voor veel diepgang zorgen. Nadeel: dataverzameling is intensief,
dus er kunnen vaak kleine steekproeven worden gedaan;
Kwalitatief onderzoek kan ideeën geven over hoe de wereld in elkaar zou kunnen zitten.
Kwantitatief onderzoek
Is beperkt tot het onderzoeken van variabelen waar al operationalisaties voor bestaan, die
ook nog valide en betrouwbaar moeten zijn;
Kwantitatief onderzoek kan de ideeën van kwalitatief onderzoek bevestigen of ontkrachten.
Meetmodel: verhoudingen tussen operationalisaties en de subvariabelen waar deze uit bestaan
worden visueel weergegeven. Het construct zet je in de ovale vorm en die verbind je met de
antwoorden. Die antwoorden zet je in een vierkant. Bij elke studie moet worden geverifieerd of de
meetmodellen correct zijn voor het starten van de analyse.
Hoofdstuk 2 univariate analyse
2.1 centrum- en spreidingsmaten
De bekendste manier om data samen te vatten is door het gemiddelde te berekenen. Dat is alles bij
elkaar optellen en delen door het aantal datapunten. Gemiddelde fixatiebias = ∑n = 1x1/N
X = datapunt
N= aantal deelnemers
X-=gemiddelde fixatiebias
∑= optellen
I=1 = het optellen start met het eerste punt in de datareeks. De i geeft aan om de hoeveelste
datapunt het gaat. X1 X2 X3, dit gaat door tot we bij N zijn, dan is de formule herhaald voor alle
datapunten
Een gemiddelde wordt als centrummaat gezien, want hij geeft aan rondom welke waarde de
datapunten in deze datareeks zich bevinden en wat het centrum van deze datareeks is.