Samenvatting boek Learning Statistics with Jamovi (Statistiek voor Bachelors)
82 views 6 purchases
Course
Statistiek voor Bachelors (800551B6)
Institution
Tilburg University (UVT)
Dit document bevat een samenvatting van het volledige boek Learning Statistics with Jamovi, a tutorial for Psychology students and other beginners (Danielle J. Navarro & David R. Foxcroft).
H1, waarom leren we statistiek?
1.1 Psychologie van Statistiek
- Statistiek wordt gebruikt in elk onderzoek, omdat bevindingen anders niet betrouwbaar zijn -> we
vertrouwen de mensheid niet, want we denken dat we vatbaar zijn voor vooroordelen etc.
- Fundamenteel dat mensen zich bezighouden met ‘’inductie’’, verstandige conclusies trekken en
verder gaan dan het onmiddellijke bewijs van de zintuigen om generalisaties over de wereld te
maken
1.1.1 De vloek van het geloven van biases
- Men vindt het moeilijk neutraal te zijn, bewijsmateriaal onpartijdig te evalueren en niet te worden
beïnvloed door vooroordelen
- Men heeft de neiging te worden beïnvloed door de geloofwaardigheid van de conclusie, ook al zou
dat niet moeten
- Argument is deductief (afleiden van nieuwe stelling) geldig als de conclusie een logisch gevolg is,
dus een geldig argument hoeft niet geldige verklaringen te bevatten
- Statistiek: Hulp om de vooroordelen van mensen in bedwang te houden
1.2 Het waarschuwende verhaal van Simpson’s Paradox
- Simpson’s Paradox: het is niet gebruikelijk, maar het gebeurt wel daadwerkelijk in het echte leven.
Vrouwen kiezen voor banen die lastig zijn en mannen kiezen voor banen met hoogste
toelatingspercentage
- Statistiek is belangrijk, want de waarheid is soms sluw verborgen in de hoekjes en gaten van
gecompliceerde gegevens
- Statistiek beantwoord niet alle kritieke vragen, maar antwoord op die vragen zullen enorme impact
hebben op hoe de gegevens geanalyseerd en geïnterpreteerd zullen worden. Daarom is statistiek
alleen maar een hulpmiddel, want er is geen vervanging voor voorzichtige gedachtes
1.3 Statistiek in Psychologie
- Psychologie heeft statistiek nodig, omdat de problemen te complex zijn
- Redenen iedereen eigen basiskennis statistiek: Onderzoeksontwerp en statistiek zijn diep verweven,
in veel psychologische literatuur wordt gebruik gemaakt van statistische analyses, iemand inhuren
voor statistische analyse is duur
1.4 Statistiek in het alledaagse leven
- Doordat je statistiek onder de knie hebt kun je erachter komen wanneer iemand een fout maakt of
liegt (bijvoorbeeld journalisten)
1.5 Er zijn meer onderzoeksmethoden dan statistiek
- Lees: pagina 11 & 12
H2, Een korte inleiding tot onderzoeksontwerp
2.1 Inleiding tot psychologisch meten
- Verzamelen van gegevens is als een soort meting (over menselijk gedrag/geest)
2.1.1 Enkele gedachten over psychologische metingen
- Meten: het vinden van een manier van nummers of labels, of een andere soort goed gedefinieerde
beschrijving, toewijzen aan ‘’spullen’’
- In een zin staat altijd ‘’het ding dat moet worden gemeten’’ en ‘’de meting zelf’’ (getallen)
- Wees nauwkeurig als je kijkt naar de mate waarin je meet, bij leeftijd bijvoorbeeld in jaren,
maanden, dagen of uren? Er zit groot verschil tussen jaren (niet bij volwassenen, maar bij kinderen).
Kind van 1 kan al veel meer dan een baby van 2 maanden oud.
- Vragen naar leeftijd: zelfrapportage, autoriteit vragen, officiële gegevens opzoeken
,2.1.2 Operationalisatie: definiëren van je metingen
- Operationalisatie: het proces waarmee we een zinvol maar ietwat vaag concept meetbaar maken
- Hieronder valt: precies zijn over wat je probeert te meten, bepalen welke methode je zult gebruiken
om deze meting(en) te doen, het definiëren van de set waarden van de variabelen van de meting
(hoeft niet numeriek, kan bijvoorbeeld ook geslacht zijn)
- Lastig, hoe het beste operationaliseren (vaak meerdere manieren) en welke waardes voorleggen
aan mensen die onderzoek afnemen
- Theoretisch construct: het ding dat je probeert te meten, kan niet direct worden waargenomen
- Meting: verwijst naar de methode waarvan je gebruikt maakt tijdens de observaties (bijvoorbeeld
een vraag in een survey of een gedragsobservatie)
- Een operationalisering: de logische verbinding tussen de meting en de theoretische constructie, of
naar het proces waarmee we proberen een meting af te leiden van een theoretisch construct
- Een variabele: de werkelijke ‘’gegevens’’ die we gebruiken in de gegevenssets (uitkomst meting)
2.2 Schalen van metingen
- Niet alle variabele zijn van hetzelfde kwalitatieve type, om hier onderscheid tussen te kunnen
maken bestaan er meetschalen
2.2.1 Nominale schaal
- Categorische variabele waarin er geen specifieke relatie is tussen de verschillende mogelijkheden
(géén gemiddelde, groter of beter dan)
2.2.2 Ordinale schaal
- Er kan sprake zijn van een rangorde tussen de verschillende mogelijkheden
2.2.3 Interval schaal
- Numerieke waardes zijn zinvol, er zijn gelijke verschillen tussen de variabelen, gemiddelde. Je kunt
spreken van 0, maar dat is geen absoluut 0-punt
2.2.4 Ratio schaal
- Je kunt spreken van een verhouding, waarin 0 een absoluut 0-punt is. Je kunt ermee
vermenigvuldigen en delen.
2.2.5 Continue versus discrete variabelen
- RT: response time
- Continue: voor elke twee waardes waar je aan kunt denken, is het altijd logisch om er twee andere
waardes tussen te hebben (interval en ratio)
- Discreet: een variabele die niet continue is. Soms kan er niks in het midden zijn (altijd: nominaal en
ordinaal, kan: interval en ratio)
2.2.6 Een aantal complexiteiten
- De meetschalen zijn richtlijnen, soms zijn ze niet zo makkelijk te pas en te onpas op alles te
gebruiken
- Likert-schaal: een schaal met, bijvoorbeeld 5, punten om uit te kiezen
- Onduidelijk tot welke meetschaal de Likert-schaal behoort, in ieder geval niet tot de
bovengenoemde vier. Het is een quasi-interval schaal en lijkt daarmee op een interval schaal
2.3 De betrouwbaarheid van metingen beoordelen
- Betrouwbaarheid: hoe je iets precies meet (stabiliteit/homogeniteit)
- Herhaalbaarheid of consistentie van de meting
- De meting hoeft niet te kloppen en de meting kan alsnog betrouwbaar zijn
-> Validiteit: hoe nauwkeurig de maat is, hierbij moet de meting wel kloppen
Verschillende mogelijkheden om betrouwbaarheid te meten
- Test-hertest betrouwbaarheid: dit heeft te maken met consistentie in de tijd. Als we de meting op
een later tijdstip herhalen, krijgen we dan hetzelfde antwoord?
- Intercodeursbetrouwbaarheid: dit heeft betrekking op consistentie tussen mensen. Als iemand
,anders het herhaalt de meting (bijv. iemand anders beoordeelt mijn intelligentie) zullen ze hetzelfde
opleveren antwoord geven?
- Parallel vormt betrouwbaarheid: dit heeft betrekking op consistentie over theoretisch equivalent
maten. Als ik een andere weegschaal gebruik om mijn gewicht te meten, doet het dat wel hetzelfde
antwoord geven?
- Betrouwbaarheid interne consistentie: als een meting is opgebouwd uit veel verschillende delen die
vergelijkbare functies vervullen (bijvoorbeeld het resultaat van een persoonlijkheidsvragenlijst wordt
opgeteld over meerdere vragen) geven de afzonderlijke delen meestal vergelijkbare antwoorden.
- Niet alle metingen hoeven vormen van betrouwbaarheid te bezitten, indien de onderzoeksmethode
van zichzelf al een hoge betrouwbaarheid heeft is het dus niet nodig
2.4 De rol van variabelen: voorspellers en uitkomsten
- Variabele ‘’te verklaren’’ = variabele Y
- Variabelen ‘’doen/verklaring’’= variabelen X1, X2, etc
-> Relatie? Y hangt af van X
- Onafhankelijke variabele = IV (voorspeller, X)
- Afhankelijke variabele = DV (de uitkomst, Y)
2.5 Experimenteel en niet-experimenteel onderzoek
- De mate van controle die de onderzoekers uitoefenen op de mensen en gebeurtenissen bij het
onderzoek
2.5.1 Experimenteel onderzoek
- De onderzoeker beheerst alle aspecten van het onderzoek
- De onderzoeker manipuleert de voorspellende variabelen (IV’s), maar laat de uitkomstvariabele
(DV) variëren van nature -> oorzakelijk verband ontdekken
- Randomisatie: mensen worden willekeurig aan verschillende groepen toegewezen en deze groepen
krijgen allen een andere behandeling. Dit minimaliseert de mogelijkheid op systematische verschillen
tussen de groepen
2.5.2 Niet-experimenteel onderzoek
- Elk onderzoek waarin de onderzoeker niet zoveel controle heeft als in een experiment
- Om onethische beslissingen te voorkomen (mensen niet dwingen)
- Quasi-experimenteel: experiment zonder controle over de voorspellers (IV’s). Evt mogelijkheid tot
gebruik statistiek om resultaten te analyseren, wel voorzichtig te werk gaan.
- Casestudy: Gedetailleerde beschrijving geven. Statistiek gebruiken om resultaten te analyseren,
maar het is moeilijk om algemene conclusies te trekken over ‘’mensen in het algemeen’’ uit een paar
geïsoleerde personen voorbeelden. Bieden veel tijd en moeite om te verdiepen.
2.6 Het beoordelen van de validiteit van een onderzoek
- Validiteit: kun je de resultaten van je onderzoek vertrouwen?
- Vijf soorten validiteit: intern, extern, construct-, gezichts-, en ecologische validiteit
- Interne en externe validiteit zijn het belangrijkst, want zij sluiten direct aan bij de fundamentele
vraag of je studie werkt
- Constructvaliditeit vraagt of je meet wat je wil meten
- Gezichtsvaliditeit is alleen belangrijk als je geeft om ‘’uiterlijk’’
- Ecologische validiteit is een soort gezichtsvaliditeit dat overeenkomt met een soort ‘’uiterlijk’’ waar
je veel om geeft
2.6.1 Interne validiteit
- De mate waarin je in staat bent om de juiste conclusies te trekken over causale relaties tussen de
variabelen
2.6.2 Externe validiteit
- De generaliseerbaarheid/toepasbaarheid van je bevindingen
, - Mensen buiten de streekproef om moeten ook voldoen aan de uitkomsten
- Fouten mbt externe validiteit: de keuze van de populatie waaruit je je steekproef trekt is erg
beperkt (bv alleen psychologiestudenten)of de beperkte populatie die je bemonsterd verschilt in een
bepaald opzicht systematisch van de algemene bevolking
2.6.3 Constructvaliditeit
- Als je meet wat je wilt meten, en dus meet volgens de correcte theoretische constructie, is de
constructvaliditeit hoog
- Dingen met een grote samenhang moet je op dezelfde manier meten, en andersom
2.6.4 Gezichtsvaliditeit
- Wat ‘’lijkt’’ dat een meting doet wat hij zou moeten doen
- Pragmatische doeleinden: Indien iemand die je vertrouwt de validiteit van de studie bekritiseert is
het de moeite waard om na te gaan denken over het ontwerp en te kijken wat er mis kan gaan, vaak
hebben ongeïnformeerde mensen een ‘’voorgevoel’’ over dat een onderzoek onzin is en zullen ze het
bekritiseren, veel mensen zullen gezichtsvaliditeit gebruiken om daadwerkelijk de validiteit te
beoordelen terwijl dat onzin is dus het hangt soms meer af van uiterlijk dan van de feiten
2.6.5 Ecologische validiteit
- De opzet van de studie moet realistisch zijn en dus een scenario in de echte wereld moeten kunnen
zijn
- Ecologisch valide? Dan is het waarschijnlijk ook extern valide
2.7 Cofound, artefacten en andere bedreigingen voor de validiteit
- Cofounder: een aanvullende, vaak niet gemeten variabele dat een verband blijkt te hebben met de
voorspellers zowel als de uitkomst (bedreigt interne validiteit, niet-experimentele studies zijn hier
kwetsbaarder voor door gebrek aan eigen controle)
- Artefact: een resultaat dat alleen geldt in de speciale situatie waarin je het getest hebt (bedreigt
externe validiteit, experimentele studies zijn hier kwetsbaarder voor)
- Er zijn meer bedreigingen voor validiteit, deze worden in de komende paragrafen besproken
2.7.1 Geschiedenis effect
- Verwijst naar specifieke gebeurtenissen die tijdens het onderzoek kunnen plaatsvinden, wat de
resultaten beïnvloed. Hierdoor zijn de conclusies niet meer betrouwbaar
2.7.2 Rijpingseffect
- Gaat over verandering in de loop van de tijd bij de deelnemers
- Men wordt ouder, meer moe, gaan ons vervelen, etc.
2.7.3 Herhalend testeffect
- Indien je één construct op meerdere manieren wil meten met dezelfde deelnemers kan de eerste
meting effect hebben op de tweede meting
- Voorbeelden: leren en oefenen, bekendheid met de testsituatie, hulpveranderingen veroorzaakt
door testen (stemming)
2.7.4 Selectiebias
- Twee groepen deelnemers krijgen een andere behandeling, je wilt hierbij zien dat de verschillende
behandelingen ook tot verschillende uitkomsten leiden. Dit gebeurt niet, dus je selecteert zelf
mensen in de twee groepen met verschillende kenmerken. (zodat de verhouding goed is)
2.7.5 Differentiële uitputting
- Homogene uitputting: het uitputtingseffect is hetzelfde voor alle groepen (generaliseerbaarheid
neemt af, bedreiging externe validiteit)
- Heterogene uitputting: het uitputtingseffect is verschillende voor de verschillende groepen
2.7.6 Geen reactie bias
- Weinig mensen reageren, en de mensen die wel reageren zijn niet generaliseerbaar door
overeenkomst in persoonlijkheid, het reageren op de survey (steekproef: niet-random)
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through EFT, credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying this summary from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller KHnx. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy this summary for R145,52. You're not tied to anything after your purchase.