Werkcollege: woensdagen 12.30-13.30
College 1: introductie, statistiek in het onderzoeksproces (30/01/2023)
Numerieke gegevens, die antwoord geven op de onderzoeksvraag
- Je hebt verschillende condities bij de onderzoeken
- n = aantal deelnemers
- SD = ‘’mean’’/gemiddelde
- Combinatie rijen en kolommen -> de gegevens
- (…), getal tussen haakjes = standaarddeviatie
Onderzoeksproces
Data Initial observation (RQ)
Theorie genereren
Identify variables Genereer hypothese
(meetniveaus)
Data verzamelen om een
Measure variables
theorie te testen
(meetniveaus)
Graph data Data analyseren (statistiek)
(Fith a model)
- Onafhankelijke variabele: gemanipuleerde variabele door onderzoeker
- Afhankelijke variabele: de tellingen, niet manipuleerbaar
- Toetsende (inferentiële) statistiek: kijken of je de uitkomsten kunt generaliseren, bij het proces van
data analyseren
-> Statistiek: Is de uitkomst significant? Is de uitkomst toeval of daadwerkelijk zo?
Variabelen
- Variabele: iets dat kan variëren, een eigenschap die verschillende waardes kan aannemen
De waarden van de eerste variabelen (onafhankelijke variabele) veroorzaken de waarden van
de tweede variabele (afhankelijke variabele)
- De oorzaak-variabele = onafhankelijke variabele (OV, ‘’independent variable’’)
Kan gehypothetiseerde oorzaak zijn
Deze variabele manipuleert de onderzoeker (hij/zij bedenkt de namen bv)
- De gevolg-variabele = afhankelijke variabele (AV, ‘’depedent variable’’)
Kan het gehypothetiseerde effect van de OV zijn
Deze variabele wordt gemeten door de onderzoeker
Meetniveaus
- Scores: Getallen die gebruikt worden om de waarden van de variabelen mee aan te geven, het zijn
verschillende codes die niet altijd een hoeveelheid aanduiden
- Scores kunnen toegekend worden (als code) of worden verkregen door te meten
,Hoofdtypen meetniveaus
1. Categorieële scores/variabelen
- Scores ‘’betekenen’’ verschillende categorieën
- Bijvoorbeeld: Geslacht, links- of rechtshandig, bloedtype, oogkleur, etc.
- Subsoorten
Nominale scores, duidt aan tot welke categorie een fenomeen behoord (alleen maar ’tellen’,
gelijkheid)
Ordinale scores, ingedeeld in categorieën mét een bepaalde ordening (volgorde,
gelijkheid/ordening)
2. Continue scores/variabelen
- De scores duiden bepaalde hoeveelheden aan ‘’van iets’’ (dmv meten)
- Bijvoorbeeld: Leeftijd, lengte, IQ, etc.
- Subsoorten
Interval, de categorieën met ordening bevatten ook gelijke verschillen tussen de scores,
waardes op een bepaalde schaal (hoeveelheden, gelijkheid/ordening/verschil)
Ratio, hetzelfde als interval-score maar dan in aanwezigheid van een absoluut 0-punt
(afwezigheid, gelijkheid/ordening/verschil/verhouding)
-> Betekent ‘’0’’ ook echt ‘’niks’’ van iets op deze schaal? (Ja) Heeft het zin om te spreken
over negatieve waarden? (Nee), ratio (antwoorden andersom is interval)
Grafieken
- Rij: horizontale lijnen, vertegenwoordigen onderwerpen
- Column: verticale lijnen, gemeten variabelen
-> Uiteindelijk komt hier een score uit, bijvoorbeeld bij geslacht ‘’man of vrouw’’
College 2: statistische modellen: een steekproef karakteriseren (06/02/2023)
- Interval en ratio wordt door Jamovi allemaal continue variabelen genoemd
Steekproef karakteriseren
- Frequentie-verdelig
Welke scores komen voor?
Hoe vaak komt elke score voor? (ruwe tellingen en percentages (percenten))
- Histogram: grafische weergave van een frequentie-verdeling
Verticaal -> hoe vaak de score voorkomt/frequenties (density)
Horizontaal -> de score
De middelste scores komen vaak het meeste voor (gemiddeld, normaalverdeling)
- Scores rond het gemiddelde zijn relatief frequent
- Scores ‘’ver van’’ het gemiddelde zijn relatief zeldzaam
Centrummaten
- Modus: Score met de hoogste frequentie, dus de score die het vaakst voorkomt
- Mediaan: score waaronder en waarboven 50% van alle scores liggen (ligt in het midden)
- Gemiddelde: som van alle scores gedeeld door het aantal scores
, Wanneer gebruik je welke maat?
Variabele Categorical Continuous
Niveau Nominaal Ordinaal Interval Ratio
Betekenis Gelijkheid Gelijkheid en Gelijkheid, Gelijkheid,
ordening ordening en ordening, afstand
afstand en ratio
Geschikte Modus Modus Modus
centrummaat Mediaan Mediaan
Gemiddelde
- Modus: gebaseerd op frequentie, NIET op ordening of afstand tussen scores
- Mediaan: gebaseerd op frequentie en ordening, NIET op afstand tussen scores
- Gemiddelde: gebaseerd op frequentie, ordening en afstand
-> Lager geordende centrummaat kun je altijd gebruiken
Maar welke dan gebruiken? Kijk naar het niveau van het ‘’probleem’’
- Heb je te maken met continue scores, dan is de vuistregel:
1. Als modus, mediaan en gemiddelde ongeveer gelijk: gebruik het gemiddelde
Die is verreweg het meest informatief
2. Verschillen ze evident van elkaar: check je dataset en ga na wat er gaande is
Gemiddelde zegt niet veel meer, gebruik mediaan of misschien zelfs de modus
Spreidingsmaten (maten voor de verdeling in de scores (‘’dispersion’’))
- Hoe ‘’goed’’ is het gemiddelde in het karakteriseren van de individuele scores?
- Wat is het verschil tussen de individuele score en het gemiddelde, ‘’afwijking’’ of ‘’error’’
Hoe groter de uitkomsten van onderstaande berekeningen hoe ‘’slechter’’ het gemiddelde
Spreiding:
- SD (standaarddeviatie, s): de gemiddelde afwijking van de scores tov het gemiddelde
Alle ‘’errors’’ optellen gedeeld door het aantal
(uitgedrukt in dezelfde eenheid als de oorspronkelijke waarden, op schaal van aantal soorten
scores (schoolcijfer is dus op schaal van 1 tot 10))
De variantie (s^2):
(uitgedrukt in grotere
eenheden, bijvoorbeeld
vierkante meters)
Samenvattend
1. Centrale tendensmaten: modus, mediaan, mean
2. Dispersiematen: standaarddeviatie, variantie
SD: gemiddelde afstand van de individuele scores tov het gemiddelde