Samenvatting Statistiek
Deel A
Deel A.1 - Week 1
Vóórdat je het onderzoek doet bepaal je welke data je gaat verzamelen en hoe je deze gaat
verwerken. Op basis hiervan bepaal je pas de onderzoeksvraag.
Basisbegrippen:
• Data-matrix: de data omgezet in tabellen
o Proefpersonen (subject) komen horizontaal (in een rij)
▪ Ook wel eenheid, unit of case
o Variabelen komen verticaal (in een kolom)
▪ Zoals geslacht, geloof, leeftijd, IQ
❖ Vervolgens codeer je deze gegevens: je zet de data
om in getallen
❖ Score = getal in één cel van de matrix
Variabele = alle antwoorden van één kolom opgeteld (horizontaal)
Statistiek = een getal dat is berekend uit een verzameling van getallen uit de matrix
(bijvoorbeeld het gemiddelde)
• Kwalitatieve variabelen: de uitkomsten zijn categorieën (geslacht, geloof)
Kwantitatieve variabelen: de uitkomsten zijn hoeveelheden (leeftijd, IQ)
3 kenmerken van psychologische tests (volgens APA):
1) De test bestaat uit een aantal vragen of opdrachten – items - die de proefpersoon uitvoert
2) Voor elk item krijgt de proefpersoon een score toegekend: itemscore
3) De itemscores worden samengenomen tot een groter resultaat: de testscore
❖ Vaak gebruikt om te meten in welke mate een persoon een eigenschap bezit
Elementair rapport:
• Bevat de volgende onderdelen:
1) Frequentieverdeling, histogram en N
o N = het aantal proefpersonen in de steekproef
2) Vijfgetallenresumé, uitschieters en gemodificeerde boxdiagram
3) Gemiddelde en standaardafwijking (/standaarddeviatie)
4) Indicatie van de normaliteit
Frequentieverdeling:
• tabel waarin voor iedere mogelijke score staat aangegeven hoe vaak deze is behaald
• vanaf 7 of meer verschillende scores, mag je een geklassificeerde frequentieverdeling
maken. Hierbij deel je de mogelijke scores op in klassen (1-5, 6-10, 11-15)
o bij hele getallen gebruik je 1-5, 6-10, 11-15
o bij kommagetallen (continue getallen) gebruik je 1-5, 5-10, 10-15)
o neem ongeveer √N klassen, maar dit is geen vaste regel
• wanneer de frequentie bij een score/klasse 0 is, hoef je deze niet aan te geven in de
frequentietabel. Dat moet wel in het histogram.
,Histogram:
• een staafdiagram met hierin de frequentieverdeling weergegeven
• Let er bij een histogram op dat de staven nauw aan elkaar staan;
met gaten ertussen weet je niet of er hiaten zijn of niet.
N = het aantal proefpersonen (Frequenties optellen)
Vijfgetallenresumé:
• Bevat: minimum, 1e kwartiel, mediaan, 3e kwartiel, maximum
o 1e kwartiel = het getal op 25%
o 3e kwartiel = het getal op 75%
Stam-en-bladdiagram:
• Vorm van frequentieverdeling
• Stam = eerste cijfers van de score (meestal de tientallen)
• Blad = de laatste cijfers van de score (meestal de eenheden)
• Volgorde van klein naar groot
• Tellen (data verzamelen)
o Frequentietabel (hoe vaak komt elke variabele voor: getallen)
o Histogram (hoe vaak komt elke variabele voor: staafdiagram)
o N = aantal subjecten (altijd erbij zetten)
o Wanneer je heel veel verschillende scores hebt, maak je klassen/
intervallen (intervallen moeten even groot zijn, tussen de 7-12 klassen)
▪ Zoals leeftijden verdelen in clusters van 10 jaar
▪ Hoe werk je met de grenzen van de clusters:
• Discrete variabelen (hele getallen): 1-4, 5-9, 10-14
• Continue variabelen (kommagetallen): 0-5, 5-10, 10-15
• Ordinale kenmerken (scores sorteren en analyseren)
• Metrische kenmerken (wat kun je hieruit berekenen)
Mediaan:
1. Neem scores van klein naar groot
2. Neem middelste getal (als het er twee zijn bereken je gemiddelde)
❖ Eerste kwartiel: alles onder de mediaan
Derde kwartiel: alles boven mediaan
❖ IKA = Interkwartielafstand; verschil in grootte van scores tussen de kwartielen
❖ Uitschieters mag je niet verwijderen. Het zijn uitschieters als:
o Groter of gelijk aan: Q3 + 1,5 x IKA of kleiner of gelijk aan: Q1 – 1,5 x IKA
, Deel A.2 - Week 2
Gemiddelde en standaarddeviaties kun je allebei berekenen uit de scores van een hele groep op een
proef → het zijn dus allebei statistieken
• Hiermee kun je de ‘standaardscore’ per persoon berekenen
Gemiddelde:
• geeft aan waar het ‘centrum’ van de scores ligt
• Dit kun je beter met functies op rekenmachine berekenen → nauwkeuriger
Standaarddeviatie:
• Geeft aan hoe groot de spreiding van de scores is / hoe sterk individuele scores afwijken van
het gemiddelde
• Hoe berekenen: - goed om te weten, hoef je niet zelf te kunnen/weten
1. Gemiddelde berekenen (met rekenmachine)
2. Voor elke score de afwijking berekenen
3. Standaarddeviatie berekenen uit totaal van afwijkingen:
a. Alle afwijkingen kwadrateren
b. Alle gekwadrateerde afwijkingen optellen
c. Optelsom delen door (N-1) → variantie
d. √variantie
❖ Waarom N-1: moet bij steekproef (en historisch gezien gebruikelijk)
Standaardscore:
• Uit de standaardscore kun je afleiden hoe goed of slecht je een test hebt gemaakt
• Het betekent dat je “… standaarddeviaties boven (of onder) het gemiddelde ligt”
𝑠𝑐𝑜𝑟𝑒−𝑔𝑒𝑚𝑖𝑑𝑑𝑒𝑙𝑑𝑒
• 𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑠𝑐𝑜𝑟𝑒 = 𝑠𝑡𝑎𝑛𝑑𝑎𝑎𝑟𝑑𝑑𝑒𝑣𝑖𝑎𝑡𝑖𝑒
• De standaardscore ligt meestal tussen -2 en +2
• Gemiddelde is altijd 0, standaardafwijking is altijd 1
• Histogram van de standaardscore ziet er zelfde uit als histogram van frequentie, alleen
wordt de frequentie vervangen door de standaardscore