Discovering statistics using IBM SPSS Statistics
Andy Field
Hoofdstuk 1 Why is my evil lecturer forcing me to learn
statistics?
1.6 Collecting data: measurement
6.1 Independent and dependent variables
Om een hypothese te testen moeten we variabelen meten. Variabelen kunnen veranderen,
afhankelijk van persoon/plaats/tijd. De meeste hypothesen kunnen in twee variabelen worden
uitgedrukt; oorzaak en uitkomst. De variabele waarvan gedacht wordt dat het de oorzaak is, is de
onafhankelijke variabele. De uitkomst is de afhankelijke variabele, want de waarde van deze
variabele is afhankelijk van de oorzaak. Voor onderzoek wordt de onafhankelijke variabele door de
onderzoeker gemanipuleerd om verschillende uitkomsten te krijgen. Het is niet altijd mogelijk om de
onafhankelijke variabele te manipuleren (vb; is roken oorzaak van kanker). In deze gevallen wordt
gebruik gemaakt van correlatie methodes.
6.2 Levels of measurement
De relatie tussen wat gemeten wordt en de nummers die deze meting representeren wordt gezien
als het meetniveau. Zo zijn er categorische variabelen die bestaan uit categorieën. Het noemt twee
verschillende soorten dingen; man of vrouw. Dit zijn dichotome variabelen. Wanneer twee dingen
die in zekere zin gelijkwaardig zijn dezelfde naam krijgen, maar er meer dan twee mogelijkheden zijn,
is het een nominale variabele. Deze soort data kan alleen gebruikt worden voor het aangeven van
frequenties. Wanneer de categorieën een vaste volgorde hebben spreekt men van ordinale
variabelen. Het laat weten in welke volgorde dingen voorkomen, maar zegt niets over het verschil
tussen de waarden. Dit wordt gebruikt bij prestaties; eerste, tweede, derde. Continue variabelen
geeft een score aan en kan elke waarde aannemen. Zo is interval variabele een continue variabele.
Gelijke verschillen op de schaal berusten op gelijke verschillen wat betreft scores. De Likert-schaal is
hier een voorbeeld van. Ratio variabele gaat nog verder dan interval. Hierbij moeten de waarden van
metingen een betekenis hebben. De schaal moet een betekenisvolle nul hebben. Iemand met een
score van 4 is twee keer zo goed als iemand met een score van 2. Continue variabelen kunnen ook
discreet zijn. Er zijn dan maar een beperkt aantal waarden die de meting aan kan nemen. Je kunt dan
bijvoorbeeld alleen een score van 1, 2, 3 of 4 geven en niet 2,35. Er zit bij discrete variabelen dus een
limiet aan het aantal waarden dat aangenomen kan worden.
1.8 Analysing data
De laatste stap van een onderzoek is het analyseren van de verzamelde data.
1.8.1 Frequency distributions
Wanneer alle data verzameld is, is het zinvol om alles in een grafiek te plotten; frequentie verdeling
of histogram. Hierbij staan de variabelen op de horizontale as en de verticale as geeft aan hoe vaak
iets voorkwam. In een perfecte wereld zou de data symmetrisch verdeeld zijn waarbij de linker en
rechterkant van de histogram identiek zijn; normaal verdeeld. De histogram heeft dan de vorm van
een bel. De meerderheid van de scores ligt dan bij het centrum van de verdeling. Hoe verder je van
het midden af gaat, hoe lager de frequenties worden dus hoe lager de staven zijn. Een verdeling kan
op twee manieren afwijken van de normaal; skewness en kurtosis. Skewness is een scheef verdeelde
verdelingen. Deze is niet symmetrisch, de meest voorkomende score ligt dan niet in het midden,
deze liggen aan een kant. Het kan een positieve scheve verdeling (meeste waarden aan de linkerkant)
of een negatieve scheve verdeling (meeste waarden aan de rechterkant) zijn. Kurtosis geeft aan in
welke mate de scores aan de eindes van de distributie zitten en geeft de puntigheid van de verdeling
,aan. Een positieve kurtosis heeft veel scores in de staarten en is puntig; leptokurtic. Een verdeling
met een negatieve kurtosis heeft dunne staarten (weinig scores) en is platter dan normaal;
platykurtic. In een normale verdeling zijn de skewness en kurtosis nul.
1.8.2 The mode
Voor het berekenen van het centrum van een frequentie verdeling (; central tendency) kunnen drie
metingen gebruikt worden; mean (gemiddelde), mode en mediaan.
De modus is de score die het vaakst voorkomt in de data set. Dit is dus de hoogste staaf in de
histogram. Het nadeel van de modus is dat er meerdere waarden kunnen zijn met de hoogste score
(bij twee; bimodaal bij meer dan twee; multimodaal) of dat bij kleine verschillen metingen een grote
invloed hebben.
1.8.3 The median
Een andere manier voor het kwantificeren van het centrum van een distributie is de middelste score,
wanneer de scores oplopend gerangschikt zijn; de mediaan. Wanneer er een even aantal scores is, is
er geen middelste waarde. De twee middelste scores worden dan bij elkaar opgeteld en gedeeld
door 2. Dus bij tien scores tel je de scores van 5 en 6 bij elkaar op en deel je dit door 2. De mediaan
wordt minder beïnvloed door extreem hoge of lage scores of bij skewness. Het kan gebruikt worden
voor ordinaal, interval en ratio data.
1.8.4 The mean
Het gemiddelde berekenen je door alle scores bij elkaar op te tellen en te delen door het aantal
scores. Het gemiddelde wordt wel sterk beïnvloed door extreme waardes. Ook wordt het gemiddelde
beïnvloed door skewness en kan het alleen gebruikt worden bij data van interval of ratio meetniveau.
Een voordeel van het gemiddelde is dat het elke score gebruikt.
1.8.5 The dispersion in a distribution
De makkelijkste manier om de verdeling van de scores te bekijken is door de range. Hierbij trek je de
laagste score van de hoogste score af. Het nadeel is dat deze sterk beïnvloed wordt door extreme
scores. Om dit te voorkomen kan de interquartile range berekend worden. Dit doe je door de
mediaan van de 25% hoogste en laagste scores (upper quartile en lower quartile) van elkaar af te
trekken. Deze wordt dus niet beïnvloedt door extreme scores, maar je verliest er een hoop data mee.
Een andere manier waarbij wel alle data gebruikt wordt is het bekijken van hoe elke score afwijkt van
het gemiddelde van de verdeling; deviance. Omdat sommige waarde boven het gemiddelde liggen
en andere er onder, krijg je positieve en negatieve waarden. Door al deze waardes in het kwadraat te
doen, bij elkaar op te tellen en te delen door het aantal waardes min 1 krijgen we de variantie.
Wanneer je hier de wortel van neemt heb je de standaard deviatie. Dit zijn allemaal maten voor
spreiding rond het gemiddelde. Bij een kleine standaard deviatie liggen de data punten dus dicht bij
het gemiddelde. Datasets kunnen het zelfde gemiddelde hebben, maar een andere standaard
deviatie.
1.8.6 Using a frequency distribution to go beyond the data
Een andere manier om naar data te kijken is hoe waarschijnlijk het is dat een score voorkomt. Hoe
kleiner de staven zijn, hoe minder waarschijnlijk het is dat deze waarden optreden. De
waarschijnlijkheidsverdeling heeft een zelfde vorm als de frequentieverdeling, maar is meer afgerond
in ronde vormen. De oppervlakte onder de grafiek is 100%, er is een kans van 100% dat de gemeten
data in de grafiek valt. Om het makkelijker te maken gebruiken we een normaalverdeling met een
gemiddelde van 0 en een standaard deviatie van 1. Dit kan door alle data rond 0 te plaatsen (de score
van het gemiddelde aftrekken). Wanneer dit gedeeld wordt door de standaard deviatie heb je de z-
score.
, Hoofdstuk 2 The spine of statistics
2.4 Populations and samples
Onderzoekers zijn vaak geïnteresseerd in het vinden van resultaten die slaan op de hele populatie.
Maar de hele populatie is nooit beschikbaar om onderzoek te doen. Daarom wordt er een steekproef
genomen. Hoe groter deze is, hoe meer representatief hij is voor de gehele populatie. Meerdere
steekproeven geven verschillende resultaten, maar het gemiddelde is ongeveer hetzelfde.
2.5 P is for parameters
Statistische modellen bestaan uit variabelen en parameters. Parameters worden niet gemeten, maar
zijn constant en representeren fundamentele waarheden over de relaties tussen variabelen in een
model. Een aantal parameters zijn; gemiddelde, mediaan, correlatie en regressie coëfficiënten.
2.7 S is for standard error
Om meer te weten te komen over de data, moet je weten hoe representatief de steekproeven zijn
voor de populatie. De standaard deviatie verteld iets over hoe representatief het gemiddelde is voor
de steekproefdata. Maar we moeten ook weten hoe representatief dit is voor de populatie. Wanneer
we meerdere steekproeven van een populatie nemen hebben ze elk een verschillend gemiddelde. Dit
geeft de steekproef variatie weer. Wanneer we de gemiddelden van meerdere steekproeven als
frequenties plotten ontstaat de steekproevenverdeling. Het gemiddelde van de steekproeven komt
overeen met het gemiddelde van de populatie. Een steekproevenverdeling is dus te gebruiken voor
het bepalen hoe representatief een steekproef is voor de populatie. De standaard deviatie van het
steekproevengemiddelde is de standaard error (SE). Deze bereken je op dezelfde manier als de
standaard deviatie.
2.8 I is for (confidence) interval
Het gemiddelde verschilt per steekproef en we kunnen de standaard error gebruiken om een idee te
krijgen hoeveel deze van elkaar verschillen. Dit kan ook gebruikt worden voor het bereken van
grenzen waarin de verwachte populatie waarde zal vallen; betrouwbaarheidsinterval.
2.8.1 Calculating confidence intervals
Vaak wordt er gekeken naar een betrouwbaarheidsinterval van 95% en soms 99%, maar ze
betekenen allemaal hetzelfde; het zijn grenzen zodat, voor een bepaald percentage steekproeven, de
waarde van de populatie er binnen valt. Dit bereken je aan de hand van de kritieke waarde. Voor een
betrouwbaarheidsinterval van 95% kijk je in de kritieke waarde tabel bij 5% en het aantal
vrijheidsgraden. Dit pas je toe in de formule; CI =X ±(t k∗SE).
2.8.3 Calculating confidence intervals in small samples
In een kleinere steekproef gebruik je; CI =X ±(t n−1∗SE) . n-1 is de vergelijking voor het aantal
vrijheidsgraden en geeft weer welke t-verdeling gebruikt moet worden.
2.8.4 Showing confidence intervals visually
Betrouwbaarheidsintervallen worden vaak in grafieken weergegeven met error bars.