Samenvatting: SPSS versie 27 (HSLeiden jaar 1,
periode 2), uitwerking lessen en hoofdstukken
Basisboek Statistiek met SPSS 6e editie
SPSS
- Computerprogramma om data te analyseren, nodig bij het vak Attitudeonderzoek
- Onderzoeksresultaten analyseren
Per onderzoeksvraag geef je aan wat het meetniveau is van de betreffende variabelen. Bij de
onderzoeksvraag of er verschil is tussen mannen en vrouwen in de mate waarin zij zich als
gezond beoordelen, is het meetniveau van de betreffende variabelen namelijk anders (en
lager) dan het meetniveau van de variabelen in bijvoorbeeld de onderzoeksvraag of er een
samenhang is tussen geld en geluk. Bij de variabele geslacht zijn er maar twee categorieën of
waarden, namelijk ‘man’ en ‘vrouw’. Hierbij is alleen sprake van een verschil, maar niet van
meer of minder. Een man is anders dan een vrouw, maar niet meer of minder. Hetzelfde
geldt voor leefsituatie; iemand is gehuwd, samenwonend of alleenstaand.
Bij dit type antwoordmogelijkheden gaat het om een nominaal meetniveau.
Je kan wel bij gegevens die zijn gemeten op respectievelijk ordinaal, interval of rationiveau.
Bij gegevens op ordinaal meetniveau is er wel sprake van meer of minder, maar het verschil
tussen de categorieën is niet in een getal uit te drukken.
Bij interval- en ratiomeetniveau is dat verschil tussen categorieën in termen van meer of
minder wel in een getal uit te drukken. Bij het intervalmeetniveau is er alleen sprake van een
natuurlijk nulpunt, zoals wel het geval is bij gegevens die op ratiomeetniveau zijn gemeten,
bijvoorbeeld gewicht en lengte.
We onderscheiden verder continue en discrete variabelen. Bij continue variabelen kun je je
een lijn voorstellen waarop waarden een aaneengesloten rij punten vormen: een continuüm.
Tussen twee punten liggen altijd nog (oneindig veel) andere mogelijke waarden.
Voorbeelden van continue variabelen zijn de lengte van een persoon, leeftijd en intelligentie.
Variabelen die alleen hele waarden kunnen aannemen, noemen we discrete variabelen,
zoals het aantal auto’s dat iemand bezit of het aantal kinderen in een gezin.
Variabele View-scherm
De omschrijving bij ‘Name’ wordt onder meer gebruikt als kolomtitel in het databestand, het
is daarom handig dat die kort maar wel helder is.
Het ‘Label’ daarentegen staat als variabelennaam op de output, dan is het wel handig als de
naam wat uitgebreider is. De variabelennaam moet altijd beginnen met een letter en mag
geen spatie bevatten. Je kunt in plaats van een spatie een onderliggend streepje gebruiken.
‘Ident’ staat voor het casenummer. Nummer al je vragenlijsten of observatieformulieren
waarvan je de gegevens in SPSS wilt invoeren en voer dit nummer in bij bijvoorbeeld de
variabele ‘ident’. Als je een fout maakt bij het invoeren van de gegeven, weet je in welke
vragenlijst moet kijken, om het goede gegeven op te zoeken.
, Je gegevens kun je het beste numeriek, dus als cijfers, invoeren. Ook bij een variabele als
geslacht is het handiger om bijvoorbeeld een ‘1’ in te voeren als het gaat om een vrouw en
een ‘2’ als het om een man gaat. Dit betekent wel dat je bij ‘Values’ aangeeft dat ‘1’ voor
vrouw staat en ‘2’ voor man.
In sommige gevallen wil je liever geen getallen invoeren maar letters, die eventueel woorden
vormen. Dat is bijvoorbeeld het geval wanneer je namen wilt intypen. Je kiest dan voor het
type ‘String’ (dat wil zeggen tekst). Let er dan wel op dat je later bij het invoeren van de data
dan ook echt symbolen en/of woorden invoert en dat statische bewerkingen hiermee
moeilijk of niet uit te voeren zijn.
Werk daarom het liefst met numerieke variabelen en markeer dus bij voorkeur het type
‘Numeric’. Als je namen gaat invoeren, heb je waarschijnlijk meer dan acht posities nodig,
pas dit aan bij ‘Width”.
De decimalen staan standaard op 2. Je kunt het aantal decimalen gemakkelijk
veranderen. Wanneer je op de linkermuisknop klikt, krijg je het menuutje met .
Door hierop te klikken kun je de decimalen aanpassen. Als je dubbelklikt op het pijltje naar
beneden, zet de SPSS de waarde automatisch op nul. Je hoeft dat maar één keer te doen.
Door op de rechtermuisknop te klikken kun je copy en paste gebruiken om het resultaat ook
in de andere ‘Decimals’-cellen te plakken.
Naast het uitbreiden van de naam van een variabele kun je de waarden van een variabele
van een label voorzien. In plaats van een ‘1’ vermeldt SPSS dan ‘vrouw’, als je hebt
aangegeven dat ‘vrouw’ voor de waarde ‘1’ staat. Vergeet niet op ’Add’ te klikken, als je een
label hebt ingevoerd.
Codeer zo veel mogelijk in de lees- en schrijfrichting. Bij de vragen over geluk hebben we de
waarden van links naar rechts toegekend. Dit maakt het invoeren van de gegevens
gemakkelijk en voorkomt fouten.
Als er gegevens ontbreken, kun je het best een spatie typen. SPSS herkent die standaard als
‘Missing Value’ en noemt die ‘system missing values’. SPSS zet dan in de datamatrix in plaats
van een spatie een punt. Kijk dus niet raar op als je een punt tegenkomt. Die heb je er
inderdaad niet zelf gezet. Een voordeel van het gebruik van de spatie als system missing
value is, dat als iemand een hele vragenlijst niet heeft ingevuld, je niet allerlei missing value
codes hoeft in te voeren, maar de cellen die betrekking hebben op de vragenlijst gewoon
open kunt laten, wat werk bespaart. Een nadeel van het op deze manier benoemen van
ontbrekende gegevens, is dat er geen onderscheid wordt gemaakt tussen gegevens die
ontbreken omdat er geen antwoord is gegeven en het ontbreken van gegevens omdat de
vraag niet op de desbetreffende respondent van toepassing is.
Daarom is het soms nodig om ‘user missing values’ in te voeren. Je gebruikt dan bijvoorbeeld
een 9 als een antwoord ontbreekt en een 8 als de vraag niet van toepassing is. Wil je dat de
‘user missing values’ echt opvallen dan kun je beter 999 en 888 gebruiken. Vergeet in dat
geval niet aan de waarden 999 of 888 met ‘Values’ een label als ‘ontbrekend’ of ‘niet van
toepassing’ te hangen, anders weet je later misschien niet meer waar de waarden voor
staan.