SPSS bij Epidemiologie
& Biostatistiek II
Gezondheidswetenschappen, jaar 2 (ook Methodologie II G&L)
Inhoud
I: Standaard SPSS functies ................................................................................................................................................................... 1
Analyseren van variabelen ............................................................................................................................................................. 1
Het splitsen in groepen (bij bijvoorbeeld onderzoeken van confounding/effectmodificatie) ....................................................... 1
Het maken van nieuwe variabelen ................................................................................................................................................. 1
Het verwijderen van missende/vreemde waarden ........................................................................................................................ 2
II: Diagnostiek ..................................................................................................................................................................................... 2
Het meten van diagnostische tests ................................................................................................................................................ 2
III: Normale verdeling ......................................................................................................................................................................... 2
IV: De analyse van continue uitkomstvariabelen ................................................................................................................................ 2
T-toetsen ........................................................................................................................................................................................ 2
Scheve verdeling ............................................................................................................................................................................. 3
Variantieanalyse: ANOVA ............................................................................................................................................................... 3
Variantieanalyse: lineaire regressieanalyse ................................................................................................................................... 4
Aannames bij lineaire regressieanalyse (en ANOVA) ..................................................................................................................... 5
Confounding ................................................................................................................................................................................... 5
Effectmodificatie ............................................................................................................................................................................ 5
V: De analyse van dichotome uitkomstvariabelen.............................................................................................................................. 5
Chi-kwadraattoets .......................................................................................................................................................................... 5
Logistische regressieanalyse ........................................................................................................................................................... 6
Schatting bij logistische regressieanalyse ....................................................................................................................................... 6
Confounding en effectmodificatie .................................................................................................................................................. 7
VI: De analyse van overlevingsdata (survivaldata) .............................................................................................................................. 7
Overlevingscurves (Kaplan-Meier) ................................................................................................................................................. 7
Cox-regressieanalyse ...................................................................................................................................................................... 8
VII: Multiple regressieanalyse: associatiemodellen en predictiemodellen ........................................................................................ 8
Predictiemodellen .......................................................................................................................................................................... 9
Effectmodificatie: a priori stratificeren .......................................................................................................................................... 9
Kwaliteit van predictiemodellen ..................................................................................................................................................... 9
Validatie van predictiemodellen................................................................................................................................................... 10
,I: Standaard SPSS functies
Analyseren van variabelen
• ‘Variable view’ geeft een overzicht van de variabelen in het bestand, hier kan je ook zien of het gaat om een
categoriale, dichotome of continue variabele en hoe dit is gecodeerd
• Analyze → Descriptive statistics → Frequencies
o Het handigst voor dichotome/categoriale variabelen (omdat de frequentie van een waarde wordt
gegeven), maar dit kan ook voor continue variabelen (lange lijst met frequenties, want bij continue
variabelen zijn er veel meer waarden mogelijk)
o Hier kan je gemiddelde, mediaan, kwartielen, standaarddeviatie, minimum, maximum, etc.
verkrijgen
o Ook kan je verschillende grafieken krijgen: pie charts, bar charts en histogrammen
• Analyze → Descriptive statistics → Descriptives
o Deze is het handigst voor continue variabelen, maar nogmaals is elke soort variabele te gebruiken
o Ook hier kan je gemiddelde, standaarddeviatie, minimum en maximum verkrijgen
• Analyze → Descriptive statistics → Explore
o Dependent list = uitkomst
o Factor list = determinant
o Label cases by = voor stratificeren (bijvoorbeeld naar geslacht)
o Hier kan je statistische gegevens krijgen (gemiddelde, mediaan, etc.), maar ook grafieken (stem-and-
leaf en histogram)
o Het geeft een tabel van de determinant en de uitkomst, hierbij moet de determinant wel een
dichotome/categoriale variabele zijn (anders zijn er teveel waarden van de determinant) en de
uitkomst een continue variabele (want er wordt gebruik gemaakt van de waarden)
• Analyze → Descriptive statistics → Crosstabs
o Tabel maken van verschillende variabelen
▪ Vaak zet je in de ‘Row(s)’ de determinant(en) en in de ‘Column(s)’ de uitkomst(en)
• Gebruik dichotome/categoriale variabelen
▪ Statistics → Chi-Square (chikwadraatverdeling (volgt nog)), Risk (odds ratio’s en relatieve
risico’s), Cochran’s and Mantel-Haenszel statistics (gewogen odds ratio verkrijgen bij
stratificatie voor confounding)
▪ Cells → Counts (observed & expected), Percentages (Row, Column, Total)
• Analyze → Compare Means → Means
o Dependent list = uitkomst
o Independent list = determinant
o Goed om te gebruiken bij een continue uitkomstvariabele en een dichotome/categoriale
determinant
o Geeft opnieuw een tabel
o Statistics → aanvinken welke statistische gegevens je wilt hebben
Het splitsen in groepen (bij bijvoorbeeld onderzoeken van confounding/effectmodificatie)
• Data → Split File
o Meestal gebruik je dan ‘Compare Groups’ en zet je de gewenste groep neer bij ‘Groups Based on’
o Let op dat je split file weer moet uitzetten (via ‘Reset’) als je het niet meer in groepen wilt
Het maken van nieuwe variabelen
• Transform → Compute Variabele
o Geef hier een naam op van je nieuwe variabele en hoe deze berekend wordt
• Transform → Recode into Different Variables
o Hier kan je van een al bestaande variabele een nieuwe maken, bijvoorbeeld bij het dichotomiseren
van een continue variabele of het indelen in groepen
o Klik de variabele aan die je wilt gebruiken en geef een nieuwe naam, bij ‘Old and New Values’ kan je
de waarden geven die verandert moeten worden
▪ Bijvoorbeeld 0 thru 10 = 0
1
, Het verwijderen van missende/vreemde waarden
• Transform → Recode into Same Variables
o Klik de gewenste variabele aan waar de missende/vreemde waarden in zitten
o ‘Old and New Values’
▪ Geef de waarden/range van waarden en vink deze aan als ‘System-missing’
▪ Ook kan je deze waarden bijvoorbeeld allemaal de waarde ‘999’ geven en dan bij ‘Variable
View’ 999 neerzetten in de kolom ‘Missing’
II: Diagnostiek
Het meten van diagnostische tests
Sensitiviteit P(T+|Z+): hoeveel procent van de personen met de ziekte wordt door de test ook als ziek bestempeld
(positieve testuitslag)?
Specificiteit P(T-|Z-): hoeveel procent van de personen zonder de ziekte wordt door de test ook als niet-ziek
bestempeld (negatieve testuitslag)?
Positief voorspellende waarde P(Z+|T+): hoeveel procent van de personen met een positieve testuitslag zijn ook
daadwerkelijk ziek?
Negatief voorspellende waarde P(Z-|T-): hoeveel procent van de personen met een negatieve testuitslag zijn ook
daadwerkelijk niet ziek?
• In SPSS: maak een tabel via crosstabs → bij Rows zet je de diagnostische test en bij Columns zet je de
gouden standaard
o Vervolgens kan je zelf de sensitiviteit, specificiteit, PVW en NVW berekenen, of je vinkt bij Cells de
percentages aan (let wel op dat je de juiste aanvinkt)
III: Normale verdeling
Alle statistische technieken die gebruikt worden voor het analyseren van continue uitkomstvariabelen gaan ervan uit
dat de betreffende variabele ongeveer normaal verdeeld is. Bij een perfecte normale verdeling is de mediaan gelijk
aan het gemiddelde (als het gemiddelde groter is dan de mediaan, is er sprake van een scheef-rechtse verdeling).
Voor de breedte van de berg geldt dat die bij een perfecte normale verdeling 95% van de observaties ligt tussen het
gemiddelde plus of min tweemaal de standaarddeviaties (deze eigenschap kunnen we alleen testen als we te maken
hebben met een variabele die alleen maar positieve waarden kan hebben).
• In SPSS checken of er sprake is van een normale verdeling:
o Observeren van het histogram (kan via Frequencies → vink ook aan ‘Show normal curve’)
o Vergelijken van het gemiddelde en de mediaan
o Vergelijken van het gemiddelde en de standaarddeviatie
Het gemiddelde en de standaarddeviatie kunnen alleen maar gerapporteerd worden als er sprake is van een
normale verdeling, anders kies je voor de mediaan en het 25ste en 75ste percentielpunt.
IV: De analyse van continue uitkomstvariabelen
T-toetsen
Hier gebruiken we een t-verdeling, omdat een normale verdeling alleen gebruikt kan worden wanneer we de
standaarddeviatie van de doelpopulatie kennen (deze kennen we meestal niet). De t-verdeling is iets breder dan de
normale verdeling. Er zijn verschillende t-verdelingen, afhankelijk van het aantal vrijheidsgraden (n – 1). Bij continue
uitkomstvariabelen is er altijd de voorwaarde dat deze bij een normale verdeling moet passen.
• Onderzoeken of de gemiddelde waarde van een onderzoekspopulatie afwijkt van een bepaalde
standaardwaarde in SPSS: Analyze → Compare Means → One-Sample T Test
o Vul de ‘Test Variable’ en de ‘Test Value’ in (meestal gebruiken we de standaard 95%
betrouwbaarheid, deze staat al standaard ingevuld onder ‘Options’)
o Je krijgt de T-waarde, vrijheidsgraden, P-waarde (tweezijdig), het gemiddelde verschil en het 95%-BI
▪ Betekenis p-waarde: Als de nulhypothese (er is geen verschil) waar is, dan is de kans op het
vinden van deze waarden of extremer …%
▪ Betekenis 95%-BI: Als dit onderzoek eindeloos herhaald wordt, zal 95% van de
betrouwbaarheidsintervallen de ‘werkelijke’ waarde bevatten
2