MTB 1
FREQUENCIES
Frequentie tabel (je ziet hier alleen aantallen en %(ook cumulatieve), geen statistische maten of gemiddelde)
Analyze - Descriptive statistics - Frequencies - variabelen kiezen
Taartdiagram (pie chart)/staafdiagram (bar start)/ histogram
Analyze - Descriptive statistics - Frequencies - Variabelen kiezen – charts – evt. Percentages aanvinken/ show
normal curve
Percentielen (kwartielen) om bijv interkwartiel afstand te berekenen (25, 50, 75)
Analyze – descriptive statistics – frequencies – variabele kiezen – statistics – quartiles
Dit kan simpeler via explore
(hier krijg je het gemiddelde van de variabele per percentiel)
In frequencies kan je bij statistics ook modus, mediaan (centrale tendentie maten) en quartiles aanvinken
Modus bij frequencies eruithalen. Mediaan en gemiddelde komen er ook bij explore uit
EXPLORE/ DESCRIPTIVES
Statistische maten (mean, median, variance, std. Devation, minimum, maximum, range, interquartile range),
stem-and-leaf plot, box-and-whikser plot, histogram (aanvinken bij plots)
Analyze - Descriptive statistics - Explore - variabele kiezen en invullen bij dependent list.
Als je een variabele invult bij factor list worden de resultaten voor deze variabelen uitgesplitst (bijv man/vrouw)
Kan ook via: Descriptives - options (hier alleen geen stem and leaf plot etc erbij)
(krijg je descriptives tabel)
Zien welke cases bijv uitbijters zijn
Analyze – descriptive statistics – explore – bij label cases by variabele invullen, zoals ID nummer van
onderzoekspersoon
vervolgens kan je in de boxplot uitschieters terug vinden met nmr.
Percentielen (5, 10, 25, 50, 75, 90, 95)
Analyze - descriptive statistics - explore - variabele kiezen - statistics- percentiles
(hier krijg je het gemiddelde van de variabele per percentiel)
Histogram en normality plots with tests
Analyze - Descriptive statistics - Explore - variabele kiezen - Plots - histogram en normality plots with tests,
show normal curve
Bij explore histogram normal curve erdoorheen= dubbel klikken op histogram, icoontje onderste rij
Person met missende waarde alleen voor die variabele en niet voor alle
Analayze – descriptive statistics – explore – options – pairwise deletion ipv listwise deletion
Wat SPSS hier doet, is elke proefpersoon, waarvoor één variabele mist in zijn geheel als ‘missing’ definiëren.
Kennelijk zijn er dus 33 proefpersonen, waarvoor één of meerdere variabelen missen. Alle andere
meetwaarden voor die persoon beschouwt het programma dus ook als ‘missing’, terwijl we daar toch in
werkelijkheid wel degelijk een waarde voor hebben. Dit wordt ‘listwise deletion’ genoemd. Wat wij hier willen
is ‘pairwise deletion’ ipv listwise deletion.
Standaardiseren/ z score
,Analyze- descriptive statistics – descriptives – kies variabele – vink onderaan save standardized values as
variables
Vervolgens krijg je een nieuwe descriptives tabel.
Je krijgt een nieuwe variabele z…Als je nu een histogram maakt met de nieuwe variabele dan is er sprake van
een standaardnormale verdeling i.p.v. een normale verdeling.
DATA
Data sorteren van laag naar hoog/andersom
Data -> sort cases - variabele kiezen - ascending/descending
Data stratificeren/ op/uitsplitsen
Data - Split file - Compare groups - variable kiezen
De optie “Compare groups” leidt tot tabellen waarin de resultaten per groep in één tabel bij elkaar staan, de
optie “Organize output by groups” geeft aparte tabellen per groep.
Alle analyses die je hier vervolgens na doet, zijn gesplitst in de categorieën van de variabele.
Variabelen met frequentie matchen:
Data- weight cases- weight cases by- variabele (frequentie) invullen
Analyses beperken (alleen bepaalde groepen meenemen)
Data – select cases – if condition is statisfied – if - In het nieuwe venster word je
gevraagd te specificeren wie je wilt includeren
Kijk hiervoor naar de categorisatie of eenheid van de variabele
In de data view kan je herkennen wie wel of niet is geïncludeerd (strepen door degene
die niet zijn geïncludeerd)
Opmerking: Je kunt alle mogelijke ‘condities’ combineren als je een filter aanmaakt. Nog twee voorbeelden:
1. Selectie op laag opgeleide respondenten die werken: EducLev=1 & Employ=1
De ‘&’ (of ‘AND’) geeft aan dat zowel de eerste als ook de tweede conditie van toepassing moeten zijn om
meegenomen te worden
2. Selectie op vrouwen die jonger zijn dan 30 en werken: (Agecat=1 | Agecat=2) &Employ=1
De ‘|’ (of ‘OR’) geeft aan dat of de eerste of de tweede conditie van toepassing moeten zijn (of jonger dan 25 of
tussen 25 en 30). Gecombineerd met & willen we uitdrukken dat naast deze conditie de vrouwen ook nog
moeten werken. De haakjes zijn hier van belang! Probeer het maar eens uit wat het verschil is.
/ Agecat= 1 OR Agecat=2, variabele blijven herhalen niet zeggen agecat 1OR2
Spatie tussen OR/ AND
Bij bovenstaande voorbeelden zijn de variabele al gecategoriseerd. Stel je wilt selecteren op leeftijd 16 tm 65
jaar (en deze variabele is niet gecategoriseerd) dan kan je gewoon invullen leeftijd>=16&leeftijd<=65
TRANSFORM
Categoriseren
Transform - compute variabele - vul target variabele in (de variabele die je wil categoriseren moet je een naam
geven, bijv gluc_cat) - vul bij numeric expression een categorisatie in, bijv een code -> if: vink aan include if
cases statisfied condition, daarna geef aan welke waarde bij de categorie hoort door naam desbetreffende
label/variabele in te vullen en daar de nieuwe waarde achter te zetten (per 1 op Ok klikken daarna volgende
doen)
Gelijk aan =
, Kleiner of gelijk aan <=
Groter of gelijk aan >=
Kleiner dan <
Groter dan >
Tussen: sglucn >= 6.1 & sglucn <= 6.9
(dit alles geldt ook voor het selecteren bij select cases!)
Vervolgens onder values deze nieuwe variabele ook categorisatie ook meegeven
Onder label kan je de variabele ook nog een naam meegeven.
Kan ook om een nieuwe variabele aan te maken bijv. wanneer lengte en gewicht gegeven zijn, nieuwe variabele
BMI en bij numeric expression formule BMI invullen: Weight /( Length * Length)
Of om afzonderlijke scores bij een te voegen, sumscore= Q1 + Q2 + Q3 + Q4 enzv
*= keer in SPSS
**= kwadraat in SPSS
Haakjes staan in SPSS ()
Kwartielen (N-tiles) maken
Indeling van een variabele maken o.b.v. de 4 kwartielen
Transform - Rank cases -> Variabelen invullen - rank types – Ntiles 4 aanvinken
Vervolgens frequentietabel opvragen
Er zijn nu dus twee nieuwe variabelen aangemaakt: het rangnummer per individu, en het kwartiel waartoe de
desbetreffende persoon in valt. Kies altijd voor percentile group of…
(Deze laat zien hoeveel personen (N) zich in welk kwartiel bevinden)
Logtransformeren (om een variabele normaal verdeeld te maken)
Transform – compute variabele – bij target variabele nieuwe naam invullen
(bijv LN_chol)- bij function group all, bij functions and special variables LN –
LN(?) voor vraagteken variabele invullen die je wilt logtransformeren
Als je vervolgens wilt kijken hoe het nu zit met de maten van de variabele
moet je wel de log versie pakken en niet de oude variabele
Een foutieve of missende waarden hercoderen naar de waarde
999/sysemmissing
Transform - recode into same variable – selecteer variabele waarin fout, zet
deze in numeric variables– klik op old and new values, vul de oude waarde in
bij old values en bij new values 999/systemmissing – klik op add – continue
Select cases: variabele <999 en alle missings zijn eruit.
CROSSTABS
Kruistabel (2 variabelen met elkaar vergelijken (kan alleen bij dichotome/categoriale variabelen. Niet bij
continue. Dan te veel waarden)
Analyze - descriptive statistics - crosstabs - rows (determinant) en column (uitkomst) invullen
Voor %: cells
Kies voor kolom als je wilt dat het gedeeld wordt door totaal van de kolom
Kies voor row als je wilt dat het gedeeld wordt door totaal van de rij
Kies voor total als je wilt dat het gedeeld wordt door het totaal van de studie
Odds ratio/ relatief risico
Analyze – descriptive statitics – crosstabs- variabelen invullen - statistics - optie risk
Kappa:
Analyze – descriptive statistics – crosstabs- variabelen invullen – statistics – optie kappa