Werkgroepen Statistiek A
Week 1
WG1: SPSS
Toelichting
In het eerste computerpracticum gaat de student zelfstandig aan het werk met SPSS.
Onderwerpen die aan bod komen zijn: het hercoderen van bestaande variabelen en het
construeren van nieuwe variabelen.
Leerdoelen
Kan de drie tabbladen in SPSS benoemen en kent de functie van deze tabbladen.
Kan nieuwe variabelen construeren.
Kan frequentietabellen maken in SPSS en deze interpreteren.
Kan kruistabellen maken in SPSS en deze interpreteren.
Literatuur
SPSS reader
WG1;
o Onafhankelijke variabele (exposure variabele) = rij-variabele
o Afhankelijke variabele (outcome variabele) = kolom-variabele
Data view= komen al je gegevens te staan, is dus je ruwe data. (Kan handmatig of via Excel
knippen/plakken).
Elke rij correspondeert met één persoon.
Variabele view= voer je je variabelen in en daar staan de eigenschappen van de variabelen.
Elke rij correspondeert met 1 variabele en de eigenschappen staat in deze rij.
- Name: Naam variabele
- Type: Numeriek (bv geslacht cijfer 1 en 2)
- Width: Hoe groot je antwoord mag zijn
- Decimalen: Achter de komma
- Label: Vul je de vraag in
- Values: Wat betekenen je waarden (bv cijfer 1 is man en 2 is vrouw of 1=rood
2=blond 3=bruin)
- Missing: /
- Columns: /
- Align: Wil je rechts/links je output
- Measure: nominaal/ordinaal/interval/ratio=scale
- Role
Colleratie= Hoe hangen 2 variabele op scale-level (dus ratio) met elkaar samen. (bv heeft
lengte een voorspellende waarde op iemands gewicht?
Scale= Meetniveau interval of ratio, bedenk zelf of het een absoluut nulpunt heeft en dus
interval of ratio is.
, Analyse Descriptive statistics
* Frequencies (frequentietabel)
o Statistics
- Mean (gemiddelde), median (mediaan =middelste), Mode (modus =vaakst voorkomt)
- Quartilies (kwartielen bv 1/4, 2/4, 3/4), percentilles (percentages)
- Std. Deviation (standaardafwijking), minimum, maximum, s.e. mean
o Charts
- Bar charts (staafdiagram), pie charts (cirkeldiagram), histogram
- Frequencies, percentages
* Descriptives
o Options
- Mean (gemiddelde)
- Std. Deviation (standaardafwijking), variance, range, minimum, maximum, s.e. mean
* Crosstabs (kruistabel)
Bij een kruistabel maak je gebruik van de variabele ‘in klassen’ dus bv leeftijd in
klassen
o Cells
- Counts: observed (als er alleen wordt gevraagd naar de frequencies per cel),
expected
- Percentages: row (als je de rijen wilt optellen tot 100%), column, total
Wat voor type waarde is de variabele hight? (=numerieke waarde)
Wat zijn de waarden van de variabele sex? (value 1 is jongen en value 2 meisje)
Maak een frequentietabel, hoeveel % is 8 jaar? Hoeveel % heeft respiratoire
problemen gehad? Wat is gemiddelde en standaardafwijking van variabele FEV1?
Analyse Descreptive statistics Frequencies
48% is 8 jaar
Het gemiddelde is 1,59 liter en de standaardafwijking is 0,30.
Maak een cumulatie frequentieverdeling van de variabele FEV1. Hoeveel % van de
kinderen heeft respiratoire problemen gehad in de afgelopen 12 maanden?
Graphs Legacy Dialogs Line Simple, summaries for groups of cases. Line
presents: cum% of cases. Category axis: FEV1.
, 22,8%
Bepaal de mediaan exact. Bepaal het derde kwartiel en het 36e percentiel
Analyse Descreptive statistics Frequencies
Kwartiel aanvinken en kijk bij 3e kwartiel. Of percentiel aanvinken en vul 75 in.
Let op: Vink de optie ‘display frequency tables’ uit, anders krijg je er een grote
frequentietabel bij.
Mediaan= 1,58
75e percentiel= 1,79
36e percentiel= 1,49
Bepaal het kleinste en grootste volume?
Analyse Descriptive statistics Frequencies OF Descriptive
Minimum= 0,64
Maximum= 2,69
, Maak een kruistabel van leeftijd en geslacht en laat rijen optellen tot 100%?
Kolommen optellen tot 100%? Absoluut meer meisjes van 8 jaar of jongens?
Analyse Descriptive statistics Crosstabs
Bij cells percentage rijen of kolommen aanzetten. Absolute aantallen staan ook in
kruistabel.
Er zijn 156 meisjes en 149 jongens.
Absoluut gezien zijn er 7 meisjes meer
dan jongens.
1
Hoeveel procent is binnen de groep meisjes 8 jaar? En binnen de groep jongens?
= Voorwaardelijke kans (uitgelegd in HC2 en WG3)
Deze kans bereken je door het aantal meisjes van 8 jaar / totaal aantal meisjes.
Wanneer je geslacht als kolomvariabele hebt gekozen, moet je dus kolommen op
laten tellen tot 100 (zie plaatje hieronder =2). Doordat je de kolommen (met het
variabele geslacht) laat optellen, heeft SPSS de betreffende voorwaardelijke kans al
voor je uitgerekend. Het blijkt dat 46,6% 8 jaar oud is.
Bij jongens doe je hetzelfde, alleen kijk je bij de kolom ‘male’. Deze voorwaardelijke
kans bedraagt 48,5%.
Wanneer je geslacht als rijvariabele hebt gekozen, moet je de rijen op laten tellen tot
100% (zie plaatje hierboven = 1).
2
, Wat is het percentage jongens binnen de groep 10-jarigen?
= Voorwaardelijke kans
Hier is gegeven dat het kind 10 jaar is en wil je de kans op een jongen weet.
Het aantal jongens van 10 jaar / het aantal 10-jarige.
Wanneer je leeftijd als rijvariabele hebt, betekent het dat je nu de rijpercentages tot
100% moet laten optellen (plaatje 1). SPSS heeft de voorwaardelijke kansen al
uitgerekend, het blijkt dat 42,6% binnen groep 10-jarigen een jongen is.
Wanneer je leeftijd als kolomvariabele hebt opgenomen, betekent het dat je nu de
kolompercentages tot 100% moet laten optellen (plaatje 2).
Transform Recode into different variables Kies numeric variable
Input variabele: Cl_heigh Name naar output variabele bv name: cat_h & label:
cat_height_3 Druk op change (ouder variabele wordt gehercodeerd in nieuwe
variabele)
* Old and New Values
Old:
- Value (nummer) …
- Range: … through …
- Range, lowest through value …
- Range, value through highest
New:
- Value (nummer) …
Maak drie nieuwe categorieën 1, 2 en 3 voor cl_heigh door 1 en 2 samen te voegen
tot categorie 1, 3 tot categorie 2 en 4 en 5 tot categorie 3.
Transform Recode into different variables cl_heigh Old and New Values
1 through 2 = 1, 3 = 2, 4 thru 5 = 3.
Definieer in het tabblad variabele view de nieuwe klassengrenzen van de lengte als
value labels voor de 3 nieuwe categorieën.
Variable view Values Value: 1 & label: 100-119,2, Value: 2 & label: 120-
129,9, Value: 3 & label: 130-149,9
Of via de syntax. Twee extra commando’s:
Met variable level geef je het meetniveau aan (nominal, ordinal, scale)
Met alter type geef je aan de Width en Decimals: F4.0 betekent width=4 en
decimals=0
VARIABLE LABELS cat_heigh 'cat_height_3'.
VALUE LABELS cat_h ‘1’ ‘100-119,2’ ‘2’ ‘120-129,9’ ‘3’ ‘130-149,9’.
VARIABLE LEVEL cat_h (ordinal).
ALTER TYPE cat_h (F4.0).
, Maak een nieuwe variabele BMI. Dit is het gewicht in kilo’s gedeeld door de lengte in
het kwadraat in meters.
Fout: Transform Recode into different variables
Goed: Transform Compute variable Tarbet variable: BMI = Numeric
Expression: weight/(height/100)**2
Bereken de gemiddelde BMI
Analyse Descreptive statistics Descriptives Variabele BMI Options
Mean
Gemiddelde is 17,68
Bereken de gemiddelde BMI voor jongens en meisjes apart
Split file Compare groups Groups based on: Sex Paste
Dus het gemiddelde van jongens is 17,60 en meisjes 17,75.