Practicum 1:
Practicum 1
Dit document na afloop inleveren
Het maken en inleveren van de opdrachten is een voorwaarde om deel te mogen nemen aan het
tentamen. Deze practicumopdracht dient individueel en op de dag van het practicum of eerder te
worden ingeleverd. U mag de antwoorden per vraag toevoegen in dit document en het geheel
inleveren op Nestor.
Voorbereiding
- Slides van college 1
- Bekijken video over het invoeren van gegevens in SPSS (link: http://youtu.be/b163iBByycw)
- Bestuderen boek Andy Field, hoofdstuk 4
- Meenemen boek Andy Field naar practicum
1. Inleiding
In het afgelopen college heb je kennisgemaakt met de relevantie en beginselen van de statistiek
als onderdeel van het onderzoeksproces. Tijdens dit practicum ga je kennismaken met SPSS
door het invoeren, beschrijven, en exporteren van data. Maar eerst wat theorievragen.
1.1 Theorievragen
1.1.1 Geef voor onderstaande variabelen het meetniveau aan (onderstreep het juiste
antwoord):
- Lievelingskleur
Nominaal Ordinaal Interval Ratio
- Lichaamslengte in cm
Nominaal Ordinaal Interval Ratio
- Geboorteprovincie
Nominaal Ordinaal Interval Ratio
- Temperatuur in Celsius
Nominaal Ordinaal Interval Ratio
- Plek op de ranglijst
Nominaal Ordinaal Interval Ratio
1.1.2 Geef voor onderstaande vragen aan wat de afhankelijke variabele en
onafhankelijke variabele is:
a. Wat is de invloed van lichamelijk uithoudingsvermogen op de eindtijd van de vier
mijl in Groningen?
Onafhankelijk: 4 mijl
Afhankelijk: uithoudingsvermogen
1
, b. In hoeverre wordt de kans dat ik een hert spot op de Veluwe bepaald door de tijd
die ik op de Veluwe doorbreng?
Onafhankelijk: tijd op de Veluwe doorbrengen
Afhankelijk: kans dat je een hert spot
c. Wat is het effect van leeftijd op de lichaamslengte van mensen?
Onafhankelijk: lichaamslengte
Afhankelijk: leeftijd
d. Is er een verschil in fysiek vermogen, uitgedrukt in loopafstand (in meters) in één
minuut, tussen oudere mensen die vroeger fanatiek gesport hebben en oudere
mensen die geen sport beoefend hebben.
Onafhankelijk: oude mensen die vroeger fanatiek gesport hebben en die geen
sport beoefend hebben
Afhankelijk: fysiek vermogen uitgedrukt in loopsafstand in een minuut
1.1.3 Geef een voorbeeld van een statistische centrummaat en een spreidingsmaat
Centrummaat: de mediaan, modus en gemiddelde
Spreidingsmaat: de spreidingsbreedte, de grootste waarneming en de kleinste
waarneming.
2. Kennismaken met SPSS
Op pagina 5 staan in een tabel de resultaten van een (fictief) onderzoek onder werknemers van een
groot elektronicabedrijf naar de test-hertest betrouwbaarheid van een handvaardigheidstest. Gebruik
deze gegevens in het vervolg van dit practicum.
A. In onderstaand schema staan de variabelen uit de eerdergenoemde tabel. Geef per variabele aan
onder welke type variabele en welk meetniveau deze valt:
Variabele Categorisch/continu Nominaal/ordinaal/interval/ratio
Naam Categorisch Nominaal
Leeftijd (in jaren) Continu Ratio
Geslacht categorisch Nominaal
Gewicht (in kg) Continu Interval
Lengte (in m) Continu Ratio
Hoogst voltooide opleiding Categorisch Nominaal
Hobby’s Categorisch Nominaal
Score test meting 1 (in sec) Continu Ratio
Score test meting 2 (in sec) Continu Ratio
2
,B. ‘Leeftijd’ wordt beschouwd als een continue variabele, omdat het in principe elke waarde kan
aannemen. Leg in je eigen woorden uit waarom ‘Leeftijd in jaren’ beschouwd kan worden als een
discrete variabele.
Omdat de leeftijd een beperkt aantal jaren heeft als mogelijke uitkomsten. Je kan niet jonger dan 0 zijn
maar het is bijvoorbeeld ook onmogelijk om 200 jaar te bereiken.
C. Open SPSS (versie 26) en begin met een leeg databestand. Alvorens je de data uit de tabel invoert,
maak je eerst de verschillende variabelen aan en definieer je alle bijbehorende karakteristieken. Per
variabele geef je de naam, het type (numeriek of tekst), de labels, de codering voor missende waarden
en het meetniveau in de ‘Variable View’ van SPSS.
I. Geef value labels op voor de gebruikte coderingen (vb. voor de variabele Geslacht: 1 = man,
2 = vrouw).
II. Ken aan missing values een waarde toe die niet mogelijk is als score op de variabele zelf.
(vb. als men op een test een score kan halen van 0-20, moet de waarde voor een ‘missing
value’ hierbuiten liggen, bijvoorbeeld ‘999’.)
III. Maak voor iedere hobby een eigen dichotome variabele aan en codeer met 1=ja, 0=nee.
D. Ga naar ‘Data View’ en vul de variabelen met de gegevens uit de tabel. Gebruik voor een missende
waarde de waarde zoals je die eerder in de ‘Variable View’ hebt gedefinieerd.
E. Sla het bestand op als een .sav-bestand (dit is de standaard ingestelde bestandsextensie)
Grafieken en frequentietabellen zijn een goede manier om je data te bestuderen voordat je de data
daadwerkelijk gaat analyseren. Je spoort bijvoorbeeld makkelijk een uitschieter (outlier) op.
F. Wat staat er op de x- en y-as van een histogram? Laat zien dat je dit weet door voor onderstaande
variabelen aan te geven wat er op de assen zal staan:
Geslacht x-as: man/vrouw y-as: Hoeveel mannen en vrouwen
Leeftijd x-as: leeftijd 1 t/m 99 y-as: Hoeveel personen die
leeftijd
G. Voor welke van de variabelen in je databestand is het niet zinvol om een histogram te maken om te
bepalen of de variabele normaal verdeeld is en waarom?
Voor de naam aangezien dit voor iedereen anders is en niet iets over het onderzoek zegt.
Maak voor alle variabelen een frequentietabel aan (Analyze > Descriptive Statistics > Frequencies). Je
zult zien dat de uitvoer (output) in een ander venster wordt weergegeven. Controleer de tabellen en
herstel, indien het geval, een onmogelijke waarde die duidt op een typefout. Creëer dan een nieuwe
frequentietabel. Probeer ook eens een histogram te maken.
3
, H. Heb je fouten hersteld? Zo ja, voor welke variabelen?
Ik had geen fouten gemaakt.
I. Sla de uitvoer op als een .spv bestand. Verwijder eventueel eerst foutieve uitvoer (rechtermuisklik op
het uitvoerblok > Delete).
J. Bereken voor de variabelen Leeftijd, Lengte, Gewicht, en Score testmeting 1 en 2 het gemiddelde en
de standaarddeviatie (Analyze > Descriptive Statistics > Frequencies). Binnen Frequencies kun je
onder de optie Statistics de gewenste maten aankruisen. Er hoeven niet nogmaals frequentietabellen
te worden afgedrukt. Vul de onderstaande tabel in.
Gemiddelde Standaarddeviatie
Leeftijd (in jaren) 31,07 10,042
Lengte (in m) 1,7854 0,11348
Gewicht (in kg) 72,369 14,1803
Score testmeting 1 (in sec) 52,3786 84,98015
Score testmeting 2 (in sec) 28,9864 6,04578
K. Wat valt je op als je naar het gemiddelde en de standaarddeviatie kijkt van de handvaardigheid
testscores gemeten tijdens de voormeting (meting 1) en nameting (meting 2)?
Die verschillen enorm.
L. We willen graag weten of het geslacht van invloed is op de handvaardigheidstest tijdens de
voormeting o.b.v. het gemiddelde. Kies daartoe Analyze > Compare Means > Means. Welke variabele
voeg je toe aan de ‘Dependent List’ (afhankelijke variabele) en welke aan de ‘Independent List’? Zijn
de mannen of de vrouwen sneller? Vermeld de gevonden waarden:
Afhankelijk = eerste score en onafhankelijk = man of vrouw Het gemiddelde van de vrouwen is hoger
Vrouwen = 78,3133 en mannen = 32,9275
_________________________________________________________________________________
_________________________________________________________________________
Later in de cursus zullen we gaan toetsen of zo’n verschil nu groter is dan we op basis van toeval
zouden mogen verwachten. Pas na zo’n statistische toets kunnen we spreken van een significant
verschil.
M. Wie zijn er sneller op de voormeting, de deelnemers die handwerken als hobby hebben of de
deelnemers die dit niet als hobby hebben? Gebruik de methode bij stap i en vermeld de gevonden
waarden:
De deelnemers die handewerken niet als hobby heb ben.
Wel als hobby: 24,2125
4