ONLINE LEERPAD SPSS:
HOOFDSTUK 1:
1.1. De eerste keer SPSS: het ‘Welcome Dialog’-venster
Wanneer je SPSS opent, krijg je automatisch het ‘Welcome Dialog’-venster te zien. Dit
is een pop-upvenster waarmee je snel toegang krijgt tot een aantal functies. Zo kan je
bijvoorbeeld je laatst gebruikte bestanden meteen terug openen (‘Recent Files’). Is
SPSS bij de voorbije sessie gecrasht, dan kan je met wat geluk recovery-bestanden
terugvinden onder ‘Restore Points’. In het ‘Welcome Dialog’-venster vind je ook
rechtstreekse links naar online hulp en tutorials.
Indien je geen van deze functies meteen nodig hebt, dan kan je dit venster gewoon
sluiten. Als je links onderaan het venster de optie ‘Don’t show this dialog in the future’
aanvinkt, dan wordt dit venster in de toekomst niet meer getoond bij het opstarten
van SPSS.
1.2. Werkomgeving SPSS
1.3.1. Data editor
Een SPSS-dataset heeft steeds de extensie ‘.sav’. Wanneer SPSS is
geïnstalleerd op je computer, dan zal je zien dat je computer dit bestand
een SPSS-dataseticoontje geeft.
Wanneer je dit bestand opent door te dubbelklikken, openen de data meteen in het
Data Editor-venster van SPSS. In dit venster krijg je alle gegevens te zien die in je
dataset zitten. Dit beeld waarbij je de gegevens ziet staan, noemen we de Data View.
Je ziet onderaan dit scherm dan ook het knopje Data View actief staan.
,Dit Data Editor-venster doet sterk denken aan een werkblad zoals je dat kent van
bijvoorbeeld MS Excel. Het basisprincipe in deze Data Editor - Data View is dat de
analyse-eenheden (de ‘cases’), in dit geval de bevraagde personen, steeds
weergegeven worden in de rijen en de variabelen in de kolommen. In dit voorbeeld
staan dus alle bevraagde personen in het kader van de European Social Survey,
Ronde 9 in de rijen weergegeven, en de antwoorden die ze gaven op de gestelde
vragen staan in de vorm van variabelen in de kolommen. We zien bijvoorbeeld de
variabele idno die aan alle respondenten een uniek identificatienummer geeft, en de
variabele cntry die verwijst naar het land waar de respondent werd bevraagd. De
waarde AT op de variabele cntry voor de eerste cases verwijst in dit geval naar
Oostenrijk. Scrol gerust eens horizontaal door de kolommen om alle variabelen te zien
– dat zijn er 572 in totaal – en verticaal door de rijen om te zien hoeveel respondenten
in je dataset zitten – dat zijn er 49.519. De gegevens die je in deze Data Editor ziet,
kan je cel per cel bewerken. Door in een cel te klikken, kan je de inhoud ervan
aanpassen. Je zal verder in deze cursus echter zien dat dit niet de beste en meest
handige methode is om systematische veranderingen door te voeren.
De variabelen die bij de Data View in de kolommen staan hebben zelf ook
eigenschappen. Een variabele kan immers een datum bevatten, tekst bevatten, of net
numeriek zijn met een aantal decimalen, etc. Een variabele kan bovendien aangevuld
worden met een variable label, value labels en user missing values (zie hoofdstuk 2).
Om de eigenschappen van de variabelen in je dataset te zien en in te stellen kan je
onderaan de Data Editor omschakelen naar de Variable View.
Per variabele (in de rijen deze keer!) kan je een aantal eigenschappen definiëren:
Name
o Dit is de naam van de variabele. Deze moet uniek zijn in je dataset. De
variabelenaam moet ook voldoen aan bepaalde voorwaarden. Zo mag er
geen spatie in voorkomen, moet ze starten met een letter, mag ze geen
speciale tekens (zoals !, ?, ‘ en *) bevatten en uit maximaal 64 karakter
bestaan. SPSS is echter niet hoofdlettergevoelig. De variabelenamen
‘leeftijd’ en ‘LEEFTIJD’ zijn dus dezelfde. In heel wat datasets worden
variabelen gewoon genummerd. De variabelenamen zijn dan v1, v2, v3,
etc. In de European Social Survey gebruikt men als variabelenamen
afkortingen van de betekenis van de variabele. Zo drukt de variabele
cntry uit in welk land de respondent werd bevraagd, en de variabele gndr
het geslacht van de respondent.
Type
o Type bepaalt het soort variabele. De meest gebruikte types zijn
‘Numerical’ (getal), ‘String’ (tekst) en ‘Date’ (datum). Voor een aantal
bewerkingen en analyses is het cruciaal om hier het juiste type te
, selecteren. Merk op dat een string variabele het meest algemene soort
van variabele is. Een string variabele kan immers tekst, maar ook cijfers
bevatten, of een combinatie van beide, terwijl een numerieke variabele
enkel en alleen cijfers kan bevatten. Naar verdere verwerking en analyse
zal een numerieke variabele echter vaak de voorkeur genieten.
Width
o Deze eigenschap bepaalt hoe ‘breed’ je variabele is, uitgedrukt in het
aantal letters of cijfers. Een width van 8 wil bijvoorbeeld zeggen dat je
getal of tekst tot 8 tekens lang mag zijn. Voor tekstvariabelen (‘string’)
moet je vaak een voldoende grote width voorzien.
Decimals
o Deze eigenschap is enkel zinvol voor numerieke variabelen aangezien hier
het aantal decimalen uitgedrukt wordt dat door SPSS wordt weergegeven.
SPSS geeft standaard 2 decimalen weer. Deze instelling verwijst enkel
naar het aantal decimalen dat wordt weergegeven in de Data View. In
sommige situaties zal je merken dat SPSS meer decimalen heeft
opgeslagen dan het aantal decimalen dat wordt weergegeven.
Label
o Als aanvulling op de variabelenaam kan je ook een label toevoegen dat
een bredere beschrijving van de variabele toelaat. Het toevoegen van een
label behoort tot het documenteren van een variabele, en wordt verder in
hoofdstuk 2 uitgewerkt.
Values
o Deze optie voegt labels toe voor de categorieën van categorische
variabelen. Aangezien het toevoegen van value labels behoort tot het
documenteren van een variabele, werken we dit later in hoofdstuk 2
verder uit.
Missing
o Bij Missing definieer je de user missing waarden. Meer info in hoofdstuk 2.
Columns
o Bepaalt de breedte van de kolom van de variabele in de Data View-
weergave.
Align
o Bepaalt de uitlijning van de gegevens in de Data View-weergave.
Measure
o Geeft aan of de variabele een nominaal, ordinaal, of scale (interval of
ratio) meetniveau heeft. Het is belangrijk dit meetniveau correct in te
stellen voor iedere variabele. Indien je meetniveau fout is ingesteld kan
dat er soms toe leiden dat je analyses niet kan uitvoeren met een
bepaalde variabele.
Role
o Deze optie wordt gebruikt voor specifieke procedures rond automatische
analyses. Deze functie zullen we in het kader van deze cursus niet verder
uitwerken.
In veel bestaande datasets, zoals de European Social Survey, staan de kenmerken van
de variabelen al correct ingevuld. Enkel wanneer je zelf een nieuwe dataset aanmaakt
of nieuwe variabelen toevoegt aan een bestaande dataset, is het nodig deze
eigenschappen nog zelf correct in te stellen. Bij een bestaande dataset kan het soms
wel nuttig zijn om de eigenschappen van de variabelen te controleren op correctheid
en volledigheid.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller winderaymaekers4. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.60. You're not tied to anything after your purchase.