Samenvatting van de SPSS- syllabus van Beschrijvende Statistiek 2 en Toetsende Statistiek. Samenvatting bestaat uit theorie en werkwijze van SPSS. Uitleg is met output van SPSS.
Samenvatting en werkwijze SPSS Toetsende Statistiek
SPSS BS2
Benamingen van bestanden van SPSS
*.sav gegevensbestanden of databestanden
*.spv uitvoerbestanden of outputfiles
*.sps opdrachtbestanden of syntaxfiles
Bij het openen van SPSS krijg je een openingsvenster die uit het volgende bestaat:
Data view is bedoeld voor de weergave van de waarden op de verschillende variabelen
Variable view hier kun je aangeven welke variabelen je wilt gebruiken
Beschrijving begrippen kolommen:
Name variabele naam (casenummer, respondentnummer, kindnummer, etc.)
Type type variabele; numeriek, string, datum etc. en het aantal posities en aantal decimalen
voor de variabele. Voor categorische variabelen worden cijfercoderingen gebruikt voor de
verschillende categorieën.
Width geeft aan uit hoeveel karakters, incl. het aantal decimalen, de variabele bestaat
(standaard staat hier 8)
Decimals het aantal decimalen. Bij categorische en ordinale variabele meestal geen
decimalen. Bij kwantitatieve meestal 2 decimalen.
Label variabele label; geeft een uitgebreide beschrijving van de variabele dan de variable
name. Je kan hier ook de daadwerkelijke vraag van de vragenlijst teruglezen.
Values de waarden die een variabele kan aannemen en de labels hiervan. Bijv. sekse;
0=mannen en 1=vrouwen (dit wijzig je door op … te klikken op een regel onder values)
Missing speciale code voor ontbrekende waarde (…, 9, 99, 999 of leeg vak).
Columns voor kolombreedte en uitlijning in het spreadsheet. Als het aantal posities dat
voor een variabele is aangegeven bij Width groter is dan de kolombreedte wordt slecht een
gedeelde weergegeven.
Align geeft aan of links of rechts is uitgelijnd dan wel wordt gecentreerd in de spreadsheet
Measure het meetniveau van de variabele (staat op 4 meetschalen). Kan je wel veranderen,
afhankelijk van de instelling.
Statistische beschrijving van de data: frequentieverdeling, gemiddelde, standaarddeviatie, etc.)
Frequentieverdeling:
ANALYZE DESCRIPTIVE STATISTICS FREQUENCIES
Onder het knopje STATISTICS vind je:
Mean
Median
Standaarddeviatie
Range
Minimum
Maximum
Altijd aanvinken (sommige zijn echter alleen zinvol bij kwantitatieve variabelen).
Optie ‘display frequency tables’ kan je uitzetten, het geeft de percentage en cumulatieve
kans per meetniveau.
Onder het knopje CHARTS vind je:
Staafdiagram (bar charts)
Taartdiagram (pie chart)
Histogram hierbij heb je de optie ‘show normal curve on histogram’ dit is handig om de
kijken of de variabele in de steekproef normaal verdeeld is.
,Deel 2: samenhang en regressie
Samenhang tussen categorische variabelen.
Binomiale toets om de kans te berekenen op bijv. man/vrouw verdeling of extreme. Let op: kan
alleen bij dichotome variabelen.
ANALYZE NON PARAMETRIC TESTS LEGACY DIALOGS BINOMIAL
Test proportion is wat je verwacht; dat hangt af van de vraagstelling
Je kan dan bij exact tests alleen exact aanvinken tweezijdige kans; de kans op de gevonden
variabele of extremer staat onder Sig (p-waarde).
o Mocht je eenzijdig willen, dus bijv. alleen mannen en niet vrouwen en mannen, dan
deel je de p- waarde door 2.
Kruistabel:
ANALYZE DESCRIPTIVE STATISTICS CROSSTABS
(Sekse komt meestal in de rij te staan en de andere variabele in de kolom).
Vink de optie ‘Display clustered bar charts’ aan. Klik vervolgens op Cells en vink de optie Total aan,
onder Percentages.
Let op: als je het percentage per kolom wilt uitrekenen, hou rekening dat je niet door het totale deelt
tenzij anders gevraagd wordt.
Samenhang tussen kwantitatieve variabelen
Scatterplot: dient voor de eerste inspectie van de samenhang tussen twee kwantitatieve variabelen.
GRAPHS LEGACY DIALOGS SCATTER/DOT
Klik vervolgens op ‘Simple Scatter’
Klik dan op ‘Define’. De afhankelijke variabele komt op de y- as en de onafhankelijke
variabele op de x- as.
Om de data van een dot te weergeven:
Dubbelklik op het figuur je krijgt dan een ander scherm klik dan op het kopje
‘Elements’ show data label de nummers die verschijnen kan je dan koppelen aan de data
op in de data view.
Correlatie: geeft een preciezer beeld van de samenhang. Heeft echter alleen zin wanneer er sprake is
van een lineaire relatie. Daarom moet je eerst een scatterplot maken om dit bij benadering te
controleren.
ANALAYZE CORRELATE BIVARIATE
Hierbij kan je kiezen of je one- tailed (eenzijdig) of two- tailed (tweezijdig) wilt toetsen.
Enkelvoudige lineaire regressie
Regressieanalyse: de afhankelijke variabele ( ^y ) kunnen voorspellen op basis van de scores op een of
meerdere onafhankelijke variabelen ( ^y =a+bx ). Om te kijken of er sprake is van een lineair verband,
moet je eerst een scatterplot maken. Als het niet lineair zou zijn, dan moet je een andere analyse
gebruiken.
^y = voorspelde of geschatte van Y
a = intercept of constante
b = regressiecoëfficiënt
Regressielijn door de scatterplot laten tekenen:
Dubbelklik op de scatterplot je krijgt dan een ander scherm rechtermuisknop ‘add fit
line at total’.
, Vergelijking van de lijn achterhalen:
Naast dat de vergelijking verschijnt bij de scatterplot, kan je het ook anders verkrijgen, namelijk:
ANALYZE REGRESSION LINEAR
Je krijgt vervolgens een dialoogvenster, let hierbij goed op welke variabele je bij de dependent- kader
(y-as) en welke bij de independent(s)- kader (x-as) selecteert.
Je krijgt dan de volgende 4 tabellen te zien:
Deze eerste tabel laat zien welke variabelen zijn gebruikt in de regressieanalyse.
De tweede tabel geeft informatie over de regressieanalyse, namelijk:
R: de correlatie tussen de onahankelijke en de afhankelijke variabele (de zogenaamde
multipele correlatie, zie hieronder bij Toetsende Statistiek). Let op! Deze waarde is altijd
positief, ook als de correlatie tussen de afhankelijke en de onafhankelijke variabele negatief is.
R Square (gekwadrateerde R): geeft de proportie verklaarde variantie in Y door X weer. Hoe
groter deze waarde, hoe beter het regressiemodel past bij de gegevens. Je kan de proportie
verklaarde variantie verhogen door meer predictoren toe te voegen. Betekenis van de R Square
is volgens bovenstaand tabel dat 89% van het aantal zonvakanties (y) wordt verklaard door het
aantal zonuren (x).
Deze derde tabel geeft een variantie- analyse weer. Zie hieronder bij Toetsende Statistiek.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller grigius_h. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $4.82. You're not tied to anything after your purchase.