Samenvatting van de SPSS- syllabus van Beschrijvende Statistiek 2 en Toetsende Statistiek. Samenvatting bestaat uit theorie en werkwijze van SPSS. Uitleg is met output van SPSS.
Samenvatting en werkwijze SPSS Toetsende Statistiek
SPSS BS2
Benamingen van bestanden van SPSS
*.sav gegevensbestanden of databestanden
*.spv uitvoerbestanden of outputfiles
*.sps opdrachtbestanden of syntaxfiles
Bij het openen van SPSS krijg je een openingsvenster die uit het volgende bestaat:
Data view is bedoeld voor de weergave van de waarden op de verschillende variabelen
Variable view hier kun je aangeven welke variabelen je wilt gebruiken
Beschrijving begrippen kolommen:
Name variabele naam (casenummer, respondentnummer, kindnummer, etc.)
Type type variabele; numeriek, string, datum etc. en het aantal posities en aantal decimalen
voor de variabele. Voor categorische variabelen worden cijfercoderingen gebruikt voor de
verschillende categorieën.
Width geeft aan uit hoeveel karakters, incl. het aantal decimalen, de variabele bestaat
(standaard staat hier 8)
Decimals het aantal decimalen. Bij categorische en ordinale variabele meestal geen
decimalen. Bij kwantitatieve meestal 2 decimalen.
Label variabele label; geeft een uitgebreide beschrijving van de variabele dan de variable
name. Je kan hier ook de daadwerkelijke vraag van de vragenlijst teruglezen.
Values de waarden die een variabele kan aannemen en de labels hiervan. Bijv. sekse;
0=mannen en 1=vrouwen (dit wijzig je door op … te klikken op een regel onder values)
Missing speciale code voor ontbrekende waarde (…, 9, 99, 999 of leeg vak).
Columns voor kolombreedte en uitlijning in het spreadsheet. Als het aantal posities dat
voor een variabele is aangegeven bij Width groter is dan de kolombreedte wordt slecht een
gedeelde weergegeven.
Align geeft aan of links of rechts is uitgelijnd dan wel wordt gecentreerd in de spreadsheet
Measure het meetniveau van de variabele (staat op 4 meetschalen). Kan je wel veranderen,
afhankelijk van de instelling.
Statistische beschrijving van de data: frequentieverdeling, gemiddelde, standaarddeviatie, etc.)
Frequentieverdeling:
ANALYZE DESCRIPTIVE STATISTICS FREQUENCIES
Onder het knopje STATISTICS vind je:
Mean
Median
Standaarddeviatie
Range
Minimum
Maximum
Altijd aanvinken (sommige zijn echter alleen zinvol bij kwantitatieve variabelen).
Optie ‘display frequency tables’ kan je uitzetten, het geeft de percentage en cumulatieve
kans per meetniveau.
Onder het knopje CHARTS vind je:
Staafdiagram (bar charts)
Taartdiagram (pie chart)
Histogram hierbij heb je de optie ‘show normal curve on histogram’ dit is handig om de
kijken of de variabele in de steekproef normaal verdeeld is.
,Deel 2: samenhang en regressie
Samenhang tussen categorische variabelen.
Binomiale toets om de kans te berekenen op bijv. man/vrouw verdeling of extreme. Let op: kan
alleen bij dichotome variabelen.
ANALYZE NON PARAMETRIC TESTS LEGACY DIALOGS BINOMIAL
Test proportion is wat je verwacht; dat hangt af van de vraagstelling
Je kan dan bij exact tests alleen exact aanvinken tweezijdige kans; de kans op de gevonden
variabele of extremer staat onder Sig (p-waarde).
o Mocht je eenzijdig willen, dus bijv. alleen mannen en niet vrouwen en mannen, dan
deel je de p- waarde door 2.
Kruistabel:
ANALYZE DESCRIPTIVE STATISTICS CROSSTABS
(Sekse komt meestal in de rij te staan en de andere variabele in de kolom).
Vink de optie ‘Display clustered bar charts’ aan. Klik vervolgens op Cells en vink de optie Total aan,
onder Percentages.
Let op: als je het percentage per kolom wilt uitrekenen, hou rekening dat je niet door het totale deelt
tenzij anders gevraagd wordt.
Samenhang tussen kwantitatieve variabelen
Scatterplot: dient voor de eerste inspectie van de samenhang tussen twee kwantitatieve variabelen.
GRAPHS LEGACY DIALOGS SCATTER/DOT
Klik vervolgens op ‘Simple Scatter’
Klik dan op ‘Define’. De afhankelijke variabele komt op de y- as en de onafhankelijke
variabele op de x- as.
Om de data van een dot te weergeven:
Dubbelklik op het figuur je krijgt dan een ander scherm klik dan op het kopje
‘Elements’ show data label de nummers die verschijnen kan je dan koppelen aan de data
op in de data view.
Correlatie: geeft een preciezer beeld van de samenhang. Heeft echter alleen zin wanneer er sprake is
van een lineaire relatie. Daarom moet je eerst een scatterplot maken om dit bij benadering te
controleren.
ANALAYZE CORRELATE BIVARIATE
Hierbij kan je kiezen of je one- tailed (eenzijdig) of two- tailed (tweezijdig) wilt toetsen.
Enkelvoudige lineaire regressie
Regressieanalyse: de afhankelijke variabele ( ^y ) kunnen voorspellen op basis van de scores op een of
meerdere onafhankelijke variabelen ( ^y =a+bx ). Om te kijken of er sprake is van een lineair verband,
moet je eerst een scatterplot maken. Als het niet lineair zou zijn, dan moet je een andere analyse
gebruiken.
^y = voorspelde of geschatte van Y
a = intercept of constante
b = regressiecoëfficiënt
Regressielijn door de scatterplot laten tekenen:
Dubbelklik op de scatterplot je krijgt dan een ander scherm rechtermuisknop ‘add fit
line at total’.
, Vergelijking van de lijn achterhalen:
Naast dat de vergelijking verschijnt bij de scatterplot, kan je het ook anders verkrijgen, namelijk:
ANALYZE REGRESSION LINEAR
Je krijgt vervolgens een dialoogvenster, let hierbij goed op welke variabele je bij de dependent- kader
(y-as) en welke bij de independent(s)- kader (x-as) selecteert.
Je krijgt dan de volgende 4 tabellen te zien:
Deze eerste tabel laat zien welke variabelen zijn gebruikt in de regressieanalyse.
De tweede tabel geeft informatie over de regressieanalyse, namelijk:
R: de correlatie tussen de onahankelijke en de afhankelijke variabele (de zogenaamde
multipele correlatie, zie hieronder bij Toetsende Statistiek). Let op! Deze waarde is altijd
positief, ook als de correlatie tussen de afhankelijke en de onafhankelijke variabele negatief is.
R Square (gekwadrateerde R): geeft de proportie verklaarde variantie in Y door X weer. Hoe
groter deze waarde, hoe beter het regressiemodel past bij de gegevens. Je kan de proportie
verklaarde variantie verhogen door meer predictoren toe te voegen. Betekenis van de R Square
is volgens bovenstaand tabel dat 89% van het aantal zonvakanties (y) wordt verklaard door het
aantal zonuren (x).
Deze derde tabel geeft een variantie- analyse weer. Zie hieronder bij Toetsende Statistiek.
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper grigius_h. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €4,49. Je zit daarna nergens aan vast.