Dit document werd opgesteld aan de hand van de slides en mijn lesnotities. Het document bevat ook alles wat voor de zelfstudie gekend moet zijn + aan het einde van het document werden enkele examenvragen die in 2021 werden gesteld, toegevoegd.
Op het examen komen theorievragen, maar er gaat vooral gepeild worden naar inzichten
Sociaal economisch verhaal opbouwen rond de belangrijkste cijfers van de output
Opbouw vak
o Introductie sas
o Structurele vergelijkingsmodellen
o Multilevelmodellen
Zelfstudiepakket = ook te kennen
Cursusmateriaal
o Handboek SAD in onderzoek Mortelmans, D. (2016) → Acco
o Cursusbundel met eigen teksetn → Universitas
Examen
o Mondeling examen
o Theoretische kennis over de technieken
▪ 3: 1 sas, 2 longituale analaye
▪ Je moet voor het examen 2 analyses zelf voorbereiden (2 modellen)
▪ 1 ongeziene output (tegengestelde van dat je al hebt kunnen voorbereiden)
o De vraag over SEM en multilevel wegen het hardste door, maar wel evenveel en de
andere 2 vragen iets minder (theorie zelfstudie en SAS)
Zelfgemaakte analyse in SAS
o Syntax
o Output
o Je moet op het examen een verhaal kunnen maken van wat er uit die cijfers komt
o Tijdens die uitleg gaan er ook nog theorievragen gesteld worden
Deadline
o Maandag 4 januari 17 uur
o Zelfgemaakte analyse moet elektronisch ingeleverd worden
o Niet inleveren, is geen examen
De oefeningen van de wc’s sluiten aan bij de instructies van het examen
o De oefeningen wekelijks maken = belangrijk!
1
,Leren werken met SAS
We gaan van start
Met Fn F4 kan je een nieuw programma starten (leegmaken wat er bij program stond)
Wanneer je hier (→) automatically open generated output
data uitvinkt doe je dit, omdat sommige bestanden heel groot
zijn en het dan veel tijd in beslag neemt om deze te openen
De proc freq code maakt tabellen aan
o Tables age; : we willen een tabel van age
o Lopend mannetje om het uit te voeren
LOG om na te kijken of er errors zijn
PROC SGPLOT wordt gebruikt om een grafiek te maken
sg= sas grapf
vbar = staafdiagram (v staat voor verticale staafdiagram; een horizontale bestaat ook)
Data bestanden
In sas moet je altijd verwijzen naar een databestand en op het moment dat je ernaar verwijst
in een code zal sas het bestand zelf openen
Maak altijd een tijdelijke kopie van een bestand als je er in werkt
Bestanden die ‘open’ staan in het programma kunnen niet gewijzigd worden
Drie soorten SAS-bestanden:
o .sas = SAS-programma’s
o .sas7bdat = DATA in SAS-formaat
o .sas7bcat = SAS-cataloogbestanden
Als je iets op uw computer opslaagt in de C schijf onder uw map MYFOLDERS, kan je het ook
bij SAS daar vinden
Wanneer een bestand geopend is → klik een variabele aan om de eigenschappen te zien
Aanroepen van sas data
Dit doen we via data =
o Hier wordt het enkel geopend om te bekijken
o Het wordt niet geopend om in te werken
SAS-data gebruiken → verwijzen naar data
o Bij een rechtstreekse verwijzing moet het tussen aanhalingstekens
▪ Bv data = “/folders/myfolders/…”;
▪ Het nadeel is hier dat dit steeds een lange verwijzing is
2
, o Je kan ook verwijzen met libraries
▪ Libraries: virtuele etiketten die je plakt over het pad naar uw harde schijf
• Sas spreekt over libraries of bibliotheken als het interne mappen wil
aanduiden
• Voordeel hiervan is dat de gebruiker enkel de essentiële bestanden
te zien krijgt
▪ Bv bij sashelp weet sas hiervan dat hier een pad bij hoort naar de harde schijf
▪ Na de libraries moet een punt en daarna de naam van het databestand
▪ Dit is de kortere en duidelijkere manier
▪ Voor sashelp moet je niets definiëren, omdat die al vast staat bij de libraries
• Sas heeft ingebouwde libraries
▪ Work is op dit moment leeg. Als je hier zaken inzet, zal sas dit altijd
leegmaken als je sas afsluit
Zelf een library aanmaken:
o Commando LIBANAME
o Na LIBNAME zetten we een spatie
o LIBNAME librefnaam “/pad/”;
▪ Voor de opdracht: ESS is de naam van onze library
▪ ESS is dus een voorbeeld van een librefnaam
▪ Deze wordt er gecreëerd
o !Vergeet niet uw codes te eindigen met een punt komma
Sas afzetten via machine, uitschakelen via ACPI
SAS syntax
Algemene regels
Een coderegel moet niet perse op een regel lopen, SAS zal alle enters negeren en zal alles
lezen als 1 regel tot er een ; komt
We hebben programma’s waar veel verschillende programmastappen inzitten
o Een programmastap wordt afgesloten met een RUN;
o Dit onderdeel zal dan moeten uitgevoerd worden
o Met de éénregelprogramma’s / éénlijnprogramma’s als uitzondering
▪ Waar het LIBNAME bevel een voorbeeld is
▪ Dit kan op zichzelf worden uitgevoerd
Gebruik een = teken bij het definiëren van teksten (formats of labels)
o Dit was verschillend bij SPSS
Soorten programma’s
We starten met een datalijst waar er dataonderzoek moet gebeuren (data invoer)
o Dit kan ook gebeuren door het importeren van databestanden in een ander formaat
Een databestand is nooit in de vorm die je wilt bestuderen
o Er moet altijd aan data beheer gedaan worden
Na de toepassing van statistische technieken gaan we de resultaten krijgen
Of te wel beginnen ze met data of we hebben proc stappen
o Proc = procedures
3
, DATA-stap = manipulatie van de gegevens
o Invoer
o Bewerkingen
PROC-stap = statistische bewerking
o Univariaat
o Bivariaat
o Multivariaat
Uitzonderingen
o Proc sort: dit sorteert uw data
▪ Hierdoor ben je uw data aan het manipuleren
o Proc format
o Eenregelprogramma’s
De DATA-stap
DATA nieuw databestand;
SET oud databestand;
Definieer DATA-bewerkingen
Run;
Deze opbouw zal altijd zo zijn
De logica van openen en opslaan wordt hier omgekeerd
o We starten met de naam hoe we het willen opslaan
o SET is het oude databestand dat we willen gebruiken
In het voorbeeld wordt een bestand gekopieerd en van naam veranderd
o Het wordt gekopieerd, omdat we in de ESS library zitten en we kopiëren het in de
tijdelijke werkmap
o We doen dit, omdat we zeker willen zijn dat we niets verkeerd kunnen doen met het
originele bestand
De PROC- stap
Wat ga je doen? Waar ga je het doen?
Hoe ga je het doen?
Run!
We willen in de library sashelp werken en daar willen we het bestand class
We hebben een verplichte optie tables en daar willen we een tabel van de leeftijd vinden
Uitzonderingen
PROC FORMAT: toewijzen van labels
PROC SORT: sorteren van data
In principe zijn de eerste 2 DATA stappen, want ze wijzigen het databestand
4
, Eénregelprogramma’s
o Dit werkt zonder run
o Bv LIBNAME
▪ LIBNAME naam “pad”
o Bv OPTIONS
▪ Dit kan dus ook over verschillende regels gaan
▪ We hebben enkel ; nodig, maar geen run
▪ Nocenter: standaard zet sas tabellen in het midden en dit willen we
ongedaan maken
▪ Nodate: we willen niet dat de datum op elke pagina komt
▪ Pagesize: we willen soms dat het niet altijd over verschillende pagina’s gaat,
maar dat het gewoon doorloopt
▪ Deze opties kunnen we gebruiken door options en dan één van die opties te
typen
Autoexec.sas of OpstartenTMA.sas
o Dit is een programma waar eerst een aantal opties worden ingesteld, dan libraries en
tot slot wordt het databestand naar iets gekopieerd naar iets waar we makkelijker
mee kunnen werken
o Dit willen we eigenlijk altijd bij het opstarten van SAS
o Er werden dus een aantal opties gegroepeerd die telkens bij het opstarten van SAS
worden opgestart
Veel voorkomende fouten in syntax
Het vergeten van een ;
Een dubbel aanhalingsteken vergeten
o Je mag vaak kiezen tussen ‘ en “, maar het is veiliger om dubbele te gebruiken
o Je moet ook wel consequent te werk gaan
o Bij de voorbeeld syntax zien we dat het fout is, omdat het tweede libname bevel niet
in het blauw staat
Bij ERROR file doesn’t exist
o Hier kan je best als eerste op typfouten controleren
Verkeerd databestand gebruikt
Tot slot van de inleiding
Automatisering opstart verzorgen
De opstartinstructies van TMA werden gekopieerd naar de automatische opstart van SAS
studio
Control A dient voor de hele code te selecteren
Je kan via preferences/ results ook de opmaak van uw resultaten kiezen
Resultaten opslaan
Voor het examen moeten we het op PDF inleveren
5
,Importeren en exporteren
Data invoeren uit andere formaten
Invoerformaten
Import uit R moet niet gekend zijn voor het examen
Import uit Excel (xlsx = bestandtype Excel)
Import uit SPSS (en STATA)
Gescheiden door een komma (CSV)
Gescheiden door een tab-teken ( TAB)
Gescheiden door een zelfgekozen teken (DLM)
PROC IMPORT
PROC IMPORT OUT = SAS-databestand
DATAFILE = bestand
DBMS = type gegevens
REPLACE;
RUN;
Voorbeeld:
We gaan een data bestand schrijven
Als er geen library staat dan betekent dit dat het in WORK wordt weggeschreven
CSV is het soort databestand
Getnames
o SAS moet op de eerste regel van het bestand gaan kijken om de variabelennamen te
gaan vinden
Guessingrows
o SAS moet raden of het over een numerieke of een tekstvariabele gaat
o Standaard gaat sas op basis van de eerste 20 lijnen bepalen wat voor variabele het is
o Met de optie max gaat die heel de kolom lezen
o Dit zorgt voor een grotere betrouwbaarheid
,Proc import
Bij Excel is sheet een belangrijke optie, omdat je moet weten op welk werkblad je moet zijn
SHEET = “Blad1”; bijvoorbeeld
Data uitvoeren
Uitvoerformaten
De export naar R moet je niet kennen
Export naar Excel
Export naar SPSS (en STATA)
Gescheiden door een komma (CSV)
Gescheiden door een tab-teken (TAB)
Gescheiden door een teken (DLM)
PROC export
PROC EXPORT DATA= SAS-databestand
OUTFILE = bestand
DBMS = type gegevens
REPLACE;
RUN;
De logica van de import wordt hier omgekeerd
Outfile: ik voer mijn bestand naar bv spss uit en daarom staat daar al spss bij
Output uitvoeren
Output wegschrijven
Wegschrijven naar SAS-databestand
o Met opties van de procedure zelf
o Met ODS
▪ Hiermee kan je alle output die je mogelijk ziet allemaal apart wegschrijven
Wegschrijven naar een extern bestand
o Bv wegschrijven naar een Excel bestand
Output wegschrijven met opties van de procedure
Sommige procedures hebben OPTIES om output om te zetten in tabellen
o Bv PROC FREQ
o Nadeel: is heel procedure-afhankelijk
o Oplossing: met ODS (Output Delivery System) kan je elk onderdeel van een output
apart wegschrijven
7
,Output wegschrijven met ODS
Stap 1: welke tabel kies je?
o Trace is om na te gaan welke tabellen we hebben
o Zie het LOG venster
Stap 2: schrijf de gewenste tabel weg als dataset
o ODS output is in de plaats van trace
o Gebruik ODS OUTPUT met de naam van de tabel(len) die je wil omzetten in een
dataset
o Eerste regel is om het te openen
o Op het einde moet het ook afgesloten worden
Een manier om te zien welke naam SAS ervoor heeft voorzien
o Googelen
o In de appendix van het boek kijken
o ODS trace gebruiken
▪ Dit is gemaakt om te weten te komen hoe de tabel noemt
▪ Met de optie listing worden de naam geschreven in het log venster
Output wegschrijven naar een extern bestand
Een extra mogelijkheid van ODS: je tabel uitvoeren naar een extern bestand
o Bv output plaatsen in Excel of Word
Sheet interval none: zorgt ervoor dat meerdere tabellen allemaal in hetzelfde werkblad
komen
8
,Databeheer
DEEL I Databeheer van bestanden en cases
Onze data zit nu in een SAS databestand.
Werken met databestanden
DATA nieuw databestand;
SET oud databestand;
Definieer DATA-bewerkingen
run;
Hier wordt het bestand van een permanent naar een WORK bestand gekopieerd
Ess1 is eigenlijk gelijk aan work.ess1
o Bij ess.ess1 gaat het over een permanent bestand
Opdracht
Data ess1;
set ess.ees106_3;
run;
Data ess3;
set ess2;
run;
LOG:
Er zit een error in deze opdracht
o Je maakt binnen WORK een koppie van ess2, maar dit bestand bestaat eigenlijk niet
o In de ess3 zal dan niets zitten
o Je moet dus altijd verwijzen naar een data bestand dat of in WORK al is aangemaakt
of in ess, maar het moet al ergens bestaan
WORK-library:
Er werd enkel een koppie van ess1 gemaakt
Nieuwe databestanden
We werken meestal eerst door een koppie te maken van ons permanent bestand naar een
tijdelijk bestand
Daarna gaan we allerlei bewerkingen doen en dan gaan we voor de veiligheid deze opslagen
en op het einde ga je terug een stap zetten waar je het opslaat naar essfinaal
o Dit is niet altijd nodig, maar het is wel makkelijker dan enkel die databeheer weer te
laten lopen
9
, Selecties maken van variabelen
Om grote databestanden in te perken tot kleinere databestanden of omdat je heleboel
hulpvariabelen gemaakt hebt en je er maar een paar wilt meenemen
Dit gebeurt van uw kolommen in tabellen
Variabelen bijhouden in een bestand
Set staat voor openen van databestand
Data staat voor het opslagen als
Hier open je het bestand (set) en daar staat de keep dus daar open je het bestand maar met
enkele variabelen
Je kan dus enkel werken met die variabelen
Hier staat uw keep bevel in de eerste lijn
Hier staat het keep bevel bij het wegschrijven van uw bestand
Je bewaart enkel de 2 variabelen, maar opent wel heel bestand
Dit wil je meestal
Variabelen weggooien uit een bestand
DROP = variabele die je wilt weggooien
Als we lussen gaan maken hebben we variabelen nodig met naam i (voor verder in de les)
Selecties maken van cases
Dit van uw rijen in tabellen
Selectie met IF
Als IF afzonderlijk wordt gebruikt dan dient het als selectie van cases
De gegevens van het oude bestand worden enkel gekopieerd voor de gegevens met
betrekking tot vrouwen
10
Voordelen van het kopen van samenvattingen bij Stuvia op een rij:
Verzekerd van kwaliteit door reviews
Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!
Snel en makkelijk kopen
Je betaalt supersnel en eenmalig met iDeal, creditcard of Stuvia-tegoed voor de samenvatting. Zonder lidmaatschap.
Focus op de essentie
Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!
Veelgestelde vragen
Wat krijg ik als ik dit document koop?
Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.
Tevredenheidsgarantie: hoe werkt dat?
Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.
Van wie koop ik deze samenvatting?
Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper vanosselaerlela. Stuvia faciliteert de betaling aan de verkoper.
Zit ik meteen vast aan een abonnement?
Nee, je koopt alleen deze samenvatting voor €0,00. Je zit daarna nergens aan vast.