100% satisfaction guarantee Immediately available after payment Both online and in PDF No strings attached
logo-home

Class notes

Samenvatting Toegepaste Multivariate Analyse

2 reviews
 272 views  31 purchases
  • Course
  • Institution

Dit document werd opgesteld aan de hand van de slides en mijn lesnotities. Het document bevat ook alles wat voor de zelfstudie gekend moet zijn + aan het einde van het document werden enkele examenvragen die in 2021 werden gesteld, toegevoegd.

Preview 10 out of 164  pages

  • February 14, 2021
  • 164
  • 2020/2021
  • Class notes
  • Dimitri mortelmans
  • All classes

2  reviews

review-writer-avatar

By: lunabeukeleirs • 1 year ago

review-writer-avatar

By: jornvanderlinden • 3 year ago

avatar-seller
Algemene info:

 Op het examen komen theorievragen, maar er gaat vooral gepeild worden naar inzichten
 Sociaal economisch verhaal opbouwen rond de belangrijkste cijfers van de output
 Opbouw vak
o Introductie sas
o Structurele vergelijkingsmodellen
o Multilevelmodellen
 Zelfstudiepakket = ook te kennen
 Cursusmateriaal
o Handboek SAD in onderzoek Mortelmans, D. (2016) → Acco
o Cursusbundel met eigen teksetn → Universitas
 Examen
o Mondeling examen
o Theoretische kennis over de technieken
▪ 3: 1 sas, 2 longituale analaye
▪ Je moet voor het examen 2 analyses zelf voorbereiden (2 modellen)
▪ 1 ongeziene output (tegengestelde van dat je al hebt kunnen voorbereiden)
o De vraag over SEM en multilevel wegen het hardste door, maar wel evenveel en de
andere 2 vragen iets minder (theorie zelfstudie en SAS)
 Zelfgemaakte analyse in SAS
o Syntax
o Output
o Je moet op het examen een verhaal kunnen maken van wat er uit die cijfers komt
o Tijdens die uitleg gaan er ook nog theorievragen gesteld worden
 Deadline
o Maandag 4 januari 17 uur
o Zelfgemaakte analyse moet elektronisch ingeleverd worden
o Niet inleveren, is geen examen
 De oefeningen van de wc’s sluiten aan bij de instructies van het examen
o De oefeningen wekelijks maken = belangrijk!




1

,Leren werken met SAS
We gaan van start
 Met Fn F4 kan je een nieuw programma starten (leegmaken wat er bij program stond)

 Wanneer je hier (→) automatically open generated output
data uitvinkt doe je dit, omdat sommige bestanden heel groot
zijn en het dan veel tijd in beslag neemt om deze te openen

 De proc freq code maakt tabellen aan
o Tables age; : we willen een tabel van age
o Lopend mannetje om het uit te voeren

 LOG om na te kijken of er errors zijn




 PROC SGPLOT wordt gebruikt om een grafiek te maken
 sg= sas grapf
 vbar = staafdiagram (v staat voor verticale staafdiagram; een horizontale bestaat ook)

Data bestanden
 In sas moet je altijd verwijzen naar een databestand en op het moment dat je ernaar verwijst
in een code zal sas het bestand zelf openen
 Maak altijd een tijdelijke kopie van een bestand als je er in werkt
 Bestanden die ‘open’ staan in het programma kunnen niet gewijzigd worden
 Drie soorten SAS-bestanden:
o .sas = SAS-programma’s
o .sas7bdat = DATA in SAS-formaat
o .sas7bcat = SAS-cataloogbestanden
 Als je iets op uw computer opslaagt in de C schijf onder uw map MYFOLDERS, kan je het ook
bij SAS daar vinden
 Wanneer een bestand geopend is → klik een variabele aan om de eigenschappen te zien

Aanroepen van sas data
 Dit doen we via data =
o Hier wordt het enkel geopend om te bekijken
o Het wordt niet geopend om in te werken
 SAS-data gebruiken → verwijzen naar data
o Bij een rechtstreekse verwijzing moet het tussen aanhalingstekens
▪ Bv data = “/folders/myfolders/…”;
▪ Het nadeel is hier dat dit steeds een lange verwijzing is



2

, o Je kan ook verwijzen met libraries
▪ Libraries: virtuele etiketten die je plakt over het pad naar uw harde schijf
• Sas spreekt over libraries of bibliotheken als het interne mappen wil
aanduiden
• Voordeel hiervan is dat de gebruiker enkel de essentiële bestanden
te zien krijgt
▪ Bv bij sashelp weet sas hiervan dat hier een pad bij hoort naar de harde schijf
▪ Na de libraries moet een punt en daarna de naam van het databestand
▪ Dit is de kortere en duidelijkere manier
▪ Voor sashelp moet je niets definiëren, omdat die al vast staat bij de libraries
• Sas heeft ingebouwde libraries
▪ Work is op dit moment leeg. Als je hier zaken inzet, zal sas dit altijd
leegmaken als je sas afsluit
 Zelf een library aanmaken:
o Commando LIBANAME
o Na LIBNAME zetten we een spatie
o LIBNAME librefnaam “/pad/”;
▪ Voor de opdracht: ESS is de naam van onze library
▪ ESS is dus een voorbeeld van een librefnaam
▪ Deze wordt er gecreëerd
o !Vergeet niet uw codes te eindigen met een punt komma
 Sas afzetten via machine, uitschakelen via ACPI

SAS syntax
Algemene regels
 Een coderegel moet niet perse op een regel lopen, SAS zal alle enters negeren en zal alles
lezen als 1 regel tot er een ; komt
 We hebben programma’s waar veel verschillende programmastappen inzitten
o Een programmastap wordt afgesloten met een RUN;
o Dit onderdeel zal dan moeten uitgevoerd worden
o Met de éénregelprogramma’s / éénlijnprogramma’s als uitzondering
▪ Waar het LIBNAME bevel een voorbeeld is
▪ Dit kan op zichzelf worden uitgevoerd
 Gebruik een = teken bij het definiëren van teksten (formats of labels)
o Dit was verschillend bij SPSS

Soorten programma’s
 We starten met een datalijst waar er dataonderzoek moet gebeuren (data invoer)
o Dit kan ook gebeuren door het importeren van databestanden in een ander formaat
 Een databestand is nooit in de vorm die je wilt bestuderen
o Er moet altijd aan data beheer gedaan worden
 Na de toepassing van statistische technieken gaan we de resultaten krijgen
 Of te wel beginnen ze met data of we hebben proc stappen
o Proc = procedures




3

,  DATA-stap = manipulatie van de gegevens
o Invoer
o Bewerkingen
 PROC-stap = statistische bewerking
o Univariaat
o Bivariaat
o Multivariaat
 Uitzonderingen
o Proc sort: dit sorteert uw data
▪ Hierdoor ben je uw data aan het manipuleren
o Proc format
o Eenregelprogramma’s

De DATA-stap
DATA nieuw databestand;
SET oud databestand;
Definieer DATA-bewerkingen
Run;

 Deze opbouw zal altijd zo zijn
 De logica van openen en opslaan wordt hier omgekeerd
o We starten met de naam hoe we het willen opslaan
o SET is het oude databestand dat we willen gebruiken




 In het voorbeeld wordt een bestand gekopieerd en van naam veranderd
o Het wordt gekopieerd, omdat we in de ESS library zitten en we kopiëren het in de
tijdelijke werkmap
o We doen dit, omdat we zeker willen zijn dat we niets verkeerd kunnen doen met het
originele bestand

De PROC- stap
Wat ga je doen? Waar ga je het doen?
Hoe ga je het doen?
Run!

 We willen in de library sashelp werken en daar willen we het bestand class
 We hebben een verplichte optie tables en daar willen we een tabel van de leeftijd vinden

Uitzonderingen
 PROC FORMAT: toewijzen van labels
 PROC SORT: sorteren van data

In principe zijn de eerste 2 DATA stappen, want ze wijzigen het databestand




4

,  Eénregelprogramma’s
o Dit werkt zonder run
o Bv LIBNAME
▪ LIBNAME naam “pad”
o Bv OPTIONS
▪ Dit kan dus ook over verschillende regels gaan
▪ We hebben enkel ; nodig, maar geen run
▪ Nocenter: standaard zet sas tabellen in het midden en dit willen we
ongedaan maken
▪ Nodate: we willen niet dat de datum op elke pagina komt
▪ Pagesize: we willen soms dat het niet altijd over verschillende pagina’s gaat,
maar dat het gewoon doorloopt
▪ Deze opties kunnen we gebruiken door options en dan één van die opties te
typen
 Autoexec.sas of OpstartenTMA.sas
o Dit is een programma waar eerst een aantal opties worden ingesteld, dan libraries en
tot slot wordt het databestand naar iets gekopieerd naar iets waar we makkelijker
mee kunnen werken
o Dit willen we eigenlijk altijd bij het opstarten van SAS
o Er werden dus een aantal opties gegroepeerd die telkens bij het opstarten van SAS
worden opgestart

Veel voorkomende fouten in syntax
 Het vergeten van een ;
 Een dubbel aanhalingsteken vergeten
o Je mag vaak kiezen tussen ‘ en “, maar het is veiliger om dubbele te gebruiken
o Je moet ook wel consequent te werk gaan
o Bij de voorbeeld syntax zien we dat het fout is, omdat het tweede libname bevel niet
in het blauw staat
 Bij ERROR file doesn’t exist
o Hier kan je best als eerste op typfouten controleren
 Verkeerd databestand gebruikt

Tot slot van de inleiding
Automatisering opstart verzorgen
 De opstartinstructies van TMA werden gekopieerd naar de automatische opstart van SAS
studio
 Control A dient voor de hele code te selecteren
 Je kan via preferences/ results ook de opmaak van uw resultaten kiezen

Resultaten opslaan
 Voor het examen moeten we het op PDF inleveren




5

,Importeren en exporteren
Data invoeren uit andere formaten
Invoerformaten
 Import uit R moet niet gekend zijn voor het examen
 Import uit Excel (xlsx = bestandtype Excel)
 Import uit SPSS (en STATA)

 Gescheiden door een komma (CSV)
 Gescheiden door een tab-teken ( TAB)
 Gescheiden door een zelfgekozen teken (DLM)

PROC IMPORT
PROC IMPORT OUT = SAS-databestand
DATAFILE = bestand
DBMS = type gegevens
REPLACE;
RUN;

Voorbeeld:




 We gaan een data bestand schrijven
 Als er geen library staat dan betekent dit dat het in WORK wordt weggeschreven
 CSV is het soort databestand
 Getnames
o SAS moet op de eerste regel van het bestand gaan kijken om de variabelennamen te
gaan vinden
 Guessingrows
o SAS moet raden of het over een numerieke of een tekstvariabele gaat
o Standaard gaat sas op basis van de eerste 20 lijnen bepalen wat voor variabele het is
o Met de optie max gaat die heel de kolom lezen
o Dit zorgt voor een grotere betrouwbaarheid

Opdracht
 PROC IMPORT OUT= sasdata_dlm
DATAFILE= "/folders/myfolders/import_dlm.txt"
DBMS= DLM
REPLACE;
GETNAMES= yes;
GUESSINGROWS= max;
DELIMITER=";";
RUN;



6

,Proc import
 Bij Excel is sheet een belangrijke optie, omdat je moet weten op welk werkblad je moet zijn
 SHEET = “Blad1”; bijvoorbeeld

Data uitvoeren
Uitvoerformaten
 De export naar R moet je niet kennen
 Export naar Excel
 Export naar SPSS (en STATA)

 Gescheiden door een komma (CSV)
 Gescheiden door een tab-teken (TAB)
 Gescheiden door een teken (DLM)

PROC export
PROC EXPORT DATA= SAS-databestand
OUTFILE = bestand
DBMS = type gegevens
REPLACE;

RUN;

 De logica van de import wordt hier omgekeerd
 Outfile: ik voer mijn bestand naar bv spss uit en daarom staat daar al spss bij




Output uitvoeren
Output wegschrijven
 Wegschrijven naar SAS-databestand
o Met opties van de procedure zelf
o Met ODS
▪ Hiermee kan je alle output die je mogelijk ziet allemaal apart wegschrijven
 Wegschrijven naar een extern bestand
o Bv wegschrijven naar een Excel bestand

Output wegschrijven met opties van de procedure
 Sommige procedures hebben OPTIES om output om te zetten in tabellen
o Bv PROC FREQ
o Nadeel: is heel procedure-afhankelijk
o Oplossing: met ODS (Output Delivery System) kan je elk onderdeel van een output
apart wegschrijven



7

,Output wegschrijven met ODS
 Stap 1: welke tabel kies je?
o Trace is om na te gaan welke tabellen we hebben
o Zie het LOG venster




 Stap 2: schrijf de gewenste tabel weg als dataset
o ODS output is in de plaats van trace
o Gebruik ODS OUTPUT met de naam van de tabel(len) die je wil omzetten in een
dataset
o Eerste regel is om het te openen
o Op het einde moet het ook afgesloten worden




 Een manier om te zien welke naam SAS ervoor heeft voorzien
o Googelen
o In de appendix van het boek kijken
o ODS trace gebruiken
▪ Dit is gemaakt om te weten te komen hoe de tabel noemt
▪ Met de optie listing worden de naam geschreven in het log venster

Output wegschrijven naar een extern bestand
 Een extra mogelijkheid van ODS: je tabel uitvoeren naar een extern bestand
o Bv output plaatsen in Excel of Word
 Sheet interval none: zorgt ervoor dat meerdere tabellen allemaal in hetzelfde werkblad
komen




8

,Databeheer
DEEL I Databeheer van bestanden en cases

Onze data zit nu in een SAS databestand.

Werken met databestanden
DATA nieuw databestand;
SET oud databestand;
Definieer DATA-bewerkingen
run;

 Hier wordt het bestand van een permanent naar een WORK bestand gekopieerd
 Ess1 is eigenlijk gelijk aan work.ess1
o Bij ess.ess1 gaat het over een permanent bestand

Opdracht
Data ess1;
set ess.ees106_3;
run;

Data ess3;
set ess2;
run;

LOG:

 Er zit een error in deze opdracht
o Je maakt binnen WORK een koppie van ess2, maar dit bestand bestaat eigenlijk niet
o In de ess3 zal dan niets zitten
o Je moet dus altijd verwijzen naar een data bestand dat of in WORK al is aangemaakt
of in ess, maar het moet al ergens bestaan

WORK-library:

 Er werd enkel een koppie van ess1 gemaakt

Nieuwe databestanden
 We werken meestal eerst door een koppie te maken van ons permanent bestand naar een
tijdelijk bestand
 Daarna gaan we allerlei bewerkingen doen en dan gaan we voor de veiligheid deze opslagen
en op het einde ga je terug een stap zetten waar je het opslaat naar essfinaal
o Dit is niet altijd nodig, maar het is wel makkelijker dan enkel die databeheer weer te
laten lopen




9

, Selecties maken van variabelen
Om grote databestanden in te perken tot kleinere databestanden of omdat je heleboel
hulpvariabelen gemaakt hebt en je er maar een paar wilt meenemen

Dit gebeurt van uw kolommen in tabellen

Variabelen bijhouden in een bestand




 Set staat voor openen van databestand
 Data staat voor het opslagen als
 Hier open je het bestand (set) en daar staat de keep dus daar open je het bestand maar met
enkele variabelen
 Je kan dus enkel werken met die variabelen




 Hier staat uw keep bevel in de eerste lijn
 Hier staat het keep bevel bij het wegschrijven van uw bestand
 Je bewaart enkel de 2 variabelen, maar opent wel heel bestand
 Dit wil je meestal

Variabelen weggooien uit een bestand




 DROP = variabele die je wilt weggooien
 Als we lussen gaan maken hebben we variabelen nodig met naam i (voor verder in de les)

Selecties maken van cases
Dit van uw rijen in tabellen

Selectie met IF




 Als IF afzonderlijk wordt gebruikt dan dient het als selectie van cases
 De gegevens van het oude bestand worden enkel gekopieerd voor de gegevens met
betrekking tot vrouwen


10

The benefits of buying summaries with Stuvia:

Guaranteed quality through customer reviews

Guaranteed quality through customer reviews

Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.

Quick and easy check-out

Quick and easy check-out

You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.

Focus on what matters

Focus on what matters

Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!

Frequently asked questions

What do I get when I buy this document?

You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.

Satisfaction guarantee: how does it work?

Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.

Who am I buying these notes from?

Stuvia is a marketplace, so you are not buying this document from us, but from seller vanosselaerlela. Stuvia facilitates payment to the seller.

Will I be stuck with a subscription?

No, you only buy these notes for $0.00. You're not tied to anything after your purchase.

Can Stuvia be trusted?

4.6 stars on Google & Trustpilot (+1000 reviews)

50843 documents were sold in the last 30 days

Founded in 2010, the go-to place to buy study notes for 14 years now

Start selling
Free  31x  sold
  • (2)