100% tevredenheidsgarantie Direct beschikbaar na betaling Zowel online als in PDF Je zit nergens aan vast
logo-home

College aantekeningen

Samenvatting Toegepaste Multivariate Analyse

2 beoordelingen
 272 keer bekeken  31 keer verkocht

Dit document werd opgesteld aan de hand van de slides en mijn lesnotities. Het document bevat ook alles wat voor de zelfstudie gekend moet zijn + aan het einde van het document werden enkele examenvragen die in 2021 werden gesteld, toegevoegd.

Voorbeeld 10 van de 164  pagina's

  • 14 februari 2021
  • 164
  • 2020/2021
  • College aantekeningen
  • Dimitri mortelmans
  • Alle colleges
Alle documenten voor dit vak (11)

2  beoordelingen

review-writer-avatar

Door: lunabeukeleirs • 1 jaar geleden

review-writer-avatar

Door: jornvanderlinden • 3 jaar geleden

avatar-seller
vanosselaerlela
Algemene info:

 Op het examen komen theorievragen, maar er gaat vooral gepeild worden naar inzichten
 Sociaal economisch verhaal opbouwen rond de belangrijkste cijfers van de output
 Opbouw vak
o Introductie sas
o Structurele vergelijkingsmodellen
o Multilevelmodellen
 Zelfstudiepakket = ook te kennen
 Cursusmateriaal
o Handboek SAD in onderzoek Mortelmans, D. (2016) → Acco
o Cursusbundel met eigen teksetn → Universitas
 Examen
o Mondeling examen
o Theoretische kennis over de technieken
▪ 3: 1 sas, 2 longituale analaye
▪ Je moet voor het examen 2 analyses zelf voorbereiden (2 modellen)
▪ 1 ongeziene output (tegengestelde van dat je al hebt kunnen voorbereiden)
o De vraag over SEM en multilevel wegen het hardste door, maar wel evenveel en de
andere 2 vragen iets minder (theorie zelfstudie en SAS)
 Zelfgemaakte analyse in SAS
o Syntax
o Output
o Je moet op het examen een verhaal kunnen maken van wat er uit die cijfers komt
o Tijdens die uitleg gaan er ook nog theorievragen gesteld worden
 Deadline
o Maandag 4 januari 17 uur
o Zelfgemaakte analyse moet elektronisch ingeleverd worden
o Niet inleveren, is geen examen
 De oefeningen van de wc’s sluiten aan bij de instructies van het examen
o De oefeningen wekelijks maken = belangrijk!




1

,Leren werken met SAS
We gaan van start
 Met Fn F4 kan je een nieuw programma starten (leegmaken wat er bij program stond)

 Wanneer je hier (→) automatically open generated output
data uitvinkt doe je dit, omdat sommige bestanden heel groot
zijn en het dan veel tijd in beslag neemt om deze te openen

 De proc freq code maakt tabellen aan
o Tables age; : we willen een tabel van age
o Lopend mannetje om het uit te voeren

 LOG om na te kijken of er errors zijn




 PROC SGPLOT wordt gebruikt om een grafiek te maken
 sg= sas grapf
 vbar = staafdiagram (v staat voor verticale staafdiagram; een horizontale bestaat ook)

Data bestanden
 In sas moet je altijd verwijzen naar een databestand en op het moment dat je ernaar verwijst
in een code zal sas het bestand zelf openen
 Maak altijd een tijdelijke kopie van een bestand als je er in werkt
 Bestanden die ‘open’ staan in het programma kunnen niet gewijzigd worden
 Drie soorten SAS-bestanden:
o .sas = SAS-programma’s
o .sas7bdat = DATA in SAS-formaat
o .sas7bcat = SAS-cataloogbestanden
 Als je iets op uw computer opslaagt in de C schijf onder uw map MYFOLDERS, kan je het ook
bij SAS daar vinden
 Wanneer een bestand geopend is → klik een variabele aan om de eigenschappen te zien

Aanroepen van sas data
 Dit doen we via data =
o Hier wordt het enkel geopend om te bekijken
o Het wordt niet geopend om in te werken
 SAS-data gebruiken → verwijzen naar data
o Bij een rechtstreekse verwijzing moet het tussen aanhalingstekens
▪ Bv data = “/folders/myfolders/…”;
▪ Het nadeel is hier dat dit steeds een lange verwijzing is



2

, o Je kan ook verwijzen met libraries
▪ Libraries: virtuele etiketten die je plakt over het pad naar uw harde schijf
• Sas spreekt over libraries of bibliotheken als het interne mappen wil
aanduiden
• Voordeel hiervan is dat de gebruiker enkel de essentiële bestanden
te zien krijgt
▪ Bv bij sashelp weet sas hiervan dat hier een pad bij hoort naar de harde schijf
▪ Na de libraries moet een punt en daarna de naam van het databestand
▪ Dit is de kortere en duidelijkere manier
▪ Voor sashelp moet je niets definiëren, omdat die al vast staat bij de libraries
• Sas heeft ingebouwde libraries
▪ Work is op dit moment leeg. Als je hier zaken inzet, zal sas dit altijd
leegmaken als je sas afsluit
 Zelf een library aanmaken:
o Commando LIBANAME
o Na LIBNAME zetten we een spatie
o LIBNAME librefnaam “/pad/”;
▪ Voor de opdracht: ESS is de naam van onze library
▪ ESS is dus een voorbeeld van een librefnaam
▪ Deze wordt er gecreëerd
o !Vergeet niet uw codes te eindigen met een punt komma
 Sas afzetten via machine, uitschakelen via ACPI

SAS syntax
Algemene regels
 Een coderegel moet niet perse op een regel lopen, SAS zal alle enters negeren en zal alles
lezen als 1 regel tot er een ; komt
 We hebben programma’s waar veel verschillende programmastappen inzitten
o Een programmastap wordt afgesloten met een RUN;
o Dit onderdeel zal dan moeten uitgevoerd worden
o Met de éénregelprogramma’s / éénlijnprogramma’s als uitzondering
▪ Waar het LIBNAME bevel een voorbeeld is
▪ Dit kan op zichzelf worden uitgevoerd
 Gebruik een = teken bij het definiëren van teksten (formats of labels)
o Dit was verschillend bij SPSS

Soorten programma’s
 We starten met een datalijst waar er dataonderzoek moet gebeuren (data invoer)
o Dit kan ook gebeuren door het importeren van databestanden in een ander formaat
 Een databestand is nooit in de vorm die je wilt bestuderen
o Er moet altijd aan data beheer gedaan worden
 Na de toepassing van statistische technieken gaan we de resultaten krijgen
 Of te wel beginnen ze met data of we hebben proc stappen
o Proc = procedures




3

,  DATA-stap = manipulatie van de gegevens
o Invoer
o Bewerkingen
 PROC-stap = statistische bewerking
o Univariaat
o Bivariaat
o Multivariaat
 Uitzonderingen
o Proc sort: dit sorteert uw data
▪ Hierdoor ben je uw data aan het manipuleren
o Proc format
o Eenregelprogramma’s

De DATA-stap
DATA nieuw databestand;
SET oud databestand;
Definieer DATA-bewerkingen
Run;

 Deze opbouw zal altijd zo zijn
 De logica van openen en opslaan wordt hier omgekeerd
o We starten met de naam hoe we het willen opslaan
o SET is het oude databestand dat we willen gebruiken




 In het voorbeeld wordt een bestand gekopieerd en van naam veranderd
o Het wordt gekopieerd, omdat we in de ESS library zitten en we kopiëren het in de
tijdelijke werkmap
o We doen dit, omdat we zeker willen zijn dat we niets verkeerd kunnen doen met het
originele bestand

De PROC- stap
Wat ga je doen? Waar ga je het doen?
Hoe ga je het doen?
Run!

 We willen in de library sashelp werken en daar willen we het bestand class
 We hebben een verplichte optie tables en daar willen we een tabel van de leeftijd vinden

Uitzonderingen
 PROC FORMAT: toewijzen van labels
 PROC SORT: sorteren van data

In principe zijn de eerste 2 DATA stappen, want ze wijzigen het databestand




4

,  Eénregelprogramma’s
o Dit werkt zonder run
o Bv LIBNAME
▪ LIBNAME naam “pad”
o Bv OPTIONS
▪ Dit kan dus ook over verschillende regels gaan
▪ We hebben enkel ; nodig, maar geen run
▪ Nocenter: standaard zet sas tabellen in het midden en dit willen we
ongedaan maken
▪ Nodate: we willen niet dat de datum op elke pagina komt
▪ Pagesize: we willen soms dat het niet altijd over verschillende pagina’s gaat,
maar dat het gewoon doorloopt
▪ Deze opties kunnen we gebruiken door options en dan één van die opties te
typen
 Autoexec.sas of OpstartenTMA.sas
o Dit is een programma waar eerst een aantal opties worden ingesteld, dan libraries en
tot slot wordt het databestand naar iets gekopieerd naar iets waar we makkelijker
mee kunnen werken
o Dit willen we eigenlijk altijd bij het opstarten van SAS
o Er werden dus een aantal opties gegroepeerd die telkens bij het opstarten van SAS
worden opgestart

Veel voorkomende fouten in syntax
 Het vergeten van een ;
 Een dubbel aanhalingsteken vergeten
o Je mag vaak kiezen tussen ‘ en “, maar het is veiliger om dubbele te gebruiken
o Je moet ook wel consequent te werk gaan
o Bij de voorbeeld syntax zien we dat het fout is, omdat het tweede libname bevel niet
in het blauw staat
 Bij ERROR file doesn’t exist
o Hier kan je best als eerste op typfouten controleren
 Verkeerd databestand gebruikt

Tot slot van de inleiding
Automatisering opstart verzorgen
 De opstartinstructies van TMA werden gekopieerd naar de automatische opstart van SAS
studio
 Control A dient voor de hele code te selecteren
 Je kan via preferences/ results ook de opmaak van uw resultaten kiezen

Resultaten opslaan
 Voor het examen moeten we het op PDF inleveren




5

,Importeren en exporteren
Data invoeren uit andere formaten
Invoerformaten
 Import uit R moet niet gekend zijn voor het examen
 Import uit Excel (xlsx = bestandtype Excel)
 Import uit SPSS (en STATA)

 Gescheiden door een komma (CSV)
 Gescheiden door een tab-teken ( TAB)
 Gescheiden door een zelfgekozen teken (DLM)

PROC IMPORT
PROC IMPORT OUT = SAS-databestand
DATAFILE = bestand
DBMS = type gegevens
REPLACE;
RUN;

Voorbeeld:




 We gaan een data bestand schrijven
 Als er geen library staat dan betekent dit dat het in WORK wordt weggeschreven
 CSV is het soort databestand
 Getnames
o SAS moet op de eerste regel van het bestand gaan kijken om de variabelennamen te
gaan vinden
 Guessingrows
o SAS moet raden of het over een numerieke of een tekstvariabele gaat
o Standaard gaat sas op basis van de eerste 20 lijnen bepalen wat voor variabele het is
o Met de optie max gaat die heel de kolom lezen
o Dit zorgt voor een grotere betrouwbaarheid

Opdracht
 PROC IMPORT OUT= sasdata_dlm
DATAFILE= "/folders/myfolders/import_dlm.txt"
DBMS= DLM
REPLACE;
GETNAMES= yes;
GUESSINGROWS= max;
DELIMITER=";";
RUN;



6

,Proc import
 Bij Excel is sheet een belangrijke optie, omdat je moet weten op welk werkblad je moet zijn
 SHEET = “Blad1”; bijvoorbeeld

Data uitvoeren
Uitvoerformaten
 De export naar R moet je niet kennen
 Export naar Excel
 Export naar SPSS (en STATA)

 Gescheiden door een komma (CSV)
 Gescheiden door een tab-teken (TAB)
 Gescheiden door een teken (DLM)

PROC export
PROC EXPORT DATA= SAS-databestand
OUTFILE = bestand
DBMS = type gegevens
REPLACE;

RUN;

 De logica van de import wordt hier omgekeerd
 Outfile: ik voer mijn bestand naar bv spss uit en daarom staat daar al spss bij




Output uitvoeren
Output wegschrijven
 Wegschrijven naar SAS-databestand
o Met opties van de procedure zelf
o Met ODS
▪ Hiermee kan je alle output die je mogelijk ziet allemaal apart wegschrijven
 Wegschrijven naar een extern bestand
o Bv wegschrijven naar een Excel bestand

Output wegschrijven met opties van de procedure
 Sommige procedures hebben OPTIES om output om te zetten in tabellen
o Bv PROC FREQ
o Nadeel: is heel procedure-afhankelijk
o Oplossing: met ODS (Output Delivery System) kan je elk onderdeel van een output
apart wegschrijven



7

,Output wegschrijven met ODS
 Stap 1: welke tabel kies je?
o Trace is om na te gaan welke tabellen we hebben
o Zie het LOG venster




 Stap 2: schrijf de gewenste tabel weg als dataset
o ODS output is in de plaats van trace
o Gebruik ODS OUTPUT met de naam van de tabel(len) die je wil omzetten in een
dataset
o Eerste regel is om het te openen
o Op het einde moet het ook afgesloten worden




 Een manier om te zien welke naam SAS ervoor heeft voorzien
o Googelen
o In de appendix van het boek kijken
o ODS trace gebruiken
▪ Dit is gemaakt om te weten te komen hoe de tabel noemt
▪ Met de optie listing worden de naam geschreven in het log venster

Output wegschrijven naar een extern bestand
 Een extra mogelijkheid van ODS: je tabel uitvoeren naar een extern bestand
o Bv output plaatsen in Excel of Word
 Sheet interval none: zorgt ervoor dat meerdere tabellen allemaal in hetzelfde werkblad
komen




8

,Databeheer
DEEL I Databeheer van bestanden en cases

Onze data zit nu in een SAS databestand.

Werken met databestanden
DATA nieuw databestand;
SET oud databestand;
Definieer DATA-bewerkingen
run;

 Hier wordt het bestand van een permanent naar een WORK bestand gekopieerd
 Ess1 is eigenlijk gelijk aan work.ess1
o Bij ess.ess1 gaat het over een permanent bestand

Opdracht
Data ess1;
set ess.ees106_3;
run;

Data ess3;
set ess2;
run;

LOG:

 Er zit een error in deze opdracht
o Je maakt binnen WORK een koppie van ess2, maar dit bestand bestaat eigenlijk niet
o In de ess3 zal dan niets zitten
o Je moet dus altijd verwijzen naar een data bestand dat of in WORK al is aangemaakt
of in ess, maar het moet al ergens bestaan

WORK-library:

 Er werd enkel een koppie van ess1 gemaakt

Nieuwe databestanden
 We werken meestal eerst door een koppie te maken van ons permanent bestand naar een
tijdelijk bestand
 Daarna gaan we allerlei bewerkingen doen en dan gaan we voor de veiligheid deze opslagen
en op het einde ga je terug een stap zetten waar je het opslaat naar essfinaal
o Dit is niet altijd nodig, maar het is wel makkelijker dan enkel die databeheer weer te
laten lopen




9

, Selecties maken van variabelen
Om grote databestanden in te perken tot kleinere databestanden of omdat je heleboel
hulpvariabelen gemaakt hebt en je er maar een paar wilt meenemen

Dit gebeurt van uw kolommen in tabellen

Variabelen bijhouden in een bestand




 Set staat voor openen van databestand
 Data staat voor het opslagen als
 Hier open je het bestand (set) en daar staat de keep dus daar open je het bestand maar met
enkele variabelen
 Je kan dus enkel werken met die variabelen




 Hier staat uw keep bevel in de eerste lijn
 Hier staat het keep bevel bij het wegschrijven van uw bestand
 Je bewaart enkel de 2 variabelen, maar opent wel heel bestand
 Dit wil je meestal

Variabelen weggooien uit een bestand




 DROP = variabele die je wilt weggooien
 Als we lussen gaan maken hebben we variabelen nodig met naam i (voor verder in de les)

Selecties maken van cases
Dit van uw rijen in tabellen

Selectie met IF




 Als IF afzonderlijk wordt gebruikt dan dient het als selectie van cases
 De gegevens van het oude bestand worden enkel gekopieerd voor de gegevens met
betrekking tot vrouwen


10

Voordelen van het kopen van samenvattingen bij Stuvia op een rij:

√  	Verzekerd van kwaliteit door reviews

√ Verzekerd van kwaliteit door reviews

Stuvia-klanten hebben meer dan 700.000 samenvattingen beoordeeld. Zo weet je zeker dat je de beste documenten koopt!

Snel en makkelijk kopen

Snel en makkelijk kopen

Je betaalt supersnel en eenmalig met iDeal, Bancontact of creditcard voor de samenvatting. Zonder lidmaatschap.

Focus op de essentie

Focus op de essentie

Samenvattingen worden geschreven voor en door anderen. Daarom zijn de samenvattingen altijd betrouwbaar en actueel. Zo kom je snel tot de kern!

Veelgestelde vragen

Wat krijg ik als ik dit document koop?

Je krijgt een PDF, die direct beschikbaar is na je aankoop. Het gekochte document is altijd, overal en oneindig toegankelijk via je profiel.

Tevredenheidsgarantie: hoe werkt dat?

Onze tevredenheidsgarantie zorgt ervoor dat je altijd een studiedocument vindt dat goed bij je past. Je vult een formulier in en onze klantenservice regelt de rest.

Van wie koop ik deze samenvatting?

Stuvia is een marktplaats, je koop dit document dus niet van ons, maar van verkoper vanosselaerlela. Stuvia faciliteert de betaling aan de verkoper.

Zit ik meteen vast aan een abonnement?

Nee, je koopt alleen deze samenvatting voor €0,00. Je zit daarna nergens aan vast.

Is Stuvia te vertrouwen?

4,6 sterren op Google & Trustpilot (+1000 reviews)

Afgelopen 30 dagen zijn er 52355 samenvattingen verkocht

Opgericht in 2010, al 14 jaar dé plek om samenvattingen te kopen

Start met verkopen
Gratis  31x  verkocht
  • (2)