GRASPLE LOGBOEK
Pakketten downloaden;
install.packages("lavaan")
Pakket uitvoeren;
library(lavaan)
Om snel te achterhalen hoeveel cases en variabelen er zijn;
nrow(D) en ncol(D) of dim(D) worden gebruikt.
Met dit commando selecteren we een rij in de data, namelijk de rij waarin kindnr gelijk is aan 100.
D[D$kindnr==100,]
Sorteren op kindnummer
D[order(D$kindnr),]
Sorteren op sekse en vervolgens op kindnummer
D[order(D$sekse,D$kindnr),]
manier waarop uit data-frame D de variabele met de naam var kan worden geselecteerd.
Dus als je bijvoorbeeld alleen maar de scores op leeftijd wilt zien, dan geef je het commando:
D$leeftijd
Als je de scores op leeftijd en sekse wilt zien, dan geef je het commando:
cbind(D$leeftijd,D$sekse)
De functie summary() kan worden gebruikt om voor een specifieke variabele of een hele data-frame
een aantal samenvattende steekproefgegevens op te vragen.
De functie table() kan worden gebruikt om voor een specifieke variabele de frequentieverdeling op
te vragen.
Welke argumenten er allemaal aan de functie table() kunnen worden opgegeven, kun je bekijken
door in de Console het commando ?table te geven. Je ziet dan in het tabblad “Help” automatisch een
beschrijving van de functie verschijnen. Op dezelfde manier kun je dit ook voor andere R functies
doen.
Als aan een functie meerdere argumenten worden opgegeven dan zijn deze gescheiden door
komma’s. Bijvoorbeeld als je naast het aantal jongens en het aantal meisjes ook het aantal
ontbrekende waarden voor sekse wilt opvragen dan geef je het commando
table(D$sekse,useNA="always") waarin useNA="always" dus een tweede argument is.
In totaal bevat data-frame D twaalf kolommen (twaalf variabelen). In de laatste acht kolommen staan
de scores van de leerlingen op de acht items. Dat zijn dus de kolommen 5 t/m 12. Dit deel van de
data kun je selecteren met het commando D[,5:12].
Als je nu in één klap de frequentieverdelingen van alle acht items wilt zien, geef dan het commando:
apply(D[,5:12],2,table,useNA="always")
, De functie apply() heeft vier argumenten. Het eerste argument is de specifieke data selectie D[,5:12].
Het tweede argument is het getal 2 en wordt hier gebruikt om gegevens voor de kolommen op te
vragen (i.p.v. het getal 1 voor de rijen). Het derde argument is table en wordt hier gebruikt om
frequenties op te vragen. Het vierde argument is useNA="always" en wordt hier gebruikt om ook de
aantallen ontbrekende waarden op te vragen.
De gemiddelden kunnen worden opgevraagd door het geven van het commando:
apply(D[,5:12],2,mean,na.rm=T)
De standaardafwijkingen kunnen worden opgevraagd door het geven van het commando:
apply(D[,5:12],2,sd,na.rm=T)
De argumenten mean en sd in deze twee commando’s spreken voor zich. Het gemeenschappelijke
vierde argument na.rm=T wordt gebruikt om aan te geven dat de ontbrekende waarden (na) eerst uit
de gegevens moeten worden verwijderd (rm van ‘remove’) voordat er berekeningen worden
gemaakt. T staat weer voor TRUE (een logische operator).
Voor het berekenen van het gemiddelde, de standaarddeviatie en de variantie van een enkele
variabele kunnen ook de functies mean(), sd() en var() worden gebruikt. Er moeten
dan twee argumenten aan de functie worden gegeven. Het eerste is de naam van de variabele,
bijvoorbeeld D$item1, en het tweede is na.rm=T.
eerst recoder downloaden en uitvoeren
Hercoderen item;
D$item1<-recoder(D$item1,"1:4;2:3;3:2;4:1")
D$item2<-recoder(D$item2,"1:4;2:3;3:2;4:1")
D$item3<-recoder(D$item3,"1:4;2:3;3:2;4:1")
D$item4<-recoder(D$item4,"1:4;2:3;3:2;4:1")
D$item5<-recoder(D$item5,"1:4;2:3;3:2;4:1")
D$item6<-recoder(D$item6,"1:4;2:3;3:2;4:1")
controle;
cbind(D$item1,it1)
frequentieverdeling opvragen;
table(it1)
Het volgende commando kan worden gebruikt om de correlaties tussen alle items te berekenen: