Formularium voor R studio
R Studio basics
* = maal
^ = macht
/ = delen
Sqrt(…) = vierkantswortel
+ en - = plus en min
Hoofdstuk 1
Naam vector <- c(… , … ,) = vector creëren
Mean( naam vector ) = gemiddelde
Min( naam vector ) en Max( naam vector ) = minimum en maximum
Length( naam vector ) = aantal dingen in een vector
Median( naam vector ) = mediaan
Naam vector[…] = rij aanvragen (bv mydata$geslacht[4])
“…” in een vector = nominale waarden (bv “roker”) = string
Naam <- factor( c( waarde, waarde, …)) = alternatief voor aanhalingstekens in vector
Naam <- factor( c( waarde, waarde, …), levels = c( waarden in juiste volgorde), ordered =
TRUE) = aantonen dat het ordinaal is en rangschikking geven
Naam string == “…” = juist of fout melding (checken hoe het noemt)
Naam <- data.frame( vector 1, vector 2, …) = aanmaken dataframe ahv vectoren/strings
Naamdataframe$naam var = kolom aanvragen (bv mydata$geslacht)
Naamdataframe[hoeveelste rij je wilt] = rij opvragen
Naamdataframe[2,1] = de waarde van PERS 2 (rij) voor VAR 1 (kolom)
Dim(naamdataframe) = aantal personen en variabelen
Write.csv(mydata, file = “mijdata”, row.names = FALSE) = frame opslaan
Read.csv(file = “mydata.csv”) = opgeslagen data terug gebruiken
Names(…) = namen variabelen
Head(…) = eerste 6 waarden
Tail(…) = laatste 6 waarden
Nchar(…) = hoeveelheid nummers
Paste (… , …) = inhoud van genoemde strings
[… : …] = waarden van … tot …
== = een conditie
Getwd(…) = opvragen in welke map een data frame zit
Str(…) = geeft variabelen met enkele waarden
, Hoofdstuk 2
Table( bepaalde variabele of dataframe) = frequentieverdeling opmaken (bv
table(mydata$opleiding) -> kan ook bivariaat, dan 2 vars met komma
Table( bepaalde var)/dim( dataframe[rij van var]) = relatieve frequantieverdeling opmaken,
dus frequenties delen door aantal van de var
Prop.table( table( bepaalde var)) = relatieve frequentieverdeling opmaken
Pie(x = c(… , … , …), labels = c(“…”, “…”, “…”)) = cirkeldiagram aanmaken met frequenties en
namen; Pie(table(….)) kan ook
Barplot(table(…)) = lijndiagram aanmaken (discrete variabelen)
Boxplot(…$...) = boxplot creëren van bepaalde variabele
Hist(x = bepaalde var) = histogram aanmaken (ratio of interval niveau)
Hist(x = …, breaks = …) = histogram aanmaken en aantal klassen kiezen
Plot(x = var ,y = var) = spreidingsdiagram aanmaken
As.numeric(…) = een ordinale ofzo reeks numeriek maken (bv scores motivatie)
Var(bepaalde var) = variantie (spreiding, slecht interpreteerbaar)
Sd(…) = standaarddeviatie (vierkantswortel van variantie, slecht interpreteerbaar)
Max( bepaalde var) – min( zelfde var) = variatiebreedte
IQR( bepaalde var) = interkwartielafstand
Cov(… , …) = covariantie van 2 variabelen
Cor(… , …) = correlatiecoëfficiënt van 2 variabelen (lineair verband)
Cor(… , …, method = “kendall”) = correlatiecoëfficiënt van Kendall voor 2 variabelen, hierbij
gaat het niet persé over een lineair verband
Lm(formula = y-as naam~x-as naam) = illustreren van regressielijn
Hoofdstuk 3
Pnorm(q = … , mean = … , sd = …) = kans berekenen dat x < q waarde (linkerkant verdeling)
-> voor rechterkant toevoegen ‘lower.tail=FALSE’ op einde
Qnorm(p = … . mean = … , sd = …) = waarde berekenen vanaf waar p% eronder ligt
Pt(q = … , df = …) = kans berekenen dat x < q waarde met df vrijheidsgraden (t-verdeling)
Qt(p = … , df = …) = waarde berekenen vanaf waar p% eronder ligt met df vrijheidsgraden
Pf(q = … , df1 = … , df2 = …) = kans berekenen dat x < q waarde met df vrijheidsgraden (f-
verdeling)
Qf(p = … , df1 = … , df2 = …) = waarde berekenen vanaf waar p% eronder ligt met df
vrijheidsgraden
Hoofdstuk 6