R – Studio
R labs Business statistics weak 1 to 3
CODES VERBERGEN
Je kan data op verschillende manieren weergeven. Via een tabel of/en via
een grafiek.
Als je alleen de data wilt en niet de plot data (code) moet je de ```{r}
veranderen
```{r result = ‘hide’}
print(iris)
Als je alleen de output wilt en niet de code moet je typen
```{r result = FALSE}
print(iris)
HULP VRAGEN
Als je niet weet hoe je iets moet gebruiken type je ?functie of
help(functie). Je kirjgt dan een scherm met een overzicht waarop uitgelegd
wordt hoe je de formule gebruikt.
SOMMEN MAKEN
2 + 2 in art geeft [1]4. Je kan ervoor kiezen ruimte te laten tussen de
2+2 om het overzichtelijker te houden. Het verandert niks aan het
uiteindelijke antwoord.
Als je 2 + 2 intypt en je klikt op enter gaat die naar de volgende regel. Bij
control enter berekend R de uitkomst voor je.
A <- 10 * 6. Je geeft hiermee aan dat iedere keer als je a uitrekend er
eigenlijk 10*6 wordt berekend oftewel 60. Als je nu dus a control enter
typt krijg je [1]60.
- Wil je de waarde van a veranderen kan dit door a opnieuw als naam
te gebruiken bij een andere waarde. Bijvoorbeeld a <- 8. Vanaf nu
geeft a control [1]8.
- Echter kan je a ook helemaal verwijderen door te doen rm(object)
oftewel rm(a) control enter.
,#wordt niet gelezen door R. Het is alleen voor jezelf om een notitie te
maken van wat je hebt gedaan en hoe je het hebt gedaan.
Getallen kan je gewoon typen. Woorden echter niet. Je moet woorden tussen
aanhalingstekens zetten. Zonder de ‘…..’ pakt die hem niet.
Bij false en true moet je het in capital letters typen. Dus FALSE en TRUE.
VECTOR:
c(data) control enter is een vector.
- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10) kan je ook schrijven als
c(1:10).
- c(‘mon’, ‘thu’, ‘wed’, ‘thur’, ‘fri’).
- c(TRUE, TRUE, FALSE) kan je ook schrijven als c(T, T, F).
myVector <- c(data) zorgt dat je alleen maar myVector hoeft te typen voor
de vector.
Je kan nu ook doen myVector * 2. Dan worden alle waarde van
jouw vector *2 gedaan.
LIST:
list(data of different elements). Ze worden verticaal i.p.v. horizontaal
gepubliceerd. Je kan dus verschillende elementen gebruiken in een list
- list(1, 2, 3, ‘hello’, F, T, ‘oke’)
- list(myVector, 1, 2, 3). De vector wordt dan horizontaal gepubliceerd
en de 1, 2, 3 verticaal.
- list(myVector, c(1, 2, 3)). De 1, 2, 3 wordt nu ook horizontaal
gepubliceerd.
,Je kan een list ook een naam geven op dezelfde manier als hierboven. Zo
kan je bijvoorbeeld Days <- c(‘mon’, ‘tue’, ‘wed’, ‘thus’, ‘wed’).
Je kan deze list genaamd Days gebruiken om een specifieke waarde uit de
list te selecteren.
- Days[1] geeft ‘mon’
- Days[2:4] geeft ‘tue’, ‘wed’, ‘thus’
- Days[-5] geeft ‘mon’, ‘tue’, ‘wed’, ‘thus’
- Days[c(1, 2, 5)] geeft ‘mon’, ‘tue’, ‘fri’
FUNCTION:
Je hebt verschillende gegevens die je kan uitrekenen door middel van R.
- mean(dataset)
o Als je de mean van een bepaalde rij wilt doe je
mean(dataset$rij).
o Als er een NA in staat doe je mean(dataset$rij, na.rm =
TRUE).
Let op! De optie na.rm is niet voor alle functies in R
beschikbaar. Hij is er echter wel voor de functies: mean,
sd, max, min, sum, mediaan.
- median(dataset)
- min(dataset)
- max(dataset)
- sum(dataset)
- sd(dataset)
o Standaarddeviatie. De sqrt van de variatie is gelijk aan sd.
- class(dataset)
o Laat zien wat voor dataset het is.
- lengthe(dataset)
o Laat zien hoeveel elementen er in de dataset zitten.
- log..(dataset)
o Maakt van de waardes een loggetal. Op de … vul je het
grondgetal in.
- sqrt(dataset)
- summary(dataset)
Je kan ook quantile berekenen. Denk hierbij aan het 33.33rd, 50th,
66.67th. Je doet dit door in te typen
`r quantile(my_testdata$Salary, probs = c(0.3333, 0.5, 0.6667))`
summary(my_testdata$Salary)
, je krijgt dan:
## Min. 1stQu. Median Mean 3rdQu Max NA
## 20000 28750 40000 42500 56250. 70000 1
Als je van het hele bestand een summary maakt en niet alleen van 1
enkele rij krijg je:
DATA FRAME:
Bij een dataframe maak je apart vectoren en stopt ze daarna bij elkaar.
group <- c(rep(‘vehicle’, 100), rep(‘drug’, 100))
je geeft hier aan dat je het word vehicle en drug 100x
laat herhalen.
respons <- c(rnorm(100, 25, 5), rnorm(100, 23, 5)
id <- c(rep(‘Lora’, 50), rep(‘Britt’, 50), rep(‘bas’, 100)
Om een dataframe te maken gebruik je data.frame. je typt dan eerst de
kollom naam en daarna de vector. Dan doe je een komma en ga je naar
de volgende kollom/vector. Je geeft de dataframe ook een naam om hem te
kunnen plakken.
myData <- data.frame(Patient = id, Treatment = Group, Respons =
response)