R-script deeltoets 3
#Histogrammen en plots------------------------------------------------------------------------------------------
hist(Genelength$gene,main= 'genlengte frequenties', xlab = 'genlengtes', ylim =
c(0,50),las=2, breaks = 10)
hist() is een histogram maken
het $ teken voor genen zegt dat alleen die kolom gepakt moet worden
- main= '..' is het instellen van de titel van het histogram
- xlab= '..' is het aanpassen van de titel van de x-as
- ylim= c(..) is het aanpassen hoe lang de y-as moet
- las= 2 hierdoor gaan de waardes bij de x-as verticaal staan om ruimte te besparen
- breaks= 10 hierdoor zorg je dat er 10 staven in het histogram zitten
- col=c(2,4) de staven worden rood en donker blauw,
(1=zwart,3=groen,7=geel,5=lichtblauw,6=paars) kleuren kunnen ook door bv. "red"
neer te zetten
mozaiek plot -> mosaicplot(table,...)
staafdiagram -> barplot()
boxplot -> boxplot()
scatterplot-> plot(categorische variabele, numerieke variabele)
par(mfrow=c(1,2)) -> twee diagrammen naast elkaar
#data inladen -------------------------------------------------------------------------------------------------------
cijfers = read.table('https://uva.sowiso.nl/images/uploads/exercises/6750/cijfers.csv',
header=T)#file inladen
- header=T betekend dat de data een titel heeft en R de eerste rij niet moet mee tellen
download data, klik op import environment, klik op From text (base) en laad in
- handig voor als je geen internet hebt.
data("ChickWeight") = data inladen die al in R staat
#tabel info-------------------------------------------------------------------------------------------------------------
head(cijfers) = eerste 6 rijen van tabel laten zien
table(cijfers) = frequentie tabel laten zien van categorische data
expand.grid(1:6,1:6,1:6,1:6,1:6,1:6) = maakt een data frame
#indexeren-----------------------------------------------------------------------------------------------------------
kip46 = ChickWeight[ChickWeight$Chick == 46,] #alle waarde voor kip 46 indexeren
kip46dag10 = kip46[kip46$Time <=10,] #alle waardes voor alles gelijk aan of lager dan 10
#kansberekening----------------------------------------------------------------------------------------------------
Binominaal : dbinom(15,size=100,prob=0.3,log=F) #de kans dat van de 100, 15 overleven
Cumulatieve kans = 1-pbinom(39,size=100,prob=0.3,lower.tail=T,log.p=F)
- de kans dat van de 100, 40 of meer overleven
- lower.tail -> kijkt alleen naar 39 of lager
- 1-.. zodat de de kans van 39 of lager van totaal afhaalt -> kans van 40 of hoger