COMANDOS RSTUDIO: (lo de dentro del paréntesis es la variabe)
Swirl:
> library(swirl)
> uninstall_all_courses()
> install_course_github("wagafo","Analisi_Dades_Catala",multi=TRUE)
Ara, inicieu el swirl:
> swirl()
Mitjana: mean(variable)
Mediana: median(variable)
Moda: table(variable) para poner la tabla y ver cuál es el número que está más veces repe.
Rang: range(variable)
Variància: var(data)--> por ejemplo var(variable)
Desviació estàndard: sd(data)--> sd(variable)
Todos los datos a la vez: summary(variable) nos da el max, min, cuartils, mediana, mitjana a la
vez.
Per veure si heu llegit les dades correctament: > head(variable)
Conjunt de resums més complet: > install.packages("psych") > library("psych"):
>describe(variable): Podem veure la mitjana (mean), la desviació estàndard (sd), la mediana
(median), el mínim (min), el màxim (max), el rang (range), el coeficient d'asimetria (skew) i la
curtosis (kurtosis), entre d'altres estadístics que no fem servir a aquest curs.
CON PAQUETE “ACTUAR”:
Ver dades agrupades: > gdental
Suma de variable al objeto de dades agrupades: sum(gdental$nj)
Mitjana: mean(gdental)
5 números resumen: > quantile(variable)
Diagrama de cajas con 5 números resumen: > boxplot(quantile(variable),range=0)
Desviación estándar: > sqrt(emm(gdental,order=2) - mean(gdental)^2)
Tabla de frecuencias: > frequency_table
Límits dels intervals: > cj <- c(0,20,40,60,80,100)
Introducir frecuencias: > nj <- c(5,10,25,10,5), en verdad es > nj <- c(f1,f2,f3,f4,f5,…)
Crear objeto dades agrupades: > x <- grouped.data(Group=cj, Frequency=nj)
, Histograma de dades agrupades: > hist(x)
TRANSFORMACIÓ DE DADES:
Veure dades: head(viatge)
Resums númerics: describe(viatge$euros) →necesita el paquete psych
Nueva variable con la transformación de datos: lliures <- (viatge$euros - 50)/1.12
Crear un nou marc de dades amb la variable transformada: data.frame(lliures) -> viatge_nou
Redondear la variable a 2 decimales: viatge_nou$lliures <- round(viatge_nou$lliures,2)
Mitjana: mitjana_lliures = (mitjana_euros - 50)/1.12
Mediana: mediana_lliures = (mediana_euros - 50)/1.12
Desviación estándar: desv_estand_lliures = desv_estand_euros/1.12
Transformació logarítmica: noves_dades = log(dades_originals)
Transformar els valors originals en euros al logaritme natural d'aquests valors: log_euros <-
log(viatge$euros).
Histograma: hist(log_euros).
GRÁFICOS CON RSTUDIO:
> table(variable)
Eixample Gracia Raval Sants
4 7 5 4
Per obtenir el mateix en freqüències relatives, és a dir proporcions, l'ordre és la següent:
> prop.table(table(variable))
Eixample Gracia Raval Sants
0.20 0.35 0.25 0.20
Si es vol en percentatges:
> 100*prop.table(table(variable))
Eixample Gracia Raval Sants
20 35 25 20
Diagrama de pastís:
> variable.freq <- table(variable)
> pie(variable.freq)
Diagrama de barres: