Pedro Ascaso Sandoval
1. ESTADÍSTICA DESCRIPTIVA UNIVARIADA compararán los estadísticos de las distribuciones en cada uno de los grupos correspondientes a las
categorías de la variable categórica.
Conjunto de técnicas que permiten resumir y presentar de forma clara y concisa los datos registrados
en una muestra y que, por tanto, nos da una primera idea sobre la variabilidad de una medida. Des. 2 variables Continuas. Diagrama de dispersión. COVARIÀNCIA (inútil, té unitats) 𝐶𝑜𝑣 =
∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)⁄𝑛, → Coeficiente de correlación lineal de Pearson IMP. (no unid, de 1 a -1) r=1:
Hay diversos tipos de variables categóricas: pueden ser nominales, variables referentes a un atributo dependencia lineal directamente proporcional. Correlación positiva. R=0: ausencia de dependencia
(sexo, grupo sanguíneo, etc.); pueden representar un orden de magnitud, es decir variables lineal. Para saber la cantidad de valores que se explican a partir de este estadístico utilizamos el
categóricas ordinales (grado de dolor –mucho, bastante, poco, muy poco-, la edad registrada en Coeficiente de determinación r2 . (r>0,7 o r < -0,7. Dep. lineal)
franjas, etc.); pueden ser el resultado de un conteo, número de veces que se produce un fenómeno
y, en este caso, las categorías no son más que números enteros (número de leucocitos por mm3, Des. Variables discretas. No descripción exacta de cómo actuar con esta variable.
accidentes laborales en una empresa por mes, etc.).
El segundo grupo, las variables continuas, está formado por toda aquella variable cuyo valor es el 3. INFERENCIA ESTADÍSTICA
resultado de aplicación de una escala métrica y por lo tanto expresa el número de veces que la
observación contiene a la unidad de medida y sus fracciones. Ejemplos de este tipo de variables son La finalidad de la inferencia estadística es extraer conclusiones para la población a la que pertenece
la talla o el nivel de glucosa en sangre. el grupo reducido de indiviudos.
V. Categóricas cualitativas. Distribución de frecuencias. Diagrama de barras. Diagrama de sectores Partiremos de un desconocimiento de la realidad en la población y sólo dispondremos de la
información obtenida en una muestra limitada de casos. Los valores obtenidos de esta muestra,
V. cuantitativas continuas. Med. Tend. Cen. (Media, Mediana, Moda) Med. Disp. (Rango “dif valores llamados estadísticos (media muestral 𝑥, desviación típica (s), proporción muestral (p), etc.) serán la
extremos”, Varianza 𝑠 2 →DE (s), Coeficiente de variación (CV)” comparar dispersión/variabilidad” base a partir de la cual inferiremos a la población con el fin de conocer los verdaderos parámetros
𝐶𝑉 = 𝑠⁄𝑥̅ , Distribución de percentiles, Rango intercuartílico. Med. Forma. Distr Coeficiente del sesgo (media poblacional (μ), desviación típica poblacional (σ), proporción poblacional (π), etc). Los
𝑥̅ −𝑥̃
de Pearson 𝑎: , “no se usa a la practica”, Coeficiente de sesgo de Fisher g3 <0>, Curtosi: presencia estadísticos son, pues, estimaciones de los parámetros poblacionales.
𝑠
de valores extremos, g4>3→aguja. =3 →Gauss. Representación Gráfica, Histograma, Diagrama de Características muestra: Representatividad, Tamaño, Aleatoriedad.
cajas (a mas de 1,5 amplitudes intercuartilianas se considera un valor atípico, i a valores 3 veces
mayores a la amplitud intercuartiliana valor extremo) 3.4. Las distribuciones de probabilidad
V. Categoricas cuantitativas (discretas). Depende. El proceso de inferencia se basa en el calculo de probabilidades como herramienta para extraer
2. ESTADÍSTICA DESCRIPTIVA BIVARIADA conclusiones para una población a partir de una muestra.
Des. 2 Variables Categóricas. Tabla de contingencia (Distribuciones condicionadas “fijar Distribución Normal. Se trata de una distribución para variable continua muy popular debido a que
columna/fila”, Distribución conjunta “sobre la muestra total”, Distribuciones marginales “. Rep. Graf. se ha observado que muchos fenómenos naturales se ajustan a su comportamiento. N(µ,σ2)
Diagrama de barras doble. Med. Asociación Razón de prevalencias (RP) para estudios transversales, Distribución t de Student. Se utiliza cuando no sabemos estadísticos poblacionales. Depende del
Razón de densidades de incidencia para estudios longitudinales. “RP es el cociente entre dos tamaño muestral.
prevalencias, en nuestro caso entre la prevalencia de hombres y mujeres” “se puede afirmar que en
nuestra muestra la prevalencia de fumadores es mas del doble entre hombres que entre mujeres”; Distribución Binomial. Variable de estudio dicotómica.
Razón de odds (OR) “ es un cociente de odds. La odds se define como la cantidad resultante de dividir
la probabilidad de que se produzca el evento de interés y la probabilidad de que no se produzca. 4. ESTIMACIÓN POR INTERVALO
𝑜𝑑𝑑𝑠ℎ𝑜𝑚𝑏𝑟𝑒𝑠 = 𝑃(𝐹𝑢𝑚𝑎𝑟 = 𝑆𝑖 ; 𝐻𝑜𝑚𝑏𝑟𝑒)⁄𝑃(𝐹𝑢𝑚𝑎𝑟 = 𝑁𝑜 ; 𝐻𝑜𝑏𝑟𝑒) Mismo proceso con mujeres, El intervalo de confianza nos señala entre que dos valores es posible que esté el parámetro
el cociente de estas dos odds seria la OR. En el ej: 𝑂𝑅 = 1,25⁄0,35 = 3,57. El número de fumadores poblacional, mostrándonos, por tanto, la precisión con la que creemos haber identificado al mismo,
respecto a no fumadores es 3,57 veces mayor en hombres que en mujeres. La OR siempre es más controlando también el riesgo de que el valor real no esté dentro del rango que damos como posible.
extrema que la RP. OR=1 Las dos variables estadísticas son independientes. P(π-p < 0,01)=0,95 Eso significa que de cada 100 muestras obtenidas, en 95 tendríamos una
proporción muestral que se alejaría de la proporción real como máximo en un 1%. 1-α → Nivel de
Des. 1 Continua 1 Categórica. La Bivariada consiste en ofrecer las distribuciones de la variable confianza.
continua para cada uno de los grupos de la variable categórica. De la misma manera que describíamos
la distribución de una sola variable continua (ten. Centr. Disper. Forma) ahora se describirá y