l
Estadística Aplicada e
GRADO EN
Informática para QUÍMICA
Químicos
ADRIANA VÁZQUEZ SILVA
, Estadística Aplicada e Informática para Químicos | Adriana Vázquez Silva
TEMA 1: ESTADÍSTICA
DESCRIPTIVA.
1. CONCEPTOS GENERALES.
La estadística es la parte de las matemáticas que trata de la recopilación, resumen, presentación e
interpretación de datos. Estudia los métodos para analizar datos y extraer conclusiones sobre ellos. Tener
datos de calidad es esencial: son la base para obtener información y hacer interferencias. Dividimos la
estadística aplicada en estadística descriptiva e inferencia estadística (estadística inferencial).
Hablamos de tres grandes disciplinas en estadística:
a) Estadística descriptiva: recoger, clasificar y resumir los datos (muestra). Esos datos
contienen la información. No se pretende sacar conclusiones.
b) Cálculo de probabilidades: parte de la matemática teórica que estudia las leyes que rigen los
mecanismos aleatorios.
c) Inferencia estadística: extraer conclusiones estadísticas sobre una población a partir de la
muestra, empleando la probabilidad.
El grado de fiabilidad se puede fijar de antemano. Otros conceptos:
• Población: conjunto de individuos (objetos, personas, entidades en general) estudiados para
extraer conclusiones, en caso de que esa sea la finalidad.
• Individuo: cada elemento de la población.
• Muestra: subconjunto, parte representativa de la población, seleccionada para obtener
información. El número de individuos de la muestra que la componen es el tamaño de la
muestra.
• Variable estadística: característica que se utiliza para describir a cada individuo de la
muestra.
Ejemplo 1.1: estudio de la cantidad de residuo seco en agua de una cierta marca comercial, la
aceptación o no de lotes de producción, a análisis de sangre…
Los pasos por seguir para realizar un análisis estadístico de una población es seleccionar una
muestra que nos permita un cálculo de probabilidades y dar una descripción de esta, sin extraer
conclusiones de la población. De todas formas, podemos a partir de una muestra obtener
conclusiones de la población a partir de una inferencia estadística.
Por lo tanto, podemos hacer un esquema de las partes que engloba esta rama matemática en:
resumir la información
contenida en una muestra
Técnicas descriptivas
métodos numéricos
métodos gráficos
ESTADÍSTICA
extraer conclusiones sobre
una población a partir de
una muestra
Técnicas interferenciales
estimación de parámetros
contrastes de hipótesis
1
, Estadística Aplicada e Informática para Químicos | Adriana Vázquez Silva
Las tablas de datos que trabajaremos en EAIQ serán de una sola variable, lo cual hace que sean
más o menos complejas.
Ejemplo 1.2: Valores de parámetros en muestras de sangre de adolescentes, Altura en cm de
alumnos de EAIQ (grupos E1 y E2, 2021/22).
2. TIPOS DE VARIABLES.
Nominales: sin nacionalidad,
ordenación estado civil...
Cualitaticas o no medibles, no
categóricas son números
Ordinales: calidad,
ordenables instrucción...
Variables
estadísticas
número de
Discretas: valores
hermanos, ritmo
separados entre si
cardíaco...
Cuantitativas o medibles, son
numéricas números
Continuas: peso, altura,
cualquier valor concentración...
Según como se mida, una variable cuantitativa puede dar distintos tipos de datos (y ser discreta o
continua).
3. DISTRIBUCIÓN DE FRECUENCIAS.
Se debe comenzar con la inspección de los datos.
Tabla de frecuencias: es una tabla que resume la información de la muestra (de tamaño n: x1, x2,
..., xn) obtenida de una población. Hay algunas diferencias en la construcción de las tablas de frecuencias
según el tipo de variable (cualitativa, cuantitativa, discreta, continua).
Para una distribución unidimensional:
- Modalidad (ci): cada uno de los “k” valores distintos de la variable (c1, c2, ..., ck) cualitativa
o cuantitativa discreta.
- Frecuencia absoluta (ni): número de individuos en cada modalidad (“ci”). Número de veces
(n1, n2, ..., nk) que aparece cada valor (“k”) de la variable.
- Frecuencia relativa, proporción o tanto por uno (fi): proporción de veces (f1, f2, ..., fk)
que aparece cada valor (“k”) para cada modalidad (“ci”). Fi= ni/n
- Frecuencia porcentual, porcentaje o tanto por ciento (%): frecuencia relativa (fi)
multiplicada por 100.
Para variables cualitativas:
2
, Estadística Aplicada e Informática para Químicos | Adriana Vázquez Silva
Ejemplo 1.4: tabla de frecuencias de alumnos
de EAIQ (grupos E1, E2, 2021/22), según su
color de ojos.
Para variables cuantitativas:
- Frecuencia absoluta acumulada (Ni):
número de veces que se ha observado un resultado, siempre menor o igual que la modalidad.
- Frecuencia relativa acumulada (Fi): suma de las frecuencias relativas, incluida la modalidad
considerada. La frecuencia absoluta divida por el tamaño de la muestra (n). Proporción
acumulada de casos o modalidades.
- Densidad de frecuencia: cociente de la frecuencia relativa y la amplitud del intervalo. Útil
en variables cuantitativas continuas.
Algunas propiedades para tener en cuenta de la distribución de frecuencias unidimensional son:
- La frecuencia absoluta: 0 <ni< n; i 1, 2, ..., k.
- La frecuencia absoluta acumulada: Nk= n1+ n2+ ... nk = n.
- La frecuencia relativa: 0<fi<1; i=1, 2, k.
- La frecuencia relativa acumulada: Fk= f1+ f2, ... fk= 1.
Ejemplo 1.5: Completar la tabla de frecuencias de los 50 datos de concentración (en µg/mL) de
NO3 – de la tabla. Hay que recordar que la frecuencia relativa y la frecuencia relativa acumulada debe dar
1, la frecuencia absoluta y la frecuencia absoluta acumulada debe ser igual al número de datos ofrecidos.
3