Análisis de Datos II
TEMA 1. PRINCIPIOS DE INFERENCIA ESTADÍSTICA 3
TEMA 2. MUESTREO 5
TEMA 3. ESTIMACIÓN PUNTUAL 14
TEMA 4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA 19
TEMA 5. CONTRASTES DE HIPÓTESIS PARAMÉTRICOS 29
TEMA 6. CONTRASTES DE HIPÓTESIS NO PARAMÉTRICOS 47
,Análisis de Datos II
2
, Análisis de Datos II
TEMA 1. PRINCIPIOS DE INFERENCIA ESTADÍSTICA
Inferencia → Es la parte de la Estadística que estudia grandes colectivos a partir de una
pequeña parte de éstos. Consiste en, una vez estudiada la muestra, proyectar las
conclusiones obtenidas al conjunto de la población. Para lograrlo, una muestra debe ser:
● Representativa de la población (métodos de muestreo).
● Debe cumplir unos objetivos de precisión (tamaño muestral frente a error).
Clasificación de los procedimientos inferenciales:
● Inferencia paramétrica. Se admite que la distribución de la población pertenece a
una cierta familia paramétrica de distribuciones, siendo necesario únicamente
precisar el valor de los parámetros para determinar la distribución poblacional.
● Inferencia no paramétrica. No supone ninguna distribución de probabilidad de la
población, exigiendo sólo hipótesis muy generales, como puede ser la de simetría.
Dentro de cada procedimiento:
1. Inferencia paramétrica: puede ser estudiada desde 2 enfoques:
a. Enfoque clásico. En el cual los parámetros de la distribución de probabilidad
de la población se consideran constantes.
b. Enfoque bayesiano. Considera a los parámetros como variables aleatorias,
permitiendo introducir información sobre ellos a través de distribución a priori.
2. Inferencia no paramétrica. Los procedimientos no paramétricos se clasifican en:
a. Procedimientos de localización. Estudian los parámetros de localización de
la distribución.
b. Procedimientos de estructura. Analizan las condiciones que se dan en la
distribución de la variable.
c. Procedimientos sobre las condiciones de la muestra. Comprueban si se
verifican las hipótesis exigibles a los valores muestrales, como la
independencia, ausencia de valores atípicos, etc.
La información de una población y su extracción se llevan a cabo por medio de:
● La Teoría de Muestras. Necesita establecer los protocolos que se deben respetar
para alcanzar los niveles de representatividad y precisión prefijados; a ésto se le
llama diseño muestral, que conduce a una muestra potencial. Una vez realizado
dicho diseño, se procede a la obtención de una o varias muestras mediante la
observación, la medición o la encuestación.
● El Diseño de Experimentos, tiene su origen con una clara aplicación al mundo
agrícola. El campo de aplicación se ha ido extendiendo con el paso de los años,
teniendo en la actualidad una aplicación generalizada en la mayoría de los campos
científicos. No se considera como objeto de análisis, con lo cual los estudios que a
continuación se llevan a cabo se restringen a la Teoría de Muestras.
3
, Análisis de Datos II
Es necesario aclarar algunas cuestiones para entender el desarrollo teórico:
● Cuando se plantea realizar un estudio inferencial se debe realizar un diseño
muestral. Esto implica que cada elemento de la muestra potencial es una variable
aleatoria unidimensional, mientras que la muestra es un vector aleatorio de
dimensión el tamaño de ésta. Además, no debe confundirse al propio elemento con
la característica o características que se desean estudiar de éste.
● Cuando de cada elemento o individuo se estudia una única característica se habla
de análisis univariable o univariante, cuando se estudian dos, bivariable o bivariante
y cuando se consideran más de dos, multivariable o multivariante. En lo que sigue,
se considerará un análisis univariable.
● Una muestra de tamaño n será denotada por (X1 , . . . ,Xn ) o bien, por X. Cada Xi ,
con i = 1, . . . , n, es una variable aleatoria que representa la característica bajo
estudio del elemento i-ésimo de la muestra.
Las razones que nos llevan a hacer un estudio inferencial son las siguientes:
● Por motivos presupuestarios. La realización de un estudio a través de muestras
supone un ahorro (dinero, tiempo, etc).
● A veces no todos los elementos de una población están localizables.
● En ocasiones la población tiene un gran número de elementos, pudiendo ser ésta
potencialmente infinita (p.e. experimentos aleatorios, como la tirada de un dado o la
contabilización del número de clientes que utilizan un cierto servicio en un periodo
determinado).
● Existen situaciones en las que las pruebas son de naturaleza destructiva (control de
calidad).
● Por motivos de precisión. Aunque parezca contradictorio, a veces un análisis total,
implica el que se cometan errores graves en la medición, codificación, resumen, etc.,
cuestiones que pueden ser mucho mejor controladas utilizando un estudio a partir de
una muestra (p.e. medidores–observadores–encuestadores en campañas de
marketing).
Algunos ejemplos podrían ser:
● Un técnico especialista desea estimar el tiempo medio de duración de un lote
correspondiente a un determinado tipo de prótesis sometiéndolas a diferentes
pruebas de desgaste.
● En un estudio se pretende estimar el tiempo medio de espera en la sala de
urgencias de un centro hospitalario.
● Se desea contrastar si la proporción de fumadores en España es superior al 45%.
4