1 Introducción
¿Qué es la estadı́stica multivariante?
Son todas aquellas técnicas estadı́sticas que analizan simultáneamente múltiples
resultados sobre unas observaciones (individuos, encuestas, paı́ses...) respecto
de unas variables bajo estudio (nivel de renta, intención de voto, ...).
El objetivo de la estadı́stica multivariante es:
• Medir, explicar y predecir el grado de relación que existe entre las variables
y las observaciones.
• Es multivariante no solo por el número de variables sino principalmente
por las múltiples combinaciones y relaicones que existen entre ellas.
• La estadı́stica multivariante no es la combinación de estaddı́sticas univari-
antes.
A continuación, definiremos el concepto de unidad experimental.
Una unidad experimental es cualquier objeto o concepto sobre el que se puede
medir o evaluar atributos o caracterı́sticas de alguna manera. A cada atributo
o caracterı́stica se le llama variable. Siempre que un investigador mide o evalue
más de un atributo o caracterı́stica en cada unidad experimental obtendrá datos
de variables múltiples.
El objetivo principal de estos métodos es resumir grandes cantidades de datos
por medio de un número reducido de parámetros.
El Análisis Factorial y el Análisis de Correlación Canónica están dirigidos hacia
las variables. Ambos métodos tratan de detectar las relaciones que existen entre
ellas.
Otras técnicas como el Análisis Discriminante y Clasificación están enfocadas
hacia el establecimiento de relaciones entre las observaciones.
1
,1.1 Tipos de variables
Las variables que se utilizan en las ténicas multivariantes pueden ser:
• Continuas: son aquellas cuyos valores pueden tomar cualquier número
real de un intervalo dado.
• Numéricas discretas: son aquellas que sólo pueden tomar un número
finito o infinito numerable de valores y entre ellos existe un orden.
• Discretas no numéricas: pueden tomar un número finito de valores y
entre ellos, no se puede establecer ningún tipo de orden. Las llamaremos
cualitativas o categóricas y a los posibles valores que tomen les llamaremos
categorı́as.
En muchas técnicas multivariantes se utiliza la hipótesis de Normalidad mul-
tivariant para un conjunto de variables, esto implica que las variables deberı́an
ser continuas, simétricas, etc.
1.2 Datos faltantes y atı́picos
Antes de llevar a cabo cualquier técnica multivariantes es preciso tratar de cribar
los datos. Los errores en la entrada de datos suelen ser inevitables y es necesario
tratarlos.
Dos de los errores que se producen en todo el proceso son:
• La existencia de datos faltantes (otra denominación que usaremos
será la de missing), que suelen producirse durante la fase de muestreo.
• La existencia de datos atı́picos. Estos últimos pueden producirse por
simple error en la codificación posterior a la toma de la muestra.
1.2.1 Datos faltantes
Muchas de las observaciones que se recogen en una muestra no se encuentran
completas, es decir, existen valores faltantes para algunas de las variables. La
manera de actuar ante esta situación es variada, las dos opciones más utilizadas
son:
• Reemplazar por el valor medio. Suele ser desaconsejable produciendo
situaciones aberrantes y disminuyendo la variabilidad de los datos.
• Eliminar las observaciones con algún dato faltante. Es la más razonable
pero provoca una reducción de la muestra que puede llegar a ser dramática.
• Utilizar técnicas de imputación multivariantes cuando exista relación entre
variables.
2
, 1.2.2 Datos atı́picos
Los datos atı́picos se definen como datos de la muestra que parecen no ser
coherentes con el resto. La caracterización de estos valores se basa en que su
distancia con el resto de los datos debe ser grande. Existen diferentes métodos
para su localización:
• Gráficos
• Análisis de Componentes Principales
• Inferencia
1.2.3 Datos estandarizados
A veces los datos son más fácilmente comprensibles y comparables cuando las
variables se estandarizan, de modo que se midan en las mismas unidades. Esto
se consigue mediante la eliminación de las unidades de medida.
Dada una variable Xi se define como Zi = X√iσ−µ i,j
i
a la variable estandarizada
(se le resta su valor esperado y se divide por su desviación tı́pica).
Se recomienda la estandarización cuando las variables medidas tienen unidades
completamente diferentes.
1.2.4 Correlación muestral. Pruebas estadı́sticas
La correlación mide la intensidad de relación lineal entre las variables. Dos vari-
ables pueden estar relacionadas entre sı́ y su correlación ser nula (incorreladas).
A partir del coeficiente exacto de correlación deberemos determinar si el valor
es significativo o no.
Siempre que la muestra esté formada por más de 12 observaciones una cor-
relación superior de 0.6 se puede considerar significativa.
1.2.5 Etapas del análisis multivariante
1. Objetivos del análisis
• Definir el problema
• Fijar los objetivos
• Elección de técnicas estadı́sticas multivariantes
2. Diseño, descriptiva y preprocessing
• Tamaño muestral
• Missing data
• Outliers
• Distancia a calcular
3
Los beneficios de comprar resúmenes en Stuvia estan en línea:
Garantiza la calidad de los comentarios
Compradores de Stuvia evaluaron más de 700.000 resúmenes. Así estas seguro que compras los mejores documentos!
Compra fácil y rápido
Puedes pagar rápidamente y en una vez con iDeal, tarjeta de crédito o con tu crédito de Stuvia. Sin tener que hacerte miembro.
Enfócate en lo más importante
Tus compañeros escriben los resúmenes. Por eso tienes la seguridad que tienes un resumen actual y confiable.
Así llegas a la conclusión rapidamente!
Preguntas frecuentes
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
100% de satisfacción garantizada: ¿Cómo funciona?
Nuestra garantía de satisfacción le asegura que siempre encontrará un documento de estudio a tu medida. Tu rellenas un formulario y nuestro equipo de atención al cliente se encarga del resto.
Who am I buying this summary from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller perdi12. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy this summary for 2,99 €. You're not tied to anything after your purchase.