1 Introducción
¿Qué es la estadı́stica multivariante?
Son todas aquellas técnicas estadı́sticas que analizan simultáneamente múltiples
resultados sobre unas observaciones (individuos, encuestas, paı́ses...) respecto
de unas variables bajo estudio (nivel de renta, intención de voto, ...).
El objetivo de la estadı́stica multivariante es:
• Medir, explicar y predecir el grado de relación que existe entre las variables
y las observaciones.
• Es multivariante no solo por el número de variables sino principalmente
por las múltiples combinaciones y relaicones que existen entre ellas.
• La estadı́stica multivariante no es la combinación de estaddı́sticas univari-
antes.
A continuación, definiremos el concepto de unidad experimental.
Una unidad experimental es cualquier objeto o concepto sobre el que se puede
medir o evaluar atributos o caracterı́sticas de alguna manera. A cada atributo
o caracterı́stica se le llama variable. Siempre que un investigador mide o evalue
más de un atributo o caracterı́stica en cada unidad experimental obtendrá datos
de variables múltiples.
El objetivo principal de estos métodos es resumir grandes cantidades de datos
por medio de un número reducido de parámetros.
El Análisis Factorial y el Análisis de Correlación Canónica están dirigidos hacia
las variables. Ambos métodos tratan de detectar las relaciones que existen entre
ellas.
Otras técnicas como el Análisis Discriminante y Clasificación están enfocadas
hacia el establecimiento de relaciones entre las observaciones.
1
,1.1 Tipos de variables
Las variables que se utilizan en las ténicas multivariantes pueden ser:
• Continuas: son aquellas cuyos valores pueden tomar cualquier número
real de un intervalo dado.
• Numéricas discretas: son aquellas que sólo pueden tomar un número
finito o infinito numerable de valores y entre ellos existe un orden.
• Discretas no numéricas: pueden tomar un número finito de valores y
entre ellos, no se puede establecer ningún tipo de orden. Las llamaremos
cualitativas o categóricas y a los posibles valores que tomen les llamaremos
categorı́as.
En muchas técnicas multivariantes se utiliza la hipótesis de Normalidad mul-
tivariant para un conjunto de variables, esto implica que las variables deberı́an
ser continuas, simétricas, etc.
1.2 Datos faltantes y atı́picos
Antes de llevar a cabo cualquier técnica multivariantes es preciso tratar de cribar
los datos. Los errores en la entrada de datos suelen ser inevitables y es necesario
tratarlos.
Dos de los errores que se producen en todo el proceso son:
• La existencia de datos faltantes (otra denominación que usaremos
será la de missing), que suelen producirse durante la fase de muestreo.
• La existencia de datos atı́picos. Estos últimos pueden producirse por
simple error en la codificación posterior a la toma de la muestra.
1.2.1 Datos faltantes
Muchas de las observaciones que se recogen en una muestra no se encuentran
completas, es decir, existen valores faltantes para algunas de las variables. La
manera de actuar ante esta situación es variada, las dos opciones más utilizadas
son:
• Reemplazar por el valor medio. Suele ser desaconsejable produciendo
situaciones aberrantes y disminuyendo la variabilidad de los datos.
• Eliminar las observaciones con algún dato faltante. Es la más razonable
pero provoca una reducción de la muestra que puede llegar a ser dramática.
• Utilizar técnicas de imputación multivariantes cuando exista relación entre
variables.
2
, 1.2.2 Datos atı́picos
Los datos atı́picos se definen como datos de la muestra que parecen no ser
coherentes con el resto. La caracterización de estos valores se basa en que su
distancia con el resto de los datos debe ser grande. Existen diferentes métodos
para su localización:
• Gráficos
• Análisis de Componentes Principales
• Inferencia
1.2.3 Datos estandarizados
A veces los datos son más fácilmente comprensibles y comparables cuando las
variables se estandarizan, de modo que se midan en las mismas unidades. Esto
se consigue mediante la eliminación de las unidades de medida.
Dada una variable Xi se define como Zi = X√iσ−µ i,j
i
a la variable estandarizada
(se le resta su valor esperado y se divide por su desviación tı́pica).
Se recomienda la estandarización cuando las variables medidas tienen unidades
completamente diferentes.
1.2.4 Correlación muestral. Pruebas estadı́sticas
La correlación mide la intensidad de relación lineal entre las variables. Dos vari-
ables pueden estar relacionadas entre sı́ y su correlación ser nula (incorreladas).
A partir del coeficiente exacto de correlación deberemos determinar si el valor
es significativo o no.
Siempre que la muestra esté formada por más de 12 observaciones una cor-
relación superior de 0.6 se puede considerar significativa.
1.2.5 Etapas del análisis multivariante
1. Objetivos del análisis
• Definir el problema
• Fijar los objetivos
• Elección de técnicas estadı́sticas multivariantes
2. Diseño, descriptiva y preprocessing
• Tamaño muestral
• Missing data
• Outliers
• Distancia a calcular
3
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller perdi12. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $3.21. You're not tied to anything after your purchase.