UNIVERSIDAD DE LA RIOJA
Postgrado al que pertenece: Máster Universitario en Inteligencia Artificial
Denominación de la asignatura: Técnicas de Aprendizaje Automático
Contenido: BLOQUE 2. Evaluación de modelos de aprendizaje automático supervisado
Guía de Estudio: TEMA 4. Regresión linea...
UNIVERSIDAD DE LA RIOJA
Postgrado al que pertenece: Máster Universitario en Inteligencia Artificial
Denominación de la asignatura: Técnicas de Aprendizaje Automático
Contenido: BLOQUE 2. Evaluación de modelos de aprendizaje automático supervisado
Guía de Estudio: TEMA 4. Regresión lineal y métricas de evaluación
Introducción
El aprendizaje automático supervisado se centra en la construcción de modelos predictivos a
partir de datos etiquetados. En este contexto, la regresión lineal es una técnica fundamental
utilizada para modelar la relación entre una variable dependiente y una o más variables
independientes. La evaluación de estos modelos es crucial para determinar su eficacia y
aplicabilidad en problemas del mundo real. Esta guía técnica avanzada proporciona una
comprensión detallada de la regresión lineal y las métricas de evaluación asociadas.
Regresión Lineal
Definición:
La regresión lineal es una técnica estadística y de aprendizaje automático que intenta modelar la
relación entre una variable dependiente (Y) y una o más variables independientes (X). La forma
más simple es la regresión lineal simple, que se define por la ecuación (Y = \beta_0 + \beta_1X + \
epsilon), donde (\beta_0) y (\beta_1) son los coeficientes que se estiman y (\epsilon) es el término
de error.
Características:
Supone una relación lineal entre variables.
Utiliza el método de mínimos cuadrados para minimizar la suma de los cuadrados de las
diferencias entre los valores observados y los valores predichos.
Puede ser extendida a la regresión lineal múltiple con varias variables independientes.
Ventajas:
Simplicidad y facilidad de interpretación.
Eficiencia computacional.
Adecuada para relaciones lineales claras entre variables.
Desventajas:
No captura relaciones no lineales.
Sensible a outliers.
Asume homocedasticidad y normalidad de errores, lo cual puede no cumplirse en todos los
casos.
Métricas de Evaluación
, Definición:
Las métricas de evaluación son herramientas que permiten medir la precisión y rendimiento de un
modelo predictivo. En el caso de la regresión lineal, las métricas más comunes son el Error
Cuadrático Medio (MSE), el Coeficiente de Determinación ((R^2)), y el Error Absoluto Medio
(MAE).
Métricas comunes:
1. Error Cuadrático Medio (MSE):
El Error Cuadrático Medio (MSE, por sus siglas en inglés) es una métrica comúnmente
utilizada para evaluar la precisión de un modelo de regresión. Esta métrica mide el
promedio de los cuadrados de los errores, es decir, las diferencias entre los valores
predichos por el modelo y los valores reales observados. La fórmula matemática del MSE
es la siguiente:
[ ]
^ { y} )
{ n} ( yi − ❑
2
i
¿ {MSE ¿}=¿ { 1 } { n } ∑ ❑
{i=1 }
Donde:
a. ( n ) es el número total de observaciones.
b. ( y_i ) representa el valor real de la i-ésima observación.
c. ( \hat{y}_i ) es el valor predicho para la i-ésima observación.
d. ( \sum ) indica la suma sobre todas las observaciones desde ( i = 1 ) hasta ( i = n ).
El MSE proporciona una medida cuantitativa de la calidad del modelo; cuanto menor sea el
MSE, mejor será el modelo en términos de su capacidad para predecir con precisión los
valores observados. Esta métrica es especialmente útil en la comparación de diferentes
modelos de regresión para determinar cuál ofrece mejores predicciones.
2. Coeficiente de Determinación ((R^2)):
El coeficiente de determinación, conocido como ( R^2 ), es una medida estadística que
indica qué tan bien se ajusta un modelo de regresión a los datos observados.
Específicamente, ( R^2 ) representa la proporción de la varianza en la variable dependiente
que es explicada por las variables independientes en el modelo.
La fórmula matemática del coeficiente de determinación ( R^2 ) es:
[ R =1−¿ { S S{ } }{S S { } } ]
2
res tot
Donde:
a. ( SS_{res} ) es la suma de los cuadrados de los residuos (errores).
b. ( SS_{tot} ) es la suma total de los cuadrados (la suma de los cuadrados de las
diferencias entre los valores observados y la media de los valores observados).
Otra forma de expresar ( SS_{tot} ) y ( SS_{res} ) es la siguiente:
a. ( SS_{tot} = \sum_{i=1}^{n} (y_i - \overline{y})^2 )
b. ( SS_{res} = \sum_{i=1}^{n} (y_i - \hat{y}_i)^2 )
Donde:
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ma_medina. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.16. You're not tied to anything after your purchase.