TEMA 6. Aprendizaje supervisado. Regresión y clasificación con árboles de decisión
4 views 0 purchase
Course
Técnicas de Aprendizaje Automático
Institution
UNIR Business School
UNIVERSIDAD DE LA RIOJA
Postgrado al que pertenece: Máster Universitario en Inteligencia Artificial
Denominación de la asignatura: Técnicas de Aprendizaje Automático
Contenido: BLOQUE 3. Modelos estadísticos y modelos no lineales
Guía de Estudio: TEMA 6. Aprendizaje supervisado. Regresió...
UNIVERSIDAD DE LA RIOJA
Postgrado al que pertenece: Máster Universitario en Inteligencia Artificial
Denominación de la asignatura: Técnicas de Aprendizaje Automático
Contenido: BLOQUE 3. Modelos estadísticos y modelos no lineales
Guía de Estudio: TEMA 6. Aprendizaje supervisado. Regresión y clasificación con árboles
de decisión
Esta guía debería proporcionar una comprensión sólida y avanzada sobre el tema de regresión y
clasificación con árboles de decisión en el contexto del aprendizaje supervisado.
Introducción
En el ámbito de la inteligencia artificial y el aprendizaje automático, el aprendizaje supervisado se
destaca como uno de los paradigmas más importantes y utilizados. Dentro de este paradigma, los
árboles de decisión son herramientas fundamentales para las tareas de regresión y clasificación.
Esta guía de estudio avanzada y técnica se centra en el Bloque 3: Modelos estadísticos y
modelos no lineales, específicamente en el Tema 6: Aprendizaje supervisado. Regresión y
clasificación con árboles de decisión. Se abordarán definiciones, características, ventajas y
desventajas de cada método, así como recomendaciones y conclusiones respaldadas por
referencias bibliográficas.
Definición
Aprendizaje Supervisado:
El aprendizaje supervisado es un tipo de aprendizaje automático en el cual un modelo es
entrenado utilizando un conjunto de datos etiquetados. Esto significa que cada ejemplo en el
conjunto de datos incluye una entrada y una salida deseada. El objetivo es que el modelo
aprenda a mapear las entradas a las salidas correctas para hacer predicciones en datos no
vistos.
Árboles de Decisión:
Los árboles de decisión son modelos predictivos utilizados tanto para tareas de clasificación como
de regresión. Un árbol de decisión estructura los datos en forma de árbol, donde cada nodo
interno representa una "prueba" sobre un atributo, cada rama representa el resultado de la
prueba, y cada hoja representa una etiqueta de clase o un valor de regresión.
Características
Los árboles de decisión se caracterizan por ser intuitivos y fáciles de interpretar. Se construyen
mediante un proceso de partición recursiva de los datos, seleccionando en cada paso el atributo
que mejor separa los datos según algún criterio, como la ganancia de información o la reducción
de la impureza.
Regresión con Árboles de Decisión:
Utiliza árboles de decisión para predecir valores continuos.
La partición se realiza en función de la minimización del error cuadrático medio (MSE).
, Cada nodo hoja contiene un valor promedio de la variable dependiente de los datos que
caen en esa hoja.
Clasificación con Árboles de Decisión:
Utiliza árboles de decisión para predecir etiquetas de clase.
La partición se basa en medidas como la entropía o el índice Gini.
Cada nodo hoja representa una etiqueta de clase predominante entre los datos que caen
en esa hoja.
Ventajas:
Interpretabilidad: Los árboles de decisión son fáciles de interpretar y visualizar.
Sin necesidad de normalización: No requieren normalización de las variables.
Manejo de datos no lineales: Pueden capturar relaciones no lineales entre las variables.
Flexibilidad: Pueden manejar tanto problemas de clasificación como de regresión.
Desventajas:
Sobreajuste: Son propensos al sobreajuste, especialmente con árboles muy profundos.
Inestabilidad: Pequeños cambios en los datos pueden resultar en árboles muy diferentes.
Limitaciones de predicción: Pueden no ser tan precisos como otros métodos más
avanzados como los bosques aleatorios o los métodos de boosting.
Recomendaciones
1. Poda del Árbol: Para reducir el sobreajuste, se recomienda podar el árbol, eliminando
ramas que tienen una importancia marginal.
2. Validación Cruzada: Utilizar técnicas de validación cruzada para evaluar el rendimiento
del modelo y seleccionar la profundidad óptima del árbol.
3. Combinación de Modelos: Considerar el uso de métodos de ensamble como bosques
aleatorios o boosting para mejorar la precisión y estabilidad de las predicciones.
Conclusiones
Los árboles de decisión son herramientas poderosas en el aprendizaje supervisado, ofreciendo
una combinación única de simplicidad e interpretabilidad. Sin embargo, es crucial manejar sus
limitaciones mediante técnicas adecuadas como la poda y la validación cruzada. Para problemas
más complejos, los métodos de ensamble pueden proporcionar mejoras significativas en el
rendimiento.
Referencias Bibliográficas
1. Breiman, L., Friedman, J., Stone, C. J., & Olshen, R. A. (1984). Classification and
Regression Trees. CRC Press.
2. Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data
Mining, Inference, and Prediction. Springer.
The benefits of buying summaries with Stuvia:
Guaranteed quality through customer reviews
Stuvia customers have reviewed more than 700,000 summaries. This how you know that you are buying the best documents.
Quick and easy check-out
You can quickly pay through credit card or Stuvia-credit for the summaries. There is no membership needed.
Focus on what matters
Your fellow students write the study notes themselves, which is why the documents are always reliable and up-to-date. This ensures you quickly get to the core!
Frequently asked questions
What do I get when I buy this document?
You get a PDF, available immediately after your purchase. The purchased document is accessible anytime, anywhere and indefinitely through your profile.
Satisfaction guarantee: how does it work?
Our satisfaction guarantee ensures that you always find a study document that suits you well. You fill out a form, and our customer service team takes care of the rest.
Who am I buying these notes from?
Stuvia is a marketplace, so you are not buying this document from us, but from seller ma_medina. Stuvia facilitates payment to the seller.
Will I be stuck with a subscription?
No, you only buy these notes for $7.16. You're not tied to anything after your purchase.