Profesor Jorge Anais
Semestre primavera 2023
Este repositorio contiene los apuntes del curso de Machine Learning
RA1 Aplica Machine Learning en problemáticas reales en contraste con otras soluciones tradicionales, siguiendo una metodología de trabajo, estandarizada de la industria.
RA2. Realiza análisis exploratorio y preparación de datos, de acuerdo a las características del dataset y del contexto del negocio.
RA3 Elabora modelos predictivos de clasificación, mediante el lenguaje de programación Python según la información del caso.
RA4 Aplica técnicas de evaluación de modelos de Machine Learning de clasificación, de acuerdo al tipo de aprendizaje de máquinas supervisado y las buenas prácticas de la industria.
RA5 Elabora algoritmos para aprendizaje no supervisado y genera las diferentes métricas para su evaluación, de acuerdo a la resolución del problema.
Parcial 1 40% Levantamiento de un proyecto de Machine Learning
Parcial 2 30% Desarrollo de un modelo de Machine Learning Supervisado
Parcial 3 30% Desarrollo de un modelo de Machine Learning no supervisado
Exámen transversal 40% Entrega de encargo con presentación
BIBLIOGRAFÍA OBLIGATORIA |
---|
- Géron, A. (2019). Aprende Machine Learning con Sci-Learn, Keras y TensorFlow (2nd ed.). O’Reilly Media. - Raschka, Sebastian (2019). Python Machine Learning (Third Edition). Packt. - Deisenroth M, Faisal A, Ong C.(2020). Mathematics for Machine Learning. Published by Cambridge University Press. https://mml-book.github.io/ - Battiti R, Brunato M. (2017). The LION way: Machine Learning plus Intelligent Optimization. LIONlab, University of Trento, Italy. https://intelligent-optimization.org/LIONbook/ - Valenzuela, N. J. S. (2018). Python Aplicaciones prácticas. RA-MA. |
RESULTADO DE APRENDIZAJE | INDICADORES DE LOGRO |
---|---|
RA1 Aplica Machine Learning en problemáticas reales en contraste con otras soluciones tradicionales, siguiendo una metodología de trabajo, estandarizada en la industria. | IL 1.1 Reconoce metodologías orientadas a datos como CRISP-DM para el desarrollo de los proyectos de ML. IL 1.2 Reconoce las diferencias entre un modelo supervisado y uno no supervisado según el contexto del caso y la naturaleza de los datos. IL 1.3 Reconoce las librerías de lenguaje python para desarrollar las diferentes tareas en un proyecto de aprendizaje automático. IL 1.4 Aplica algoritmos de regresión para construir modelos supervisados según los requerimientos del caso. IL 1.5 Utiliza métricas de evaluación de modelos de regresión, considerando aprendizaje de máquinas supervisado, según las buenas prácticas de la industria. |
RA2 Realiza análisis exploratorio y preparación de datos, de acuerdo a las características del dataset y del contexto del negocio. | IL 2.1 Realiza limpieza y preparación de datos de acuerdo con las buenas prácticas de la industria, utilizando lenguaje Python sobre Jupyter notebook. IL 2.2 Elabora documentación del proceso comparando los resultados obtenidos a partir de la información del caso y de los datos. IL 2.3 Realiza limpieza y preparación de los datos considerando missing values, outliers, normalización y estandarización según los requerimientos. IL 2.4 Aplica elementos de estadística descriptiva para realizar análisis exploratorio complementando el significado y distribución de los datos. IL 2.5 Asocia los resultados obtenidos en el análisis exploratorio con el entendimiento del negocio para dar respuesta a los requerimientos de cada caso. |
Formativa 1 | Actividad práctica | Autoevaluación | 0% |
---|---|---|---|
Parcial 1: Levantamiento de un proyecto de Machine Learning | 1. Prueba de conocimientos 2. Entrega de encargo |
Docente | 40% |
RESULTADO DE APRENDIZAJE | INDICADORES DE LOGRO |
---|---|
RA3 Elabora modelos predictivos de clasificación, mediante el lenguaje de programación Python según la información del caso. | IL 3.1 Reconoce las diferencias en una tarea de clasificación de una regresión en el aprendizaje supervisado, con el objetivo de dar respuesta a una problemática orientada al uso de datos. IL 3.2 Utiliza técnicas para analizar la correlación entre los diferentes features a usar en un modelo de Machine Learning. IL 3.3 Realiza ingeniería de características, seleccionando y transformando los atributos para desarrollar un buen modelo de clasificación. IL 3.4 Construye modelos de clasificación en aprendizaje supervisado, utilizando lenguaje Python sobre Jupyter notebook. IL 3.5 Identifica problemáticas asociadas al entrenamiento de los datos como overfitting y underfitting. |
RA4 Aplica técnicas de evaluación de modelos de Machine Learning de clasificación, de acuerdo al tipo de aprendizaje de máquinas supervisado y las buenas prácticas de la industria. | IL 4.1 Identifica métricas de evaluación de modelos de clasificación, considerando aprendizaje de máquinas supervisado, según las buenas prácticas de la industria. IL 4.2 Utiliza las métricas que derivan de una matriz de confusión para validar y discriminar el mejor modelo de clasificación. IL 4.3 Aplica técnicas de balance de clases para mejorar la generalización en el desempeño de los modelos de clasificación. IL 4.4 Analiza las métricas de los modelos de clasificación desarrollados, justificando el más adecuado dependiendo del caso. IL 4.5 Identifica las ventajas y desventajas de cada métrica en la evaluación de los modelos de clasificación. |
Formativa 2 | Quiz | Autoevaluación | 0% |
---|---|---|---|
Parcial 2: Desarrollo de un modelo de Machine Learning Supervisado | Entrega de encargo | Docente | 30% |
RESULTADO DE APRENDIZAJE | INDICADORES DE LOGRO |
---|---|
RA5 Elabora algoritmos para aprendizaje no supervisado y genera las diferentes métricas para su evaluación, de acuerdo a la resolución del problema. | IL 5.1 Identifica los diferentes casos de uso donde se aplica aprendizaje no supervisado, reconociendo sus ventajas y desventajas. IL 5.2 Construye modelos de aprendizaje no supervisado utilizando algoritmos de segmentación según corresponda. IL 5.3 Utiliza técnicas que ayuden a seleccionar la cantidad óptima de clusters en los modelos de segmentación para aprendizaje no supervisado. IL 5.4 Programa en lenguaje Python sobre Jupyter notebook, modelos de segmentación para aprendizaje no supervisado. IL 5.5 Reconoce métricas de rendimiento para modelos no supervisados que permitan validar los resultados obtenidos. |
- EA1
- Introducción a machine learning
- Metodologías Orientadas a Datos: CRISP-DM
- Conceptos de algebra lineal y su uso en Machine Learning
- Estadística descriptiva para Machine Learning
- Estrategias para tratamiento de Missing Values y Outliers
- Escalamiento y Encoding
- Tareas de regresión para modelos predictivos y sus métricas
- EA2
- Regresión logística
- Clasificación Binaria
- Clasificación Multiclase
- Métricas de clasificación
- Entrenamiento, prueba y validación. Cross validation.
- EA3
- Introducción al aprendizaje No supervisado
- Clustering. Generalidades
- K-means, K-medoids
- Clustering jerárquico
- Density based clustering y agrupamiento Gaussiano
- Reducción dimensional