Este proyecto se enfoca en la implementación de técnicas de Machine Learning para la evaluación de solvencia crediticia en una institución financiera alemana. Desde la limpieza y exploración de datos hasta la construcción y evaluación de modelos, se busca mejorar la precisión en la predicción de incumplimientos crediticios. Se adjunta archivo .csv donde está la base de datos inicial.
- Preprocesamiento de Datos: Limpieza, manejo de valores faltantes y codificación de variables categóricas.
- Exploración de Datos: Análisis y visualizaciones para entender las relaciones entre variables.
- Feature Engineering: Creación de nuevas características para mejorar la capacidad predictiva.
- Construcción de Modelos: Experimentación con algoritmos como Regresión Logística, Árboles de Decisión y Random Forest.
- Evaluación de Modelos: Métricas como precisión, recall, F1-score y área bajo la curva ROC.
- Balanceo de Datos: Utilización de SMOTE para equilibrar proporciones en la base de datos.
- Predicción de un Nuevo Cliente: Uso del mejor modelo para predecir la solvencia crediticia de un nuevo cliente.
- Python 3.x
- Bibliotecas: pandas, numpy, scikit-learn, seaborn, matplotlib
- Uso de Google Colab.
El mejor modelo, Random Forest, alcanza una precisión del 82.38% en la evaluación de solvencia crediticia. El proyecto destaca por su capacidad para identificar riesgos potenciales y mejorar la toma de decisiones en el sector financiero. Se adjunta un PDF con la presentación del proyecto.
Contribuciones son bienvenidas. Si encuentras algún problema, por favor, abre un issue en el repositorio.