Análisis con el objetivo de realizar un scoring de crédito. Trabajo obligatorio realizadon en el marco de la materia Machine Learning Supervisado. Posgrado en Analítica de Negocios - Universidad ORT. Montevideo, Uruguay
Consigna: Analice la siguiente base con el objetivo de realizar un scoring de crédito de acuerdo a al menos dos métodos vistos en clase.
Base de Datos: CreditScoring.csv Descripción: la base de datos cuenta con información de 50.000 créditos otorgados a clientes del Banco XXX. Variable dependiente = “Default” (definido por haber tenido créditos vencidos en al menos un mes en los siguientes 12 meses de otorgado el crédito) Variables Independientes: Edad, Sexo, Ingreso, Nivel Educativo, Cantidad de Bancos con los que opera, Cantidad de Financieras no bancarias con las que opera, Ratio de Endeudamiento en el Sistema Financiero, Mínima calificación del Historial de pago en 6 meses, Aumento porcentual del endeudamiento últimos 3 meses, Tiene crédito inmobiliario?, Contingencias en el sistema Financiero (disponibles en tarjetas de crédito) , Monto créditos vigentes en el Sistema Financiero en USD.
Se pide: 1 - Investigar la importancia de las variables y comentar los resultados. (si lo cree conveniente puede agregar más variables). 2 - Estimar al menos por dos modelos (uno de ellos tiene que ser RandomForest o Boosting) 3 - Explicitar los hiperparámetros a optimizar., explicando brevemente su significado en el modelo. 4 - Optimizar los hiperparámetros por 5-Fold Cross Validation 5 - Calcular el error de clasificación y concluir sobre el modelo elegido