/credit_risk_analysis_portuguese

Criação de um modelo preditivo de churn com XGBoost.

Primary LanguageJupyter Notebook

Análise de Risco de Crédito

EN Click here to English-EN


Sobre o projeto

A análise de risco de crédito é peça chave para a boa manutenção dos balanços das instituições financeiras. Manter uma taxa de inadimplência baixa garante que os empréstimos que estão sendo feitos estão gerando lucro. Para isso, tem-se intensificado o uso de aprendizado de máquina para a construção de modelos capazes de identificar padrões e prever se um cliente pode vir a se tornar default.

Nesse estudo tenho por objetivo encontrar o melhor modelo preditivo para esse problema, com o uso de análise exploratória, análises estatísticas (descritiva, diagnóstica e prescritiva), indicadores e gráficos, limpeza e tratamento dos dados, preparação dos dados com padronização (Standard Scaler) e balanceamento (Undersampling), tratamento de variáveis categóricas com Label Encoder e variáveis dummy, criação de uma função para a criar e avaliar modelos, construção de modelos para comparações com 7 algoritmos diferentes, otimização de hiperparâmetros do XGBoost com o uso de validação cruzada (Stratified KFold) e busca em grade (Grid Search), aplicação de engenharia de atributos, e avaliação de performance dos modelos com a construção de matrizes de confusão e pelas métricas de Área abaixo da curva (AUC) e Recall. Finalmente, comprova-se que um modelo tem melhor desempenho do que o outro com teste de hipótese z.


Material Extra

Os resultados obtidos nesse estudo foram condensados em imagens para gerar uma apresentação direta do que a empresa poderia alcançar com o uso dessa ferramenta.





Outros projetos


Contatos