Esse notebook tem como objetivo construir um modelo de classificação que retorne a probabilidade que um cliente tem de ser enviado para análise de crédito dado que ele foi pré-aprovado para o empréstimo com garantia de automóvel.
-
Pandas: para leitura e manipulação de dados
-
https://matplotlib.org/: para criar o gráfico de barras
-
Seaborn: para criar o gráfico de barras
-
Pycaret: para realizar o AutoML
-
sklearn: para criação de modelos de machine learning
-
numpy: para realizar calculos e operações de manipulação de estrutura de dados
-
scipy: para realizar testes estatísticos
-
imblearn: para realizar o método de balanceamento de classes
-
Alibi: para realizar o método de explicabilidade dos modelos
-
imblearn: para realizar o método de balanceamento de classes
-
Pandas Profilling: para realizar o método de análise de dados automática
- Untitled.ipynb: notebook com os códigos das análises, insights extraídos e construção do modelo.
- dataset.csv: arquivo com os dados
- description.csv : arquivo com a descrição dos campos dos dados
- environment.yml: arquivo yml para instalar as bibliotecas
- modelo_auto.pkl: arquivo com o modelo pkl
- Baixar o projeto
- Dentro do terminal do anaconda rodar:
conda env create -f environment.yml --name env_auto
- Ativar o ambiente virtual
conda activate env_auto
- Após a ativação é necessário rodar o seguinte comando:
jupyter notebook
-
Acessar a pasta do projeto e abrir o arquivo .ipynb
-
Rodar os códigos na ordem mostrada no tópico "Etapas de execução do notebook"