🪧 Vitrine.Dev | |
---|---|
✨ Nome | Challenge Data Science |
🏷️ Tecnologias | mysql, python |
🚀 URL | https://github.com/fab-souza/challenge-data-science-2/ |
🔥 Desafio | Alura Challenges |
A proposta do Challenge é simular o desenvolvimento de um projeto, que neste caso é fazer um estudo para reduzir o número de inadimplência no banco Alura Cash.
O desafio da primeira semana é estudar o banco de dados da empresa, utilizando o MySQL, entendendo seus dados, verificando inconsistências, traduzir dados e exportar a tabela de dados, no formato csv.
As inconsistências que encontrei no banco de dados foram:
-
5 clientes com mais de 100 anos de idade;
-
2 clientes com 123 anos de trabalho;
-
e cliente com 42 anos de idade, 0 anos trabalhados e renda superior a 2 milhões por ano.
A forma que encontrei para exportar a tabela foi:
- chamar a tabela, selecionar a opção "Sem limite" de linhas e clicar em 'Export'.
Os desafios da segunda semana consitiam em tratar os dados, ou seja, remover dados nulos e tratar os outliers. Além de analisar correlações, normalizar variáveis, criação de modelos de classificação e exportar o modelo.
-
Analisando métricas: criando visualizações com o Power BI;
-
Criar uma API para disponibilizar o modelo no Power BI;
-
Conectar a API do modelo de Machine Learning no Power BI;
-
Criar parâmetros para receber os dados do cliente;
-
Analisar os dados através de gráficos;
-
Estilizar o dashboard.