/challenge-data-science-2

Projeto desenvolvido durante o 2º Challenge Data Science da Alura

Primary LanguageJupyter Notebook

challenge-data-science-2

Badge Em-desenvolvimento

Badge code size

🪧 Vitrine.Dev
✨ Nome Challenge Data Science
🏷️ Tecnologias mysql, python
🚀 URL https://github.com/fab-souza/challenge-data-science-2/
🔥 Desafio Alura Challenges

Sobre o Challenge 📚

A proposta do Challenge é simular o desenvolvimento de um projeto, que neste caso é fazer um estudo para reduzir o número de inadimplência no banco Alura Cash.

Minha prática 👩🏻‍💻

Semana 1:

O desafio da primeira semana é estudar o banco de dados da empresa, utilizando o MySQL, entendendo seus dados, verificando inconsistências, traduzir dados e exportar a tabela de dados, no formato csv.

As inconsistências que encontrei no banco de dados foram:

  • 5 clientes com mais de 100 anos de idade;

  • 2 clientes com 123 anos de trabalho;

  • e cliente com 42 anos de idade, 0 anos trabalhados e renda superior a 2 milhões por ano.

A forma que encontrei para exportar a tabela foi:

  • chamar a tabela, selecionar a opção "Sem limite" de linhas e clicar em 'Export'.

mysql_export_csv


Semana 2:

Os desafios da segunda semana consitiam em tratar os dados, ou seja, remover dados nulos e tratar os outliers. Além de analisar correlações, normalizar variáveis, criação de modelos de classificação e exportar o modelo.

idade-100

trabalho-100


Semana 3 e 4:

  • Analisando métricas: criando visualizações com o Power BI;

  • Criar uma API para disponibilizar o modelo no Power BI;

  • Conectar a API do modelo de Machine Learning no Power BI;

  • Criar parâmetros para receber os dados do cliente;

  • Analisar os dados através de gráficos;

  • Estilizar o dashboard.

Ferramentas utilizadas 🧰

mysql python