Projeto de especialização em análise de dados desenvolvido durante a realização do curso Pandas: limpeza e tratamento de dados, ministrado pelo instrutor Bruno Raphael. A partir desse projeto, será trabalhado os processos de limpeza e tratamento de dados com a biblioteca Pandas.
- O que é "churn" em um contexto de negócios;
- Normalização de arquivos JSON;
- Obtenção de informações com o método
info()
; - Identificação e tratamento de strings vazias;
- Identificação e tratamento de dados duplicados com os métodos
duplicated()
edrop_duplicates()
; - Identificação e remoção de dados nulos;
- O que são outliers;
- Métodos para encontrar outliers em um conjunto de dados: Z-Score, Regra dos 3 Sigmas, Análise de dispersão, Método IQR;
- Remoção de outliers;
- O que são variáveis categóricas e quais são seus tipos;
- Como transformar variáveis categóricas em binárias com o método
get_dummies()
.
O projeto foi feito por completo no Google Colaboratory, logo, para acessar a análise, clique no link abaixo:
- Google Colaboratory: Ambiente de notebook interativo baseado na nuvem;
- Python: Linguagem de programação;
- Pandas: Biblioteca para manipulação e análise de dados;
- Numpy: Biblioteca para computação numérica em Python;
- Seaborn: Biblioteca de visualização de dados baseada no Matplotlib, com estilos adicionais e recursos estatísticos.
Este projeto está licenciado sob a Licença MIT. Consulte o arquivo LICENSE
para obter mais informações sobre os termos de licenciamento.
✨ Feito com carinho por Andrieli Gonçalves.