🐼| Pandas: limpeza e tratamento de dados

Índice

Sobre o projeto
Aprendizagens
Como acessar o projeto?
Tecnologias utilizadas
Licença

Sobre o projeto

Projeto de especialização em análise de dados desenvolvido durante a realização do curso Pandas: limpeza e tratamento de dados, ministrado pelo instrutor Bruno Raphael. A partir desse projeto, será trabalhado os processos de limpeza e tratamento de dados com a biblioteca Pandas.

Aprendizagens

O que é "churn" em um contexto de negócios;
Normalização de arquivos JSON;
Obtenção de informações com o método info();
Identificação e tratamento de strings vazias;
Identificação e tratamento de dados duplicados com os métodos duplicated() e drop_duplicates();
Identificação e remoção de dados nulos;
O que são outliers;
Métodos para encontrar outliers em um conjunto de dados: Z-Score, Regra dos 3 Sigmas, Análise de dispersão, Método IQR;
Remoção de outliers;
O que são variáveis categóricas e quais são seus tipos;
Como transformar variáveis categóricas em binárias com o método get_dummies().

Como acessar o projeto?

O projeto foi feito por completo no Google Colaboratory, logo, para acessar a análise, clique no link abaixo:

Projeto no Google Colaboratory

Tecnologias utilizadas

Google Colaboratory: Ambiente de notebook interativo baseado na nuvem;
Python: Linguagem de programação;
Pandas: Biblioteca para manipulação e análise de dados;
Numpy: Biblioteca para computação numérica em Python;
Seaborn: Biblioteca de visualização de dados baseada no Matplotlib, com estilos adicionais e recursos estatísticos.

Licença

Este projeto está licenciado sob a Licença MIT. Consulte o arquivo LICENSE para obter mais informações sobre os termos de licenciamento.

✨ Feito com carinho por Andrieli Gonçalves.