/python-ds-pandas-limpeza-tratamento-dados

Projeto de introdução à ciência de dados e Python, da plataforma Alura.

Primary LanguageJupyter NotebookMIT LicenseMIT

🐼| Pandas: limpeza e tratamento de dados

Licença Status

Índice

Sobre o projeto

Projeto de especialização em análise de dados desenvolvido durante a realização do curso Pandas: limpeza e tratamento de dados, ministrado pelo instrutor Bruno Raphael. A partir desse projeto, será trabalhado os processos de limpeza e tratamento de dados com a biblioteca Pandas.

Aprendizagens

  • O que é "churn" em um contexto de negócios;
  • Normalização de arquivos JSON;
  • Obtenção de informações com o método info();
  • Identificação e tratamento de strings vazias;
  • Identificação e tratamento de dados duplicados com os métodos duplicated() e drop_duplicates();
  • Identificação e remoção de dados nulos;
  • O que são outliers;
  • Métodos para encontrar outliers em um conjunto de dados: Z-Score, Regra dos 3 Sigmas, Análise de dispersão, Método IQR;
  • Remoção de outliers;
  • O que são variáveis categóricas e quais são seus tipos;
  • Como transformar variáveis categóricas em binárias com o método get_dummies().

Como acessar o projeto?

O projeto foi feito por completo no Google Colaboratory, logo, para acessar a análise, clique no link abaixo:

Tecnologias utilizadas

  • Google Colaboratory: Ambiente de notebook interativo baseado na nuvem;
  • Python: Linguagem de programação;
  • Pandas: Biblioteca para manipulação e análise de dados;
  • Numpy: Biblioteca para computação numérica em Python;
  • Seaborn: Biblioteca de visualização de dados baseada no Matplotlib, com estilos adicionais e recursos estatísticos.

Licença

Este projeto está licenciado sob a Licença MIT. Consulte o arquivo LICENSE para obter mais informações sobre os termos de licenciamento.


✨ Feito com carinho por Andrieli Gonçalves.