lets_code_projeto_pandas

Contém o resultado de um exercício proposto pelo curso Let's Code Ciência de Dados. Realizado em grupo e objetivando treinar uso do GitHub e Pandas.

Objetivos

Usando o banco de dados fornecido:

  • Juntar as bases de dados, observando as colunas coincidentes; Caso não existam, utilizar o índice.

  • Para variáveis quantitativas, calcular:
    Mínimo, Primeiro Quartil, Mediana, Terceiro Quartil, Máximo, Média.

  • Tratar os dados outliers como faltantes e criar novamente o relatório, para observar a diferenca.

  • Tratar os dados Outliers substituindo-os pela mediana, e crie novamente o relatório.

  • Fazer relatório dos itens acima.

  • Para variáveis qualitativas, calcular:
    Frequência Absoluta, Frequência Acumulada, Frequência Relativa, Frequência Relativa Acumulada.

  • Separar os 10% dos dados relativos às famílias de maior renda e exportar como novo csv.

  • Criar os dummies para pelo menos 3 das variáveis qualitativas.

  • Comparar a média das variáveis (Quantitativas e 3 Qualitativas) da populacão dos 10% com maior renda contra o restante.

Execução

A análise pode ser replicada seguindo o Jupyter Notebook principal.ipynb.

Resultados

O Notebook de análise exporta os resultados para principal.html.
Um preview dos resultados pode ser verificado neste link.