lets_code_projeto_pandas
Contém o resultado de um exercício proposto pelo curso Let's Code Ciência de Dados. Realizado em grupo e objetivando treinar uso do GitHub e Pandas.
Objetivos
Usando o banco de dados fornecido:
-
Juntar as bases de dados, observando as colunas coincidentes; Caso não existam, utilizar o índice.
-
Para variáveis quantitativas, calcular:
Mínimo, Primeiro Quartil, Mediana, Terceiro Quartil, Máximo, Média. -
Tratar os dados outliers como faltantes e criar novamente o relatório, para observar a diferenca.
-
Tratar os dados Outliers substituindo-os pela mediana, e crie novamente o relatório.
-
Fazer relatório dos itens acima.
-
Para variáveis qualitativas, calcular:
Frequência Absoluta, Frequência Acumulada, Frequência Relativa, Frequência Relativa Acumulada. -
Separar os 10% dos dados relativos às famílias de maior renda e exportar como novo csv.
-
Criar os dummies para pelo menos 3 das variáveis qualitativas.
-
Comparar a média das variáveis (Quantitativas e 3 Qualitativas) da populacão dos 10% com maior renda contra o restante.
Execução
A análise pode ser replicada seguindo o Jupyter Notebook principal.ipynb
.
Resultados
O Notebook de análise exporta os resultados para principal.html
.
Um preview dos resultados pode ser verificado neste link.