gzerbone/avanti-bootcamp-cdd

Exploração de dados

Closed this issue · 1 comments

  • Criar um notebook de análise exploratória notebooks/01-exploratory_data_analysis.ipynb, contendo as seguintes seções de texto:

  • - Descrição dos dados: informações sobre a quantidade de instâncias, variáveis e seus tipos, quantidade de valores faltantes. Utilize o dicionário de dados nessa seção.

  • - Perguntas de partida e hipóteses: que tipo de informações podem ser obtidas a partir dos dados e quais hipóteses podem ser levantadas?

  • - Insights: respostas às perguntas feitas na seção anterior e quais informações interessantes podem ser levantadas através dos dados?

Coleta inicial de dados e criação do dicionário de dados

  • Adicionou o conjunto de dados na pasta data/raw/?
  • Criou e salvou o dicionário de dados na pasta data/external/?

Exploração de dados

Pontos positivos

  • Escreveu uma descrição dos dados?
  • Falou sobre dados faltantes?
  • Escreveu perguntas e partidas de hipóteses?
  • Utilizou mais que 3 tipos de gráficos?
  • Escreveu um sumário dos insights no final?
  • Criou gráficos que não foram vistos em aula?
  • Fez análise univariada?
  • Fez análise bivariada?
  • Fez análise multivariada?

Pontos negativos

  • Usou canal de cor sem necessidade?
  • Utilizou rótulos inclinados?
  • Utilizou gráfico de dispersão quando deveria ter utilizado gráfico de boxplot?
  • Não ordenou gráficos de barra quando deveria?

Comentários

  • Adorei a ilustração inicial para ajudar no storytelling da exploração de dados
  • Bom uso programático das frases de descrição do conjunto de dados
  • Pode explorar o gráfico de correlação pras análises
  • No caso do plot do tamanho de grupo, poderia fazer um boxplot

cc @omadson