Teste para área de atuação Cientista de Dados (especialização, mestrado e doutorado)

Informações

Neste repositório foram disponibilizados 2 arquivos:

  • dataset_teste_selecao.csv
  • dicionario.csv

O arquivo dataset_teste_selecao.csv contém dados fictícios de pacientes com COVID-19 e o arquivo dicionario.csv contém a descrição das colunas/dados contidos no arquivo dataset_teste_selecao.csv

Orientações para a realização do teste

  • Os candidatos nos perfis de Especialização, Mestrado e Doutorado devem elaborar uma visualização de dados com os insights obtidos a partir do arquivo dataset_teste_selecao.csv. A visualização deve conter uma análise exploratória dos dados.
  • Os candidatos no perfil de Mestrado e Doutorado devem treinar um modelo preditivo (tarefa de classificação ou de regressão) utilizando os dados contidos no arquivo dataset_teste_selecao.csv. Em caso de tarefa de classificação, a escolha do atributo de classe (relevante e adequado) deve ser feita pelo candidato.
  • Ao finalizar as atividades, enviar um PULL REQUEST (PR) contendo todos os arquivos gerados (notebooks, conjuntos de treino, conjuntos de teste etc) para o respositório atual na branch MAIN seguindo seguinte padrão no nome da branch "SEU_NUMERO_CPF" e na descrição do PULL REQUEST incluir seu nome completo e seu CPF.