Processo seletivo para Estágio em Data Science

Este exercício não tem o foco de analisar a acurácia dos modelos, mas sim a forma como você pensou para resolvê-lo. Por conta disso, faça o exercício organizado e com comentários.

Instruções:

  • Faça um fork deste repositório;

  • Resolva o exercício utilizando a linguagem de programação que tenha maior afinidade;

  • Faça um Pull-Request com a solução.


​ Apesar do agro gerar muito lucro, a vida dos agricultores não é fácil, mas sim um verdadeiro teste de resistência e determinação. Uma vez que tenhamos semeado as sementes, o agricultor precisa trabalhar dia e noite para garantir uma boa safra no final da estação. Uma boa colheita depende de diversos fatores, como disponibilidade de água, fertilidade do solo, proteção das culturas, uso oportuno de pesticidas, outros fatores químicos úteis e da natureza.

​ Muitos desses dados são quase impossíveis de se controlar, mas a quantidade e a frequência de pesticidas é algo que o agricultor pode administrar. Os pesticidas podem protegem a colheita com a dosagem certa. Mas, se adicionados em quantidade inadequada, podem prejudicar toda a safra.

​ Dito isto, abaixo são fornecidos dados baseados em culturas colhidas por vários agricultores no final da safra de 2018-2019. Para simplificar o problema, você pode assumir que todos os fatores relacionados as técnicas agrícolas e climáticas, não influenciaram esses resultados.

​ Seu objetivo neste exercício é determinar o resultado desta safra atual de 2020, ou seja, se a colheita será saudável, prejudicada por pesticidas, ou prejudicada por outros motivos.

Variável Descrição
Identificador_Agricultor IDENTIFICADOR DO CLIENTE
Estimativa_de_Insetos Estimativa de insetos por M²
Tipo_de_Cultivo Classificação do tipo de cultivo (0,1)
Tipo_de_Solo Classificação do tipo de solo (0,1)
Categoria_Pesticida Informação do uso de pesticidas (1- Nunca Usou, 2-Já Usou, 3-Esta usando)
Doses_Semana Número de doses por semana
Semanas_Utilizando Número de semanas Utilizada
Semanas_Sem_Uso Número de semanas sem utilizar
Temporada Temporada Climática (1,2,3)
dano_na_plantacao Variável de Predição - Dano no Cultivo (0=Sem Danos, 1=Danos causados por outros motivos, 2=Danos gerados pelos pesticidas)

SciCrop®