Repositório com os códigos e dados utilizados para o desafio da John Deere/ESALQ no 6º Workshop de Soluções Matemáticas para Problemas Industriais - CeMEAI - USP
- numpy
- pandas
- sklearn
- O arquivo
feat_eng.py
cria o pipeline para e avalia as métricas de avaliação no conjunto de calibração - O arquivo
generate_maps.py
usa os pipelines salvos pelo script anterior para interpolar novas malhas - O arquivo
feat_importance.py
estima a importância das variáveis (de acordo com o modelo RF) - O arquivo
plot_maps.py
cria scatter plots dos maps interpolados (demorado, dependendo da quantidade de pontos)
data
: dados de entrada (calibração e validação)malhas
: malhas geradas para interpolação (com base nos dados georreferenciados)models
: pipelines de processamento salvos para ambos os campos passados pela John Deere/ESALQ- Modelos, scalers, feature engineering
- Esses pipelines são carregados em memória (após sua primeira execução) para evitar processamento desnecessário
predictions
: saidas dos modelos (nos conjuntos de validação e nas malhas)- os arquivos txt contém métricas de avaliação (desempenho preditivo e tempo de execução -- não de treinamento)
Apenas os dados de Ca
foram considerados até o momento.