6BSGI_John_Deere_ESALQ

Repositório com os códigos e dados utilizados para o desafio da John Deere/ESALQ no 6º Workshop de Soluções Matemáticas para Problemas Industriais - CeMEAI - USP

Requerimentos

numpy
pandas
sklearn

O arquivo feat_eng.py cria o pipeline para e avalia as métricas de avaliação no conjunto de calibração
O arquivo generate_maps.py usa os pipelines salvos pelo script anterior para interpolar novas malhas
O arquivo feat_importance.py estima a importância das variáveis (de acordo com o modelo RF)
O arquivo plot_maps.py cria scatter plots dos maps interpolados (demorado, dependendo da quantidade de pontos)

Pastas

data: dados de entrada (calibração e validação)
malhas: malhas geradas para interpolação (com base nos dados georreferenciados)
models: pipelines de processamento salvos para ambos os campos passados pela John Deere/ESALQ
- Modelos, scalers, feature engineering
- Esses pipelines são carregados em memória (após sua primeira execução) para evitar processamento desnecessário
predictions: saidas dos modelos (nos conjuntos de validação e nas malhas)
- os arquivos txt contém métricas de avaliação (desempenho preditivo e tempo de execução -- não de treinamento)

Apenas os dados de Ca foram considerados até o momento.

smastelini/6BSGI_John_Deere_ESALQ

6BSGI_John_Deere_ESALQ

Requerimentos

Pastas