RossmannChallenge

Link a la competencia

Las notebooks utilizadas son:

  • 1-data-exploration.ipynb
  • 2-data-preprocessing.ipynb
  • 3-durations-preprocessing.ipynb
  • 4-normalize-and-encode.ipynb
  • 5-full-model.ipynb: acá se desarrolla el modelo de redes neuronales a paritr de los datos preprocesados en las notebooks anteriores. Se explica el concepto de Entity Embeddings y la métrica de la competencia. Además se generan gráficos de los embeddings que se guardan en la carpeta /embeddings.

En el archivo requirements.txt se encuentran las librerías necesarias para correr las notebooks.

Los archivos intermedios generados para preprocesar los datos no se pueden subir a Github ya que exceden los 25MB. Estos archivos se guardan en una carpeta llamada /preprocessed_dfs.

El archivo hiperparametros.xlsx indica las distintas pruebas que se corrieron y los hiperparámetros utilizados en cada una junto con el score correspondiente.El archivo con el mejor resultado se obtuvo con submissions/submission-best.csv.

Mejor resultado