Proyecto para Lenguajes modernos de programación. (Enero-Junio de 2020).
Link del dataset: https://www.kaggle.com/xapulc/jpsales Gracias Victor Kharlamov por crear el dataset.
Antes de alimentar el modelo se hace un proceso de ingenieria de datos para seleccionar features, remover outliers, datos faltantes, etc.
Para la prediccion se usan los features de
- Ventas en Europa
- Ventas en el resto del mundo
- Calificacion de los usuario
Y se busca predecir las ventas en Norteamerica (NA_Sales).
Primero se utiliza regresion lineal, y después los metodos de regularizacion ridge, lasso y elastic net regression.