/mod-machine-learning

Practica del modulo Machine Learning KC

Primary LanguageJupyter Notebook

mod-machine-learning

El objetivo de esta practica es obtener dos modelos, uno de clasificación y otro de regresión para los conjuntos de datos ./data/census_train.csv y ./data/diamonds_train.csv, respectivamente.

Una vez obtenidos los modelos los aplicamos a los datos de ./data/census_test.csv y ./data/diamonds_test.csv y obtenemos los archivos ./data/census_pred.csv y ./data/diamonds_pred.csv.

La explicación de como se desarrollan los modelos estan en sendos cuadernos census_clasificacion.ipynb y diamonds_regresion.ipynb.

Nota: Al ejecutar totalmente los cuadernos (tarea que es muy larga en el momento que comienza la optimización del Gradient Boosting y SVM), se genera un archivo con dos veces el id. Los he corregido de forma manual para adaptarlos al formato pedido por la practica. Si es necesario consultarlos, los originales se encuentran en ./data/census_pred_con_id.csv y ./data/diamonds_pred_con_id.csv.