/DataScience-Titanic

Repositorio que contiene los scripts y explicaciones en R para elaborar un estudio del data set Titanic por medio de un proceso de preprocesado de datos, regresión logística para la selección de variables y árboles de decisión. Prácticas de la asignatura Tratamiento Inteligente de Datos.

Primary LanguageRGNU General Public License v3.0GPL-3.0

Titanic: Machine Learning

Repositorio que contiene los scripts y explicaciones en R sobre el dataset Titanic de una de las competiciones activas en Kaggle.

  • First Approach: Encontramos scripts para implementar ingenieria de caracteristias, una regresión logística para estudiar las características más relevantes y por último predicción basada en Random Forest y un intento de XGBOOST.

  • Final Approach: En este proyecto en R encontramos los scripts y explicaciones para implementar un modelo más avanzado que el anterior. Está basado en el tutorial de Marcio Gualtieri y con el podremos obtener 0.82 de acc en test.