PDF con la documentación final.
Kaggle es una comunidad online propiedad de Google de científicos de datos. Esta comunidad permite a sus usuarios encontrar y publicar conjuntos de datos, explorar y construir modelos en un entorno de ciencia de datos basado en la web, trabajar con otros científicos e ingenieros de aprendizaje automático y acceder en competiciones para resolver desafíos relacionados con este área.
Una de estas competiciones, organizada por el banco Santander, es Santander Customer Transaction Prediction[2], que promete premios de un total de 65.000$ para los equipos con los mejores resultados. Esta competición proporciona un conjunto de datos de las transacciones con 200.000 clientes y 200 variables cada uno y está orientada a identificar qué clientes realizarán una transacción en el futuro, independientemente del dinero.
El objetivo de esta práctica será conseguir un resultado competente para esta competición usando RStudio.