Esta práctica se ha realizado bajo el contexto de la asignatura Tipología y ciclo de vida de los datos, perteneciente al Máster en Ciencia de Datos de la Universitat Oberta de Catalunya. En esta práctica se elabora un caso práctico orientado a aprender a identificar los datos relevantes de un proyecto analítico y usar las herramientas de integración, limpieza, validación y análisis de las mismas. El dataset utiliado es el de Titanic.
La actividad ha sido realizada de manera individual por Carina Miriam Zavala Juárez, katzezavala@gmail.com.
https://www.kaggle.com/c/titanic
Código fuente
- src/.py: contiene el código para generar el conjunto de datos a partir de la tabla online Info.
- pdf/: se encuentran los archivos html de las prácticas de Titanic.
- csv/: se encuentran los dataset de los códigos de Titanic.
- Lawson, R. (2015). Web Scraping with Python. Packt Publishing Ltd. Chapter 2. Scraping the Data.
- Mitchel, R. (2015). Web Scraping with Python: Collecting Data from the Modern Web. O'Reilly Media, Inc. Chapter 1. Your First Web Scraper.