/PythonTitanic

EDA and supervised learning with python and Titanic dataset.

Primary LanguageJupyter Notebook

PythonTitanic

Descripción

Esta práctica se ha realizado bajo el contexto de la asignatura Tipología y ciclo de vida de los datos, perteneciente al Máster en Ciencia de Datos de la Universitat Oberta de Catalunya. En esta práctica se elabora un caso práctico orientado a aprender a identificar los datos relevantes de un proyecto analítico y usar las herramientas de integración, limpieza, validación y análisis de las mismas. El dataset utiliado es el de Titanic.

Equipo/Autor

La actividad ha sido realizada de manera individual por Carina Miriam Zavala Juárez, katzezavala@gmail.com.

Set de datos

https://www.kaggle.com/c/titanic

Ficheros

Código fuente

  • src/.py: contiene el código para generar el conjunto de datos a partir de la tabla online Info.
  • pdf/: se encuentran los archivos html de las prácticas de Titanic.
  • csv/: se encuentran los dataset de los códigos de Titanic.

Recursos

  1. Lawson, R. (2015). Web Scraping with Python. Packt Publishing Ltd. Chapter 2. Scraping the Data.
  2. Mitchel, R. (2015). Web Scraping with Python: Collecting Data from the Modern Web. O'Reilly Media, Inc. Chapter 1. Your First Web Scraper.