Práctica 1: Web scraping

Descripción

Esta práctica se ha realizado bajo el contexto de la asignatura Tipología y ciclo de vida de los datos, perteneciente al Máster en Ciencia de Datos de la Universitat Oberta de Catalunya. En ella, se aplican técnicas de web scraping mediante el lenguaje de programación Python para extraer así datos de la web https://info.aserca.gob.mx/ y https://www.entrepreneur.com/ generando para ambos un dataset.

Equipo

La actividad ha sido realizada de manera individual por Carina Miriam Zavala Juárez.

Ficheros

Código fuente

  • src/scraper__porcino.py: contiene el código para generar el conjunto de datos a partir de la tabla online Info.
  • src/scraper__mailing.py: contiene el código para generar el conjunto de datos a partir de la página online Info.
  • pdf/: se encuentran los archivos html de las prácticas de Mailing y Precios Porcinos.
  • csv/: se encuentran los dataset de los códigos de Mailing y Precios Porcinos.

Recursos

  1. Lawson, R. (2015). Web Scraping with Python. Packt Publishing Ltd. Chapter 2. Scraping the Data.
  2. Mitchel, R. (2015). Web Scraping with Python: Collecting Data from the Modern Web. O'Reilly Media, Inc. Chapter 1. Your First Web Scraper.