/openwebinars-datos-web

Códigos del curso "Extracción de Datos Web"

Primary LanguageJupyter Notebook

Acceso a Datos Web

Este repositorio contiene los códigos en Python utilizados durante el curso "Acceso a Datos Web". El formato de los códigos es ipynb (jupyter notebook).

Sesión 1 - Introducción

  • 1.1 Mi primer notebook.ipynb
  • 1.2 Introducción a Python.ipynb

Sesión 2 - Web Scraping y Web Crawling

  • 2.1 Navegadores web y HTTP.ipynb
  • 2.2 Scraping y parsing de webs HTML.ipynb
  • 2.3 Web Crawlers.ipynb
  • 2.4 Scraping con Selenium.ipynb
  • 2.5 Ejemplos prácticos de web scraping.ipynb
  • chromedriver.exe (fichero ejecutable necesario para utilizar Selenium)
  • Resultados Selenium (carpeta donde se guardan los ficheros resultantes del scraping utilizando Selenium)

Sesión 3 - Servicios Web y APIs

  • 3.1 Formatos XML y JSON.ipynb
  • 3.2 Open AQ Platform API.ipynb
  • 3.3 API Idealista.ipynb
  • data.json (fichero JSON de ejemplo)
  • (Documentación API) oauth2-documentation.pdf (documentación de la API de Idealista)
  • (Documentación API) oauth2-documentation.pdf (documentación de la API de Idealista)

Sección 4 - Ejemplos y aplicaciones prácticas

  • 4.1 Ejemplos y aplicaciones prácticas.ipynb
  • oauth.py (código Python necesario para utilizar las APIs de Twitter)