/web_scraping_noticias

Proyecto de web scraping, recopilar noticias de una web colombiana perteneciente a un periodico colombiano, guarda las noticias del landing page en un archivo

Primary LanguagePython

Proyecto de web scraping

Este script hace conexion con la pagina https://www.larepublica.co/ y a partir del cual se extraen las noticias publicadas en la pag principal

  • Se extraen las noticias con su contenido
  • Se crea una carpeta con el nombre del dia en que se ejecuta el script
  • En la carpeta se guardan archivos de texto con el contenido de cada una de las noticias encontradas