Faz o download dos diários oficiais da cidade de Guarujá-SP
Fonte: Diário Oficila de Guarujá
Este projeto requer Python 3.+ e outras bibliotecas. É aconselhado que se utilize uma virtualenv para manter seu ambiente de desenvolvimento atualizado.
Após isso, faça uso do arquivo requirements.txt para instalar as dependências.
$ git clone https://github.com/julianyraiol/diario-oficial-guaruja.git
$ cd diario-oficial-guaruja
$ pip install -r requirements.txt
Também é necessário ter o Selenium em seu computador. Veja como baixar o driver do selenium para seu navegador aqui
- Este projeto utiliza o driver do Firefox para executar as ações.
Mova o executável para /usr/bin.
No seu terminal, já tendo executado o arquivo de instalação, execute o seguinte comando:
$ python crawler.py