Ferramenta de download de livros da biblioteca virtual da DigitalPages. Baixa pĂĄgina a pĂĄgina como imagem e depois converte para pdf. Veja esse estudo de caso para saber como ela foi desenvolvida. escrito pelo desenvolvedor que iniciou o projeto.
- Biblioteca do Python Selenium:
sudo pip3 install selenium
- Biblioteca do Python fpdf:
sudo pip3 install fpdf
- Biblioteca do Python pillow:
sudo pip3 install pillow
- PhantonJS: Download Page in phantonjs.org
- Adicione o python ao path do S.O. para que seja fĂĄcil executar os comandos
- Adicione o phantonjs ao path do S.O. porque foi desenvolvido pensando nisso
- download.py é o responsåvel por fazer o serviço completo, ele faz o login, acessa todas as paginas, baixa, coloca na pasta, cria o PDF, e apaga as paginas baixadas...
- pdf.py foi criado para criar o pdf caso por algum motivo o processo tenha falhado e as paginas jĂĄ tenham sido baixadas, basta usar o comando
pdf.py <id do livro> [outros ids]
para usĂĄ-lo... - book Ă© a pasta onde ele farĂĄ o download das pĂĄginas
- books Ă© onde ele salvarĂĄ os arquivos pdf com o id do livro (no futuro vou tentar por com o tĂtulo)
Windows
- Abra o CMD na pasta em que se localiza o script
- Use o comando:
download.py <nĂșmeros, e somente os numeros, de sua matrĂcula> <senha> <endereco url do livro no bvu> [endereco url de outro livro] ..
.
Linux
- Abra o terminal na pasta em que se localiza o script
- Use o comando:
py3 download.py <nĂșmeros, e somente os numeros, de sua matrĂcula> <senha> <endereco url do livro no bvu> [endereco url de outro livro] ..
.
Mac-OSX
- Abra o terminal na pasta em que se localiza o script
- Use o comando:
python3 download.py <nĂșmeros, e somente os numeros, de sua matrĂcula> <senha> <endereco url do livro no bvu> [endereco url de outro livro] ..
. OBS: O endereço a ser fornecido é o mesmo do navegador. Pode-se fornecer quantos livros quiser.