这是一个从超星图书馆(http://www.sslibrary.com )下载PDF并且自动添加目录的python脚本。鉴于大概没有外国友人用,所以no English。
本脚本由本刚刚学会python的菜鸟一边google一边编写出来,当然不能突破超星图书馆的版权限制,原理只是网页爬虫,只能省去阁下按几百次右键保存图片的时间。
所以请使用者自重,若他人将该项目用于非法用途,本人概不负责。
环境为python 3.x,需要的模块如下:
import requests,time,os,shutil,img2pdf,sys,re
from PyPDF2 import PdfFileReader,PdfFileWriter
如果阁下是完全不会python的新人,要使用,只需下载一个Visual Studio Code,安装python扩展,然后打开python所在的目录(大概在\Program Files (x86)\Microsoft Visual Studio\Shared\Python39_64\之类的地方),在Script文件夹上按住Shift地右键→在此处打开Powershell窗口,然后运行以下命令:
pip3 install requests PyPDF2 Pillow img2pdf
然后用VS code打开本脚本运行即可。
用法非常简单:只需在超星网页打开一本书,复制阅读界面的网址进命令行,回车,然后等它下载就可以了。
主要能进行清晰度和下载间隔的设置:
- 清晰度
zoom
:超星的最高分辨率图即为zoom=3
,但是代价是总是去色的;如果想下载彩色书籍而保留颜色,可更改到zoom=2
。 - 下载间隔
interval
:下太快会被ban的!所以默认interval=1
,即每下一页停1s,因此下载速度略慢。若阁下对自己的ip有信心可以改短一点。
本脚本受到https://github.com/0NG/sslibrary-pdf-downloader 的启发而编写,补完了前辈计划做而没有做完的工作。