自用爬虫,用于下载科学文库电子书。
支持正版,请勿传播,谢谢。
[已失效] 网站管理员太过勤奋,而这只是个水贴项目,且个人暂无索书需求,故先弃之,溜了溜了。
- 根据 book_id 自动获取电子书总页数
- 对 book_id 做基本判别
- 对页面图片下载有误的情况进行修复
- 任务进度使用进度条可视化
- 整编图片为 PDF
- 支持命令行脚本和 GUI 两版
- 为下载图书添加书签
- 文件名显示为书名
- 支持下载清晰度选择
- 支持保留下载图片文件夹
# 依赖项
pip install requests pillow rich pysimplegui pyinstaller pycrypto beautifulsoup4 pypdf2 lxml
- Requests用于爬虫请求
- Pillow用于 PDF 生成
- Rich用于命令行进度条展示
- PySimpleGUI用于 GUI 界面
- PyInstaller用于打包成 exe
- PyCrypto用于 PyInstaller 打包加密
- BeautifulSoup4用于网页解析
- PyPDF2用于 PDF 添加书签
- lxml用于解析 XPath
# 命令行脚本直接运行
python main.py
# 打包成GUI程序
pyinstaller -F -w --key 'passwd' --hidden-import pillow --hidden-import requests --hidden-import pysimplegui --hidden-import beautifulsoup4 --hidden-import pypdf2 --hidden-import lxml -n 科学文库电子书下载器 -i icon.ico --clean --win-private-assemblies -y main.py