使用puppeteer和devtools协议模拟用户调试行为,自动实现(drawSomeText)处断点,然后获取保存文字的Array Object,逐字读取。
以下将包含drawSomeText的javaScript文件称为tool.js(实际是6.21ec78ec.js不知道含义是什么)
- 如果用户没有登陆,下载用于登陆的二维码,用户扫码后保存登陆凭据供下次使用
- 获取tool.js的url
- 获取tool.js的scriptId
- 获取章节的html和css原始文件
- 展示用户书架,每本书对应一个ID,用户输入ID打开对应的书,要注意微信读书会重排书架,所以一开始拿到的列表序号不能作为ID
- 绑定快捷键“下一章”
- 书架上的书可能从某章开始需要会员才能阅读
- 模糊搜索书籍
- 如果有的书免费不需要登陆,应允许直接打开
- 如果页面上存在图片,文字中会用[图片]替代(这是微信的策略不是我的策略),将对应的图片下载下来
- 包含图片的书籍如何排版?
- 更进一步,微信读书没有保留任何epub信息,如果要还原为epub如何进行?