这个工具可以使用一位豆瓣读书用户的ID,批量下载其所有的读书短评,并导出为 Markdown 和 Html 格式文件。
- Windows:请点击这里下载工具,在解压后打开dbc-downloader.exe运行。
- Python3 环境:执行命令python dbcDownloader.py.
可以选择是否使用代理。
如果需要在使用时设置HTTP代理,请确保代理可用并使用以下格式:IP:PORT。例如:127.0.0.1:80
首先访问用户的豆瓣主页,在地址栏看到的那一串数字或英文,就是用户的ID。
例如某用户的读书主页网址为:http://book.douban.com/people/1000001/
,该用户的ID则为1000001
。
用户的读书短评最终会以Markdown格式输出,该文件的扩展名为**.md**。
如果你不了解Markdown,你可以选择输出Html格式的文件,然后在Chrome等浏览器中打开,选择打印功能输出PDF文件,或者将内容复制到任何地方。
每一条读书评论由以下部分组成:
- 第一行为书本标题,如果中文标题则会加上书名号,其他语言标题则会使用斜体格式
- 第二行为图书出版相关信息
- 第三行为图书标签
- 第四行为用户标记的日期
- 第五行为用户对这本书的短评
为了防止由于访问过于频繁而使IP被豆瓣屏蔽,在代码的循环中使用了time.sleep(5)
,每访问一个
网页等待5秒。如果你愿意的话,可以在源代码修改这个数值,并重新生成exe文件。