/dbc-downloader

豆瓣用户读书短评下载工具

Primary LanguagePythonApache License 2.0Apache-2.0

豆瓣用户读书短评下载工具

这个工具可以使用一位豆瓣读书用户的ID,批量下载其所有的读书短评,并导出为 Markdown 和 Html 格式文件。

运行方法

  1. Windows:请点击这里下载工具,在解压后打开dbc-downloader.exe运行。
  2. Python3 环境:执行命令python dbcDownloader.py.

设置代理

可以选择是否使用代理。
如果需要在使用时设置HTTP代理,请确保代理可用并使用以下格式:IP:PORT。例如:127.0.0.1:80

用户ID

首先访问用户的豆瓣主页,在地址栏看到的那一串数字或英文,就是用户的ID。
例如某用户的读书主页网址为:http://book.douban.com/people/1000001/,该用户的ID则为1000001

输出格式

用户的读书短评最终会以Markdown格式输出,该文件的扩展名为**.md**。
如果你不了解Markdown,你可以选择输出Html格式的文件,然后在Chrome等浏览器中打开,选择打印功能输出PDF文件,或者将内容复制到任何地方。

内容格式说明

每一条读书评论由以下部分组成:

  1. 第一行为书本标题,如果中文标题则会加上书名号,其他语言标题则会使用斜体格式
  2. 第二行为图书出版相关信息
  3. 第三行为图书标签
  4. 第四行为用户标记的日期
  5. 第五行为用户对这本书的短评

其他

为了防止由于访问过于频繁而使IP被豆瓣屏蔽,在代码的循环中使用了time.sleep(5),每访问一个 网页等待5秒。如果你愿意的话,可以在源代码修改这个数值,并重新生成exe文件。