/Booklist

Linux下获取豆瓣读书不同种类的高质量书籍信息并整理成书单(pdf格式)

Primary LanguagePythonApache License 2.0Apache-2.0

兼容系统

  • Linux

描述

Linux下获取豆瓣不同种类书籍信息并整理成书单(pdf格式)。许多人不知道不同类的书籍哪些好,这个程序获取的书籍普遍是高质量的书籍(一份书单最多400本书,一共有145份书单)。

  • 爬取书籍信息按类别存储在相应的txt文件中,如: **文学.txt 小说.txt
  • 利用Text2docx转换txt为docx文件,如:**文学.docx 小说.docx
  • 利用Docx2pdf转换docx为pdf文件,如:**文学.pdf 小说.pdf
  • 删除.txt和.docx等缀余文件

依赖

请使用python3并安装依赖包
$ sudo pip3 install -r requirement.txt

使用

1.首先将Text2docx和Docx2pdf放到/usr/bin/下
  $ sudo chown root Text2docx Docx2pdf
  $ sudo chgrp root Text2docx Docx2pdf
  $ sudo chmod 755  Text2docx Docx2pdf
  $ sudo mv Text2docx /usr/bin/
  $ sudo mv Docx2pdf  /usr/bin/
2.建立存放书单pdf文件的目录,如'/home/username/file/booklist/'
  $ sudo mkdir /home/username/file/booklist/
3.修改Booklist/booklist.py的self.save_fold(第23行)为上述目录(注意最后的斜杠要加上) 
4.将category.csv放入上述目录
  $ mv Booklist/category.csv /home/username/file/booklist/
5.执行
  $ python3 booklist.py
6.最后
  直接到/home/username/file/booklis/下查看书单pdf文件

书单示例

ekqGXF.png