/ZhiHuZhuanLanToPDF

知乎专栏文章导出成 PDF 文档

Primary LanguagePython

一键下载: 将知乎专栏导出成电子书

GitHub issues GitHub forks GitHub stars

参考自 : https://gitee.com/crossin/snippet/tree/master/get_zhihu


准备工作

需要安装库:requests、bs4、pdfkit(可要可不要 程序代码会使用pdfkit,pdfkit会调用wkhtmltopdf,而wkhtmltopdf会调用windows中的wkhtmltopdf.exe来转化html为pdf。所以可以直接用os.system(cmd)操作)

手动安装 wkhtmltopdf https://wkhtmltopdf.org/

安装可参考 https://github.com/JazzCore/python-pdfkit/wiki/Installing-wkhtmltopdf

关于no such file or directory:b'' 这种错误在python中出现时,意味着有.exe文件需要被调用,而该.exe文件没有被安装或者在控制面板的环境变量中没有添加该.exe的路径。另外,有时候需要改pdfkit代码为下列两句,才可消除错误:

config=pdfkit.configuration(wkhtmltopdf=r"D:\software\wkhtmltopdf\bin\wkhtmltopdf.exe")

实现效果

  • 输入专栏名字 获取每篇文章链接

  • 获取文章详情 保存为html文件

  • 生成pdf


TODO

* [ ] 速度太慢了,要搞快点。