感谢天河大佬维护,船新版本 https://github.com/qiannianshuangxue/safe_message_spider
目前只支持简书和先知社区
- -s 需要查找的关键字,空代表按时间顺序爬取
- -c 需要文章的数目,默认30
- -p 是否需要建立本地图床,默认0 0代表不需要 1代表需要
xz增加了反爬,没得时间逆向了,手动访问一次https://xz.aliyun.com/,更新第38行的acw_sc__v2字段即可
https://github.com/bkfish/html2markdown_Spider
cd xianzhiSpider
pip install -r requirements.txt
python xianzhiSpider.py -s CTF -c 10 -p 1
生成的内容放于同目录./xianzhi文件夹下,先知目前文章总数为五千不到,建议-c最大开至5000
简书由于多次访问会ban,所以慢一些,但是不影响使用~多等等
git clone https://github.com/Kit4y/xianzhiSpider
cd xianzhiSpider
pip install -r requirements.txt
python jianshuSpider.py -s CTF -c 5 -p 1
生成的内容放于同目录./jianshu文件夹下,因为简书最多只能100页每页10篇文章 所以-c最大开至1000
仅供学习,禁止商用行为