-
- 根据作文分类整理
-
- 文本内容存储在分类文件夹中的txt文本中
-
- 已经搜索的网站会再次搜索 资源浪费
-
- 只有文本存储没有存储数据库 不便查找
-
- 频繁爬虫导致被网站封禁IP
-
- Python3.7
-
- request_html
-
- threading
-
- queue
# 安装依赖
pip3 install -r requirements.txt
# 运行程序
python3 poll.py.
├── poll.py #线程管理
├── README.md # 说明文件
├── requirements.txt #依赖项
├── server.py #爬虫主函数
`-- txt # 作文存放的目录