/news_crawler

各大门户网站新闻爬虫

Primary LanguagePython

news_hotspot_crawler

基于scrapy的国内各大新闻网站内容爬虫 入口文件为begin.py 日志将保存在hotspot_crawler/log文件夹中。

使用说明:

# 安装依赖库
pip install -r requirements.txt
# 启动程序
python begin.py