附带GUI界面的百度快照爬虫,能按路径保存整页资源,附带死链检测与站点重新修复
可同时开启爬取快照与站点检测
处理已有站点需要单独使用
域名合法性:www.hao123.com (√) www.hao123.com/ (X) http://www.hao123.com (X)
git clone https://github.com/Zhui-CN/BaiDuKuaiZhaoSpiderGui.git
pip install PySide2
cd BaiDuKuaiZhaoSpiderGui
python SpiderGui.py