/spider

python爬虫 全球网址URL滚动提取

Primary LanguagePython

spider

python 爬虫

支持python3

版本1 功能简述: 以hao123为入口页面,滚动爬取外链,收集网址,并记录网址上的内链和外链数目,记录title等信息

windows7 32位上测试,目前每24个小时,可收集数据为10万左右