Qianlitp/crawlergo

多级目录爬取不到,只能爬取到二级目录,希望可以增加一下功能

Kepler587 opened this issue · 3 comments

多级目录爬取不到,只能爬取到二级目录,希望可以增加一下功能

能详细描述下吗?抱歉没有看懂

会对相似的url路由结构进行去重,这种文章链接只会保存几个。
crawlergo是用于尽可能发现web网站的入口,用于后续漏扫,不适合爬取所有文章链接的场景。