sixs/wenshu_spider

目前最多只能获取前面5页的数据

Closed this issue · 1 comments

目前最多只能获取前面5页的数据,第6页开始的数据全部都是重复的,请问有什么好的办法

sixs commented

目前办法应该细分搜索条件到25条以内,爬到最后再去重,文书去掉了时间检索条件,极大增加了全量爬取的成本和难度。