/Spark

星火计划项目实践过程

Primary LanguagePython

Spark

a hard trial wsal是针对 无讼案例 这个网站的第一版爬取,不过因为这个网站响应好慢,而且当时不知道一个关键词只会显示固定数目的案例所以当时就抛弃了。 bashouanli是针对新的 把手案例 网站编写的第二版爬虫,感觉好极了,不过还是为了得到最好的体验在很多没必要的地方耗时过久,其实这个就是为了获取足够多的样本就ok,重复的手动删除也是完全OK的