/sogou_weixin

通过爬虫获取某个关键词下的所有公众号文章全文,然后编写一个简易的查重算法,筛选出微信公众号上不重复的文章,降低人为筛选的工作量。

Primary LanguagePython

Watchers