1.这个爬虫完全用于个人功能,获取了一个微信公众号的排行及其数据,但这个数据有时候不对,所以要再搜索每个公众号的真实数据进行比对
2.搜索公众号用的是搜狗的微信搜索功能,如果搜不到就没办法了
3.反反爬用的是代理ip(阿布云代理)
4.功能很简单,不过可以继续扩展,另外这个代码写的挺麻烦,还没重构
5.两个文件只是访问的网址不同,别的都一样
6.因为这个功能做的不全,所以只有最近10天的数据是准确的
7.搜狗微信的反爬好像更新了,访问50次会要求输验证码
8.用之前要先登搜狗微信的任意公众号,输验证码
9.[7,8]现在应该可以规避这两项,每次访问网址都使用新的cookie和ip,一旦出现验证码页面就重试