/wechat_article_spider

通过selenium获取cookie登录,个人公众号平台搜素素材的方式定时爬取指定公众号发布的新内容

Primary LanguagePython

wechat_article_spider

1.利用个人公众号(需要申请个人公众号)的素材查找进行公众号文章爬取,数据库输入公众号名称即可,自动获取公众号id
2.爬到的数据根据每条数据的appmsgid进行判断,是否为新数据,新数据存库。
3.可以拿到公众号的标题、内容、发布时间、永久链接
4.cookie和token过期后通过selenium自动登录重新获取cookie和token,但是还是需要手机扫一次码
5.爬取大量数据可能存在封号风险