通过话题入口抓取话题下所有问题和回答
MySQL: topic question answer
requwsts/xpath/re
mac
解密chrome cookie文件
知乎答案获取接口发生变化,之前是随意访问的get:
https://www.zhihu.com/api/v4/questions/{}/answers?sort_by=default&include={}&limit=20&offset={}
现在变成了post:
https://www.zhihu.com/node/QuestionAnswerListV2
Form Data:
- method:next
- params:{"url_token":36535039,"pagesize":10,"offset":30}
接口返回数据格式由原来的json数据变成了html,需要进一步xpath解析.
几个topic数据已在变化前全部抓下来了,后面会放到百度云上.
topic记录: 30
question记录: 8868
answer记录: 3145338
链接: https://pan.baidu.com/s/1slW6cSt 密码: 5fs4
知乎有封禁策略,建议使用小号抓取