/ZhihuSpider

网络爬虫之用户名密码及验证码登陆:爬取知乎网站

Primary LanguagePython

网络爬虫之用户名密码及验证码登陆:爬取知乎网站

一些说明:

  • 使用requests包来爬取。首先尝试用用户名密码自动登陆,如果失败,则需要采用cookie登陆。
  • 配置文件config.ini,其中包括用户名密码信息,如果有验证码情况,需要手动登陆一次网站获取cookie信息。
  • 判断登陆成功与否,看生成的html文件中有没有用户信息。