/facebook-spider

crawl facebook article spider using go language

Primary LanguageGo

facebook-spider

crawl facebook article spider using go language

  • 框架搭建,技术选型colly
  • csv读取,格式化
  • 爬虫的header头封装
  • colly乱码问题,Accept-Encoding问题
  • 模拟登陆,Post登录Content-Type问题
  • 登陆后保持cookie,redis持久化
  • cookie过期的情况
  • 抓取post,更多的问题,递归调用
  • 抓取comment,更多,递归
  • 随机refer,随机user-agent,随机事件抓取
  • facebook的时间格式化
  • 评论的回复抓取
  • 定时任务
  • 国际化