/baidu_tieba_crawler

技术栈vue cheerio socket mongodb redis 在线演示地址

Primary LanguageJavaScript

baidu_tieba_crawler

服务器很慢,请原谅

一定要安装redis以及开启redis服务!!!

1.3更新说明

  • 使用redis队列爬取 所有爬取任务都会插入到队列 实现后台爬取
  • socket 只用于通讯,其他接口均换成http请求
  • 增加了右边的队列的监控

更迭期望

  • 数据分析
  • 任务队列,实现无需驻足网页爬取,而是后台爬取
  • 代码优化 部分重写

项目地址

https://github.com/tyaqing/baidu_tieba_crawler 喜欢的给个star

使用说明书

!!!爬虫类的东东还是友善使用

程序运行不起来就要检查下 以下接口是否替换

~ 代理的api接口  mongo地址 socket地址 ~

真·调试

npm i          //安装后端依赖
node server.js //运行restful api 和socket服务 默认端口8081
cd fe          //进入前端目录
npm i          //安装前端依赖
npm run dev    //运行调试模式  默认端口8080

@Molunerfinn 谢谢建议

关于技术栈

用到的东西挺多的,但是都是用了点皮毛知识,提前踩坑。

前端的

vue大礼包(vue-resource vue-router vue-socket.id element-ui)

后端的

express socket.io superagent cheerio mongoose kue

数据库

mongo