/spider

虎扑NBA新闻爬虫

Primary LanguageJavaScript

抓取虎嗅文章

Redis + Mongodb

mongod --port 27017 --dbpath [path]
npm i
1. node app.js init // 把要抓取文章id存入redis
2. node app.js crawl 10 // 10是抓取数量, 默认5条