First Step To Build Big Crawler.
-
爬取x-cold的博客:http://blog.lxstart.net/ 的全站文章(约20-30篇)
-
结构化爬取的文章,持久化到本地(数据库、文件均可,暂时不考虑存储优化)
-
实现一个简单的HTTP服务器对抓取的结果进行展示(文章列表+文章详情)
Nodejs: v4.3.0
-
分支命名(每人一个分支):feature/x-cold (其中x-cold为用户名) -
直接在master分支进行开发,apps文件夹下创建对应的文件夹(命名为用户名)
-
提交commit规范:https://github.com/scauhci/single_crawler/blob/master/contribute.md
-
编码规范
-
本次练习采用使用es5
-
请使用jshint进行代码检查,通过后方可提交(可以考虑进行git-hook)