微博热门新闻爬取

爬取的内容主要是新浪的热门话题页(http://d.weibo.com/100803)
爬取第一页的内容拿到新闻标题和类别并读取页面爬取阅读数讨论数和关注数

crawler为爬虫小程序使用java编写

在运行前需要编辑 crawler/conf/application.conf 中的相关属性

sub是页面cookie 请自行用浏览器获取这个cookie值原本的可能已经失效

db相关的是数据库配置具体的数据库在crawler/sql中请自行导入

运行App.java 启动程序

server作为数据可视化后台服务器主要使用D3.js 做出来的效果比较糟糕

xiaofan-linux/weibo_hotnews_crawler