#Spring Boot + Lucene + WebMagic
一个简单的爬虫项目,固定的爬取数据,仅供参考。
项目仅适用于单一网站的全文检索,用途不大,并且本项目不会增加复杂功能,仅作为学习使用。
##说明
没有太多时间整合 Solr,所以简单用的 Lucene。
项目默认带的索引数据是 http://blog.csdn.net/isea533 博客的内容
启动后,首页(参考 Google)如下:
搜索内容页:
#Spring Boot + Lucene + WebMagic
一个简单的爬虫项目,固定的爬取数据,仅供参考。
项目仅适用于单一网站的全文检索,用途不大,并且本项目不会增加复杂功能,仅作为学习使用。
##说明
没有太多时间整合 Solr,所以简单用的 Lucene。
项目默认带的索引数据是 http://blog.csdn.net/isea533 博客的内容
启动后,首页(参考 Google)如下:
搜索内容页: