基于知识图谱,实现了论文搜索引擎,包括关键词搜索模式以及智能问答模式。
整个项目包含了数据获取(爬虫)、简单数据处理、图数据库建立、算法设计、后端、前端。本项目是后端与算法部分。
- 爬虫部分:aFlyBird0/CnkiSpider: 知网爬虫
- 数据处理之建库数据生成:aFlyBird0/data_import: 从原始数据中抽取Neo4j图数据库导入所需的csv文件
- 后端:本项目
- 前端:aFlyBird0/tech_search_front: 基于知识图谱的科技文献搜索引擎-前端
注意:
-
/src/main/resources/application.properties
文件涉及数据库密码,已隐藏,文件内容如下:spring.neo4j.uri= spring.neo4j.authentication.username= spring.neo4j.authentication.password=
-
/src/main/resources/hanlp/data/dictionary
,Hanlp 词典文件已隐藏,请自行下载