/text_grapher

利用java对文章进行分析并图谱化展示(主要提取关键词、实体、依存分析等)。

Primary LanguageJava

java_text_grapher

文章图谱化展示。利用hanlp进行nlp处理。

introduction

这里提取文章的关键信息,包括关键词、高频词、实体(地名,人名,机构名)以及依存句法分析提取主谓关系等三元组信息。hanlp可以去官网下载data(数据和模型),然后在hanlp.properties中进行相关配置。

quick start

import text.TextMine;
String content="文本内容";
TextMine textMine = new TextMine();
textMine.buildGraph(content);

图谱利用vis生成有向图,保存在text_graph.html中,可直接打开查看。

cases

1) 美国黑人佛洛伊德被杀

image

  1. **银行原油宝

image

references

1)https://github.com/liuhuanyong/TextGrapher

2)https://github.com/hankcs/HanLP