/WordSegmentation

.net 中文分词组件

Primary LanguageC#

中文分词组件

主要功能

  1. 中文分词
  2. 计算文章相关性

使用算法

  1. 使用 Trie 树结构进行词语查找
  2. 生成句子中所有成词情况的有向无环图
  3. 使用动态规划查找最大概率路径

不足

  1. 未处理未登陆词