taozhijiang/chinese_correct_wsd

在使用proc预处理数据进行分词和ngram时发生错误

Closed this issue · 1 comments

ngram-count: not found

这个配置问题好像在README中并没有得到提示。

搜了一下,应该是 SRILM里面的

http://www.speech.sri.com/projects/srilm/download.html

已经好几年了,也不知道当时怎么弄的,你用上面的工具试试看呢?