hightman/scws

请教一下,我想知道作者这词库是手工打的吗?

Closed this issue · 1 comments

zbooa commented

“采用的是自己采集的词频词典,并辅以一定的专有名称,人名,地名, 数字年代等规则识别来达到基本分词”请教这几十万的词库你是如何操作的?怎么个采集法?难道是手工打上去的?

不是手工打的,网上下载的词典加编写脚本处理。