thunlp/SE-WRL

数据问题

Closed this issue · 2 comments

你好,请问sougou语料中分好的词是用什么进行分词的?

数据预处理不是我做的,不过推荐使用thulac分词器。https://github.com/thunlp/THULAC

好的,多谢