Opened this issue a year ago · 2 comments
词库中的词频一列是经过具体怎样的计算公式得到的? 如果我想另制一份词典, 与八股文进行融合, 怎样决定那一份词典中每个词的词频效果才最佳呢?
从语料中统计出来的。 可以根据两份统计数据的总体规模粗略地折算。
比如
一樣 65596
是指一定的文本量里出现了 65596次吗? 分母是多少呢