excing/find-roots-of-word

项目目标是提供一套算法来查找所有单词的词根词缀么?

saltbo opened this issue · 0 comments

我在写一个项目,需要一个功能就是查单词的词根词缀。 我目前找到的是欧路词典里的英语词根词缀记忆词典和高伟东那个词根词缀网站。但是欧陆那个词典格式没开源,好像没办法读出来。高伟东那个也不提供接口,问了下人家也不出售。

我目前也在尝试你这种方案,就是通过遍历所有的词根来匹配单词的词根,但是准确性不够高。今天搜到你的仓库感觉可以参考下。

我是有一万多的单词,我的目标是给这一万多单词标注出来词根词缀。因为我感觉算法再怎么弄准确率也不可能百分百准确。我想着可以用算法来标注,然后也有个类似的打分机制给算法标注的结果打分,然后人肉对低分的标注进行矫正。

最终提供一个对外的数据库,类似IP数据库那样的东西。