skywind3000/ECDICT

去除"人名"释义

andylee1890 opened this issue · 5 comments

使用fastwordquery将词典导入anki进行记忆时发现很多高频单词都有"人名"释义,在过去半年背单词的过程中这个"人名"解释在记忆过程中是个很不好的干扰因素,在记忆过程中想过滤人名再导入
image
我基于原始文件concise-bing.mdx导出一份txt,并使用正则去除人名释义之后,再使用MdxBuilder3.0和4.0进行再压制都失败
.*<div class="dcb">\n.*<span class="pos">n.</span>\n.*<span class="dcn">.*人名.*</span>\n.*</div>\n
image

自己编辑修正下吧,导入的时候。anki 的话,推荐用我的《卡片生成词典》:

https://www.pdawiki.com/forum/forum.php?mod=viewthread&tid=20846&highlight=anki

目前我的anki长这样,我倒不是个研究党,搞完就不背了,确实有需要,我觉得简明里面的词频,星级还有tag都是我需要留意的因素,所以还是希望能原生倒入简明,但是实在不想要“人名”, pdawiki这个网站没账号,也没法获取注册邀请码,公众号坏掉了。


image

image

image

image

image


首先,必须支持和尊重下作者的辛苦劳动。毕竟ECDICT英汉词典能够有432万词条,并且开源,是不容易的。其他地方根本找不到这么好的开源词典,当然能够找到英英词典或者英法词典的开源,但是英汉还是极少。国内大量学习英语的人,很少有人想过这么做。

其次,我也非常支持楼主这样的提案,个人认为,一个词典的统一规范是非常重要的。建议去掉人名之类的注释。当然可以自己编辑修正,生成自己的版本,但是没有影响力。所以我们使用者是没有能力完善并推广的。

望作者采纳。

作为一个通用的词典,要保证完整性,不能为了某些个性化的需求去裁剪。如果有需要,可以自己写程序做过滤。我的youzack.com使用ECDict,就是自己写程序过滤掉人名的。因此不赞同这个issue。

某人在背单词时不需要人名,但是其他人读小说时又会需要到这个人名。不需要觉得干扰的人可以自己过滤,但需要人名解释的人删了的话就没法加了。