/flypy_dictionary

全拼词库转小鹤双拼词库Python脚本 for Gboard&&Rime

Primary LanguagePythonGNU General Public License v3.0GPL-3.0

flypy_dictionary

全拼转小鹤双拼Python脚本+Rime词库脚本

为什么有这个Repo?

最近使用gboard的时候,想整理自己的双拼词库,打算分为私人词库和常用公共词库,私人词库可以通过自己使用习惯导出,然而通过网络上找到的公共词库都是全拼词库,所以打算转换成小鹤双拼可以使用的词库。这是一个非常简单的小脚本,但是竟然在网上没看到对小鹤双拼进行支持的词库,可能还是双拼用户比较少的缘故。

当然这个脚本不止支持小鹤双拼,你可以通过修改initials和finals对照表重新运行,得到符合你输入习惯的词库;也可以通过定制输出的line格式,定制符合其他输入法词库格式的dictionary文件。

Repo中文件介绍

  1. 搜狗标准词库.scel:搜狗网上下载的标准词库。
  2. dictionary.txt:深蓝词库转换上述词库得到的文件。
  3. finals1.txt:常规韵母对照表。
  4. finals2.txt:没声母的那些字韵母对照表。
  5. initials.txt:声母对照表。
  6. dictionary_new.txt:新生成的gboard词库文件(半成品)。
  7. todouble.py:主要完成生成词典的脚本。
  8. dictionary_rime.txt:添加支持生成Rime的词库啦。
  9. torime.py:生成rime词库的小脚本。

todouble.py使用

安装好Python环境后,只需要部署好pypinyin即可:

python -m pip install pypinyin

然后到此文件夹运行:

cd \path\to\this\folder
python .\todouble.py

最后生成的dictionary_new.txt要用notepad++转换一下格式:

编辑 > 文档格式转换 > 转换为UNIX(LF)

添加Rime词库支持了~

cd \path\to\this\fold
python .\torime.py

生成的dictionary_rime.txt可以直接使用: 右键单击Rime图标 > 用户词典管理 > 点击<luna_pinyin> > 点击<导入文本码表>

一些链接

不太熟悉Python,所以基本都是一些Python基本语法。

其他

  • 最后我把自己生成的gboard可以直接导入使用的压缩包放release,第一版,可能会有错误。
  • 补充Rime支持,词库文件放release里,标签打第二版吧。

后记

  • rime的词库没有必要,因为rime的双拼与全拼的词库通用,只需要常见词汇的汉字列表即可;
  • rime太强了!附一个链接,rime添加扩展词库;
  • gboard则不同,gboard手机版中的方式是通过“按键组合-汉字输出”的映射方式实现的,需要特定的双拼组合,所以todouble.py这个脚本还是有点用处的。