整理**各地区 (大陆、香港、**) 汉字标准。
由于疏忽、参考资料有误等,码表可能会存在一些错误,如果你发现了错误请通过 Issues 或者 PR 反馈给我。
每个文件一行一字,以 Tab (制表符) 进行分割,例:
U+7684 的 de,dī,dí,dì
U+4E00 一 yī
U+4E86 了 le,liǎo
U+662F 是 shì
- 大陆
- 《通用规范汉字表》 (2013 年)
- 收录汉字 8,105 个。
- 《通用规范汉字表-字频》
- 依照 邢红兵教授 发布的 25 亿字语料汉字字频表 进行排序 (最后 445 个汉字在字频表中没有,依照 《通用规范汉字表》 顺序排序)。
- 《通用规范汉字表》 (2013 年)
- 香港
- 《常用字字形表》 (2000 年,修订本)
- 收录汉字 4,759 个。
- 《常用字字形表-合并》
- 将相同序号的汉字合并到一行。
- 《常用字字形表》 (2000 年,修订本)
- **
- 《国字标准字体表-常用(甲表)》 (1982 年)
- 收录汉字 4,808 个。
- 《国字标准字体表-次常用(乙表)》 (1993 年)
- 收录汉字 6,343 个。
- 《国字标准字体表-常用(甲表)》 (1982 年)
参考资料可在 参考资料 目录下找到。其中非文件类的在线资料将转换成 PDF 快照存放。
- Unihan.zip
- 25 亿字语料汉字字频表
- 常用字下載
- 次常用國字標準字體表 - 维基文库
- ButTaiwan/cjktables.git
rime-aca/character_set.gitcjkvi/cjkvi-tables.git
整理**大陆简中、****繁中的国标汉字表。
整理所有 Unicode CJK 字符。
整理 Unicode CJK 字符的 五笔98 编码。
整理 Unicode CJK 字符的 仓颉5 编码。
备份、修补 chise/ids。
整理 Unicode CJK 字符的 字海两分 编码。