/Chinese-Names-Corpus

中文人名语料库

Apache License 2.0Apache-2.0

中文人名语料库(Chinese-Names-Corpus)

120万常见中文人名,其中名人姓名已删除。

25万古代中文人名,已删除罕见姓、和部分带生僻字的人名。

1万日本常见人名,数据来源于网络。

2万英文常见姓或名,数据来源于网络。

1千个中文姓氏,已删除罕见姓、复姓只保留了“欧阳”。

5千称呼词根,18万中文称呼。


后续准备更新:

翻译人名,估计有10万个。


@思南斋 整理

2017.04.02