中文人名语料库(Chinese-Names-Corpus) 120万常见中文人名,其中名人姓名已删除。 25万古代中文人名,已删除罕见姓、和部分带生僻字的人名。 1万日本常见人名,数据来源于网络。 2万英文常见姓或名,数据来源于网络。 1千个中文姓氏,已删除罕见姓、复姓只保留了“欧阳”。 5千称呼词根,18万中文称呼。 48万翻译人名,混有部分西化中文人名,如“李伯恩”。 @思南斋 整理 2017.04.23